RU2745322C2 - Композиции и способы контроля вредителей растений - Google Patents
Композиции и способы контроля вредителей растений Download PDFInfo
- Publication number
- RU2745322C2 RU2745322C2 RU2017124614A RU2017124614A RU2745322C2 RU 2745322 C2 RU2745322 C2 RU 2745322C2 RU 2017124614 A RU2017124614 A RU 2017124614A RU 2017124614 A RU2017124614 A RU 2017124614A RU 2745322 C2 RU2745322 C2 RU 2745322C2
- Authority
- RU
- Russia
- Prior art keywords
- leu
- thr
- plant
- ser
- val
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 239000000203 mixture Substances 0.000 title claims abstract description 57
- 241000607479 Yersinia pestis Species 0.000 title description 71
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 395
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 305
- 230000014509 gene expression Effects 0.000 claims abstract description 122
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 91
- 230000009261 transgenic effect Effects 0.000 claims abstract description 82
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 75
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 75
- 231100000331 toxic Toxicity 0.000 claims abstract description 45
- 230000002588 toxic effect Effects 0.000 claims abstract description 45
- 239000013598 vector Substances 0.000 claims abstract description 41
- 241000566547 Agrotis ipsilon Species 0.000 claims abstract description 30
- 230000002068 genetic effect Effects 0.000 claims abstract description 13
- 241000196324 Embryophyta Species 0.000 claims description 307
- 241000238631 Hexapoda Species 0.000 claims description 103
- 239000002773 nucleotide Substances 0.000 claims description 83
- 125000003729 nucleotide group Chemical group 0.000 claims description 83
- 230000000749 insecticidal effect Effects 0.000 claims description 42
- 240000008042 Zea mays Species 0.000 claims description 39
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 34
- 150000001413 amino acids Chemical group 0.000 claims description 32
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 28
- 235000009973 maize Nutrition 0.000 claims description 28
- 241000193388 Bacillus thuringiensis Species 0.000 claims description 23
- 229940097012 bacillus thuringiensis Drugs 0.000 claims description 22
- 241000589158 Agrobacterium Species 0.000 claims description 18
- 241000894006 Bacteria Species 0.000 claims description 18
- 108020004705 Codon Proteins 0.000 claims description 18
- 239000013612 plasmid Substances 0.000 claims description 12
- 230000001580 bacterial effect Effects 0.000 claims description 11
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 10
- 229920000742 Cotton Polymers 0.000 claims description 10
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 7
- 108090000848 Ubiquitin Proteins 0.000 claims description 7
- 235000010469 Glycine max Nutrition 0.000 claims description 6
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 6
- 244000061176 Nicotiana tabacum Species 0.000 claims description 6
- 102000044159 Ubiquitin Human genes 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 6
- 244000020551 Helianthus annuus Species 0.000 claims description 5
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 5
- 240000007594 Oryza sativa Species 0.000 claims description 5
- 235000007164 Oryza sativa Nutrition 0.000 claims description 5
- 235000009566 rice Nutrition 0.000 claims description 5
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 claims description 4
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 4
- 240000005979 Hordeum vulgare Species 0.000 claims description 4
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 4
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 4
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 4
- 240000000111 Saccharum officinarum Species 0.000 claims description 4
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 4
- 240000003768 Solanum lycopersicum Species 0.000 claims description 4
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 4
- 244000061456 Solanum tuberosum Species 0.000 claims description 4
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 4
- 235000021536 Sugar beet Nutrition 0.000 claims description 4
- 235000021307 Triticum Nutrition 0.000 claims description 4
- 244000098338 Triticum aestivum Species 0.000 claims description 4
- 235000007319 Avena orientalis Nutrition 0.000 claims description 3
- 244000075850 Avena orientalis Species 0.000 claims description 3
- 240000007124 Brassica oleracea Species 0.000 claims description 3
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 claims description 3
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 claims description 3
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 claims description 3
- 239000004471 Glycine Substances 0.000 claims description 3
- 241001148062 Photorhabdus Species 0.000 claims description 3
- 235000010582 Pisum sativum Nutrition 0.000 claims description 3
- 240000004713 Pisum sativum Species 0.000 claims description 3
- 108010043934 Sucrose synthase Proteins 0.000 claims description 3
- 241000607757 Xenorhabdus Species 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 3
- 238000003306 harvesting Methods 0.000 claims description 3
- 108020003589 5' Untranslated Regions Proteins 0.000 claims description 2
- 241000589220 Acetobacter Species 0.000 claims description 2
- 241000588986 Alcaligenes Species 0.000 claims description 2
- 101710187578 Alcohol dehydrogenase 1 Proteins 0.000 claims description 2
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 claims description 2
- 241000186063 Arthrobacter Species 0.000 claims description 2
- 241000589151 Azotobacter Species 0.000 claims description 2
- 101000981883 Brevibacillus parabrevis ATP-dependent tryptophan/phenylalanine/tyrosine adenylase Proteins 0.000 claims description 2
- 101000981889 Brevibacillus parabrevis Linear gramicidin-PCP reductase Proteins 0.000 claims description 2
- 108010004539 Chalcone isomerase Proteins 0.000 claims description 2
- 101000906861 Chondromyces crocatus ATP-dependent tyrosine adenylase Proteins 0.000 claims description 2
- 241000193403 Clostridium Species 0.000 claims description 2
- 241000588698 Erwinia Species 0.000 claims description 2
- 241000588722 Escherichia Species 0.000 claims description 2
- 241000588748 Klebsiella Species 0.000 claims description 2
- 241000186660 Lactobacillus Species 0.000 claims description 2
- 108090001090 Lectins Proteins 0.000 claims description 2
- 102000004856 Lectins Human genes 0.000 claims description 2
- 241000192132 Leuconostoc Species 0.000 claims description 2
- 241000606860 Pasteurella Species 0.000 claims description 2
- 241001668579 Pasteuria Species 0.000 claims description 2
- 101710091688 Patatin Proteins 0.000 claims description 2
- 240000007377 Petunia x hybrida Species 0.000 claims description 2
- 241000589516 Pseudomonas Species 0.000 claims description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 2
- 241000607142 Salmonella Species 0.000 claims description 2
- 241000607720 Serratia Species 0.000 claims description 2
- 229940039696 lactobacillus Drugs 0.000 claims description 2
- 239000002523 lectin Substances 0.000 claims description 2
- 108010083942 mannopine synthase Proteins 0.000 claims description 2
- 108010058731 nopaline synthase Proteins 0.000 claims description 2
- 241000701832 Enterobacteria phage T3 Species 0.000 claims 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 claims 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 claims 1
- 240000006394 Sorghum bicolor Species 0.000 claims 1
- 241000589634 Xanthomonas Species 0.000 claims 1
- 230000000644 propagated effect Effects 0.000 claims 1
- 239000000126 substance Substances 0.000 abstract description 16
- 230000000694 effects Effects 0.000 abstract description 15
- 238000004519 manufacturing process Methods 0.000 abstract description 15
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 abstract description 8
- 235000018102 proteins Nutrition 0.000 description 283
- 102000040430 polynucleotide Human genes 0.000 description 119
- 108091033319 polynucleotide Proteins 0.000 description 119
- 239000002157 polynucleotide Substances 0.000 description 119
- 210000004027 cell Anatomy 0.000 description 118
- 125000003275 alpha amino acid group Chemical group 0.000 description 74
- 108020004414 DNA Proteins 0.000 description 52
- 108091028043 Nucleic acid sequence Proteins 0.000 description 44
- 235000001014 amino acid Nutrition 0.000 description 42
- 230000009466 transformation Effects 0.000 description 38
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 30
- 229940024606 amino acid Drugs 0.000 description 29
- 210000001519 tissue Anatomy 0.000 description 28
- 108090000765 processed proteins & peptides Proteins 0.000 description 25
- 102000004196 processed proteins & peptides Human genes 0.000 description 25
- 241001147398 Ostrinia nubilalis Species 0.000 description 24
- 229920001184 polypeptide Polymers 0.000 description 23
- 102000004190 Enzymes Human genes 0.000 description 21
- 108090000790 Enzymes Proteins 0.000 description 21
- 239000003795 chemical substances by application Substances 0.000 description 21
- 229940088598 enzyme Drugs 0.000 description 21
- 108010089804 glycyl-threonine Proteins 0.000 description 20
- 239000002609 medium Substances 0.000 description 19
- 230000001105 regulatory effect Effects 0.000 description 19
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 18
- 108010005233 alanylglutamic acid Proteins 0.000 description 18
- 238000009396 hybridization Methods 0.000 description 18
- 239000000047 product Substances 0.000 description 18
- 108010061238 threonyl-glycine Proteins 0.000 description 18
- 239000003550 marker Substances 0.000 description 17
- 210000002706 plastid Anatomy 0.000 description 17
- 230000000361 pesticidal effect Effects 0.000 description 16
- 108010073969 valyllysine Proteins 0.000 description 16
- 239000004009 herbicide Substances 0.000 description 15
- 108700012359 toxins Proteins 0.000 description 15
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 14
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 14
- 108010068265 aspartyltyrosine Proteins 0.000 description 14
- 230000001404 mediated effect Effects 0.000 description 14
- 108010051242 phenylalanylserine Proteins 0.000 description 14
- 238000006467 substitution reaction Methods 0.000 description 14
- 238000012360 testing method Methods 0.000 description 14
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 13
- 230000001965 increasing effect Effects 0.000 description 13
- 239000000523 sample Substances 0.000 description 13
- 238000003556 assay Methods 0.000 description 12
- 230000006378 damage Effects 0.000 description 12
- 108010048818 seryl-histidine Proteins 0.000 description 12
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 12
- 230000000890 antigenic effect Effects 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 11
- -1 rRNA Proteins 0.000 description 11
- 230000008685 targeting Effects 0.000 description 11
- 239000003053 toxin Substances 0.000 description 11
- 231100000765 toxin Toxicity 0.000 description 11
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 10
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 10
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 10
- 108091005804 Peptidases Proteins 0.000 description 10
- 239000004365 Protease Substances 0.000 description 10
- 241000753145 Sitotroga cerealella Species 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 10
- 108010044940 alanylglutamine Proteins 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 10
- 108010047857 aspartylglycine Proteins 0.000 description 10
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 10
- 108010037850 glycylvaline Proteins 0.000 description 10
- 238000003752 polymerase chain reaction Methods 0.000 description 10
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 9
- 108010021466 Mutant Proteins Proteins 0.000 description 9
- 102000008300 Mutant Proteins Human genes 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 230000001976 improved effect Effects 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 229920001817 Agar Polymers 0.000 description 8
- 108010076441 Ala-His-His Proteins 0.000 description 8
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 8
- ZFSIGJMSVGZVGP-DHATWTDPSA-N Arg-Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCN=C(N)N)[C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZFSIGJMSVGZVGP-DHATWTDPSA-N 0.000 description 8
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 8
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 8
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 8
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 8
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 8
- YUZPQIQWXLRFBW-ACZMJKKPSA-N Cys-Glu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O YUZPQIQWXLRFBW-ACZMJKKPSA-N 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 8
- RKAQZCDMSUQTSS-FXQIFTODSA-N Gln-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RKAQZCDMSUQTSS-FXQIFTODSA-N 0.000 description 8
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 8
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 8
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 8
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 8
- WEIYKCOEVBUJQC-JYJNAYRXSA-N His-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WEIYKCOEVBUJQC-JYJNAYRXSA-N 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 8
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 8
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 8
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 8
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 8
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 8
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 8
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 8
- 108091022912 Mannose-6-Phosphate Isomerase Proteins 0.000 description 8
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 8
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 8
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 8
- 108010079005 RDV peptide Proteins 0.000 description 8
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 8
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 8
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 8
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 8
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 8
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 8
- 239000008272 agar Substances 0.000 description 8
- 108090000637 alpha-Amylases Proteins 0.000 description 8
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 8
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 8
- 108010062796 arginyllysine Proteins 0.000 description 8
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 230000001276 controlling effect Effects 0.000 description 8
- 101150086784 cry gene Proteins 0.000 description 8
- 210000002257 embryonic structure Anatomy 0.000 description 8
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 8
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 8
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 8
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 8
- 108010084389 glycyltryptophan Proteins 0.000 description 8
- 230000002363 herbicidal effect Effects 0.000 description 8
- 108010025306 histidylleucine Proteins 0.000 description 8
- 108010057821 leucylproline Proteins 0.000 description 8
- 244000005700 microbiome Species 0.000 description 8
- 239000000575 pesticide Substances 0.000 description 8
- 108010029020 prolylglycine Proteins 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- 108010020532 tyrosyl-proline Proteins 0.000 description 8
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 7
- 241000255967 Helicoverpa zea Species 0.000 description 7
- 241000255777 Lepidoptera Species 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 235000019621 digestibility Nutrition 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 239000002245 particle Substances 0.000 description 7
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 6
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 6
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 6
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 6
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 6
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 6
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 6
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 6
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 6
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 6
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 6
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 6
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 6
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 6
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 6
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 6
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 6
- 241000426497 Chilo suppressalis Species 0.000 description 6
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 6
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 6
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 6
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 6
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 6
- MKWFGXSFLYNTKC-XIRDDKMYSA-N His-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N MKWFGXSFLYNTKC-XIRDDKMYSA-N 0.000 description 6
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 6
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 6
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 6
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 6
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 6
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 6
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 6
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 6
- 102000048193 Mannose-6-phosphate isomerases Human genes 0.000 description 6
- 241000346285 Ostrinia furnacalis Species 0.000 description 6
- 102000057297 Pepsin A Human genes 0.000 description 6
- 108090000284 Pepsin A Proteins 0.000 description 6
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 6
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 6
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 6
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 6
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 6
- 241000256251 Spodoptera frugiperda Species 0.000 description 6
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 6
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 6
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 6
- 108700019146 Transgenes Proteins 0.000 description 6
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 6
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 6
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 6
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 6
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 6
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 6
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 6
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 6
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 6
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 6
- 108010077245 asparaginyl-proline Proteins 0.000 description 6
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 6
- 108010093581 aspartyl-proline Proteins 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 235000005822 corn Nutrition 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 239000000499 gel Substances 0.000 description 6
- 108010078144 glutaminyl-glycine Proteins 0.000 description 6
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 6
- 108010049041 glutamylalanine Proteins 0.000 description 6
- 108010010147 glycylglutamine Proteins 0.000 description 6
- 108010081551 glycylphenylalanine Proteins 0.000 description 6
- 239000001963 growth medium Substances 0.000 description 6
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 6
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 6
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 6
- 108010000761 leucylarginine Proteins 0.000 description 6
- 108010017391 lysylvaline Proteins 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 210000001938 protoplast Anatomy 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 108010080629 tryptophan-leucine Proteins 0.000 description 6
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 6
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 5
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- 241001147381 Helicoverpa armigera Species 0.000 description 5
- 244000111261 Mucuna pruriens Species 0.000 description 5
- 235000008540 Mucuna pruriens var utilis Nutrition 0.000 description 5
- 241001460678 Napo <wasp> Species 0.000 description 5
- 102000035195 Peptidases Human genes 0.000 description 5
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 5
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 5
- 229920002472 Starch Polymers 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Chemical class Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 102000004139 alpha-Amylases Human genes 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 210000002421 cell wall Anatomy 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 230000034994 death Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 5
- 238000009472 formulation Methods 0.000 description 5
- 210000004051 gastric juice Anatomy 0.000 description 5
- 210000001035 gastrointestinal tract Anatomy 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000002703 mutagenesis Methods 0.000 description 5
- 231100000350 mutagenesis Toxicity 0.000 description 5
- 229940111202 pepsin Drugs 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 239000002689 soil Substances 0.000 description 5
- 235000019698 starch Nutrition 0.000 description 5
- 239000008107 starch Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 4
- 108010000700 Acetolactate synthase Proteins 0.000 description 4
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 4
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 4
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 4
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 4
- ATAKEVCGTRZKLI-UWJYBYFXSA-N Ala-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 ATAKEVCGTRZKLI-UWJYBYFXSA-N 0.000 description 4
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 4
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 4
- JWUZOJXDJDEQEM-ZLIFDBKOSA-N Ala-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 JWUZOJXDJDEQEM-ZLIFDBKOSA-N 0.000 description 4
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 4
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 4
- 241000625764 Anticarsia gemmatalis Species 0.000 description 4
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 4
- BIOCIVSVEDFKDJ-GUBZILKMSA-N Arg-Arg-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O BIOCIVSVEDFKDJ-GUBZILKMSA-N 0.000 description 4
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 4
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 4
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 4
- QIWYWCYNUMJBTC-CIUDSAMLSA-N Arg-Cys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QIWYWCYNUMJBTC-CIUDSAMLSA-N 0.000 description 4
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 4
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 4
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 4
- JAYIQMNQDMOBFY-KKUMJFAQSA-N Arg-Glu-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JAYIQMNQDMOBFY-KKUMJFAQSA-N 0.000 description 4
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 4
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 4
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 4
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 4
- XRLOBFSLPCHYLQ-ULQDDVLXSA-N Arg-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XRLOBFSLPCHYLQ-ULQDDVLXSA-N 0.000 description 4
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 4
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 4
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 4
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 4
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 4
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 4
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 4
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 4
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 4
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 4
- KNENKKKUYGEZIO-FXQIFTODSA-N Asn-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N KNENKKKUYGEZIO-FXQIFTODSA-N 0.000 description 4
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 4
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 4
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 4
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 4
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 4
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 4
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 4
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 4
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 4
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 4
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 4
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 4
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 4
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 4
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 4
- FIAKNCXQFFKSSI-ZLUOBGJFSA-N Asp-Ser-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O FIAKNCXQFFKSSI-ZLUOBGJFSA-N 0.000 description 4
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 4
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 4
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 4
- 108010083946 Asp-Tyr-Leu-Lys Proteins 0.000 description 4
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 4
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 4
- 102100032487 Beta-mannosidase Human genes 0.000 description 4
- 241001364932 Chrysodeixis Species 0.000 description 4
- 241000254173 Coleoptera Species 0.000 description 4
- 108091035707 Consensus sequence Proteins 0.000 description 4
- URDUGPGPLNXXES-WHFBIAKZSA-N Cys-Gly-Cys Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O URDUGPGPLNXXES-WHFBIAKZSA-N 0.000 description 4
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 4
- JUUMIGUJJRFQQR-KKUMJFAQSA-N Cys-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)O JUUMIGUJJRFQQR-KKUMJFAQSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 241000879145 Diatraea grandiosella Species 0.000 description 4
- 241000122106 Diatraea saccharalis Species 0.000 description 4
- 241000255925 Diptera Species 0.000 description 4
- 241001095202 Ecdytolopha fabivora Species 0.000 description 4
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 4
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 4
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 4
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 4
- OETQLUYCMBARHJ-CIUDSAMLSA-N Gln-Asn-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OETQLUYCMBARHJ-CIUDSAMLSA-N 0.000 description 4
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 4
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 4
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 4
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 4
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 4
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 4
- SFAFZYYMAWOCIC-KKUMJFAQSA-N Gln-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SFAFZYYMAWOCIC-KKUMJFAQSA-N 0.000 description 4
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 4
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 4
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 4
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 4
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 4
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 4
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 4
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 4
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 4
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 4
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 4
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 4
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 4
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 4
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 4
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 4
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 4
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 4
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 4
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 4
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 4
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 4
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 4
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 4
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 4
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 4
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 4
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 4
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 4
- LKJCZEPXHOIAIW-HOTGVXAUSA-N Gly-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN LKJCZEPXHOIAIW-HOTGVXAUSA-N 0.000 description 4
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 4
- 239000005562 Glyphosate Substances 0.000 description 4
- 241000400808 Herpetogramma phaeopteralis Species 0.000 description 4
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 4
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 4
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 4
- JBSLJUPMTYLLFH-MELADBBJSA-N His-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O JBSLJUPMTYLLFH-MELADBBJSA-N 0.000 description 4
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 4
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 4
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 4
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 4
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 4
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 4
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 4
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 4
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 4
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 4
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 4
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 4
- MGUTVMBNOMJLKC-VKOGCVSHSA-N Ile-Trp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C(C)C)C(=O)O)N MGUTVMBNOMJLKC-VKOGCVSHSA-N 0.000 description 4
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 4
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 4
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 4
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 4
- DUBAVOVZNZKEQQ-AVGNSLFASA-N Leu-Arg-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCN=C(N)N DUBAVOVZNZKEQQ-AVGNSLFASA-N 0.000 description 4
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 4
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 4
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 4
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 4
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 4
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 4
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 4
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 4
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 4
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 4
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 4
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 4
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 4
- ONHCDMBHPQIPAI-YTQUADARSA-N Leu-Trp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N ONHCDMBHPQIPAI-YTQUADARSA-N 0.000 description 4
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 4
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 4
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 4
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 4
- MIROMRNASYKZNL-ULQDDVLXSA-N Lys-Pro-Tyr Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MIROMRNASYKZNL-ULQDDVLXSA-N 0.000 description 4
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 4
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 4
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 4
- DZTDEZSHBVRUCQ-FXQIFTODSA-N Met-Asp-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N DZTDEZSHBVRUCQ-FXQIFTODSA-N 0.000 description 4
- VWFHWJGVLVZVIS-QXEWZRGKSA-N Met-Val-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O VWFHWJGVLVZVIS-QXEWZRGKSA-N 0.000 description 4
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 4
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 4
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 4
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 4
- WGXOKDLDIWSOCV-MELADBBJSA-N Phe-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O WGXOKDLDIWSOCV-MELADBBJSA-N 0.000 description 4
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 4
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 4
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 4
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 4
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 4
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 4
- 108700001094 Plant Genes Proteins 0.000 description 4
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 4
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 4
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 4
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 4
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 4
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 4
- NTXFLJULRHQMDC-GUBZILKMSA-N Pro-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 NTXFLJULRHQMDC-GUBZILKMSA-N 0.000 description 4
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 4
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 4
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 4
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 4
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 4
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 4
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 4
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 4
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 4
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 4
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 4
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 4
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 4
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 4
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 4
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 4
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 4
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 4
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 4
- 244000062793 Sorghum vulgare Species 0.000 description 4
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 4
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 4
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 4
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 4
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 4
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 4
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 4
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 4
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 4
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 4
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 4
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 4
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 4
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 4
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 4
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 4
- XIULAFZYEKSGAJ-IXOXFDKPSA-N Thr-Leu-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XIULAFZYEKSGAJ-IXOXFDKPSA-N 0.000 description 4
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 4
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 4
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 4
- QFCQNHITJPRQTB-IEGACIPQSA-N Thr-Lys-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O QFCQNHITJPRQTB-IEGACIPQSA-N 0.000 description 4
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 4
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 4
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 4
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 4
- REJRKTOJTCPDPO-IRIUXVKKSA-N Thr-Tyr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O REJRKTOJTCPDPO-IRIUXVKKSA-N 0.000 description 4
- RPECVQBNONKZAT-WZLNRYEVSA-N Thr-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H]([C@@H](C)O)N RPECVQBNONKZAT-WZLNRYEVSA-N 0.000 description 4
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 4
- MJBBMTOGSOSAKJ-HJXMPXNTSA-N Trp-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MJBBMTOGSOSAKJ-HJXMPXNTSA-N 0.000 description 4
- RNFZZCMCRDFNAE-WFBYXXMGSA-N Trp-Asn-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O RNFZZCMCRDFNAE-WFBYXXMGSA-N 0.000 description 4
- XKTWZYNTLXITCY-QRTARXTBSA-N Trp-Val-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 XKTWZYNTLXITCY-QRTARXTBSA-N 0.000 description 4
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 4
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 4
- JRXKIVGWMMIIOF-YDHLFZDLSA-N Tyr-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JRXKIVGWMMIIOF-YDHLFZDLSA-N 0.000 description 4
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 4
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 4
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 4
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 4
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 4
- YMUQBRQQCPQEQN-CXTHYWKRSA-N Tyr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YMUQBRQQCPQEQN-CXTHYWKRSA-N 0.000 description 4
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 4
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 4
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 4
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 4
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 4
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 4
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 4
- KRXFXDCNKLANCP-CXTHYWKRSA-N Tyr-Tyr-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 KRXFXDCNKLANCP-CXTHYWKRSA-N 0.000 description 4
- CCEVJBJLPRNAFH-BVSLBCMMSA-N Tyr-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N CCEVJBJLPRNAFH-BVSLBCMMSA-N 0.000 description 4
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 4
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 4
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 4
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 4
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 4
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 4
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 4
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 4
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 4
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 4
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 4
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- 230000002009 allergenic effect Effects 0.000 description 4
- 239000003242 anti bacterial agent Substances 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 108010055059 beta-Mannosidase Proteins 0.000 description 4
- 238000004166 bioassay Methods 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 229960005091 chloramphenicol Drugs 0.000 description 4
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 4
- 210000003763 chloroplast Anatomy 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 108010004073 cysteinylcysteine Proteins 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 4
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 4
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 4
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 4
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 229940097068 glyphosate Drugs 0.000 description 4
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 210000005260 human cell Anatomy 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 108010078274 isoleucylvaline Proteins 0.000 description 4
- 230000002147 killing effect Effects 0.000 description 4
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 239000011541 reaction mixture Substances 0.000 description 4
- 108010026333 seryl-proline Proteins 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000028070 sporulation Effects 0.000 description 4
- 238000005507 spraying Methods 0.000 description 4
- 230000000451 tissue damage Effects 0.000 description 4
- 231100000827 tissue damage Toxicity 0.000 description 4
- 108010051110 tyrosyl-lysine Proteins 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 102100026189 Beta-galactosidase Human genes 0.000 description 3
- 240000002791 Brassica napus Species 0.000 description 3
- 108010084185 Cellulases Proteins 0.000 description 3
- 102000005575 Cellulases Human genes 0.000 description 3
- 241000098289 Cnaphalocrocis medinalis Species 0.000 description 3
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 102100022624 Glucoamylase Human genes 0.000 description 3
- 108010028688 Isoamylase Proteins 0.000 description 3
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 3
- 108090001060 Lipase Proteins 0.000 description 3
- UXJHNUBJSQQIOC-SZMVWBNQSA-N Met-Trp-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O UXJHNUBJSQQIOC-SZMVWBNQSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- 241000244206 Nematoda Species 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 3
- 241000931985 Sesamia calamistis Species 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 241000098292 Striacosta albicosta Species 0.000 description 3
- 229940100389 Sulfonylurea Drugs 0.000 description 3
- WDFPMSHYMRBLKM-NKIYYHGXSA-N Thr-Glu-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O WDFPMSHYMRBLKM-NKIYYHGXSA-N 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 229940024171 alpha-amylase Drugs 0.000 description 3
- JFDZBHWFFUWGJE-UHFFFAOYSA-N benzonitrile Chemical compound N#CC1=CC=CC=C1 JFDZBHWFFUWGJE-UHFFFAOYSA-N 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 239000003593 chromogenic compound Substances 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 244000038559 crop plants Species 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000000593 degrading effect Effects 0.000 description 3
- 210000005069 ears Anatomy 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- NYPJDWWKZLNGGM-UHFFFAOYSA-N fenvalerate Aalpha Natural products C=1C=C(Cl)C=CC=1C(C(C)C)C(=O)OC(C#N)C(C=1)=CC=CC=1OC1=CC=CC=C1 NYPJDWWKZLNGGM-UHFFFAOYSA-N 0.000 description 3
- 230000002538 fungal effect Effects 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 102000005396 glutamine synthetase Human genes 0.000 description 3
- 108020002326 glutamine synthetase Proteins 0.000 description 3
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- KZAUOCCYDRDERY-UHFFFAOYSA-N oxamyl Chemical compound CNC(=O)ON=C(SC)C(=O)N(C)C KZAUOCCYDRDERY-UHFFFAOYSA-N 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 238000004161 plant tissue culture Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Natural products NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 2
- PGOOBECODWQEAB-UHFFFAOYSA-N (E)-clothianidin Chemical compound [O-][N+](=O)\N=C(/NC)NCC1=CN=C(Cl)S1 PGOOBECODWQEAB-UHFFFAOYSA-N 0.000 description 2
- ZDOOQPFIGYHZFV-UHFFFAOYSA-N 2-ethyl-4-[(4-phenoxyphenoxy)methyl]-1,3-dioxolane Chemical compound O1C(CC)OCC1COC(C=C1)=CC=C1OC1=CC=CC=C1 ZDOOQPFIGYHZFV-UHFFFAOYSA-N 0.000 description 2
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- ZOCSXAVNDGMNBV-UHFFFAOYSA-N 5-amino-1-[2,6-dichloro-4-(trifluoromethyl)phenyl]-4-[(trifluoromethyl)sulfinyl]-1H-pyrazole-3-carbonitrile Chemical compound NC1=C(S(=O)C(F)(F)F)C(C#N)=NN1C1=C(Cl)C=C(C(F)(F)F)C=C1Cl ZOCSXAVNDGMNBV-UHFFFAOYSA-N 0.000 description 2
- 239000005660 Abamectin Substances 0.000 description 2
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 2
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 2
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 2
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 2
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 2
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 2
- HFBFSOAKPUZCCO-ZLUOBGJFSA-N Ala-Cys-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HFBFSOAKPUZCCO-ZLUOBGJFSA-N 0.000 description 2
- DAEFQZCYZKRTLR-ZLUOBGJFSA-N Ala-Cys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O DAEFQZCYZKRTLR-ZLUOBGJFSA-N 0.000 description 2
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 2
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 2
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 2
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 2
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 2
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 2
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 2
- RNHKOQHGYMTHFR-UBHSHLNASA-N Ala-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 RNHKOQHGYMTHFR-UBHSHLNASA-N 0.000 description 2
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 2
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 2
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 2
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 2
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 2
- ZDILXFDENZVOTL-BPNCWPANSA-N Ala-Val-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDILXFDENZVOTL-BPNCWPANSA-N 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 2
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 2
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 2
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 2
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 2
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 2
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 2
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 2
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 2
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 2
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 2
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 2
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 2
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 2
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 2
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 2
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 2
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 2
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 2
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 2
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 2
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 2
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 2
- QHVRVUNEAIFTEK-SZMVWBNQSA-N Arg-Pro-Trp Chemical compound N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O QHVRVUNEAIFTEK-SZMVWBNQSA-N 0.000 description 2
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 2
- FBXMCPLCVYUWBO-BPUTZDHNSA-N Arg-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N FBXMCPLCVYUWBO-BPUTZDHNSA-N 0.000 description 2
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 2
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 2
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 2
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 2
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 2
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 2
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 2
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 2
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 2
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 2
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 2
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 2
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 2
- YQNBILXAUIAUCF-CIUDSAMLSA-N Asn-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N YQNBILXAUIAUCF-CIUDSAMLSA-N 0.000 description 2
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 2
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 2
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 2
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 2
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 2
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 2
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 2
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 2
- OFQPMRDJVWLMNJ-CIUDSAMLSA-N Asn-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N OFQPMRDJVWLMNJ-CIUDSAMLSA-N 0.000 description 2
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 2
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 2
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 2
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 2
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 2
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 2
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 2
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 2
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 2
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 2
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 2
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 2
- KYQJHBWHRASMKG-ZLUOBGJFSA-N Asn-Ser-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O KYQJHBWHRASMKG-ZLUOBGJFSA-N 0.000 description 2
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 2
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 2
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 2
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 2
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 2
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 2
- YNQMEIJEWSHOEO-SRVKXCTJSA-N Asn-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YNQMEIJEWSHOEO-SRVKXCTJSA-N 0.000 description 2
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 2
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 2
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 2
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 2
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 2
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 2
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 2
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 2
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 2
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 2
- TZBJAXGYGSIUHQ-XUXIUFHCSA-N Asp-Leu-Leu-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O TZBJAXGYGSIUHQ-XUXIUFHCSA-N 0.000 description 2
- HSGOFISJLFDMBJ-CIUDSAMLSA-N Asp-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N HSGOFISJLFDMBJ-CIUDSAMLSA-N 0.000 description 2
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 2
- FOXXZZGDIAQPQI-XKNYDFJKSA-N Asp-Pro-Ser-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FOXXZZGDIAQPQI-XKNYDFJKSA-N 0.000 description 2
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 2
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 2
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 2
- OZBXOELNJBSJOA-UBHSHLNASA-N Asp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OZBXOELNJBSJOA-UBHSHLNASA-N 0.000 description 2
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 2
- YODBPLSWNJMZOJ-BPUTZDHNSA-N Asp-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N YODBPLSWNJMZOJ-BPUTZDHNSA-N 0.000 description 2
- MRYDJCIIVRXVGG-QEJZJMRPSA-N Asp-Trp-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O MRYDJCIIVRXVGG-QEJZJMRPSA-N 0.000 description 2
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 2
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 2
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 235000000832 Ayote Nutrition 0.000 description 2
- 239000005884 Beta-Cyfluthrin Substances 0.000 description 2
- 235000006008 Brassica napus var napus Nutrition 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 241000193417 Brevibacillus laterosporus Species 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 2
- 241000034870 Chrysoteuchia culmella Species 0.000 description 2
- 239000005888 Clothianidin Substances 0.000 description 2
- 235000009854 Cucurbita moschata Nutrition 0.000 description 2
- 240000001980 Cucurbita pepo Species 0.000 description 2
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 2
- 239000005946 Cypermethrin Substances 0.000 description 2
- GMXSSZUVDNPRMA-FXQIFTODSA-N Cys-Arg-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GMXSSZUVDNPRMA-FXQIFTODSA-N 0.000 description 2
- OIMUAKUQOUEPCZ-WHFBIAKZSA-N Cys-Asn-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIMUAKUQOUEPCZ-WHFBIAKZSA-N 0.000 description 2
- GSNRZJNHMVMOFV-ACZMJKKPSA-N Cys-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N GSNRZJNHMVMOFV-ACZMJKKPSA-N 0.000 description 2
- XRTISHJEPHMBJG-SRVKXCTJSA-N Cys-Asp-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XRTISHJEPHMBJG-SRVKXCTJSA-N 0.000 description 2
- BPHKULHWEIUDOB-FXQIFTODSA-N Cys-Gln-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BPHKULHWEIUDOB-FXQIFTODSA-N 0.000 description 2
- UDPSLLFHOLGXBY-FXQIFTODSA-N Cys-Glu-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDPSLLFHOLGXBY-FXQIFTODSA-N 0.000 description 2
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 2
- JAHCWGSVNZXHRR-SVSWQMSJSA-N Cys-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)N JAHCWGSVNZXHRR-SVSWQMSJSA-N 0.000 description 2
- 239000005894 Emamectin Substances 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 108090000371 Esterases Proteins 0.000 description 2
- 239000005899 Fipronil Substances 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 2
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 2
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 2
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 2
- KWLMLNHADZIJIS-CIUDSAMLSA-N Gln-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N KWLMLNHADZIJIS-CIUDSAMLSA-N 0.000 description 2
- DXMPMSWUZVNBSG-QEJZJMRPSA-N Gln-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N DXMPMSWUZVNBSG-QEJZJMRPSA-N 0.000 description 2
- OIIIRRTWYLCQNW-ACZMJKKPSA-N Gln-Cys-Asn Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O OIIIRRTWYLCQNW-ACZMJKKPSA-N 0.000 description 2
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 2
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 2
- GHYJGDCPHMSFEJ-GUBZILKMSA-N Gln-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GHYJGDCPHMSFEJ-GUBZILKMSA-N 0.000 description 2
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 2
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 2
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 2
- KHGGWBRVRPHFMH-PEFMBERDSA-N Gln-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHGGWBRVRPHFMH-PEFMBERDSA-N 0.000 description 2
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 2
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 2
- RWCBJYUPAUTWJD-NHCYSSNCSA-N Gln-Met-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O RWCBJYUPAUTWJD-NHCYSSNCSA-N 0.000 description 2
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 2
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 2
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 2
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 2
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 2
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 2
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 2
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 2
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 2
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 2
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 2
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 2
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 2
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 2
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 2
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 2
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 2
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 2
- FLQAKQOBSPFGKG-CIUDSAMLSA-N Glu-Cys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLQAKQOBSPFGKG-CIUDSAMLSA-N 0.000 description 2
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 2
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 2
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- GGJOGFJIPPGNRK-JSGCOSHPSA-N Glu-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 GGJOGFJIPPGNRK-JSGCOSHPSA-N 0.000 description 2
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 2
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 2
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 2
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 2
- UMHRCVCZUPBBQW-GARJFASQSA-N Glu-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UMHRCVCZUPBBQW-GARJFASQSA-N 0.000 description 2
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 2
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 2
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 2
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 2
- TZXOPHFCAATANZ-QEJZJMRPSA-N Glu-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N TZXOPHFCAATANZ-QEJZJMRPSA-N 0.000 description 2
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 2
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 2
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 2
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- QVXWAFZDWRLXTI-NWLDYVSISA-N Glu-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QVXWAFZDWRLXTI-NWLDYVSISA-N 0.000 description 2
- ZNOHKCPYDAYYDA-BPUTZDHNSA-N Glu-Trp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZNOHKCPYDAYYDA-BPUTZDHNSA-N 0.000 description 2
- RXJFSLQVMGYQEL-IHRRRGAJSA-N Glu-Tyr-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 RXJFSLQVMGYQEL-IHRRRGAJSA-N 0.000 description 2
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 2
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- NEDQVOQDDBCRGG-UHFFFAOYSA-N Gly Gly Thr Tyr Chemical compound NCC(=O)NCC(=O)NC(C(O)C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 NEDQVOQDDBCRGG-UHFFFAOYSA-N 0.000 description 2
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 2
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 2
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 2
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 2
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 2
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 2
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 2
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 2
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 2
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 2
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 2
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 2
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 2
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 2
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 2
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 2
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 2
- MREVELMMFOLESM-HOCLYGCPSA-N Gly-Trp-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O MREVELMMFOLESM-HOCLYGCPSA-N 0.000 description 2
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 2
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 2
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 2
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 241000219146 Gossypium Species 0.000 description 2
- 241000256244 Heliothis virescens Species 0.000 description 2
- TVQGUFGDVODUIF-LSJOCFKGSA-N His-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N TVQGUFGDVODUIF-LSJOCFKGSA-N 0.000 description 2
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 2
- MWXBCJKQRQFVOO-DCAQKATOSA-N His-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CN=CN1)N MWXBCJKQRQFVOO-DCAQKATOSA-N 0.000 description 2
- IDQNVIWPPWAFSY-AVGNSLFASA-N His-His-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O IDQNVIWPPWAFSY-AVGNSLFASA-N 0.000 description 2
- MPXGJGBXCRQQJE-MXAVVETBSA-N His-Ile-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O MPXGJGBXCRQQJE-MXAVVETBSA-N 0.000 description 2
- CTEMYIWDSVICKS-WDSOQIARSA-N His-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N CTEMYIWDSVICKS-WDSOQIARSA-N 0.000 description 2
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 2
- VDHOMPFVSABJKU-ULQDDVLXSA-N His-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N VDHOMPFVSABJKU-ULQDDVLXSA-N 0.000 description 2
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 2
- FOCSWPCHUDVNLP-PMVMPFDFSA-N His-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC4=CN=CN4)N FOCSWPCHUDVNLP-PMVMPFDFSA-N 0.000 description 2
- WYKXJGWSJUULSL-AVGNSLFASA-N His-Val-Arg Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O WYKXJGWSJUULSL-AVGNSLFASA-N 0.000 description 2
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 2
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 2
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 2
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 2
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 2
- DMHGKBGOUAJRHU-RVMXOQNASA-N Ile-Arg-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N DMHGKBGOUAJRHU-RVMXOQNASA-N 0.000 description 2
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 2
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 2
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 2
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 2
- LEDRIAHEWDJRMF-CFMVVWHZSA-N Ile-Asn-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LEDRIAHEWDJRMF-CFMVVWHZSA-N 0.000 description 2
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 2
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 2
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 2
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 2
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 2
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 2
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 2
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 2
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 2
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 2
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 2
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 2
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 2
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 2
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 2
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 2
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 2
- 239000005906 Imidacloprid Substances 0.000 description 2
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- BAJIJEGGUYXZGC-CIUDSAMLSA-N Leu-Asn-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BAJIJEGGUYXZGC-CIUDSAMLSA-N 0.000 description 2
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 2
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 2
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 2
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 2
- NFHJQETXTSDZSI-DCAQKATOSA-N Leu-Cys-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NFHJQETXTSDZSI-DCAQKATOSA-N 0.000 description 2
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 2
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 2
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 2
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 2
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 2
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 2
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 2
- HMDDEJADNKQTBR-BZSNNMDCSA-N Leu-His-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMDDEJADNKQTBR-BZSNNMDCSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 2
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 2
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 2
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 2
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- YXTKSLRSRXKXNV-IHRRRGAJSA-N Lys-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N YXTKSLRSRXKXNV-IHRRRGAJSA-N 0.000 description 2
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 2
- JYVCOTWSRGFABJ-DCAQKATOSA-N Lys-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N JYVCOTWSRGFABJ-DCAQKATOSA-N 0.000 description 2
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 2
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 2
- DYJOORGDQIGZAS-DCAQKATOSA-N Lys-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N DYJOORGDQIGZAS-DCAQKATOSA-N 0.000 description 2
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 2
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 2
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 2
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 2
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- XUMBMVFBXHLACL-UHFFFAOYSA-N Melanin Chemical compound O=C1C(=O)C(C2=CNC3=C(C(C(=O)C4=C32)=O)C)=C2C4=CNC2=C1C XUMBMVFBXHLACL-UHFFFAOYSA-N 0.000 description 2
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 2
- IIPHCNKHEZYSNE-DCAQKATOSA-N Met-Arg-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O IIPHCNKHEZYSNE-DCAQKATOSA-N 0.000 description 2
- HKRYNJSKVLZIFP-IHRRRGAJSA-N Met-Asn-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HKRYNJSKVLZIFP-IHRRRGAJSA-N 0.000 description 2
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 2
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 2
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 2
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 2
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 2
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- SEQKRHFRPICQDD-UHFFFAOYSA-N N-tris(hydroxymethyl)methylglycine Chemical compound OCC(CO)(CO)[NH2+]CC([O-])=O SEQKRHFRPICQDD-UHFFFAOYSA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 108010033272 Nitrilase Proteins 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 108091005461 Nucleic proteins Chemical group 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 2
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 2
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 2
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 2
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 2
- UMKYAYXCMYYNHI-AVGNSLFASA-N Phe-Gln-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N UMKYAYXCMYYNHI-AVGNSLFASA-N 0.000 description 2
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 2
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 2
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 2
- SWCOXQLDICUYOL-ULQDDVLXSA-N Phe-His-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SWCOXQLDICUYOL-ULQDDVLXSA-N 0.000 description 2
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 2
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 2
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 2
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 2
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 2
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 2
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 2
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 2
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 2
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 2
- 235000014676 Phragmites communis Nutrition 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- KDIIENQUNVNWHR-JYJNAYRXSA-N Pro-Arg-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KDIIENQUNVNWHR-JYJNAYRXSA-N 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 2
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 2
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 2
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 2
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 2
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 2
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 2
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 2
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 2
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 2
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 2
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 2
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 2
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 2
- 239000005925 Pymetrozine Substances 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 241001400590 Richia Species 0.000 description 2
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 2
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 2
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 2
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 2
- CTRHXXXHUJTTRZ-ZLUOBGJFSA-N Ser-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O CTRHXXXHUJTTRZ-ZLUOBGJFSA-N 0.000 description 2
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 2
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 2
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 2
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 2
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 2
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 2
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 2
- MOQDPPUMFSMYOM-KKUMJFAQSA-N Ser-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N MOQDPPUMFSMYOM-KKUMJFAQSA-N 0.000 description 2
- ZUDXUJSYCCNZQJ-DCAQKATOSA-N Ser-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N ZUDXUJSYCCNZQJ-DCAQKATOSA-N 0.000 description 2
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 2
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 2
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 2
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 2
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 2
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 2
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 2
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 2
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 2
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 2
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 2
- SOACHCFYJMCMHC-BWBBJGPYSA-N Ser-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O SOACHCFYJMCMHC-BWBBJGPYSA-N 0.000 description 2
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 2
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 2
- AXKJPUBALUNJEO-UBHSHLNASA-N Ser-Trp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O AXKJPUBALUNJEO-UBHSHLNASA-N 0.000 description 2
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 2
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 2
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 2
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 2
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 2
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 2
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 2
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 2
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 2
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 2
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 2
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 2
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 2
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 2
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 2
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 2
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 2
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 2
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 2
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 2
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 2
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 2
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 2
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 2
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 2
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 2
- FDALPRWYVKJCLL-PMVVWTBXSA-N Thr-His-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O FDALPRWYVKJCLL-PMVVWTBXSA-N 0.000 description 2
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 2
- UDNVOQMPQBEITB-MEYUZBJRSA-N Thr-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UDNVOQMPQBEITB-MEYUZBJRSA-N 0.000 description 2
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 2
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 2
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 2
- DDDLIMCZFKOERC-SVSWQMSJSA-N Thr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N DDDLIMCZFKOERC-SVSWQMSJSA-N 0.000 description 2
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 2
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 2
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 2
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 2
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 2
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 2
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 2
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 2
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 2
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 2
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 2
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 2
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 2
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 2
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 241000499912 Trichoderma reesei Species 0.000 description 2
- 239000005942 Triflumuron Substances 0.000 description 2
- PXQPYPMSLBQHJJ-WFBYXXMGSA-N Trp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PXQPYPMSLBQHJJ-WFBYXXMGSA-N 0.000 description 2
- VTHNLRXALGUDBS-BPUTZDHNSA-N Trp-Gln-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VTHNLRXALGUDBS-BPUTZDHNSA-N 0.000 description 2
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 2
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 2
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 2
- WKQNLTQSCYXKQK-VFAJRCTISA-N Trp-Lys-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WKQNLTQSCYXKQK-VFAJRCTISA-N 0.000 description 2
- OJKVFAWXPGCJMF-BPUTZDHNSA-N Trp-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)N[C@@H](CO)C(=O)O OJKVFAWXPGCJMF-BPUTZDHNSA-N 0.000 description 2
- MPYZGXUYLNPSNF-NAZCDGGXSA-N Trp-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O MPYZGXUYLNPSNF-NAZCDGGXSA-N 0.000 description 2
- LNGFWVPNKLWATF-ZVZYQTTQSA-N Trp-Val-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LNGFWVPNKLWATF-ZVZYQTTQSA-N 0.000 description 2
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 2
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 2
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 2
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 2
- UMXSDHPSMROQRB-YJRXYDGGSA-N Tyr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UMXSDHPSMROQRB-YJRXYDGGSA-N 0.000 description 2
- UXUFNBVCPAWACG-SIUGBPQLSA-N Tyr-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N UXUFNBVCPAWACG-SIUGBPQLSA-N 0.000 description 2
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 2
- FMOSEWZYZPMJAL-KKUMJFAQSA-N Tyr-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N FMOSEWZYZPMJAL-KKUMJFAQSA-N 0.000 description 2
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 2
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 2
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 2
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 2
- YYZPVPJCOGGQPC-JYJNAYRXSA-N Tyr-His-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYZPVPJCOGGQPC-JYJNAYRXSA-N 0.000 description 2
- WPXKRJVHBXYLDT-JUKXBJQTSA-N Tyr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPXKRJVHBXYLDT-JUKXBJQTSA-N 0.000 description 2
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 2
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 2
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 2
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 2
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 2
- SCZJKZLFSSPJDP-ACRUOGEOSA-N Tyr-Phe-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SCZJKZLFSSPJDP-ACRUOGEOSA-N 0.000 description 2
- MNWINJDPGBNOED-ULQDDVLXSA-N Tyr-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 MNWINJDPGBNOED-ULQDDVLXSA-N 0.000 description 2
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 2
- VSYROIRKNBCULO-BWAGICSOSA-N Tyr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O VSYROIRKNBCULO-BWAGICSOSA-N 0.000 description 2
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 2
- QRCBQDPRKMYTMB-IHPCNDPISA-N Tyr-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N QRCBQDPRKMYTMB-IHPCNDPISA-N 0.000 description 2
- GZWPQZDVTBZVEP-BZSNNMDCSA-N Tyr-Tyr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O GZWPQZDVTBZVEP-BZSNNMDCSA-N 0.000 description 2
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 2
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 2
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 2
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 2
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 2
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 2
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 2
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 2
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 2
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 2
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 2
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 2
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 2
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 2
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 2
- AHHJARQXFFGOKF-NRPADANISA-N Val-Glu-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N AHHJARQXFFGOKF-NRPADANISA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- GMOLURHJBLOBFW-ONGXEEELSA-N Val-Gly-His Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMOLURHJBLOBFW-ONGXEEELSA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 2
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 2
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 2
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 2
- SVFRYKBZHUGKLP-QXEWZRGKSA-N Val-Met-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVFRYKBZHUGKLP-QXEWZRGKSA-N 0.000 description 2
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 2
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 2
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 2
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 2
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 2
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 2
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 2
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 2
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 2
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- UFCHCOKFAGOQSF-BQFCYCMXSA-N Val-Trp-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N UFCHCOKFAGOQSF-BQFCYCMXSA-N 0.000 description 2
- OEVFFOBAXHBXKM-HSHDSVGOSA-N Val-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N)O OEVFFOBAXHBXKM-HSHDSVGOSA-N 0.000 description 2
- VBTFUDNTMCHPII-UHFFFAOYSA-N Val-Trp-Tyr Natural products C=1NC2=CC=CC=C2C=1CC(NC(=O)C(N)C(C)C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 VBTFUDNTMCHPII-UHFFFAOYSA-N 0.000 description 2
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 2
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 2
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 2
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 2
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 2
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- QQODLKZGRKWIFG-RUTXASTPSA-N [(R)-cyano-(4-fluoro-3-phenoxyphenyl)methyl] (1S)-3-(2,2-dichloroethenyl)-2,2-dimethylcyclopropane-1-carboxylate Chemical compound CC1(C)C(C=C(Cl)Cl)[C@@H]1C(=O)O[C@@H](C#N)C1=CC=C(F)C(OC=2C=CC=CC=2)=C1 QQODLKZGRKWIFG-RUTXASTPSA-N 0.000 description 2
- 108010093941 acetylxylan esterase Proteins 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 108010030291 alpha-Galactosidase Proteins 0.000 description 2
- 108010061314 alpha-L-Fucosidase Proteins 0.000 description 2
- 108010044879 alpha-L-rhamnosidase Proteins 0.000 description 2
- 108010012864 alpha-Mannosidase Proteins 0.000 description 2
- 229960002587 amitraz Drugs 0.000 description 2
- QXAITBQSYVNQDR-ZIOPAAQOSA-N amitraz Chemical compound C=1C=C(C)C=C(C)C=1/N=C/N(C)\C=N\C1=CC=C(C)C=C1C QXAITBQSYVNQDR-ZIOPAAQOSA-N 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 108010019077 beta-Amylase Proteins 0.000 description 2
- 108010047754 beta-Glucosidase Proteins 0.000 description 2
- 230000029918 bioluminescence Effects 0.000 description 2
- 238000005415 bioluminescence Methods 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 108010005400 cutinase Proteins 0.000 description 2
- 229960001591 cyfluthrin Drugs 0.000 description 2
- QQODLKZGRKWIFG-QSFXBCCZSA-N cyfluthrin Chemical compound CC1(C)[C@@H](C=C(Cl)Cl)[C@H]1C(=O)O[C@@H](C#N)C1=CC=C(F)C(OC=2C=CC=CC=2)=C1 QQODLKZGRKWIFG-QSFXBCCZSA-N 0.000 description 2
- ZXQYGBMAQZUVMI-UNOMPAQXSA-N cyhalothrin Chemical compound CC1(C)C(\C=C(/Cl)C(F)(F)F)C1C(=O)OC(C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 ZXQYGBMAQZUVMI-UNOMPAQXSA-N 0.000 description 2
- 229960005424 cypermethrin Drugs 0.000 description 2
- KAATUXNTWXVJKI-UHFFFAOYSA-N cypermethrin Chemical compound CC1(C)C(C=C(Cl)Cl)C1C(=O)OC(C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 KAATUXNTWXVJKI-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- MCWXGJITAZMZEV-UHFFFAOYSA-N dimethoate Chemical compound CNC(=O)CSP(=S)(OC)OC MCWXGJITAZMZEV-UHFFFAOYSA-N 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 239000012153 distilled water Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000012149 elution buffer Substances 0.000 description 2
- CXEGAUYXQAKHKJ-NSBHKLITSA-N emamectin B1a Chemical compound C1=C[C@H](C)[C@@H]([C@@H](C)CC)O[C@]11O[C@H](C\C=C(C)\[C@@H](O[C@@H]2O[C@@H](C)[C@H](O[C@@H]3O[C@@H](C)[C@H](NC)[C@@H](OC)C3)[C@@H](OC)C2)[C@@H](C)\C=C\C=C/2[C@]3([C@H](C(=O)O4)C=C(C)[C@@H](O)[C@H]3OC\2)O)C[C@H]4C1 CXEGAUYXQAKHKJ-NSBHKLITSA-N 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 229960003276 erythromycin Drugs 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 229940013764 fipronil Drugs 0.000 description 2
- RYLHNOVXKPXDIP-UHFFFAOYSA-N flufenoxuron Chemical compound C=1C=C(NC(=O)NC(=O)C=2C(=CC=CC=2F)F)C(F)=CC=1OC1=CC=C(C(F)(F)F)C=C1Cl RYLHNOVXKPXDIP-UHFFFAOYSA-N 0.000 description 2
- 239000013568 food allergen Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 239000008187 granular material Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010002430 hemicellulase Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 229940056881 imidacloprid Drugs 0.000 description 2
- YWTYJOPNNQFBPC-UHFFFAOYSA-N imidacloprid Chemical compound [O-][N+](=O)\N=C1/NCCN1CC1=CC=C(Cl)N=C1 YWTYJOPNNQFBPC-UHFFFAOYSA-N 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 230000009571 larval growth Effects 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 210000004379 membrane Anatomy 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- SXTAYKAGBXMACB-UHFFFAOYSA-N methionine sulfoximine Chemical compound CS(=N)(=O)CCC(N)C(O)=O SXTAYKAGBXMACB-UHFFFAOYSA-N 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 108010034507 methionyltryptophan Proteins 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- YTYGAJLZOJPJGH-UHFFFAOYSA-N noviflumuron Chemical compound FC1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=C(Cl)C=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F YTYGAJLZOJPJGH-UHFFFAOYSA-N 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 150000004804 polysaccharides Chemical class 0.000 description 2
- 235000012015 potatoes Nutrition 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 238000002331 protein detection Methods 0.000 description 2
- 235000015136 pumpkin Nutrition 0.000 description 2
- QHMTXANCGGJZRX-WUXMJOGZSA-N pymetrozine Chemical compound C1C(C)=NNC(=O)N1\N=C\C1=CC=CN=C1 QHMTXANCGGJZRX-WUXMJOGZSA-N 0.000 description 2
- NHDHVHZZCFYRSB-UHFFFAOYSA-N pyriproxyfen Chemical compound C=1C=CC=NC=1OC(C)COC(C=C1)=CC=C1OC1=CC=CC=C1 NHDHVHZZCFYRSB-UHFFFAOYSA-N 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000013605 shuttle vector Substances 0.000 description 2
- SQGYOTSLMSWVJD-UHFFFAOYSA-N silver(1+) nitrate Chemical compound [Ag+].[O-]N(=O)=O SQGYOTSLMSWVJD-UHFFFAOYSA-N 0.000 description 2
- 238000002791 soaking Methods 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- BAKXBZPQTXCKRR-UHFFFAOYSA-N thiodicarb Chemical compound CSC(C)=NOC(=O)NSNC(=O)ON=C(C)SC BAKXBZPQTXCKRR-UHFFFAOYSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- XAIPTRIXGHTTNT-UHFFFAOYSA-N triflumuron Chemical compound C1=CC(OC(F)(F)F)=CC=C1NC(=O)NC(=O)C1=CC=CC=C1Cl XAIPTRIXGHTTNT-UHFFFAOYSA-N 0.000 description 2
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 210000003934 vacuole Anatomy 0.000 description 2
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- ZXQYGBMAQZUVMI-RDDWSQKMSA-N (1S)-cis-(alphaR)-cyhalothrin Chemical compound CC1(C)[C@H](\C=C(/Cl)C(F)(F)F)[C@@H]1C(=O)O[C@@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 ZXQYGBMAQZUVMI-RDDWSQKMSA-N 0.000 description 1
- LZTIMERBDGGAJD-SNAWJCMRSA-N (2e)-2-(nitromethylidene)-1,3-thiazinane Chemical compound [O-][N+](=O)\C=C1/NCCCS1 LZTIMERBDGGAJD-SNAWJCMRSA-N 0.000 description 1
- XUNYDVLIZWUPAW-UHFFFAOYSA-N (4-chlorophenyl) n-(4-methylphenyl)sulfonylcarbamate Chemical compound C1=CC(C)=CC=C1S(=O)(=O)NC(=O)OC1=CC=C(Cl)C=C1 XUNYDVLIZWUPAW-UHFFFAOYSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- FCHBECOAGZMTFE-ZEQKJWHPSA-N (6r,7r)-3-[[2-[[4-(dimethylamino)phenyl]diazenyl]pyridin-1-ium-1-yl]methyl]-8-oxo-7-[(2-thiophen-2-ylacetyl)amino]-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylate Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=CC=[N+]1CC1=C(C([O-])=O)N2C(=O)[C@@H](NC(=O)CC=3SC=CC=3)[C@H]2SC1 FCHBECOAGZMTFE-ZEQKJWHPSA-N 0.000 description 1
- WCXDHFDTOYPNIE-RIYZIHGNSA-N (E)-acetamiprid Chemical compound N#C/N=C(\C)N(C)CC1=CC=C(Cl)N=C1 WCXDHFDTOYPNIE-RIYZIHGNSA-N 0.000 description 1
- FYADHXFMURLYQI-UHFFFAOYSA-N 1,2,4-triazine Chemical compound C1=CN=NC=N1 FYADHXFMURLYQI-UHFFFAOYSA-N 0.000 description 1
- JIHQDMXYYFUGFV-UHFFFAOYSA-N 1,3,5-triazine Chemical compound C1=NC=NC=N1 JIHQDMXYYFUGFV-UHFFFAOYSA-N 0.000 description 1
- 108020004465 16S ribosomal RNA Proteins 0.000 description 1
- NDUPDOJHUQKPAG-UHFFFAOYSA-M 2,2-Dichloropropanoate Chemical compound CC(Cl)(Cl)C([O-])=O NDUPDOJHUQKPAG-UHFFFAOYSA-M 0.000 description 1
- GOCUAJYOYBLQRH-UHFFFAOYSA-N 2-(4-{[3-chloro-5-(trifluoromethyl)pyridin-2-yl]oxy}phenoxy)propanoic acid Chemical compound C1=CC(OC(C)C(O)=O)=CC=C1OC1=NC=C(C(F)(F)F)C=C1Cl GOCUAJYOYBLQRH-UHFFFAOYSA-N 0.000 description 1
- ZUYKJZQOPXDNOK-UHFFFAOYSA-N 2-(ethylamino)-2-thiophen-2-ylcyclohexan-1-one;hydrochloride Chemical class Cl.C=1C=CSC=1C1(NCC)CCCCC1=O ZUYKJZQOPXDNOK-UHFFFAOYSA-N 0.000 description 1
- SXERGJJQSKIUIC-UHFFFAOYSA-N 2-Phenoxypropionic acid Chemical class OC(=O)C(C)OC1=CC=CC=C1 SXERGJJQSKIUIC-UHFFFAOYSA-N 0.000 description 1
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 1
- AXAVXPMQTGXXJZ-UHFFFAOYSA-N 2-aminoacetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound NCC(O)=O.OCC(N)(CO)CO AXAVXPMQTGXXJZ-UHFFFAOYSA-N 0.000 description 1
- UPMXNNIRAGDFEH-UHFFFAOYSA-N 3,5-dibromo-4-hydroxybenzonitrile Chemical compound OC1=C(Br)C=C(C#N)C=C1Br UPMXNNIRAGDFEH-UHFFFAOYSA-N 0.000 description 1
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 1
- HUNCSWANZMJLPM-UHFFFAOYSA-N 5-methyltryptophan Chemical compound CC1=CC=C2NC=C(CC(N)C(O)=O)C2=C1 HUNCSWANZMJLPM-UHFFFAOYSA-N 0.000 description 1
- IBSREHMXUMOFBB-JFUDTMANSA-N 5u8924t11h Chemical compound O1[C@@H](C)[C@H](O)[C@@H](OC)C[C@@H]1O[C@@H]1[C@@H](OC)C[C@H](O[C@@H]2C(=C/C[C@@H]3C[C@@H](C[C@@]4(O3)C=C[C@H](C)[C@@H](C(C)C)O4)OC(=O)[C@@H]3C=C(C)[C@@H](O)[C@H]4OC\C([C@@]34O)=C/C=C/[C@@H]2C)/C)O[C@H]1C.C1=C[C@H](C)[C@@H]([C@@H](C)CC)O[C@]11O[C@H](C\C=C(C)\[C@@H](O[C@@H]2O[C@@H](C)[C@H](O[C@@H]3O[C@@H](C)[C@H](O)[C@@H](OC)C3)[C@@H](OC)C2)[C@@H](C)\C=C\C=C/2[C@]3([C@H](C(=O)O4)C=C(C)[C@@H](O)[C@H]3OC\2)O)C[C@H]4C1 IBSREHMXUMOFBB-JFUDTMANSA-N 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- 241000238876 Acari Species 0.000 description 1
- 239000005875 Acetamiprid Substances 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 101150021974 Adh1 gene Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000449794 Alabama argillacea Species 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 244000291564 Allium cepa Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 240000002234 Allium sativum Species 0.000 description 1
- 244000144730 Amygdalus persica Species 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 208000031295 Animal disease Diseases 0.000 description 1
- 101710117679 Anthocyanidin 3-O-glucosyltransferase Proteins 0.000 description 1
- 108010037870 Anthranilate Synthase Proteins 0.000 description 1
- 241000625753 Anticarsia Species 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 238000006677 Appel reaction Methods 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 241000511859 Aproaerema anthyllidella Species 0.000 description 1
- 101710152845 Arabinogalactan endo-beta-1,4-galactanase Proteins 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 244000003416 Asparagus officinalis Species 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241001513093 Aspergillus awamori Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 239000005878 Azadirachtin Substances 0.000 description 1
- 108700003860 Bacterial Genes Proteins 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 239000005874 Bifenthrin Substances 0.000 description 1
- 241000167854 Bourreria succulenta Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 241000555281 Brevibacillus Species 0.000 description 1
- 239000005489 Bromoxynil Substances 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- JFLRKDZMHNBDQS-UCQUSYKYSA-N CC[C@H]1CCC[C@@H]([C@H](C(=O)C2=C[C@H]3[C@@H]4C[C@@H](C[C@H]4C(=C[C@H]3[C@@H]2CC(=O)O1)C)O[C@H]5[C@@H]([C@@H]([C@H]([C@@H](O5)C)OC)OC)OC)C)O[C@H]6CC[C@@H]([C@H](O6)C)N(C)C.CC[C@H]1CCC[C@@H]([C@H](C(=O)C2=C[C@H]3[C@@H]4C[C@@H](C[C@H]4C=C[C@H]3C2CC(=O)O1)O[C@H]5[C@@H]([C@@H]([C@H]([C@@H](O5)C)OC)OC)OC)C)O[C@H]6CC[C@@H]([C@H](O6)C)N(C)C Chemical compound CC[C@H]1CCC[C@@H]([C@H](C(=O)C2=C[C@H]3[C@@H]4C[C@@H](C[C@H]4C(=C[C@H]3[C@@H]2CC(=O)O1)C)O[C@H]5[C@@H]([C@@H]([C@H]([C@@H](O5)C)OC)OC)OC)C)O[C@H]6CC[C@@H]([C@H](O6)C)N(C)C.CC[C@H]1CCC[C@@H]([C@H](C(=O)C2=C[C@H]3[C@@H]4C[C@@H](C[C@H]4C=C[C@H]3C2CC(=O)O1)O[C@H]5[C@@H]([C@@H]([C@H]([C@@H](O5)C)OC)OC)OC)C)O[C@H]6CC[C@@H]([C@H](O6)C)N(C)C JFLRKDZMHNBDQS-UCQUSYKYSA-N 0.000 description 1
- 101150078024 CRY2 gene Proteins 0.000 description 1
- 101150053424 CRYGC gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 241000747028 Cestrum yellow leaf curling virus Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- RAPBNVDSDCTNRC-UHFFFAOYSA-N Chlorobenzilate Chemical compound C=1C=C(Cl)C=CC=1C(O)(C(=O)OCC)C1=CC=C(Cl)C=C1 RAPBNVDSDCTNRC-UHFFFAOYSA-N 0.000 description 1
- 108700031407 Chloroplast Genes Proteins 0.000 description 1
- 108010089254 Cholesterol oxidase Proteins 0.000 description 1
- 108091060290 Chromatid Proteins 0.000 description 1
- 235000007542 Cichorium intybus Nutrition 0.000 description 1
- 244000298479 Cichorium intybus Species 0.000 description 1
- 241000098277 Cnaphalocrocis Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 101150102464 Cry1 gene Proteins 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 241000219130 Cucurbita pepo subsp. pepo Species 0.000 description 1
- 235000003954 Cucurbita pepo var melopepo Nutrition 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 description 1
- 235000017788 Cydonia oblonga Nutrition 0.000 description 1
- 239000005891 Cyromazine Substances 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 239000005892 Deltamethrin Substances 0.000 description 1
- 241000122105 Diatraea Species 0.000 description 1
- LWLJUMBEZJHXHV-UHFFFAOYSA-N Dienochlor Chemical compound ClC1=C(Cl)C(Cl)=C(Cl)C1(Cl)C1(Cl)C(Cl)=C(Cl)C(Cl)=C1Cl LWLJUMBEZJHXHV-UHFFFAOYSA-N 0.000 description 1
- 108010082495 Dietary Plant Proteins Proteins 0.000 description 1
- 239000005893 Diflubenzuron Substances 0.000 description 1
- 239000005947 Dimethoate Substances 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- AHMIDUVKSGCHAU-UHFFFAOYSA-N Dopaquinone Natural products OC(=O)C(N)CC1=CC(=O)C(=O)C=C1 AHMIDUVKSGCHAU-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 108010001817 Endo-1,4-beta Xylanases Proteins 0.000 description 1
- 101710147028 Endo-beta-1,4-galactanase Proteins 0.000 description 1
- 102100023882 Endoribonuclease ZC3H12A Human genes 0.000 description 1
- 101710112715 Endoribonuclease ZC3H12A Proteins 0.000 description 1
- 241001555556 Ephestia elutella Species 0.000 description 1
- 102100023164 Epididymis-specific alpha-mannosidase Human genes 0.000 description 1
- 101100437498 Escherichia coli (strain K12) uidA gene Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 239000005895 Esfenvalerate Substances 0.000 description 1
- FNELVJVBIYMIMC-UHFFFAOYSA-N Ethiprole Chemical compound N1=C(C#N)C(S(=O)CC)=C(N)N1C1=C(Cl)C=C(C(F)(F)F)C=C1Cl FNELVJVBIYMIMC-UHFFFAOYSA-N 0.000 description 1
- 239000005958 Fenamiphos (aka phenamiphos) Substances 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 1
- 108050008938 Glucoamylases Proteins 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 239000005561 Glufosinate Substances 0.000 description 1
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 241000258937 Hemiptera Species 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 1
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 238000009015 Human TaqMan MicroRNA Assay kit Methods 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 241000257303 Hymenoptera Species 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- 239000005907 Indoxacarb Substances 0.000 description 1
- 206010061217 Infestation Diseases 0.000 description 1
- IMQLKJBTEOYOSI-GPIVLXJGSA-N Inositol-hexakisphosphate Chemical compound OP(O)(=O)O[C@H]1[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O IMQLKJBTEOYOSI-GPIVLXJGSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 241001495069 Ischnocera Species 0.000 description 1
- 241000588744 Klebsiella pneumoniae subsp. ozaenae Species 0.000 description 1
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- AHMIDUVKSGCHAU-LURJTMIESA-N L-dopaquinone Chemical compound [O-]C(=O)[C@@H]([NH3+])CC1=CC(=O)C(=O)C=C1 AHMIDUVKSGCHAU-LURJTMIESA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108010029541 Laccase Proteins 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 1
- 241000710118 Maize chlorotic mottle virus Species 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 101150054907 Mrps12 gene Proteins 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 101150014068 PPIP5K1 gene Proteins 0.000 description 1
- 102100026367 Pancreatic alpha-amylase Human genes 0.000 description 1
- 102100033359 Pancreatic triacylglycerol lipase Human genes 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- ZKSLXIGKRJMALF-MGHWNKPDSA-N Phe-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N ZKSLXIGKRJMALF-MGHWNKPDSA-N 0.000 description 1
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- 108091000041 Phosphoenolpyruvate Carboxylase Proteins 0.000 description 1
- 102100035362 Phosphomannomutase 2 Human genes 0.000 description 1
- 241001674048 Phthiraptera Species 0.000 description 1
- IMQLKJBTEOYOSI-UHFFFAOYSA-N Phytic acid Natural products OP(O)(=O)OC1C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C1OP(O)(O)=O IMQLKJBTEOYOSI-UHFFFAOYSA-N 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 239000005923 Pirimicarb Substances 0.000 description 1
- 241000242594 Platyhelminthes Species 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 108010059820 Polygalacturonase Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108020001991 Protoporphyrinogen Oxidase Proteins 0.000 description 1
- 102000005135 Protoporphyrinogen oxidase Human genes 0.000 description 1
- 235000009827 Prunus armeniaca Nutrition 0.000 description 1
- 244000018633 Prunus armeniaca Species 0.000 description 1
- 235000006029 Prunus persica var nucipersica Nutrition 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 244000017714 Prunus persica var. nucipersica Species 0.000 description 1
- 241001646398 Pseudomonas chlororaphis Species 0.000 description 1
- 239000005927 Pyriproxyfen Substances 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 108010066717 Q beta Replicase Proteins 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 101100120298 Rattus norvegicus Flot1 gene Proteins 0.000 description 1
- 101100412401 Rattus norvegicus Reg3a gene Proteins 0.000 description 1
- 101100412403 Rattus norvegicus Reg3b gene Proteins 0.000 description 1
- 108700005079 Recessive Genes Proteins 0.000 description 1
- 102000052708 Recessive Genes Human genes 0.000 description 1
- 241000235403 Rhizomucor miehei Species 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 240000007651 Rubus glaucus Species 0.000 description 1
- 101100199945 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rps1201 gene Proteins 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 241000931987 Sesamia Species 0.000 description 1
- 241000563489 Sesamia inferens Species 0.000 description 1
- CSPPKDPQLUUTND-NBVRZTHBSA-N Sethoxydim Chemical compound CCO\N=C(/CCC)C1=C(O)CC(CC(C)SCC)CC1=O CSPPKDPQLUUTND-NBVRZTHBSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- UIIMBOGNXHQVGW-DEQYMQKBSA-M Sodium bicarbonate-14C Chemical compound [Na+].O[14C]([O-])=O UIIMBOGNXHQVGW-DEQYMQKBSA-M 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000592344 Spermatophyta Species 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 239000005930 Spinosad Substances 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- UZMAPBJVXOGOFT-UHFFFAOYSA-N Syringetin Natural products COC1=C(O)C(OC)=CC(C2=C(C(=O)C3=C(O)C=C(O)C=C3O2)O)=C1 UZMAPBJVXOGOFT-UHFFFAOYSA-N 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- 241000656145 Thyrsites atun Species 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 239000007997 Tricine buffer Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- BCOBSVIZMQXKFY-KKUMJFAQSA-N Tyr-Ser-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O BCOBSVIZMQXKFY-KKUMJFAQSA-N 0.000 description 1
- OJCISMMNNUNNJA-BZSNNMDCSA-N Tyr-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 OJCISMMNNUNNJA-BZSNNMDCSA-N 0.000 description 1
- 102000003425 Tyrosinase Human genes 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- 244000078534 Vaccinium myrtillus Species 0.000 description 1
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 101150067314 aadA gene Proteins 0.000 description 1
- 229950008167 abamectin Drugs 0.000 description 1
- 230000036579 abiotic stress Effects 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- YASYVMFAVPKPKE-UHFFFAOYSA-N acephate Chemical compound COP(=O)(SC)NC(C)=O YASYVMFAVPKPKE-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 231100000460 acute oral toxicity Toxicity 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- QGLZXHRNAYXIBU-WEVVVXLNSA-N aldicarb Chemical compound CNC(=O)O\N=C\C(C)(C)SC QGLZXHRNAYXIBU-WEVVVXLNSA-N 0.000 description 1
- 108010050181 aleurone Proteins 0.000 description 1
- 239000013566 allergen Substances 0.000 description 1
- 208000030961 allergic reaction Diseases 0.000 description 1
- 102000005840 alpha-Galactosidase Human genes 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 102000016679 alpha-Glucosidases Human genes 0.000 description 1
- 102000012086 alpha-L-Fucosidase Human genes 0.000 description 1
- 102000019199 alpha-Mannosidase Human genes 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 231100000788 altered fertility Toxicity 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 239000004410 anthocyanin Substances 0.000 description 1
- 229930002877 anthocyanin Natural products 0.000 description 1
- 235000010208 anthocyanin Nutrition 0.000 description 1
- 150000004636 anthocyanins Chemical class 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 210000000628 antibody-producing cell Anatomy 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- RRZXIRBKKLTSOM-XPNPUAGNSA-N avermectin B1a Chemical compound C1=C[C@H](C)[C@@H]([C@@H](C)CC)O[C@]11O[C@H](C\C=C(C)\[C@@H](O[C@@H]2O[C@@H](C)[C@H](O[C@@H]3O[C@@H](C)[C@H](O)[C@@H](OC)C3)[C@@H](OC)C2)[C@@H](C)\C=C\C=C/2[C@]3([C@H](C(=O)O4)C=C(C)[C@@H](O)[C@H]3OC\2)O)C[C@H]4C1 RRZXIRBKKLTSOM-XPNPUAGNSA-N 0.000 description 1
- VEHPJKVTJQSSKL-UHFFFAOYSA-N azadirachtin Natural products O1C2(C)C(C3(C=COC3O3)O)CC3C21C1(C)C(O)C(OCC2(OC(C)=O)C(CC3OC(=O)C(C)=CC)OC(C)=O)C2C32COC(C(=O)OC)(O)C12 VEHPJKVTJQSSKL-UHFFFAOYSA-N 0.000 description 1
- FTNJWQUOZFUQQJ-IRYYUVNJSA-N azadirachtin A Natural products C([C@@H]([C@]1(C=CO[C@H]1O1)O)[C@]2(C)O3)[C@H]1[C@]23[C@]1(C)[C@H](O)[C@H](OC[C@@]2([C@@H](C[C@@H]3OC(=O)C(\C)=C/C)OC(C)=O)C(=O)OC)[C@@H]2[C@]32CO[C@@](C(=O)OC)(O)[C@@H]12 FTNJWQUOZFUQQJ-IRYYUVNJSA-N 0.000 description 1
- FTNJWQUOZFUQQJ-NDAWSKJSSA-N azadirachtin A Chemical compound C([C@@H]([C@]1(C=CO[C@H]1O1)O)[C@]2(C)O3)[C@H]1[C@]23[C@]1(C)[C@H](O)[C@H](OC[C@@]2([C@@H](C[C@@H]3OC(=O)C(\C)=C\C)OC(C)=O)C(=O)OC)[C@@H]2[C@]32CO[C@@](C(=O)OC)(O)[C@@H]12 FTNJWQUOZFUQQJ-NDAWSKJSSA-N 0.000 description 1
- CJJOSEISRRTUQB-UHFFFAOYSA-N azinphos-methyl Chemical group C1=CC=C2C(=O)N(CSP(=S)(OC)OC)N=NC2=C1 CJJOSEISRRTUQB-UHFFFAOYSA-N 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 108010048056 beta-1,3-exoglucanase Proteins 0.000 description 1
- 102000006995 beta-Glucosidase Human genes 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- OMFRMAHOUUJSGP-IRHGGOMRSA-N bifenthrin Chemical compound C1=CC=C(C=2C=CC=CC=2)C(C)=C1COC(=O)[C@@H]1[C@H](\C=C(/Cl)C(F)(F)F)C1(C)C OMFRMAHOUUJSGP-IRHGGOMRSA-N 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- VEMKTZHHVJILDY-UXHICEINSA-N bioresmethrin Chemical compound CC1(C)[C@H](C=C(C)C)[C@H]1C(=O)OCC1=COC(CC=2C=CC=CC=2)=C1 VEMKTZHHVJILDY-UXHICEINSA-N 0.000 description 1
- 235000021029 blackberry Nutrition 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 101150039352 can gene Proteins 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 235000013877 carbamide Nutrition 0.000 description 1
- DUEPRVBVGDRKAG-UHFFFAOYSA-N carbofuran Chemical compound CNC(=O)OC1=CC=CC2=C1OC(C)(C)C2 DUEPRVBVGDRKAG-UHFFFAOYSA-N 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 101150052795 cbh-1 gene Proteins 0.000 description 1
- 101150114858 cbh2 gene Proteins 0.000 description 1
- 229960004261 cefotaxime Drugs 0.000 description 1
- AZZMGZXNTDTSME-JUZDKLSSSA-M cefotaxime sodium Chemical compound [Na+].N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C([O-])=O)=O)C(=O)\C(=N/OC)C1=CSC(N)=N1 AZZMGZXNTDTSME-JUZDKLSSSA-M 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 108010080434 cephalosporin-C deacetylase Proteins 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- SBPBAQFWLVIOKP-UHFFFAOYSA-N chlorpyrifos Chemical compound CCOP(=S)(OCC)OC1=NC(Cl)=C(Cl)C=C1Cl SBPBAQFWLVIOKP-UHFFFAOYSA-N 0.000 description 1
- HPNSNYBUADCFDR-UHFFFAOYSA-N chromafenozide Chemical compound CC1=CC(C)=CC(C(=O)N(NC(=O)C=2C(=C3CCCOC3=CC=2)C)C(C)(C)C)=C1 HPNSNYBUADCFDR-UHFFFAOYSA-N 0.000 description 1
- 210000004756 chromatid Anatomy 0.000 description 1
- 210000001726 chromosome structure Anatomy 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 239000000306 component Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- OILAIQUEIWYQPH-UHFFFAOYSA-N cyclohexane-1,2-dione Chemical compound O=C1CCCCC1=O OILAIQUEIWYQPH-UHFFFAOYSA-N 0.000 description 1
- WCMMILVIRZAPLE-UHFFFAOYSA-M cyhexatin Chemical compound C1CCCCC1[Sn](C1CCCCC1)(O)C1CCCCC1 WCMMILVIRZAPLE-UHFFFAOYSA-M 0.000 description 1
- LVQDKIWDGQRHTE-UHFFFAOYSA-N cyromazine Chemical compound NC1=NC(N)=NC(NC2CC2)=N1 LVQDKIWDGQRHTE-UHFFFAOYSA-N 0.000 description 1
- 229950000775 cyromazine Drugs 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- 229960002483 decamethrin Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- OWZREIFADZCYQD-NSHGMRRFSA-N deltamethrin Chemical compound CC1(C)[C@@H](C=C(Br)Br)[C@H]1C(=O)O[C@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 OWZREIFADZCYQD-NSHGMRRFSA-N 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- WOWBFOBYOAGEEA-UHFFFAOYSA-N diafenthiuron Chemical compound CC(C)C1=C(NC(=S)NC(C)(C)C)C(C(C)C)=CC(OC=2C=CC=CC=2)=C1 WOWBFOBYOAGEEA-UHFFFAOYSA-N 0.000 description 1
- FHIVAFMUCKRCQO-UHFFFAOYSA-N diazinon Chemical compound CCOP(=S)(OCC)OC1=CC(C)=NC(C(C)C)=N1 FHIVAFMUCKRCQO-UHFFFAOYSA-N 0.000 description 1
- UOAMTSKGCBMZTC-UHFFFAOYSA-N dicofol Chemical compound C=1C=C(Cl)C=CC=1C(C(Cl)(Cl)Cl)(O)C1=CC=C(Cl)C=C1 UOAMTSKGCBMZTC-UHFFFAOYSA-N 0.000 description 1
- 235000020788 dietary exposure Nutrition 0.000 description 1
- 235000021245 dietary protein Nutrition 0.000 description 1
- JXSJBGJIGXNWCI-UHFFFAOYSA-N diethyl 2-[(dimethoxyphosphorothioyl)thio]succinate Chemical compound CCOC(=O)CC(SP(=S)(OC)OC)C(=O)OCC JXSJBGJIGXNWCI-UHFFFAOYSA-N 0.000 description 1
- 229940019503 diflubenzuron Drugs 0.000 description 1
- 230000001079 digestive effect Effects 0.000 description 1
- KCFYHBSOLOXZIF-UHFFFAOYSA-N dihydrochrysin Natural products COC1=C(O)C(OC)=CC(C2OC3=CC(O)=CC(O)=C3C(=O)C2)=C1 KCFYHBSOLOXZIF-UHFFFAOYSA-N 0.000 description 1
- MHUWZNTUIIFHAS-CLFAGFIQSA-N dioleoyl phosphatidic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(COP(O)(O)=O)OC(=O)CCCCCCC\C=C/CCCCCCCC MHUWZNTUIIFHAS-CLFAGFIQSA-N 0.000 description 1
- 238000007598 dipping method Methods 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000010410 dusting Methods 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000000408 embryogenic effect Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 108010050200 endo-1,4-beta-D-mannanase Proteins 0.000 description 1
- YERABYSOHUZTPQ-UHFFFAOYSA-P endo-1,4-beta-Xylanase Chemical compound C=1C=CC=CC=1C[N+](CC)(CC)CCCNC(C(C=1)=O)=CC(=O)C=1NCCC[N+](CC)(CC)CC1=CC=CC=C1 YERABYSOHUZTPQ-UHFFFAOYSA-P 0.000 description 1
- RDYMFSUJUZBWLH-SVWSLYAFSA-N endosulfan Chemical compound C([C@@H]12)OS(=O)OC[C@@H]1[C@]1(Cl)C(Cl)=C(Cl)[C@@]2(Cl)C1(Cl)Cl RDYMFSUJUZBWLH-SVWSLYAFSA-N 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- NYPJDWWKZLNGGM-RPWUZVMVSA-N esfenvalerate Chemical compound C=1C([C@@H](C#N)OC(=O)[C@@H](C(C)C)C=2C=CC(Cl)=CC=2)=CC=CC=1OC1=CC=CC=C1 NYPJDWWKZLNGGM-RPWUZVMVSA-N 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 108010038658 exo-1,4-beta-D-xylosidase Proteins 0.000 description 1
- 108010093305 exopolygalacturonase Proteins 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- ZCJPOPBZHLUFHF-UHFFFAOYSA-N fenamiphos Chemical compound CCOP(=O)(NC(C)C)OC1=CC=C(SC)C(C)=C1 ZCJPOPBZHLUFHF-UHFFFAOYSA-N 0.000 description 1
- YYJNOYZRYGDPNH-MFKUBSTISA-N fenpyroximate Chemical compound C=1C=C(C(=O)OC(C)(C)C)C=CC=1CO/N=C/C=1C(C)=NN(C)C=1OC1=CC=CC=C1 YYJNOYZRYGDPNH-MFKUBSTISA-N 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 108010041969 feruloyl esterase Proteins 0.000 description 1
- 244000037666 field crops Species 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- GJEREQYJIQASAW-UHFFFAOYSA-N flufenerim Chemical compound CC(F)C1=NC=NC(NCCC=2C=CC(OC(F)(F)F)=CC=2)=C1Cl GJEREQYJIQASAW-UHFFFAOYSA-N 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 235000004611 garlic Nutrition 0.000 description 1
- 210000004211 gastric acid Anatomy 0.000 description 1
- 210000001156 gastric mucosa Anatomy 0.000 description 1
- 102000034238 globular proteins Human genes 0.000 description 1
- 108091005896 globular proteins Proteins 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 239000003630 growth substance Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- RGNPBRKPHBKNKX-UHFFFAOYSA-N hexaflumuron Chemical compound C1=C(Cl)C(OC(F)(F)C(F)F)=C(Cl)C=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F RGNPBRKPHBKNKX-UHFFFAOYSA-N 0.000 description 1
- 231100000171 higher toxicity Toxicity 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 238000010874 in vitro model Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- VBCVPMMZEGZULK-NRFANRHFSA-N indoxacarb Chemical compound C([C@@]1(OC2)C(=O)OC)C3=CC(Cl)=CC=C3C1=NN2C(=O)N(C(=O)OC)C1=CC=C(OC(F)(F)F)C=C1 VBCVPMMZEGZULK-NRFANRHFSA-N 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 238000012994 industrial processing Methods 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000011147 inorganic material Substances 0.000 description 1
- 239000002917 insecticide Substances 0.000 description 1
- 108010090785 inulinase Proteins 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- HOQADATXFBOEGG-UHFFFAOYSA-N isofenphos Chemical compound CCOP(=S)(NC(C)C)OC1=CC=CC=C1C(=O)OC(C)C HOQADATXFBOEGG-UHFFFAOYSA-N 0.000 description 1
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229930014550 juvenile hormone Natural products 0.000 description 1
- 239000002949 juvenile hormone Substances 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 150000002596 lactones Chemical class 0.000 description 1
- 239000005910 lambda-Cyhalothrin Substances 0.000 description 1
- 230000001418 larval effect Effects 0.000 description 1
- 108010005131 levanase Proteins 0.000 description 1
- 229960004502 levodopa Drugs 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 108010062085 ligninase Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- KBHDSWIXRODKSZ-UHFFFAOYSA-N methyl 5-chloro-2-(trifluoromethylsulfonylamino)benzoate Chemical compound COC(=O)C1=CC(Cl)=CC=C1NS(=O)(=O)C(F)(F)F KBHDSWIXRODKSZ-UHFFFAOYSA-N 0.000 description 1
- 229960001952 metrifonate Drugs 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 239000003595 mist Substances 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000001483 mobilizing effect Effects 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- NJPPVKZQTLUDBO-UHFFFAOYSA-N novaluron Chemical compound C1=C(Cl)C(OC(F)(F)C(OC(F)(F)F)F)=CC=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F NJPPVKZQTLUDBO-UHFFFAOYSA-N 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000002417 nutraceutical Substances 0.000 description 1
- 235000021436 nutraceutical agent Nutrition 0.000 description 1
- YCIMNLLNPGFGHC-UHFFFAOYSA-N o-dihydroxy-benzene Natural products OC1=CC=CC=C1O YCIMNLLNPGFGHC-UHFFFAOYSA-N 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000011368 organic material Substances 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- LCCNCVORNKJIRZ-UHFFFAOYSA-N parathion Chemical compound CCOP(=S)(OCC)OC1=CC=C([N+]([O-])=O)C=C1 LCCNCVORNKJIRZ-UHFFFAOYSA-N 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 229960000490 permethrin Drugs 0.000 description 1
- RLLPVAHGXHCWKJ-UHFFFAOYSA-N permethrin Chemical compound CC1(C)C(C=C(Cl)Cl)C1C(=O)OCC1=CC=CC(OC=2C=CC=CC=2)=C1 RLLPVAHGXHCWKJ-UHFFFAOYSA-N 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- NONJJLVGHLVQQM-JHXYUMNGSA-N phenethicillin Chemical compound N([C@@H]1C(N2[C@H](C(C)(C)S[C@@H]21)C(O)=O)=O)C(=O)C(C)OC1=CC=CC=C1 NONJJLVGHLVQQM-JHXYUMNGSA-N 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- BULVZWIRKLYCBC-UHFFFAOYSA-N phorate Chemical compound CCOP(=S)(OCC)SCSCC BULVZWIRKLYCBC-UHFFFAOYSA-N 0.000 description 1
- IOUNQDKNJZEDEP-UHFFFAOYSA-N phosalone Chemical compound C1=C(Cl)C=C2OC(=O)N(CSP(=S)(OCC)OCC)C2=C1 IOUNQDKNJZEDEP-UHFFFAOYSA-N 0.000 description 1
- LMNZTLDVJIUSHT-UHFFFAOYSA-N phosmet Chemical compound C1=CC=C2C(=O)N(CSP(=S)(OC)OC)C(=O)C2=C1 LMNZTLDVJIUSHT-UHFFFAOYSA-N 0.000 description 1
- RGCLLPNLLBQHPF-HJWRWDBZSA-N phosphamidon Chemical compound CCN(CC)C(=O)C(\Cl)=C(/C)OP(=O)(OC)OC RGCLLPNLLBQHPF-HJWRWDBZSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 235000002949 phytic acid Nutrition 0.000 description 1
- 239000000467 phytic acid Substances 0.000 description 1
- 229940068041 phytic acid Drugs 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- YFGYUFNIOHWBOB-UHFFFAOYSA-N pirimicarb Chemical compound CN(C)C(=O)OC1=NC(N(C)C)=NC(C)=C1C YFGYUFNIOHWBOB-UHFFFAOYSA-N 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- QYMMJNLHFKGANY-UHFFFAOYSA-N profenofos Chemical compound CCCSP(=O)(OCC)OC1=CC=C(Br)C=C1Cl QYMMJNLHFKGANY-UHFFFAOYSA-N 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 235000021251 pulses Nutrition 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- FBQQHUGEACOBDN-UHFFFAOYSA-N quinomethionate Chemical compound N1=C2SC(=O)SC2=NC2=CC(C)=CC=C21 FBQQHUGEACOBDN-UHFFFAOYSA-N 0.000 description 1
- 235000021013 raspberries Nutrition 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 229940080817 rotenone Drugs 0.000 description 1
- JUVIOZPCNVVQFO-UHFFFAOYSA-N rotenone Natural products O1C2=C3CC(C(C)=C)OC3=CC=C2C(=O)C2C1COC1=C2C=C(OC)C(OC)=C1 JUVIOZPCNVVQFO-UHFFFAOYSA-N 0.000 description 1
- 101150015537 rps12 gene Proteins 0.000 description 1
- 101150098466 rpsL gene Proteins 0.000 description 1
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000014639 sexual reproduction Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical compound [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 1
- 229910010271 silicon carbide Inorganic materials 0.000 description 1
- 229910001961 silver nitrate Inorganic materials 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000003195 sodium channel blocking agent Substances 0.000 description 1
- 229910001415 sodium ion Inorganic materials 0.000 description 1
- 244000000000 soil microbiome Species 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 229940014213 spinosad Drugs 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 235000021012 strawberries Nutrition 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 229940124530 sulfonamide Drugs 0.000 description 1
- 150000003456 sulfonamides Chemical class 0.000 description 1
- JXHJNEJVUNHLKO-UHFFFAOYSA-N sulprofos Chemical compound CCCSP(=S)(OCC)OC1=CC=C(SC)C=C1 JXHJNEJVUNHLKO-UHFFFAOYSA-N 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 239000005936 tau-Fluvalinate Substances 0.000 description 1
- INISTDXBRIBGOC-XMMISQBUSA-N tau-fluvalinate Chemical compound N([C@H](C(C)C)C(=O)OC(C#N)C=1C=C(OC=2C=CC=CC=2)C=CC=1)C1=CC=C(C(F)(F)F)C=C1Cl INISTDXBRIBGOC-XMMISQBUSA-N 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- QSOHVSNIQHGFJU-UHFFFAOYSA-L thiosultap disodium Chemical compound [Na+].[Na+].[O-]S(=O)(=O)SCC(N(C)C)CSS([O-])(=O)=O QSOHVSNIQHGFJU-UHFFFAOYSA-L 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 229960001295 tocopherol Drugs 0.000 description 1
- 229930003799 tocopherol Natural products 0.000 description 1
- 235000010384 tocopherol Nutrition 0.000 description 1
- 239000011732 tocopherol Substances 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- YWBFPKPWMSWWEA-UHFFFAOYSA-O triazolopyrimidine Chemical compound BrC1=CC=CC(C=2N=C3N=CN[N+]3=C(NCC=3C=CN=CC=3)C=2)=C1 YWBFPKPWMSWWEA-UHFFFAOYSA-O 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- NFACJZMKEDPNKN-UHFFFAOYSA-N trichlorfon Chemical compound COP(=O)(OC)C(O)C(Cl)(Cl)Cl NFACJZMKEDPNKN-UHFFFAOYSA-N 0.000 description 1
- 101150019416 trpA gene Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000009105 vegetative growth Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
- 229940093612 zein Drugs 0.000 description 1
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/10—Seeds
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N37/00—Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids
- A01N37/44—Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids containing at least one carboxylic group or a thio analogue, or a derivative thereof, and a nitrogen atom attached to the same carbon skeleton by a single or double bond, this nitrogen atom not being a member of a derivative or of a thio analogue of a carboxylic group, e.g. amino-carboxylic acids
- A01N37/46—N-acyl derivatives
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N63/00—Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
- A01N63/50—Isolated enzymes; Isolated proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
- C07K14/325—Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8286—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Pest Control & Pesticides (AREA)
- Plant Pathology (AREA)
- Environmental Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Dentistry (AREA)
- Agronomy & Crop Science (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Insects & Arthropods (AREA)
- Virology (AREA)
- Physiology (AREA)
- Botany (AREA)
- Developmental Biology & Embryology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Peptides Or Proteins (AREA)
Abstract
Изобретение относится к области биохимии, в частности к химерной генетической конструкции для экспрессии белка, токсичного для совки-ипсилон (Agrotis ipsilon), а также к содержащему ее вектору, клетке, растению, семени растения. Также раскрыта синтетическая молекула нуклеиновой кислоты для обеспечения экспрессии белка, токсичного для совки-ипсилон (Agrotis ipsilon), а также способ получения устойчивого к совке-ипсилон трансгенного растения. Изобретение также относится к белку, токсичному для совки-ипсилон (Agrotis ipsilon), к способу его получения, а также к содержащей его композиции и к способу борьбы с совкой-ипсилон (Agrotis ipsilon) с его использованием. 11 н. и 16 з.п. ф-лы, 3 табл., 11 пр.
Description
ССЫЛКА НА ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ, ПОДАННЫЙ В ЭЛЕКТРОННОМ ВИДЕ
[0001] Официальная копия перечня последовательностей подана в электронном виде через EFS-Web в виде перечня последовательностей в формате ASCII с названием файла "80668-US-L-ORG-NAT-1_SeqList.txt", созданного 5 декабря 2014 г., и имеющего размер 135 килобайт, и поданного одновременно с описанием. Перечень последовательностей, содержащийся в данном документе в формате ASCII, является частью описания и включен в данный документ посредством ссылки во всей своей полноте.
ОБЛАСТЬ ТЕХНИКИ ИЗОБРЕТЕНИЯ
[0002] Настоящее изобретение относится к пестицидным белкам и молекулам нуклеиновых кислот, которые их кодируют, а также к композициям и способам контроля вредителей растений.
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
[0003] Bacillus thuringiensis (Bt) является грамположительной спорообразующей почвенной бактерией, которая отличается своей способностью продуцировать кристаллические включения, которые особенно токсичны для определенных отрядов и видов вредителей растений, в том числе насекомых, но безвредны для растений и других нецелевых организмов. По этой причине композиции, содержащие штаммы Bacillus thuringiensis или их инсектицидные белки, могут применяться в качестве приемлемых с точки зрения охраны окружающей среды инсектицидов для контроля насекомых-вредителей, важных с точки зрения сельского хозяйства, или насекомых-переносчиков различных заболеваний человека или животных.
[0004] Кристаллические (Cry) белки из Bacillus thuringiensis обладают сильной инсектицидной активностью в отношении преимущественно личинок чешуекрылых, двукрылых и жесткокрылых. Эти белки также продемонстрировали активность в отношении вредителей из отрядов Hymenoptera, Homoptera, Phthiraptera, Mallophaga и вредителей из отрядов подкласса Acari, а также других групп беспозвоночных, таких как Nemathelminthes, Platyhelminthes и Sarcomastigorphora (Feitelson, J. 1993. The Bacillus Thuringiensis family tree. In Advanced Engineered Pesticides. Marcel Dekker, Inc., New York, N.Y.). Эти белки изначально разделили на классы CryI-CryVI преимущественно на основании их инсектицидной активности. Основными классами были специфические для Lepidoptera (I), специфические для Lepidoptera и Diptera (II), специфические для Coleoptera (III), специфические для Diptera (IV) и специфические для нематод (V) и (VI). Далее белки разделили на подсемейства, белкам с более высокой степенью родства в пределах каждого семейства присвоили буквы для обозначения раздела, как, например, CryIA, CryIB, CryIC и т.д. Еще более близкородственным белкам в пределах каждого раздела присвоили названия, такие как CryIC(a), CryIC(b) и т.д. Термины "токсин Cry" и "дельта-эндотоксин" применялись взаимозаменяемо с термином "белок Cry". Современная номенклатура белков и генов Cry основана на гомологии аминокислотных последовательностей, а не на специфичности в отношении целевых насекомых (Crickmore et al. (1998) Microbiol. Mol. Biol. Rev. 62:807-813). В этой более распространенной классификации каждому токсину присваивается уникальное название, включающее первичный ранг (арабская цифра), вторичный ранг (заглавная буква), третичный ранг (строчная буква) и четвертичный ранг (еще одна арабская цифра). В современной классификации в первичном ранге римские цифры были заменены на арабские цифры. Например, "CryIA(а)" согласно старой номенклатуре в настоящее время имеет название "Cry1Aa" согласно современной номенклатуре.
[0005] Белки Cry представляют собой глобулярные белковые молекулы, которые накапливаются в виде протоксинов в кристаллической форме в ходе стадии споруляции Bt. После поедания вредителем кристаллы, как правило, растворяются с высвобождением протоксинов, размер которых может варьировать, например, от 130-140 кДа в случае белков Cry, активных в отношении чешуекрылых, и 60-80 кДа в случае белков Cry, активных в отношении жесткокрылых. Протоксины превращаются в полноценные токсичные фрагменты (N-концевой участок размером приблизительно 60-70 кДа) под действием протеаз пищеварительного канала целевого вредителя. Многие из этих белков очень токсичны для специфических целевых насекомых, но безвредны для растений и других нецелевых организмов.
[0006] Белки Cry, как правило, имеют пять доменов с консервативной последовательностью и три домена с консервативной структурой (см., например, de Maagd et al. (2001) Trends Genetics 17:193-199). Первый домен с консервативной структурой, называемый домен I, как правило, состоит из семи альфа-спиралей и вовлечен во вставку в мембрану и образовании пор. Домен II, как правило, состоит из трех бета-складчатых слоев, расположенных в конфигурации типа греческий ключ, а домен III состоит из двух антипараллельных бета-складчатых слоев в виде структуры 'jelly-roll' (de Maagd et al., 2001, выше). Домены II и III вовлечены в распознавание и связывание рецепторов, и поэтому считаются детерминантами специфичности токсина.
[0007] Многочисленные коммерчески ценные растения, в том числе широко распространенные сельскохозяйственные культуры, восприимчивы к нападению вредителей растений, в том числе насекомых-вредителей и нематод-вредителей, что приводит к существенному снижению урожайности и качества сельскохозяйственных культур. Например, вредители растений являются главным фактором потери урожая важных мировых сельскохозяйственных культур. Приблизительно 8 миллиардов долларов теряется каждый год только в Соединенных Штатах в связи с повреждениями, вызываемыми вредителями, не являющимися млекопитающими, в том числе насекомыми. В дополнение к потерям урожая полевых культур насекомые-вредители также ложатся бременем на овощеводов и плодоводов, производителей декоративных цветов, а также владельцев приусадебных хозяйств.
[0008] Насекомых-вредителей контролируют главным образом путем интенсивного применения химических пестицидов, которые действуют путем подавления роста насекомых, препятствования питанию или размножению, или вызывая гибель. Средства для биологического контроля вредителей, например, штаммы Bacillus thuringiensis, экспрессирующие пестицидные токсины, такие как белки Cry, также применялись в отношении культурных растений с удовлетворительными результатами, что является альтернативой или дополнением к химическим пестицидам. Были выделены гены, кодирующие некоторые из этих белков Cry, и было показано, что их экспрессия в гетерологичных хозяевах, таких как трансгенные растения, обеспечивает другой инструмент для контроля экономически важных насекомых-вредителей.
[0009] Таким образом, можно достичь надлежащего контроля насекомых, но определенные химические вещества иногда могут наносить вред на нецелевым полезным насекомым, и определенные биологические вещества имеют очень узкий спектр активности. Кроме того, продолжительное применение определенных способов химического и биологического контроля повышает вероятность развития у насекомых-вредителей устойчивости к таким мерам контроля. Частично это ослаблялось путем применения различных агротехнических приемов, связанных с устойчивостью, однако все еще сохраняется потребность в поиске новых и эффективных средств для контроля вредителей, которые обеспечивают экономическую пользу фермерам и которые являются приемлемыми с точки зрения охраны окружающей среды. Особенно необходимыми являются средства для контроля, целенаправленно воздействующие на более широкий спектр экономически важных насекомых-вредителей, и которые обеспечивают эффективный контроль линий насекомых, которые могут стать устойчивыми к существующим средствам для контроля насекомых или являются таковыми.
КРАТКОЕ ОПИСАНИЕ
[0010] Ввиду этих потребностей, целью настоящего изобретения является обеспечение новых средств для контроля вредителей путем обеспечения новых генов и пестицидных белков, которые можно применять для контроля целого ряда вредителей растений.
[0011] В настоящем изобретении предусмотрены композиции и способы придания пестицидной активности бактериям, растениям, растительным клеткам, тканям и семенам. В частности, предусмотрены химерные гены, содержащие новые полинуклеотиды, которые кодируют белки Cry, выделенные из Bacillus thuringiensis (Bt), и последовательности, в значительной степени идентичные им, экспрессия которых приводит к образованию белков, обладающих токсичностью в отношении экономически важных насекомых-вредителей, в частности, насекомых-вредителей, которые поражают растения. Кроме того, настоящее изобретение относится к новым белкам Cry, полученным в результате экспрессии последовательностей нуклеиновых кислот, а также к композициям и составам, содержащим белки Cry, которые оказывают токсическое воздействие на насекомых путем подавления способности насекомых-вредителей к выживанию, росту и размножению, либо путем ограничения повреждения или гибели культурных растений, вызванных насекомыми. Белки Cry по настоящему изобретению включают нативные белки Cry и мутантные белки Cry, которые содержат одну или несколько аминокислотных замен, добавлений или делеций. Примеры мутантных белков Cry включают без ограничения таковые, подвергнутые мутации, чтобы обладать более широким спектром активности по сравнению с их аналогами, нативными белками Cry, или таковые, подвергнутые мутации, чтобы ввести эпитоп для выработки антител, которые избирательно распознают мутантный белок, а не нативный белок. Новые белки Cry по настоящему изобретению обладают высокой активностью в отношении насекомых-вредителей. Например, белки Cry по настоящему изобретению можно применять для контроля одного или нескольких экономически важных насекомых-вредителей, таких как совка-ипсилон (Agrotis ipsilon), кукурузный мотылек (Ostrinia nubilalis), совка травяная (Spodoptera frugiperda), американская кукурузная совка (Helicoverpa zea), огневка тростниковая (Diatraea saccharalis), гусеница совки бархатных бобов (Anticarsia gemmatalis), соевая совка (Chrysodeixis includes), огневка кукурузная юго-западная (Diatraea grandiosella), западная бобовая совка (Richia albicosta), табачная совка (Heliothis virescens), восточный кукурузный мотылек (Ostrinia furnacalis), хлопковая совка (Helicoverpa armigera), огневка желтая рисовая (Chilo suppressalis), розовая стеблевая совка (Sesamia calamistis), огневка рисовая (Cnaphalocrocis medinalis) и т.п.
[0012] В настоящем изобретении также предусмотрены синтетические полинуклеотиды, которые кодируют белки Cry по настоящему изобретению и имеют один или несколько кодонов, оптимизированных для экспрессия в трансгенных организмах, таких как бактерии и растения.
[0013] Настоящее изобретение дополнительно относится к кассетам экспрессии и рекомбинантным векторам, содержащим полинуклеотид, который кодирует белок Cry по настоящему изобретению. В настоящем изобретении также предусмотрены трансформированные бактерии, растения, растительные клетки, ткани и семена, содержащие химерный ген, или кассету экспрессии, или рекомбинантный вектор, которые содержат полинуклеотид, кодирующий белок Cry по настоящему изобретению.
[0014] Настоящее изобретение также относится к способам применения полинуклеотидов, например, в ДНК-конструкциях, или химерных генах, или кассетах экспрессии, или рекомбинантных векторах для трансформация и экспрессии в организмах, в том числе микроорганизмах и растениях. Нуклеотидные или аминокислотные последовательности могут представлять собой синтетические последовательности, которые были сконструированы для экспрессии в организме, в том числе без ограничения в микроорганизме или растении, или для получения гибридных токсинов с усиленной пестицидной активностью. Настоящее изобретение дополнительно относится к способам получения белков Cry и к способам применения последовательностей нуклеиновых кислот, например, в микроорганизмах для контроля насекомых или в трансгенных растениях для обеспечения защиты от повреждения насекомыми, а также к способам применения белков Cry и композиций и составов, содержащих белки Cry, например, применению белков Cry, или композиций, или составов по отношению к пораженным вредителями участкам, или для профилактической обработки уязвимых для насекомых участков или растений, чтобы обеспечить защиту от повреждения насекомыми-вредителями. Нуклеотидные или аминокислотные последовательности могут представлять собой синтетические последовательности, которые были сконструированы для экспрессии в организме, в том числе без ограничения в микроорганизме или растении.
[0015] Композиции и способы по настоящему изобретению применимы для получения организмов, которые токсичны для насекомых, в частности, для получения бактерий и растений. Такие организмы и композиции на их основе актуальны для сельскохозяйственных целей. Композиции по настоящему изобретению также применимы для получения измененных или улучшенных белков Cry, которые обладают пестицидной активностью, или для обнаружения наличия белка Cry или нуклеиновых кислот в продуктах или организмах.
[0016] Эти и другие признаки, аспекты и преимущества настоящего изобретения станут более понятны со ссылкой на следующее подробное описание и формулу изобретения.
КРАТКОЕ ОПИСАНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ В ПЕРЕЧНЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
[0017] SEQ ID NO: 1 представляет собой нуклеотидную последовательность, кодирующую белок ВТ-0044.
[0018] SEQ ID NO: 2 представляет собой нуклеотидную последовательность, кодирующую белок ВТ-0051.
[0019] SEQ ID NO: 3 представляет собой нуклеотидную последовательность, кодирующую белок ВТ-0068.
[0020] SEQ ID NO: 4 представляет собой нуклеотидную последовательность, кодирующую белок ВТ-0128.
[0021] SEQ ID NO: 5 представляет собой кодон-оптимизированную последовательность, кодирующую белок ВТ-0044.
[0022] SEQ ID NO: 6 представляет собой кодон-оптимизированную последовательность, кодирующую белок ВТ-0051.
[0023] SEQ ID NO: 7 представляет собой кодон-оптимизированную последовательность, кодирующую белок ВТ-0068.
[0024] SEQ ID NO: 8 представляет собой кодон-оптимизированную последовательность, кодирующую белок ВТ-0128.
[0025] SEQ ID NO: 9 представляет собой нуклеотидную последовательность, кодирующую мутантный белок ВТ-0044.
[0026] SEQ ID NO: 10 представляет собой нуклеотидную последовательность, кодирующую мутантный белок ВТ-0051.
[0027] SEQ ID NO: 11 представляет собой нуклеотидную последовательность, кодирующую мутантный белок ВТ-0068.
[0028] SEQ ID NO: 12 представляет собой нуклеотидную последовательность, кодирующую мутантный белок ВТ-0128.
[0029] SEQ ID NO: 13 представляет собой аминокислотную последовательность белка ВТ-0044.
[0030] SEQ ID NO: 14 представляет собой аминокислотную последовательность белка ВТ-0051.
[0031] SEQ ID NO: 15 представляет собой аминокислотную последовательность белка ВТ-0068.
[0032] SEQ ID NO: 16 представляет собой аминокислотную последовательность белка ВТ-0128.
[0033] SEQ ID NO: 17 представляет собой аминокислотную последовательность мутантного белка ВТ-0044.
[0034] SEQ ID NO: 18 представляет собой аминокислотную последовательность мутантного белка ВТ-0051.
[0035] SEQ ID NO: 19 представляет собой аминокислотную последовательность мутантного белка ВТ-0068.
[0036] SEQ ID NO: 20 представляет собой аминокислотную последовательность мутантного белка ВТ-0128.
[0037] SEQ ID NO: 21-26 представляют собой праймеры, применимые в настоящем изобретении.
ПОДРОБНОЕ ОПИСАНИЕ
[0038] Не подразумевается, что данное описание является подробным перечнем всех различных путей, с помощью которых может быть реализовано настоящее изобретение, или всех признаков, которые можно добавить к настоящему изобретению. Например, признаки, проиллюстрированные в отношении одного варианта осуществления, могут быть включены в другие варианты осуществления, а признаки, проиллюстрированные в отношении конкретного варианта осуществления, могут быть удалены из этого варианта осуществления. Таким образом, настоящим изобретением предполагается, что в некоторых вариантах осуществления настоящего изобретения можно исключить или опустить любой признак или комбинацию признаков, изложенных в данном документе. Кроме того, многочисленные вариации и дополнения к различным вариантам осуществления, предлагаемым в данном документе, будут очевидны для специалистов в данной области в свете настоящего раскрытия, которое не отступает от сути настоящего изобретения. Следовательно, следующие описания предназначены для иллюстрации некоторых конкретных вариантов осуществления настоящего изобретения, а не исчерпывающего определения всех их преобразований, комбинаций и вариаций.
[0039] Если не указано иное, все технические и научные термины, используемые в данном документе, имеют то же значение, которое обычно понятно специалисту в области техники, к которой относится настоящее изобретение. Терминология, применяемая в описании настоящего изобретения в данном документе, используется только в целях описания конкретных вариантов осуществления, а не предназначена для ограничения настоящего изобретения. Следует также понимать, что терминология, применяемая в данном документе, представлена исключительно с целью описания конкретных вариантов осуществления, а не предназначена для ограничения объема настоящего изобретения.
Определения
[0040] Применяемые в данном документе и прилагаемой формуле изобретения формы единственного числа включают ссылки на множественное число, если в контексте явно не указано иное. Таким образом, например, ссылка на "растение" является ссылкой на одно или несколько растений и включает их эквиваленты, известные специалистам в данной области, и т.д. Применяемое в данном документе слово "или" означает любой элемент из конкретного перечня, а также включает любую комбинацию элементов из такого перечня (то есть, включает также "и").
[0041] Применяемый в данном документе термин "приблизительно" означает примерно, ориентировочно, около или в районе. Если термин "приблизительно" применяется в сочетании с числовым диапазоном, он модифицирует этот диапазон, расширяя границы выше и ниже указанных численных значений. В целом, применяемый в данном документе термин "приблизительно" модифицирует численное значение выше и ниже указанного значения путем отклонения на 20 процентов, предпочтительно 10 процентов вверх или вниз (больше или меньше). Что касается температуры, термин "приблизительно" означает ±1°С, предпочтительно ±0,5°С. Если термин "приблизительно" применяется в контексте настоящего изобретения (например, в комбинациях с температурой или значениями молекулярной массы), предпочтительным является точное значение (то есть, без "приблизительно").
[0042] Под "активностью" токсичного белка Cry по настоящему изобретению подразумевается, что токсичный белок действует как активное при пероральном поступлении средство для контроля насекомых, обладает токсическим действием или способен нарушать или ограничивать питание насекомых, что может или не может вызвать гибель насекомого. Когда токсичный белок по настоящему изобретению доставляется в организм насекомого, как правило, результатом является гибель насекомого, или насекомое не питается источником, который делает токсичный белок доступным для насекомого.
[0043] Применяемый в данном документе термин "амплифицированный" означает создание множества копий молекулы нуклеиновой кислоты или множества копий, комплементарных молекуле нуклеиновой кислоты, с применением по меньшей мере одной из молекул нуклеиновых кислот в качестве матрицы. Системы амплификации включают систему на основе полимеразной цепной реакции (ПЦР), систему на основе лигазной цепной реакции (LCR), систему амплификации, основанную на последовательности нуклеиновых кислот (NASBA, Cangene, Миссиссога, Онтарио), систему на основе Q-бета репликазы, систему амплификации, основанную на транскрипции (TAS), и амплификацию с замещением цепей (SDA). См., например, Diagnostic Molecular Microbiology: Principles and Applications, PERSING et al., Ed., American Society for Microbiology, Washington, D.C. (1993). Продукт амплификации называется "ампликоном".
[0044] Применяемый в данном документе термин "химерная конструкция", или "химерный ген", или "химерный полинуклеотид", или "химерная нуклеиновая кислота" (или подобные термины) относится к конструкции или молекуле, содержащей два или более полинуклеотидов разного происхождения, собранных в одну молекулу нуклеиновой кислоты. Термин "химерная конструкция", "химерный ген", "химерный полинуклеотид" или "химерная нуклеиновая кислота" относится к любой конструкции или молекуле, которая содержит без ограничения (1) полинуклеотиды (например, ДНК), в том числе регуляторные и кодирующие полинуклеотиды, которые вместе не встречаются в природе (то есть, по меньшей мере один из полинуклеотидов в конструкции является гетерологичным по отношению по меньшей мере к одному из его других полинуклеотидов), или (2) полинуклеотиды, кодирующие части белков, не связанные в природе, или (3) части промоторов, которые не связаны в природе. Кроме того, химерная конструкция, химерный ген, химерный полинуклеотид или химерная нуклеиновая кислота могут содержать регуляторные полинуклеотиды и кодирующие полинуклеотиды, полученные из разных источников, или могут содержать регуляторные полинуклеотиды и кодирующие полинуклеотиды, полученные из одного и того же источника, но расположенные иным способом, чем встречающийся в природе. В некоторых вариантах осуществления настоящего изобретения химерная конструкция, химерный ген, химерный полинуклеотид или химерная нуклеиновая кислота содержат кассету экспрессии, содержащую полинуклеотид по настоящему изобретению под контролем регуляторных полинуклеотидов, в частности, под контролем регуляторных полинуклеотидов, функционирующих в растениях или бактериях.
[0045] "Кодирующая последовательность" представляет собой последовательность нуклеиновой кислоты, которая транскрибируется в РНК, такую как mRNA, rRNA, tRNA, snRNA, смысловая РНК или антисмысловая РНК. Предпочтительно РНК затем транслируется в организме с продукцией белка.
[0046] Применяемое в данном документе выражение "кодон-оптимизированная" последовательность означает нуклеотидную последовательность рекомбинантного, трансгенного или синтетического полинуклеотида, в котором кодоны выбраны так, чтобы отражать склонность к определенным кодонам, которая может наблюдаться в клетке- или организме-хозяине. Как правило, это выполняется таким образом, чтобы сохранить аминокислотную последовательность полипептида, кодируемого кодон-оптимизированной нуклеотидной последовательностью. В некоторых вариантах осуществления последовательность ДНК рекомбинантной ДНК-конструкции включает последовательность, которая была кодон-оптимизирована для клетки (например, клетки животного, растения или гриба), в которой данная конструкция будет экспрессироваться. Например, у конструкции, которая будет экспрессироваться в растительной клетке, может быть кодон-оптимизированной для экспрессии в растении вся последовательность или ее часть (например, первый элемент для супрессии гена или элемент для экспрессии гена). См., например, патент США №6121014, включенный в данный документ посредством ссылки.
[0047] "Контроль" насекомых означает подавление, посредством токсического действия, способности насекомых-вредителей к выживанию, росту, питанию и/или размножению, или ограничение повреждения или гибели культурных растений, вызванных насекомыми, или защиту максимального потенциального урожая сельскохозяйственной культуры при выращивании в присутствии насекомых-вредителей. "Контроль" насекомых может означать или может не означать уничтожение насекомых, хотя, предпочтительно, означает уничтожение насекомых.
[0048] При использовании в данном описании термины "содержит" и/или "содержащий" указывают на присутствие изложенных признаков, целых чисел, стадий, операций, элементов и/или компонентов, но не исключают присутствие или добавление одного или нескольких других признаков, целых чисел, стадий, операций, элементов, компонентов и/или их групп.
[0049] Применяемая в данном документе переходная фраза "состоящий главным образом из" (и ее грамматические варианты) означает, что объем пункта формулы изобретения следует интерпретировать как охватывающий указанные материалы или стадии, перечисленные в данном пункте формулы изобретения, и таковые, которые существенно не изменяют основную и новую характеристику(и) заявленного изобретения. Таким образом, термин "состоящий главным образом из", когда применяется в пункте формулы настоящего изобретения, не предназначен для интерпретации как эквивалент термину "содержащий".
[0050] В контексте настоящего изобретения "соответствующий" или "соответствует" означает, что когда аминокислотные последовательности вариантных белков Cry выравнивают друг с другом, аминокислоты, которые "соответствуют" определенным перечисленным положениям в вариантном или гомологичном белке, являются такими, которые выравниваются с этими положениями в эталонном белке, но не обязательно находятся именно в этих числовых положениях относительно конкретной эталонной аминокислотной последовательности по настоящему изобретению. Например, если SEQ ID NO: 13 является эталонной последовательностью, и ее выравнивают с SEQ ID NO: 15, Asn4 SEQ ID NO: 15 "соответствует" Asn6 SEQ ID NO: 13.
[0051] "Доставка" композиции или токсичного белка означает, что композиция или токсичный белок вступает в контакт с насекомым, что приводит к токсическому действию и контролю насекомого. Композиция или токсичный белок могут быть доставлены множеством известных путей, например, перорально при поедании насекомым или при контакте с насекомым посредством экспрессии в трансгенном растении, с помощью составленной белковой композиции(й) белков, распыляемой белковой композиции(й), матрицы приманки или любой другой известной из уровня техники системы доставки белков.
[0052] Термин "домен" относится к набору аминокислот, консервативных в определенных положениях по длине выравнивания последовательностей эволюционно родственных белков. В то время как аминокислоты в других положениях гомологов могут отличаться, аминокислоты, которые являются высококонсервативными в определенных положениях, указывают на аминокислоты, которые, вероятно, являются необходимыми для структуры, стабильности или функции белка. Идентифицированные по их высокой степени консервативности в выравненных последовательностях семейства гомологов белков, они могут применяться в качестве идентификаторов для определения того, принадлежит ли любой рассматриваемый полипептид к ранее идентифицированному семейству полипептидов.
[0053] "Эффективное для контроля насекомых количество" означает, что концентрация токсичного белка, которая обеспечивает подавление, посредством токсического действия, способности насекомых к выживанию, росту, питанию и/или размножению, или ограничение вызванных насекомыми повреждения или гибель культурного растения, или защиту максимального потенциального урожая сельскохозяйственной культуры при выращивании в присутствии насекомых-вредителей. "Эффективное для контроля насекомых количество" может означать или может не означать уничтожение насекомых, хотя предпочтительно оно означает уничтожение насекомых.
[0054] Применяемый в данном документе термин "кассета экспрессии" означает молекулу нуклеиновой кислоты, способную управлять экспрессией по меньшей мере одного представляющего интерес полинуклеотида в соответствующей клетке-хозяине, содержащую промотор, функционально связанный с представляющим интерес полинуклеотидом, который функционально связан с сигналом терминации. "Кассета экспрессии" также, как правило, содержит дополнительные полинуклеотиды, необходимые для надлежащей трансляции представляющего интерес полинуклеотида. Кассета экспрессии также может содержать другие полинуклеотиды, которые не требуются для управления экспрессией представляющего интерес полинуклеотида, но которые присутствует из-за соответствующих сайтов рестрикции для извлечения кассеты из вектора экспрессии. Кассета экспрессии, содержащая представляющий интерес полинуклеотид(ы) может быть химерной, что означает, что по меньшей мере один из ее компонентов является гетерологичным по отношению по меньшей мере к одному из ее других компонентов. Кассета экспрессии может также представлять собой последовательность, которая встречается в природе, но была получена в рекомбинантной форме, пригодной для гетерологичной экспрессии. Тем не менее, как правило, кассета экспрессии является гетерологичной по отношению к хозяину, то есть представляющий интерес полинуклеотид в кассете экспрессии не встречается в природе в клетке-хозяине, и его необходимо было ввести в клетку-хозяина или предка клетки-хозяина с помощью процесса трансформации или процесса скрещивания. Экспрессия представляющего интерес полинуклеотида(ов) в кассете экспрессии обычно находится под контролем промотора. В случае многоклеточного организма, такого как растение, промотор может также быть специфичным или предпочтительным по отношению к конкретной ткани, или органу, или стадии развития. После трансформации в растение кассета экспрессии или ее фрагмент также могут называться "вставленным полинуклеотидом" или "полинуклеотидом вставки".
[0055] "Ген" определяется в данном документе как единица наследственности, состоящая из полинуклеотида, который занимает определенное местоположение на хромосоме или плазмиде и который содержит генетическую инструкцию для определенной характеристики или признака, свойственных организму.
[0056] "Протеаза пищеварительного канала" представляет собой протеазу, которая в встречается в пищеварительном тракте насекомого в природе. Данная протеаза, как правило, участвует в переваривании поглощенных белков.
[0057] Термин "гетерологичный" при применении в отношении гена или нуклеиновой кислоты относится к гену, кодирующему фактор, который не находится в его естественном окружении (то есть, который был изменен посредством вмешательства человека). Например, гетерологичный ген может предусматривать ген организма одного вида, введенный в организм другого вида. Гетерологичный ген также может предусматривать ген, нативный по отношению к организму, но который был изменен определенным образом (например, подвергнут мутации, добавлен в виде множества копий, связан с ненативным промоторным или энхансерным полинуклеотидом и т.д.). Гетерологичные гены дополнительно могут предусматривать полинуклеотиды генов растения, которые включают кДНК-формы гена растения; кДНК могут экспрессироваться либо в смысловой (с получением мРНК), либо антисмысловой ориентации (с получением антисмыслового РНК-транскрипта, комплементарного мРНК-транскрипту). Согласно одному аспекту настоящего изобретения гетерологичные гены отличаются от эндогенных генов растения тем, что полинуклеотид гетерологичного гена, как правило, присоединен к полинуклеотидам, содержащим регуляторные элементы, такие как промоторы, которые в природе не встречаются как ассоциированные с геном для белка, кодируемого гетерологичным геном, или с полинуклеотидом гена растения в хромосоме, или ассоциированы с частями хромосомы, в которых они не встречаются в природе (например, гены экспрессируются в локусах, в которых указанный ген в обычных условиях не экспрессируется). Кроме того, "гетерологичный" полинуклеотид относится к полинуклеотиду, в природе не ассоциированному с клеткой-хозяином, в которую его вводят, в том числе к не встречающимся в природе множественным копиям полинуклеотида, встречающегося в природе.
[0058] "Гомологичная рекомбинация" представляет собой обмен ("кроссинговер") фрагментами ДНК между двумя молекулами ДНК или хроматидами пар хромосом в участке идентичных полинуклеотидов. Будет понятно, что "событие рекомбинации" в данном документе означает мейотический кроссинговер.
[0059] Последовательность нуклеиновой кислоты является "изокодонной" по отношению к эталонной последовательности нуклеиновой кислоты в том случае, когда последовательность нуклеиновой кислоты кодирует полипептид, имеющий такую же аминокислотную последовательность, что и полипептид, кодируемый эталонной последовательностью нуклеиновой кислоты.
[0060] Термин "выделенная" молекула нуклеиновой кислоты, полинуклеотид или токсин представляет собой молекулу нуклеиновой кислоты, полинуклеотид или токсичный белок, которые больше не находится в своей естественной среде. Выделенная молекула нуклеиновой кислоты, полинуклеотид или токсин по настоящему изобретению могут находиться в очищенной форме или могут находиться в рекомбинантном хозяине, таком как трансгенная бактериальная клетка или трансгенное растение.
[0061] "Молекула нуклеиновой кислоты" представляет собой одно- или двунитевую ДНК или РНК, которые могут быть выделены из любого источника. В контексте настоящего изобретения молекула нуклеиновой кислоты предпочтительно является сегментом ДНК.
[0062] "Функционально связанный" относится к ассоциации полинуклеотидов на одном фрагменте нуклеиновой кислоты, вследствие чего функция одного влияет на функцию другого. Например, промотор является функционально связанным с кодирующим полинуклеотидом или функциональной РНК, когда он может влиять на экспрессию такого кодирующего полинуклеотида или функциональной РНК (то есть такой кодирующий полинуклеотид или функциональная РНК находятся под контролем промотора на уровне транскрипции). Кодирующий полинуклеотид в смысловой или антисмысловой ориентации может быть функционально связан с регуляторными полинуклеотидами.
[0063] Применяемые в данном документе выражения "пестицидный," инсектицидный" и т.п. относятся к способности белка Cry по настоящему изобретению обеспечивать контроль вредного организма или к количеству белка Cry, которое может обеспечивать контроль вредного организма, как определено в данном документе. Таким образом, пестицидный белок Cry может подавлять способность вредного организма (например, насекомого-вредителя) к выживанию, росту, питанию и/или размножению или уничтожать его.
[0064] "Растение" представляет собой любое растение на любой стадии развития, в частности, семенное растение.
[0065] "Растительная клетка" представляет собой структурную и физиологическую единицу растения, содержащую протопласт и клеточную стенку. Растительная клетка может находиться в форме выделенной одиночной клетки или культивируемой клетки или в качестве части более высокоорганизованной единицы, такой как, например, растительная ткань, орган растения или целое растение.
[0066] "Культура растительных клеток" означает культуры структурных единиц растения, таких как, например, протопласты, клетки в культуре клеток, клетки растительных тканей, пыльцы, пыльцевых трубок, семязачатков, зародышевых мешков, зиготы и зародышей на различных стадиях развития.
[0067] "Растительный материал" относится к листьям, стеблям, корням, цветкам или частям цветков, плодам, пыльце, яйцеклеткам, зиготам, семенам, черенкам, клеточным или тканевым культурам, или к любым другим частям или продуктам растения.
[0068] "Орган растения" представляет собой отдельную и визуально структурированную и дифференцированную часть растения, такую как корень, стебель, лист, цветочная почка или зародыш.
[0069] Выражение "растительная ткань", применяемое в данном документе, означает группу растительных клеток, организованных в структурную и функциональную единицу. Предусматривается любая ткань растения in planta или в культуре. Данный термин включает без ограничения целые растения, органы растений, семена растений, тканевую культуру и любые группы растительных клеток, организованных в структурные и/или функциональные единицы. Применение данного термина в сочетании с любым специфическим типом растительной ткани, приведенным выше или иным образом охваченным данным определением, или без такового не предназначено для исключения любого другого типа растительной ткани.
[0070] "Полинуклеотид" относится к полимеру, состоящему из большого числа мономеров-нуклеотидов, ковалентно связанных в цепь. Такие "полинуклеотиды" включают ДНК, РНК, модифицированные олигонуклеотиды (например, олигонуклеотиды, содержащие основания, которые не являются типичными для биологической РНК или ДНК, такие как 2'-O-метилированные олигонуклеотиды) и т.п. В некоторых вариантах осуществления нуклеиновая кислота или полинуклеотид могут быть однонитевыми, двунитевыми, многонитевыми или представлять собой комбинацию перечисленного. Если не указано иное, конкретная нуклеиновая кислота или полинуклеотид по настоящему изобретению необязательно содержат или кодируют комплементарные полинуклеотиды, в дополнение к любому явно указанному полинуклеотиду.
[0071] "Представляющий интерес полинуклеотид" относится к любому полинуклеотиду, который при переносе в организм, например растение, придает организму требуемую характеристику, такую как устойчивость к антибиотикам, устойчивость к вирусам, устойчивость к насекомым, устойчивость к болезням или устойчивость к другим вредителям, толерантность к гербицидам, улучшенная питательная ценность, улучшенные показатели в производственном процессе, продукция коммерчески ценных ферментов или метаболитов или измененная репродуктивная способность.
[0072] Термин "промотор" относится к полинуклеотиду, как правило, расположенному выше (5') от его кодирующего полинуклеотида, который осуществляет контроль экспрессии кодирующего полинуклеотида, обеспечивая узнавание РНК-полимеразой и другими факторами, необходимыми для правильной транскрипции.
[0073] "Протопласт" представляет собой выделенную растительную клетку без клеточной стенки или только с частичной клеточной стенкой.
[0074] Применяемый в данном документе термин "рекомбинантный" относится к форме нуклеиновой кислоты (например, ДНК или РНК), и/или белка, и/или организма, которая обычно не будет встречаться в природе и как таковая создана посредством вмешательства человека. Применяемая в данном документе "молекула рекомбинантной нуклеиновой кислоты" представляет собой молекулу нуклеиновой кислоты, содержащую комбинацию полинуклеотидов, которые в природе не встречаются вместе и являются результатом вмешательства человека, например, молекулу нуклеиновой кислоты, которая состоит из комбинации по меньшей мере двух полинуклеотидов, гетерологичных по отношению друг к другу, и/или молекулу нуклеиновой кислоты, синтезированную искусственно и содержащую полинуклеотид, который отличается от полинуклеотида, который будет в норме существовать в природе, и/или молекулу нуклеиновой кислоты, которая содержит трансген, искусственно введенный в геномную ДНК клетки-хозяина, и ассоциированную фланкирующую ДНК генома клетки-хозяина. Примером молекулы рекомбинантной нуклеиновой кислоты является молекула ДНК, полученная в результате вставки трансгена в геномную ДНК растения, что в конечном итоге может приводить к экспрессии молекулы рекомбинантной РНК и/или белка в данном организме. Применяемое в данном документе выражение "рекомбинантное растение" представляет собой растение, которое обычно не будет существовать в природе, и оно является результатом вмешательства человека и содержит трансген и/или гетерологичную молекулу нуклеиновой кислоты, введенную в его геном. В результате такого изменения генома рекомбинантное растение явно отличается от родственного растения дикого типа.
[0075] "Регуляторные элементы" относятся к последовательностям, вовлеченным в контроль экспрессии нуклеотидной последовательности. Регуляторные элементы предусматривают промотор, функционально связанный с представляющей интерес нуклеотидной последовательностью, и сигналы терминации. Как правило, они охватывают также последовательности, необходимые для надлежащей трансляции нуклеотидной последовательности.
[0076] Термин "идентичный" или "в значительной степени идентичный" в контексте двух последовательностей нуклеиновых кислот или белковых последовательностей относится к двум или более последовательностям или подпоследовательностям, которые характеризуются по меньшей мере 60%, предпочтительно 80%, более предпочтительно 90, даже более предпочтительно 95% и наиболее предпочтительно по меньшей мере 99% идентичностью нуклеотидных или аминокислотных остатков при сравнении и выравнивании для максимального соответствия, как определено с применением одного из следующих алгоритмов сравнения последовательностей или путем визуальной проверки. Предпочтительно значительная степень идентичности имеет место в пределах участка последовательностей, который состоит из по меньшей мере приблизительно 50 остатков в длину, более предпочтительно в пределах участка, состоящего из по меньшей мере приблизительно 100 остатков, и наиболее предпочтительно последовательности в значительной степени идентичны в пределах по меньшей мере приблизительно 150 остатков. В особенно предпочтительном варианте осуществления последовательности являются в значительной степени идентичными по всей длине кодирующих участков. Кроме того, в значительной степени идентичные последовательности нуклеиновой кислоты или белка выполняют, по сути, одинаковую функцию.
[0077] При сравнении последовательностей одна последовательность, как правило, выступает в качестве эталонной последовательности, с которой сравнивают тестируемые последовательности. При использовании алгоритма сравнения последовательностей тестируемую и эталонную последовательности вводят в компьютер, при необходимости задают координаты подпоследовательности, и задают программные параметры алгоритма сравнения последовательностей. Затем с помощью алгоритма сравнения последовательностей на основе заданных программных параметров вычисляют процент идентичности последовательностей для тестируемой последовательности(ей) относительно эталонной последовательности.
[0078] Оптимальное выравнивание последовательностей для сравнения можно проводить, например, с помощью алгоритма поиска локальной гомологии по Smith & Waterman, Adv. Appl. Math. 2: 482 (1981), с помощью алгоритма выравнивания областей гомологии по Needleman & Wunsch, J. Mol. Biol. 48: 443 (1970), с помощью способа поиска сходства по Pearson & Lipman, Proc. Nat'l. Acad Sci. USA 85: 2444 (1988), с помощью реализации данных алгоритмов в компьютерных программах (GAP, BESTFIT, FASTA и TFASTA в пакете программного обеспечения Wisconsin Genetics, Genetics Computer Group, 575 Science Dr., Мэдисон, Висконсин) или путем визуальной проверки (в целом см. Ausubel et al., ниже).
[0079] Одним из примеров алгоритма, подходящего для определения процента идентичности последовательностей и сходства последовательностей, является алгоритм BLAST, описанный в Altschul et al., J. Mol. Biol. 215: 403-410 (1990). Программное обеспечение для осуществления анализов BLAST является общедоступным в Национальном центре биотехнологической информации (National Center for Biotechnology Information, U.S. National Library of Medicine, 8600 Rockville Pike, Бетесда, Мэриленд 20894, США). Данный алгоритм включает первоначально идентификацию пар последовательностей с наибольшим сходством (HSP) путем идентификации коротких "слов" длиной W в запрашиваемой последовательности, которые либо совпадают, либо удовлетворяют некоторому положительному пороговому баллу Т при выравнивании со "словом" такой же длины в последовательности из базы данных. Т называется пороговым показателем соседнего "слова" (Altschul et al., 1990). Эти исходные совпадения соседних "слов" выступают в качестве затравки для начала поисков с целью обнаружения более длинных HSP, содержащих их. Совпадения "слов" затем продлеваются в обоих направлениях вдоль каждой последовательности до тех пор, пока может увеличиваться совокупный показатель выравнивания. Совокупные показатели рассчитывают с применением, в случае нуклеотидных последовательностей, параметров М (балл-вознаграждение, начисляемый за пару совпадающих остатков; всегда > 0) и N (штрафной балл, начисляемый за несовпадающие остатки; всегда < 0). В случае аминокислотных последовательностей для расчета совокупного показателя применяют матрицу замен. Продление совпадений "слов" в каждом направлении прекращается, когда совокупный показатель выравнивания снижается на величину X от его максимального достигнутого значения, при этом совокупный показатель падает до нуля или ниже вследствие накопления одного или нескольких выравниваний остатков с отрицательными показателями, либо в случае достижения конца одной из последовательностей. Параметры алгоритма BLAST, W, Т и X, определяют чувствительность и скорость выравнивания. Программа BLASTN (для нуклеотидных последовательностей) использует по умолчанию длину "слова" (W), равную 11, ожидаемое значение (Е), равное 10, пороговое значение, равное 100, М=5, N=-4 и сравнение обеих нитей. Для аминокислотных последовательностей программа BLASTP использует по умолчанию длину "слова" (W), равную 3, ожидаемое значение (Е), равное 10, и матрицу замен BLOSUM62 (см. Henikoff & Henikoff, Proc. Natl. Acad Sci. USA 89: 10915 (1989)).
[0080] В дополнение к расчету процента идентичности последовательностей алгоритм BLAST также выполняет статистический анализ сходства между двумя последовательностями (см., например, Karlin & Altschul, Proc. Nat'l. Acad. Sci. USA 90: 5873-5787 (1993)). Одной мерой сходства, предоставляемой алгоритмом BLAST, является наименьшая суммарная вероятность (P(N)), которая предусматривает показатель вероятности, согласно которому совпадения между двумя нуклеотидными или аминокислотными последовательностями будут наблюдаться случайным образом. Например, тестируемая последовательность нуклеиновой кислоты считается подобной эталонной последовательности, если наименьшая суммарная вероятность при сравнении тестируемой последовательности нуклеиновой кислоты с эталонной последовательностью нуклеиновой кислоты составляет менее приблизительно 0,1, более предпочтительно менее приблизительно 0,01 и наиболее предпочтительно менее приблизительно 0,001.
[0081] Другим показателем того, что две последовательности нуклеиновых кислот в значительной степени идентичны, является то, что две молекулы гибридизируются друг с другом в жестких условиях. Фраза "гибридизируется специфически с" относится к связыванию, образованию дуплекса или гибридизации молекулы только с определенной нуклеотидной последовательностью в жестких условиях, когда такая последовательность присутствует в сложной смеси (например, общих клеточных) ДНК или РНК. "В значительной степени связывается" относится к гибридизации комплементарных последовательностей, нуклеиновой кислоты-зонда и целевой нуклеиновой кислоты, и также охватывает незначительные несовпадения, которые могут компенсироваться за счет снижения жесткости среды для гибридизации, чтобы добиться требуемого обнаружения целевой последовательности нуклеиновой кислоты.
[0082] "Жесткие условия гибридизации" и "жесткие условия отмывки при гибридизации" в контексте экспериментов по гибридизации нуклеиновых кислот, таких как Саузерн- и нозерн-гибридизация, зависят от последовательности и отличаются при разных параметрах окружающей среды. Более длинные последовательности специфично гибридизируются при более высоких температурах. Подробное руководство по гибридизации нуклеиновых кислот входит в состав Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2 "Overview of principles of hybridization and the strategy of nucleic acid probe assays" Elsevier, New York. Как правило, условия гибридизации и отмывки высокой жесткости выбирают так, чтобы температура была приблизительно на 5°С ниже точки плавления (Tm) для конкретной последовательности при определенных ионной силе и рН. Как правило, в "жестких условиях" зонд будет гибридизироваться со своей целевой подпоследовательностью, а не с другими последовательностями.
[0083] Tm является температурой (при определенных ионной силе и рН), при которой 50% целевой последовательности гибридизируется с абсолютно совпадающим зондом. Для очень жестких условий выбирают температуру, равную Tm для конкретного зонда. Примером жестких условий гибридизации для гибридизации комплементарных нуклеиновых кислот, которые имеют более 100 комплементарных остатков на фильтре при Саузерн- или нозерн-блоттинге, является 50% формамида с 1 мг гепарина при 42°С, при этом гибридизацию проводят в течение ночи. Примером условий отмывки высокой жесткости является 0,15 М NaCl при 72°С в течение приблизительно 15 минут. Примером жестких условий отмывки является отмывка с помощью 0,2 × SSC при 65°С в течение 15 минут (описание буфера SSC см. в Sambrook ниже). Зачастую для избавления от фонового сигнала зонда отмывке в условиях высокой жесткости предшествует отмывка в условиях низкой жесткости. Примером условий отмывки средней жесткости для дуплекса, имеющего, например, более 100 нуклеотидов, является 1 × SSC при 45°С в течение 15 минут. Примером условий отмывки низкой жесткости для дуплекса, имеющего, например, более 100 нуклеотидов, является 4-6 × SSC при 40°С в течение 15 минут. Для коротких зондов (например, длиной от приблизительно 10 до 50 нуклеотидов) жесткие условия, как правило, предусматривают концентрации солей, составляющие менее чем приблизительно 1,0 М ионов Na, как правило, концентрации, составляющие приблизительно 0,01-1,0 М ионов Na (или других солей) при рН 7,0-8,3, а также температуру, как правило, составляющую по меньшей мере приблизительно 30°С. Жестких условий также можно достигать путем добавления дестабилизирующих средств, таких как формамид. В целом, соотношение сигнал-шум, в 2× (или более) раза превышающее наблюдаемое для неродственного зонда в конкретном гибридизационном анализе, указывает на выявление специфической гибридизации. Нуклеиновые кислоты, которые не гибридизируются друг с другом в жестких условиях, все еще являются в значительной степени идентичными, если белки, которые они кодируют, в значительной степени идентичны. Например, это происходит в тем случае, когда копию нуклеиновой кислоты создают с применением максимальной вырожденности кодонов, допускаемой генетическим кодом.
[0084] Примеры комплексов условий гибридизации/отмывки, которые можно применять для клонирования гомологичных нуклеотидных последовательностей, которые в значительной степени идентичны эталонным нуклеотидным последовательностям по настоящему изобретению, являются следующими: эталонная нуклеотидная последовательность предпочтительно гибридизируется с эталонной нуклеотидной последовательностью в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ EDTA при 50°С с отмывкой в 2 × SSC, 0,1% SDS при 50°С, более желательно в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ EDTA при 50°С с отмывкой в 1 × SSC, 0,1% SDS при 50°С, еще более желательно в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ EDTA при 50°С с отмывкой в 0,5 × SSC, 0,1% SDS при 50°С, предпочтительно в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ EDTA при 50°С с отмывкой в 0,1 × SSC, 0,1% SDS при 50°С, более предпочтительно в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ EDTA при 50°С с отмывкой в 0,1 × SSC, 0,1% SDS при 65°С.
[0085] Еще одним показателем того, что две последовательности нуклеиновых кислот или белки являются в значительной степени идентичными, является то, что белок, кодируемый первой нуклеиновой кислотой, характеризуется иммунологической перекрестной реактивностью с белком, кодируемым второй нуклеиновой кислотой, или специфически связывается в таких реакциях. Таким образом, белок, как правило, является в значительной степени идентичным второму белку, например, если два белка отличаются только консервативными заменами.
[0086] "Синтетический" относится к нуклеотидной последовательности, содержащей основания и/или структурные признаки, отсутствующие в природной последовательности. Например, синтетической считается искусственная последовательность, кодирующая белок Cry по настоящему изобретению, которая по содержанию G + C и нормальному распределению кодонов больше похожа на гены двудольных и/или однодольных растений.
[0087] "Трансформация" представляет собой процесс введения гетерологичной нуклеиновой кислоты в клетку- или организм-хозяин. В частности, "трансформация" означает стабильную интеграцию молекулы ДНК в геном представляющего интерес организма.
[0088] "Трансформированный/трансгенный/рекомбинантный" относится к организму-хозяину, такому как бактерия или растение, в который была введена гетерологичная молекула нуклеиновой кислоты. Молекулу нуклеиновой кислоты можно стабильно интегрировать в геном хозяина, или же молекула нуклеиновой кислоты также может присутствовать в качестве внехромосомной молекулы. Такая внехромосомная молекула может быть автореплицирующейся. Подразумевается, что трансформированные клетки, ткани или растения охватывают не только конечный продукт процесса трансформации, но также и его трансгенное потомство. "Нетрансформированный", "нетрансгенный" или "нерекомбинантный" хозяин относится к организму дикого типа, например, бактерии или растению, которые не содержат гетерологичную молекулу нуклеиновой кислоты.
[0089] Нуклеотиды обозначены по их основаниям с помощью следующих стандартных сокращений: аденин (А), цитозин (С), тимин (Т) и гуанин (G). Аналогичным образом, аминокислоты обозначены с помощью следующих стандартных сокращений: аланин (Ala; А), аргинин (Arg; R), аспарагин (Asn; N), аспарагиновая кислота (Asp; D), цистеин (Cys; С), глутамин (Gln; Q), глутаминовая кислота (Glu; Е), глицин (Gly; G), гистидин (His; Н), изолейцин (Ile; 1), лейцин (Leu; L), лизин (Lys; K), метионин (Met; М), фенилаланин (Phe; F), пролин (Pro; Р), серии (Ser; S), треонин (Thr, Т), триптофан (Trp; W), тирозин (Tyr; Y) и валин (Val; V).
[0090] В настоящем изобретении предусмотрены композиции и способы для контроля опасных вредителей растений. В частности, настоящее изобретение относится к белкам Cry, которые токсичны для вредителей растений, и к полинуклеотидам, которые содержат нуклеотидные последовательности, которые кодируют белки Cry, а также к получению и применению полинуклеотидов и белков Cry для контроля вредителей растений.
[0091] Соответственно, в некоторых вариантах осуществления предусмотрен химерный ген, который содержит гетерологичный промотор, функционально связанный с полинуклеотидом, содержащим нуклеотидную последовательность, которая кодирует белок, токсичный по меньшей мере для совки-ипсилон (Agrotis ipsilon), где нуклеотидная последовательность (а) характеризуется от по меньшей мере 80% (например, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%) до по меньшей мере 99% (99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%) идентичностью последовательности с любой из SEQ ID NO: 1-4; или (b) кодирует белок, содержащий аминокислотную последовательность, которая характеризуется от по меньшей мере 80% (например, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%) до по меньшей мере 99% (99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%) идентичностью последовательности с любой из SEQ ID NO: 13-16; или (с) представляет собой синтетическую последовательность на основании (а) или (b), которая имеет кодоны, оптимизированные для экспрессии в трансгенном организме.
[0092] В других вариантах осуществления гетерологичный промотор представляет собой промотор, обеспечивающий экспрессию в растении. Например, без ограничения, промотор, обеспечивающий экспрессию в растении, может быть выбран из группы, состоящей из промотора убиквитина, cmp, TrpA кукурузы, 5'-UTR гена 9 бактериофага Т3, сахарозосинтетазы 1 кукурузы, алкогольдегидрогеназы 1 кукурузы, светособирающего комплекса кукурузы, белка теплового шока кукурузы, малой субъединицы RuBP карбоксилазы гороха, маннопинсинтазы Ti-плазмиды, нопалинсинтазы Ti-плазмиды, халкон-изомеразы петунии, богатого глицином белка 1 бобов, пататина картофеля, лектина, 35S CaMV и малой субъединицы S-E9 RuBP карбоксилазы.
[0093] В дополнительных вариантах осуществления белок, кодируемый химерным геном, дополнительно токсичен для одного или нескольких видов насекомых, выбранных из группы, состоящей из кукурузного мотылька (Ostrinia nubilalis), совки травяной (Spodoptera frugiperda), американской кукурузной совки (Helicoverpa zea), огневки тростниковой (Diatraea saccharalis), гусеницы совки бархатных бобов (Anticarsia gemmatalis), соевой совки (Chrysodeixis includes), огневки кукурузной юго-западной (Diatraea grandiosella), западной бобовой совки (Richia albicosta), табачной совки (Heliothis virescens), восточного кукурузного мотылька (Ostrinia furnacalis), хлопковой совки (Helicoverpa armigera), огневки желтой рисовой (Chilo suppressalis), розовой стеблевой совки (Sesamia calamistis) и огневки рисовой (Cnaphalocrocis medinalis).
[0094] В дополнительных вариантах осуществления полинуклеотид содержит нуклеотидную последовательность, которая характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 1, или характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 2, или характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 3, или характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с SEQ ID NO: 4.
[0095] В других вариантах осуществления полинуклеотид содержит нуклеотидную последовательность, которая кодирует белок, содержащий аминокислотную последовательность, которая характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с любой из SEQ ID NO: 13-16.
[0096] В еще одних вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 13.
[0097] В дополнительных вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 14.
[0098] В еще одних вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 15.
[0099] В других вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 16.
[00100] В некоторых вариантах осуществления химерный ген по настоящему изобретению содержит полинуклеотид, содержащий синтетическую последовательность нуклеотидной последовательности, которая характеризуется по меньшей мере 80%, или по меньшей мере на 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% с любой из SEQ ID NO: 5-12, где синтетическая последовательность имеет кодоны, оптимизированные для экспрессии в трансгенном организме. В других вариантах осуществления химерный ген по настоящему изобретению содержит молекулу нуклеиновой кислоты, содержащую синтетическую последовательность нуклеотидной последовательности, которая кодирует белок, содержащий аминокислотную последовательность, которая характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с любой из SEQ ID NO: 13-20, где синтетическая последовательность имеет ко доны, оптимизированные для экспрессии в трансгенном организме. В дополнительных вариантах осуществления трансгенный организм представляет собой трансгенную бактерию или трансгенное растение.
[00101] В некоторых вариантах осуществления настоящего изобретения предусмотрен синтетический полинуклеотид, содержащий, состоящий главным образом или состоящий из нуклеотидной последовательности, которая кодирует белок, активный в отношении по меньшей мере совки-ипсилон (Agrotis ipsilon), где нуклеотидная последовательность характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с любой из SEQ ID NO: 5-12.
[00102] В других вариантах осуществления настоящего изобретения предусмотрен синтетический полинуклеотид, содержащий, состоящий главным образом или состоящий из нуклеотидной последовательности, которая кодирует белок, активный в отношении по меньшей мере совки-ипсилон (Agrotis ipsilon), где нуклеотидная последовательность кодирует аминокислотную последовательностью, которая характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с любой из SEQ ID NO: 13-20.
[00103] В некоторых вариантах осуществления настоящего изобретения предусмотрен синтетический полинуклеотид, содержащий, состоящий главным образом или состоящий из нуклеотидной последовательности, имеющей по меньшей мере один кодон, оптимизированный для экспрессии в трансгенном организме, и кодирующий белок, токсичный по меньшей мере для совки-ипсилон (Agrotis ipsilon) и американской кукурузной совки (Helicoverpa zea), где белок содержит аминокислотную последовательность, которая характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 13, и при этом аминокислотная последовательность в положениях, соответствующих аминокислотным положениям 40-44 из SEQ ID NO: 13, представляет собой NLNSC. В дополнительных вариантах осуществления полинуклеотид содержит, состоит главным образом или состоит из SEQ ID NO: 5 или SEQ ID NO: 9. В дополнительных вариантах осуществления аминокислотная последовательность содержит, состоит главным образом или состоит из SEQ ID NO: 13 или SEQ ID NO: 17.
[00104] Согласно некоторым вариантам осуществления настоящего изобретения предусмотрен выделенный белок, токсичный по меньшей мере для совки-ипсилон (Agrotis ipsilon), при этом белок содержит, состоит главным образом или состоит из (а) аминокислотной последовательности, которая характеризуется от по меньшей мере 80% идентичностью последовательности до по меньшей мере 99% идентичностью последовательности с аминокислотной последовательностью, представленной любой из SEQ ID NO: 13-20; или (b) аминокислотная последовательность, которая кодируется нуклеотидной последовательностью, которая характеризуется от по меньшей мере 80% идентичностью последовательности до по меньшей мере 99% идентичностью последовательности с нуклеотидной последовательностью, представленной любой из SEQ ID NO: 5-12.
[00105] В других вариантах осуществления выделенный белок содержит, состоит главным образом или состоит из аминокислотной последовательности, которая характеризуется от по меньшей мере 80% до по меньшей мере 99% идентичностью последовательности с любой из SEQ ID NO: 13-16. В еще одних вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 13.
[00106] В других вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 14.
[00107] В дополнительных вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 15.
[00108] В еще одних вариантах осуществления аминокислотная последовательность характеризуется по меньшей мере 80%, или по меньшей мере 81%, или по меньшей мере 82%, или по меньшей мере 83%, или по меньшей мере 84%, или по меньшей мере 85%, или по меньшей мере 86%, или по меньшей мере 87%, или по меньшей мере 88%, или по меньшей мере 89%, или по меньшей мере 90%, или по меньшей мере 91%, или по меньшей мере 92%, или по меньшей мере 94%, или по меньшей мере 94%, или по меньшей мере 95%, или по меньшей мере 96%, или по меньшей мере 97%, или по меньшей мере 98%, или по меньшей мере 99%, или по меньшей мере 99,1%, или по меньшей мере 99,2%, или по меньшей мере 99,3%, или по меньшей мере 99,4%, или по меньшей мере 99,5% или по меньшей мере 99,6%, или по меньшей мере 99,7%, или по меньшей мере 99,8%, или по меньшей мере 99,9% идентичностью последовательности с SEQ ID NO: 16.
[00109] В некоторых вариантах осуществления аминокислотная последовательность содержит, состоит главным образом или состоит из любой из SEQ ID NO: 13-20.
[00110] Антитела, вырабатываемые в ответ на иммунную стимуляцию нативными или мутантными ВТ-0044, ВТ-0051, ВТ-0068 и ВТ-0128 и подобными или родственными белками по настоящему изобретению, могут быть получены с применением стандартных иммунологических методик получения поликлональной антисыворотки и, при необходимости, иммортализации антителопродуцирующих клеток иммунизированного организма-хозяина для получения источников моноклональных антител. Методики получения антител к любому представляющему интерес веществу хорошо известны, например, как описано в Harlow и Lane (1988) и в Goding (1986). Настоящее изобретение охватывает инсектицидные белки, которые перекрестно реагируют с антителами, вырабатываемыми против одного или нескольких инсектицидных белков Cry по настоящему изобретению.
[00111] Антитела, полученные согласно настоящему изобретению, также применимы в иммунологических анализах для определение количества или наличия нативных или мутантных ВТ-0044, ВТ-0051, ВТ-0068 и ВТ-0128 или родственного белка в биологическом образце. Такие анализы также применимы в получении композиций, содержащих один или несколько токсичных белков по настоящему изобретению или родственных токсичных белков, причем такое получение проводят с обеспечением контроля качества. Кроме того, антитела можно применять для оценки эффективности рекомбинантной продукции одного или нескольких белков по настоящему изобретению или родственного белка, а также для скрининга библиотек экспрессии на наличие нуклеотидной последовательности, кодирующей один или несколько белков по настоящему изобретению или последовательностей, кодирующих родственные белки. Антитела также применимы в качестве аффинных лигандов для очистки и/или выделения любого одного или нескольких белков по настоящему изобретению и родственных белков. Белки по настоящему изобретению и белки, содержащие родственные антигенные эпитопы, могут быть получены в результате сверхэкспрессии полноразмерной или частичной последовательности, кодирующей весь белок по настоящему изобретению или родственный белок, или их часть, в предпочтительной клетке-хозяине.
[00112] Считается, что последовательности ДНК, которые кодируют нативный белок Cry по настоящему изобретению, можно изменять с помощью различных способов, и что эти изменения могут приводить к образованию последовательностей ДНК, кодирующих белки с аминокислотными последовательности, отличающимися от таковых, закодированных в нативном белке Cry по настоящему изобретению. Этот белок может быть изменен различными способами, в том числе с помощью аминокислотных замен, делеций, усечений и вставок одной или нескольких аминокислот из любой из SEQ ID NO: 13-16, включая до приблизительно 2, приблизительно 3, приблизительно 4, приблизительно 5, приблизительно 6, приблизительно 7, приблизительно 8, приблизительно 9, приблизительно 10, приблизительно 15, приблизительно 20, приблизительно 25, приблизительно 30, приблизительно 35, приблизительно 40, приблизительно 45, приблизительно 50, приблизительно 55, приблизительно 60, приблизительно 65, приблизительно 70, приблизительно 75, приблизительно 80, приблизительно 85, приблизительно 90, приблизительно 100, приблизительно 105, приблизительно 110, приблизительно 115, приблизительно 120, приблизительно 125, приблизительно 130, приблизительно 135, приблизительно 140, приблизительно 145, приблизительно 150, приблизительно 155 или больше аминокислотных замен, делеций или вставок. Способы таких манипуляций в целом известны из уровня техники. Например, варианты аминокислотной последовательности нативного белка Cry могут быть получены посредством введения мутаций в полинуклеотид, который кодирует данный белок. Это также можно осуществлять с применением одной из нескольких форм мутагенеза и/или метода направленной эволюции. Согласно некоторым аспектам изменения, кодируемые аминокислотной последовательностью, не будут существенно влиять на функцию белка. Такие варианты будут обладать требуемой инсектицидной активностью. В одном варианте осуществления настоящего изобретения нуклеотидные последовательности, представленные SEQ ID NO: 1-4, изменяют с введением аминокислотных замен в кодируемый белок. В некоторых вариантах осуществления полученный мутантный белок кодируется синтетическим мутантным полинуклеотидом, содержащим нуклеотидную последовательность, представленную любой из SEQ ID NO: 9-12. В других вариантах осуществления мутантные белки содержат, состоят главным образом или состоят из аминокислотной последовательности, представленной любой из SEQ ID NO: 17-20.
[00113] Понятно, что способность инсектицидного белка обеспечивать инсектицидную активность может быть улучшена путем применения таких методик для композиций по настоящему изобретению. Например, можно экспрессировать белок Cry в клетках-хозяевах, которые характеризуются высоким уровнем ошибочного включения оснований в ходе репликации ДНК, например, XL-1 Red (Stratagene, Ла-Хойя, Калифорния). После размножения в таких штаммах можно выделять ДНК (например, путем получения плазмидной ДНК или путем амплификации с помощью ПЦР и клонирования полученного ПЦР-фрагмента в вектор), экспрессировать мутантные последовательности белка Cry в штамме, не приводящем к образованию мутаций, и идентифицировать мутированные гены с инсектицидной активностью, например, путем осуществления анализа для тестирования инсектицидной активности. Обычно белок смешивают и применяют в анализах питания. См., например Marrone et al. (1985) J. of Economic Entomology 78:290-293. Такие анализы могут включать приведение растения в контакт с одним или несколькими вредителями и определение способности растений к выживанию и/или способности вызывать гибель вредителей. Примеры мутаций, которые приводят к повышению токсичности, можно найти в Schnepf et al. (1998) Microbiol. Mol. Biol. Rev. 62:775-806.
[00114] В качестве альтернативы, могут быть выполнены изменения в аминокислотной последовательности по настоящему изобретению на амино- или карбокси-конце, при этом они не оказывают существенное влияние на активность. Они могут включать вставки, делеции или изменения, введенные с применением современных способов молекулярной биологии, таких как ПЦР, в том числе ПЦР-амплификаций, обеспечивающих изменение или расширение последовательности, кодирующей белок, за счет включения последовательностей, кодирующих аминокислоты, в олигонуклеотиды, используемые при ПЦР-амплификации. В качестве альтернативы добавленные последовательности, кодирующие белок, могут включать последовательности, кодирующие весь белок, такие как в большинстве случаев применяются в уровне техники для создания белков слияния. Такие белки слияния зачастую применяют для (1) повышения уровня экспрессии представляющего интерес белка, (2) для введения связывающего домена, ферментативной активности или эпитопа для облегчения одного из очистки белка, выявления белка или других применений в эксперименте, известных из уровня техники, (3) направленной секреции в субклеточную органеллу, такую как периплазматическое пространство грамотрицательных бактерий, или трансляции в эндоплазматическом ретикулуме эукариотических клеток, в последнем случае результатом зачастую является гликозилирования белка.
[00115] Белок Cry по настоящему изобретению также может быть подвергнут мутации с введением эпитопа для получения антител, которые распознают мутантный белок. Таким образом, в некоторых вариантах осуществления настоящего изобретения предусмотрен мутированный белок Cry, где аминокислотная замена в нативном белке Cry дает мутантный белок Cry с антигенным участком, который позволяет отличать мутантный белок Cry от нативного белка Cry в анализе выявления белков. В другом варианте осуществления настоящего изобретения предусмотрен мутированный белок Cry по настоящему изобретению, где аминокислотная последовательность содержит аминокислотную замену в участке, соответствующем аминокислотам 342-354 из SEQ ID NO: 6. В других вариантах осуществления аминокислотная последовательность содержит аминокислотную замену в положении 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353 или 354 из SEQ ID NO: 6. В еще одних вариантах осуществления аминокислотная последовательность содержит аминокислотную замену в аминокислотном положении, соответствующем аминокислотам 350, 351 и 354 из SEQ ID NO: 6. В дополнительных вариантах осуществления аминокислотная последовательность содержит аминокислотную замену в аминокислотных положениях 350, 351 и 354 из SEQ ID NO: 6. В еще одних вариантах осуществления аминокислота, соответствующая положению 350, заменена на изолейцин (I), аминокислота, соответствующая положению 351, заменена на глутамин (Q), а аминокислота, соответствующая положению 354, заменена на серии (S). В других вариантах осуществления лейцин (L) в положении 350 из SEQ ID NO: 6 заменен на изолейцин (I), аспарагин (N) в положении 351 из SEQ ID NO: 6 заменен на глутамин (Q), а треонин (Т) в положении 354 из SEQ ID NO: 6 заменен на серии (S). В других вариантах осуществления нативный белок Cry содержит аминокислотную последовательность, представленную любой из SEQ ID NO: 13-16. В еще одних варианты осуществления нативный белок Cry содержит аминокислотную последовательность, представленную SEQ ID NO: 6, а мутантный белок содержит аминокислотную последовательность, представленную SEQ ID NO: 18.
[00116] В некоторых вариантах осуществления настоящего изобретения предусмотрено антитело, которое специфически распознает эпитоп мутантного белка Cry по настоящему изобретению, где эпитоп содержит аминокислотную последовательность с одной или несколькими заменами в аминокислотах, соответствующих аминокислотам 342-354 из SEQ ID NO: 6. В других вариантах осуществления эпитоп содержит аминокислотную последовательность с одной или несколькими заменами в аминокислотах 342-354 из SEQ ID NO: 6. В еще одних вариантах осуществления эпитоп содержит аминокислоты 342-354 из SEQ ID NO: 18.
[00117] В некоторых вариантах осуществления настоящего изобретения предусмотрен способ получения антитела, которое способно дифференцировать мутированный белок Cry и нативный белок Cry, из которого получен мутированный белок Cry, при этом метод включает стадии замены аминокислоты в антигенной петле нативного белка Cry и стимуляции выработки антител, которые специфически распознают мутированную антигенную петлю в мутированном белке Cry и не распознают нативный белок Cry. В одном варианте осуществления антигенную петлю идентифицируют в неконсервативных участках за пределами домена I нативного белка Cry. В другом варианте осуществления антигенная петля не является петлей, вовлеченной в распознавание рецепторов белков Cry в пищеварительном канале насекомого или вовлеченной в активацию белка Cry под действием протеазы. В другом варианте осуществления антигенная петля содержит аминокислотную последовательность, которая соответствует аминокислотам 341-354 из SEQ ID NO: 6. В еще одном варианте осуществления антигенная петля содержит аминокислоты 342-354 из SEQ ID NO: 6.
[00118] Варианты нуклеотидных и аминокислотных последовательностей по настоящему изобретению также охватывают последовательности, полученные в результате процедур мутагенеза и рекомбинации, таких как ДНК-шаффлинг. С помощью такой процедуры один или несколько различных участков, кодирующих токсичный белок, можно применять для создания нового токсичного белка, обладающего требуемыми свойствами. Следовательно, библиотеки рекомбинантных полинуклеотидов получают из популяции полинуклеотидов с родственными последовательностями, содержащими участки последовательности, которые характеризуются значительной степенью идентичности последовательности и могут подвергаться гомологичной рекомбинации in vitro или in vivo. Например, с применением данного подхода, мотивы последовательности, кодирующие представляющий интерес домен, можно подвергать шаффлингу между пестицидным геном по настоящему изобретению и другими известными пестицидными генами с получением нового гена, кодирующего белок с улучшенным представляющим интерес свойством, таким как повышенная инсектицидная активность. Стратегии для такого ДНК-шаффлинга известны из уровня техники. См., например, Stemmer (1994) Proc. Natl. Acad. Sci. USA 91:10747-10751; Stemmer (1994) Nature 370:389-391; Crameri et al. (1997) Nature Biotech. 15:436-438; Moore et al. (1997) J. Mol. Biol. 272:336-347; Zhang et al. (1997) Proc. Natl. Acad. Sci. USA 94:4504-4509; Crameri et al. (1998) Nature 391:288-291; и патенты США №№5605793 и 5837458.
[00119] Обмен доменов или шаффлинг является другим механизмом для получения измененных белков Cry по настоящему изобретению. Домены можно обменивать между белками Cry, что приводит к гибридным или химерным токсичным белкам с улучшенной пестицидной активностью или спектром мишеней. Способы получения рекомбинантных белков и тестирования их в отношении пестицидной активности хорошо известны из уровня техники (см., например, Naimov et al. (2001) Appl. Environ. Microbiol. 67:5328-5330; de Maagd et al. (1996) Appl. Environ. Microbiol. 62:1537-1543; Ge et al. (1991) J. Biol. Chem. 266:17954-17958; Schnepf et al. (1990) J. Biol. Chem. 265:20923-20930; Rang et al. 91999) Appl. Environ. Microbiol. 65:2918-2925).
[00120] В некоторых вариантах осуществления настоящего изобретения предусмотрен рекомбинантный вектор, содержащий полинуклеотид, молекулу нуклеиновой кислоты, кассету экспрессии или химерный ген по настоящему изобретению. В других вариантах осуществления вектор дополнительно определен как плазмида, космида, фагмида, искусственная хромосома, фаг или вирусный вектор. Некоторые векторы для применения в трансформации растений и других организмов известны из уровня техники.
[00121] Таким образом, некоторые варианты осуществления настоящего изобретения относятся к кассетам экспрессии, сконструированным для экспрессии полинуклеотидов и молекул нуклеиновых кислот по настоящему изобретению. Применяемое в данном документе выражение "кассета экспрессии" означает молекулу нуклеиновой кислоты, имеющую по меньшей мере последовательность контроля, функционально связанную с представляющей интерес нуклеотидной последовательностью. Таким образом, например, в кассетах экспрессии для экспрессии в растении, части растения и/или растительной клетке предусмотрены промоторы растений, функционально связанные с нуклеотидными последовательностями, подлежащими экспрессии.
[00122] Кассета экспрессии, содержащая представляющую интерес нуклеотидную последовательность, может быть химерной, что означает, что по меньшей мере один из ее компонентов является гетерологичным по отношению по меньшей мере к одному из ее остальных компонентов. Кассета экспрессии также может представлять собой последовательность, которая встречается в природе, но которая была получена в рекомбинантной форме, применимой для гетерологичной экспрессии. Однако, как правило, кассета экспрессии является гетерологичной по отношению к хозяину, т.е. конкретная последовательность нуклеиновой кислоты в кассете экспрессии не встречается в природе в клетке-хозяине, и ее необходимо было ввести в клетку-хозяина или предка клетки-хозяина с помощью события трансформации.
[00123] В дополнение к промоторам, функционально связанным с нуклеотидными последовательностями по настоящему изобретению, кассета экспрессии по настоящему изобретению также может содержать другие регуляторные последовательности. Применяемое в данном документе выражение "регуляторные последовательности" означает нуклеотидные последовательности, расположенные выше (5'-некодирующие последовательности), в пределах или ниже (3'-некодирующие последовательности) кодирующей последовательности, которые влияют на транскрипцию, процессинг или стабильность РНК или трансляцию ассоциированной кодирующей последовательности. Регуляторные последовательности включают без ограничения энхансеры, интроны, лидерные последовательности, регулирующие трансляцию, сигналы терминации и сигнальные последовательности полиаденилирования.
[00124] В некоторых вариантах осуществления кассета экспрессии по настоящему изобретению также может содержать нуклеотидные последовательности, которые кодируют другие требуемые признаки. Такие нуклеотидные последовательности можно "пакетировать" с любой комбинацией нуклеотидных последовательностей для создания растений, частей растений или растительных клеток с требуемым фенотипом. "Пакетированные" комбинации можно создавать с помощью любого способа, в том числе без ограничения с помощью скрещивания растений с помощью любой общепринятой методики или с помощью генетической трансформации (т.е. молекулярного стэкинга). При "пакетировании" путем генетической трансформации растений представляющие интерес нуклеотидные последовательности можно комбинировать в любой момент времени и в любом порядке. Например, трансгенное растение, содержащее один или несколько требуемых признаков, можно применять в качестве мишени для введения дополнительных признаков путем последующей трансформации. Дополнительные нуклеотидные последовательности можно вводить по протоколу котрансформации одновременно с нуклеотидной последовательностью, молекулой нуклеиновой кислоты, конструкцией нуклеиновой кислоты и/или композицией по настоящему изобретению, обеспечиваемыми любой комбинацией кассет экспрессии. Например, если будут вводить две нуклеотидные последовательности, то их можно встроить в отдельные кассеты (транс), или их можно встроить в одну кассету (цис). Экспрессия полинуклеотидов может управляться одним и тем же промотором или различными промоторами. Кроме того, известно, что полинуклеотиды можно "пакетировать" в требуемом местоположении в геноме при помощи системы сайт-специфической рекомбинации. См., например, публикации международных заявок на патенты №№ WO 99/25821, WO 99/25854, WO 99/25840, WO 99/25855 и WO 99/25853.
[00125] Кассета экспрессии также может содержать кодирующую последовательность, соответствующую одному или нескольким полипептидам, обеспечивающим агрономические признаки, которые преимущественно приносят пользу семенной компании, сельхозпроизводителю или переработчику зерна. Представляющий интерес полипептид может быть любым полипептидом, кодируемым представляющей интерес нуклеотидной последовательностью. Неограничивающие примеры представляющих интерес полипептидов, которые подходят для продуцирования в растениях, включают таковые, обуславливающие возникновение агрономически важных признаков, таких как устойчивость к гербицидам (также иногда называемая "толерантность к гербицидам"), устойчивость к вирусам, устойчивость к патогенным бактериям, устойчивость к насекомым, устойчивость к нематодам и/или устойчивость к грибам. См., например, патенты США №№5569823; 5304730; 5495071; 6329504 и 6337431. Полипептид также может являться таким, который увеличивает мощность или урожайность растений (включая признаки, которые дают возможность растению произрастать при различных температурах, почвенных условиях и уровнях солнечного света и атмосферных осадков), или таким, который дает возможность идентифицировать растение, проявляющее представляющий интерес признак (например, селектируемый маркер, цвет семенной оболочки и т.д.). Разнообразные представляющие интерес полипептиды, а также способы введения этих полипептидов в растение описаны, например, в патентах США №№4761373; 4769061; 4810648; 4940835; 4975374; 5013659; 5162602; 5276268; 5304730;5495071; 5554798; 5561236; 5569823; 5767366; 5879903, 5928937; 6084155; 6329504 и 6337431; а также в публикации заявки на патент США №2001/0016956. См. также во всемирной сети Интернет по адресу lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/.
[00126] В некоторых вариантах осуществления настоящего изобретения также могут применяться полинуклеотиды, придающие устойчивость/толерантность к гербициду, ингибирующему конус нарастания или меристему, такому как имидазолинон или сульфонилмочевина. Иллюстративные полинуклеотиды из этой категории кодируют мутантные ферменты ALS и AHAS, как описано, например, в патентах США №№5767366 и 5928937. Патенты США №№4761373 и 5013659 относятся к растениям, устойчивым к различным имидазолиноновым или сульфонамидным гербицидам. Патент США №4975374 относится к растительным клеткам и растениям, содержащим нуклеиновую кислоту, кодирующую мутантную глутаминсинтетазу (GS), устойчивую к ингибированию гербицидами, которые, как известно, ингибируют GS, например, фосфинотрицин и метионинсульфоксимин. В патенте США №5162602 раскрыты растения, устойчивые к ингибированию гербицидами на основе циклогександиона и арилоксифеноксипропановой кислоты. Устойчивость придает измененная ацетил-коэнзим А-карбоксилаза (АССаза).
[00127] Полипептиды, кодируемые нуклеотидными последовательностями, придающими устойчивость к глифосату, также подходят для настоящего изобретения. См., например, патент США №4940835 и патент США №4769061. В патенте США №5554798 раскрыты трансгенные растения маиса, устойчивые к глифосату, устойчивость которым придает ген измененной 5-енолпирувил-3-фосфошикиматсинтазы (EPSP).
[00128] Также подходят полинуклеотиды, кодирующие устойчивость к фосфоновым соединениям, таким как глюфосинат аммония или фосфинотрицин, а также пиридинокси- или феноксипропионовым кислотам и циклогексанонам. См. заявку на европейский патент №0242246. См. также патенты США №№5879903, 5276268 и 5561236.
[00129] Другие подходящие полинуклеотиды включают таковые, кодирующие устойчивость к гербицидам, ингибирующим фотосинтез, таким как триазин и бензонитрил (ген нитрилазы). См. патент США №4810648. Дополнительные подходящие полинуклеотиды, кодирующие устойчивость к гербицидам, включают таковые, кодирующие устойчивость к 2,2-дихлорпропионовой кислоте, сетоксидиму, галоксифопу, имидазолиноновым гербицидам, сульфонилмочевинным гербицидам, триазолопиримидиновым гербицидам, s-триазиновым гербицидам и бромоксинилу. Также подходят полинуклеотиды, придающие устойчивость к ингибиторам фермента protox, или которые обеспечивают повышенную устойчивость к заболеваниям растений; повышенную толерантность к неблагоприятным условиям окружающей среды (видам абиотического стресса), в том числе без ограничения к засухе, чрезмерному охлаждению, чрезмерному нагреву, или чрезмерной засоленности почвы, или экстремальной кислотности или щелочности; и изменения строения или развития растений, в том числе изменения сроков развития. См., например, публикацию заявки на патент США №2001/0016956 и патент США №6084155.
[00130] Дополнительные подходящие полинуклеотиды включают таковые, кодирующие пестицидные (например, инсектицидные) полипептиды. Эти полипептиды могут быть получены в количествах, достаточных для контроля, например, насекомых-вредителей (т.е. в количествах, обеспечивающих контроль насекомых). Считается, что количество продуцируемого в растении пестицидного полипептида, необходимое для контроля насекомых или других вредителей, может варьировать в зависимости от сорта, типа вредителя, факторов окружающей среды и т.п. Полинуклеотиды, применимые для придания дополнительной устойчивости к насекомым или вредителям, включают, например, таковые, кодирующие токсины, идентифицированные в организмах Bacillus. Полинуклеотиды, содержащие нуклеотидные последовательности, кодирующие инсектицидные белки Bacillus thuringiensis (Bt) из нескольких подвидов, были клонированы и было обнаружено, что рекомбинантные клоны токсичны для личинок чешуекрылых, двукрылых и жесткокрылых насекомых. Примеры таких инсектицидных белков Bt включают белки Cry, такие как Cry1Aa, Cry1Ab, Cry1Ac, Cry1B, Cry1C, Cry1D, Cry1Ea, Cry1Fa, Cry3A, Cry9A, Cry9B, Cry9C, и т.п., а также вегетативные инсектицидные белки, такие как Vip1, Vip2, Vip3 и т.п. Полный перечень белков Bt можно найти во всемирной сети Интернет в базе данных номенклатуры токсинов Bacillus thuringiensis, поддерживаемой университетом Сассекса (см. также Crickmore et al. (1998) Microbiol. Mol. Biol. Rev. 62:807-813).
[00131] Полипептиды, пригодные для продуцирования в растениях, дополнительно включают таковые, улучшающие превращение собранных растений и/или частей растений в коммерчески применимый продукт или иным образом содействующие ему, в том числе, например, обеспечивающие повышенное или измененное содержание и/или распределение углеводов, улучшенные свойства сбраживаемости, повышенное содержание масла, повышенное содержание белка, улучшенную усвояемость или повышенное содержание нутрицевтиков, например, повышенное содержание фитостерола, повышенное содержание токоферола, повышенное содержание станола и/или повышенное содержание витаминов. Представляющие интерес полипептиды также включают, например, таковые, обуславливающие снижение содержания нежелательного компонента в собранном урожае, например, фитиновой кислоты или ферментов, расщепляющих сахара, или способствующие этому. Под "обуславливающим" или "способствующим" подразумевается, что представляющий интерес полипептид может прямо или косвенно способствовать наличию представляющего интерес признака (например, путем увеличения расщепления целлюлозы с помощью гетерологичного фермента целлюлазы).
[00132] В одном варианте осуществления полипептид способствует улучшению усвояемости еды или корма. Ксиланазы представляют собой ферменты, расщепляющие гемицеллюлозу, которые усиливают разрушение клеточных стенок растений, что приводит к лучшему использованию питательных веществ растения животным. Это приводит к увеличению темпов роста и конверсии корма. Также можно снижать вязкость кормов, содержащих ксилан. Гетерологичное продуцирование ксиланаз в растительных клетках также может содействовать превращению лигноцеллюлозы в сбраживаемые сахара в ходе промышленной переработки.
[00133] Были идентифицированы и охарактеризованы многочисленные ксиланазы из грибковых и бактериальных микроорганизмов (см., например, патент США №5437992; Coughlin et al. (1993) "Proceedings of the Second TRICEL Symposium on Trichoderma reesei Cellulases and Other Hydrolases" Espoo; Souminen and Reinikainen, eds. (1993) Foundation for Biotechnical and Industrial Fermentation Research 8:125-135; публикацию заявки на патент США №2005/0208178; и публикацию согласно РСТ № WO 03/16654). В частности у Т. reesei были идентифицированы три специфические ксиланазы (XYL-I, XYL-II и XYL-III) (Tenkanen et al. (1992) Enzyme Microb. Technol. 14:566; Torronen et al. (1992) Bio/Technology 10:1461; and Xu et al. (1998) Appl. Microbiol. Biotechnol. 49:718).
[00134] В другом варианте осуществления полипептид, применимый для настоящего изобретения, может представлять собой фермент, расщепляющий полисахариды. Растения по настоящему изобретению, вырабатывающие такой фермент, могут быть применимы для получения, например, сбраживаемого сырья для биологической переработки. В некоторых вариантах осуществления ферменты, применимые для способа сбраживания, включают альфа-амилазы, протеазы, пуллуланазы, изоамилазы, целлюлазы, гемицеллюлазы, ксиланазы, циклодекстрингликозилтрансферазы, липазы, фитазы, лакказы, оксидазы, эстеразы, кутиназы, фермент, гидролизующий гранулированный крахмал, и другие глюкоамилазы.
[00135] Ферменты, расщепляющие полисахариды, включают ферменты, расщепляющие крахмал, такие как α-амилазы (ЕС 3.2.1.1), глюкуронидазы (Е.С. 3.2.1.131); экзо-1,4-α-D-глюканазы, такие как амилоглюкозидазы и глюкоамилазы (ЕС 3.2.1.3), β-амилазы (ЕС 3.2.1.2), α-глюкозидазы (ЕС 3.2.1.20) и другие экзоамилазы; крахмал-деветвящие ферменты, такие как а) изоамилаза (ЕС 3.2.1.68), пуллуназа (ЕС 3.2.1.41) и т.п.; b) целлюлазы, такие как экзоо-1,4-3-целлобиогидролаза (ЕС 3.2.1.91), экзо-1,3-β-D-глюканаза (ЕС 3.2.1.39), β-глюкозидаза (ЕС 3.2.1.21); с) L-арабиназы, такие как эндо-1,5-α-L-арабиназа (ЕС 3.2.1.99), α-арабинозидазы (ЕС 3.2.1.55) и т.п.; d) галактаназы, такие как эндо-1,4-β-D-галактаназа (ЕС 3.2.1.89), эндо-1,3-β-D-галактаназа (ЕС 3.2.1.90), α-галактозидаза (ЕС 3.2.1.22), β-галактозидаза (ЕС 3.2.1.23) и т.п.; е) маннаназы, такие как эндо-1,4-β-D-маннаназа (ЕС 3.2.1.78), β-маннозидаза (ЕС 3.2.1.25), α-маннозидаза (ЕС 3.2.1.24) и т.п.; f) ксиланазы, такие как эндо-1,4-β-ксиланаза (ЕС 3.2.1.8), β-D-ксилозидаза (ЕС 3.2.1.37), 1,3-β-D-ксиланаза и т.п.; и g) другие ферменты, такие как α-L-фукозидаза (ЕС 3.2.1.51), α-L-рамнозидаза (ЕС 3.2.1.40), леваназа (ЕС 3.2.1.65), инулиназа (ЕС 3.2.1.7) и т.п. В одном варианте осуществления α-амилаза представляет собой синтетическую α-амилазу, Amy797E, описанную в патенте США №8093453, включенном в данный документ посредством ссылки во всей своей полноте.
[00136] Дополнительные ферменты, которые можно применять в соответствии с настоящим изобретением, включают протеазы, такие как протеазы грибов и бактерий. Протеазы грибов включают без ограничений таковые, полученные из Aspergillus, Trichoderma, Mucor и Rhizopus, как, например, A. niger, A. awamori, A. oryzae и М. miehei. В некоторых вариантах осуществления полипептиды по настоящему изобретению могут представлять собой ферменты целлобиогидролазы (СВН) (ЕС 3.2.1.91). В одном варианте осуществления фермент целлобиогидролаза может представлять собой СВН1 или СВН2.
[00137] Другие ферменты, применимые в соответствии с настоящим изобретением, включают без ограничения гемицеллюлазы, такие как манназы и арабинофуранозидазы (ЕС 3.2.1.55); лигниназы; липазы (например, Е.С. 3.1.1.3), глюкозооксидазы, пектиназы, ксиланазы, трансглюкозидазы, альфа-1,6-глюкозидазы (например, Е.С.3.2.1.20); эстеразы, такие как естераза феруловой кислоты (ЕС 3.1.1.73) и ацетилксиланэстеразы (ЕС 3.1.1.72); и кутиназы (например, Е.С. 3.1.1.74).
[00138] В некоторых вариантах осуществления настоящего изобретения предусмотрена трансгенная клетка-хозяин, отличная от клетки человека, которая содержит полинуклеотид, молекулу нуклеиновой кислоты, химерный ген, кассету экспрессии или рекомбинантный вектор по настоящему изобретению. Трансгенная клетка-хозяин, отличная от клетки человека, может включать без ограничений растительную клетку, дрожжевую клетку, бактериальную клетку или клетку насекомого. Соответственно, в некоторых вариантах осуществления настоящего изобретения предусмотрена бактериальная клетка, выбранная из родов Bacillus, Brevibacillus, Clostridium, Xenorhabdus, Photorhabdus, Pasteuria, Escherichia, Pseudomonas, Erwinia, Serratia, Klebsiella, Salmonella, Pasteurella, Xanthomonas, Streptomyces, Rhizobium, Rhodopseudomonas, Methylophilius, Agrobacterium, Acetobacter, Lactobacillus, Arthrobacter, Azotobacter, Leuconostoc, или Alcaligenes. Таким образом, например, в качестве средств для биологического контроля насекомых можно получать белки Cry по настоящему изобретению путем экспрессии химерного гена, кодирующего белки Cry по настоящему изобретению в бактериальной клетке. Например, в одном варианте осуществления предусмотрена клетка Bacillus thuringiensis, содержащая химерный ген по настоящему изобретению.
[00139] В дополнительных вариантах осуществления настоящего изобретения предусмотрена растительная клетка, которая представляет собой клетку двудольного растения или клетку однодольного растения. В дополнительных вариантах осуществления клетка двудольного растения выбрана из группы, состоящей из клетки сои, клетки подсолнечника, клетки томата, клетки культурной разновидности капусты, клетки хлопчатника, клетки сахарной свеклы и клетки табака. В дополнительных вариантах осуществления клетка однодольного растения выбрана из группы, состоящей из клетки ячменя, клетки маиса, клетки овса, клетки риса, клетки сорго, клетки сахарного тростника и клетки пшеницы. В некоторых вариантах осуществления настоящего изобретения предусмотрена совокупность клеток двудольных растений или клеток однодольных растений, экспрессирующих токсичный белок по настоящему изобретению, кодируемый химерным геном по настоящему изобретению. В других вариантах осуществления клетки в совокупности расположены рядом с образованием апопласта и их выращивают при естественном солнечном свете.
[00140] В другом варианте осуществления настоящего изобретения токсичный белок по настоящему изобретению экспрессируется в высшем организме, например растении. В этом случае трансгенные растения, экспрессируя эффективные количества токсичного белка, защищают себя от вредителей растений, таких как насекомые-вредители. Когда насекомое начинает питаться на таком трансгенном растении, оно также поедает экспрессируемый токсин. Это может удерживать насекомое от дальнейшего вгрызания в растительную ткань или даже может причинять вред насекомому или уничтожать его. Полинуклеотид по настоящему изобретению вставляют в кассету экспрессии, которая затем стабильно интегрируется в геном растения. В другом варианте осуществления полинуклеотид включают в непатогенный самореплицирующийся вирус. Растения, трансформированные в соответствии с настоящим изобретением, могут представлять собой однодольные или двудольные растения, и они включают без ограничения кукурузу (маис), сою, рис, пшеницу, ячмень, рожь, овес, сорго, просо, подсолнечник, сафлор, сахарную свеклу, хлопчатник, сахарный тростник, масличный рапс, люцерну, табак, разновидности арахиса, овощные культуры, в том числе батат, фасоль, горох, цикорий, латук, кочанную капусту, цветную капусту, брокколи, репу, морковь, баклажан, огурец, редьку, шпинат, картофель, томат, спаржу, лук, чеснок, разновидности дыни, перец, сельдерей, тыкву крупноплодную, тыкву обыкновенную, цуккини, плодовые культуры, включая яблоню, грушу, айва, сливу, вишню, персик, нектарин, абрикос, землянику, виноград, малину, ежевику, ананас, авокадо, папайю, манго, банан и специализированные растения, такие как Arabidopsis, а также древесные растения, такие как хвойные и лиственные деревья. Предпочтительно растения по настоящему изобретению представляют собой культурные растения, такие как маис, сорго, пшеница, подсолнечник, томат, крестоцветные, разновидности перца, картофель, хлопчатник, рис, соя, сахарная свекла, сахарный тростник, табак, ячмень, масличный рапс и т.п.
[00141] После того как требуемый полинуклеотид введен в конкретный вид растения путем трансформации, при помощи традиционных методик размножения он может передаваться в пределах данного вида или переходить в другие разновидности того же вида, в частности, включающие коммерческие разновидности.
[00142] Полинуклеотид по настоящему изобретению экспрессируется в трансгенных растениях, обусловливая тем самым биосинтез соответствующего белка Cry в трансгенных растениях. Таким способом получают трансгенные растения с улучшенной защитой урожая в присутствии нагрузки насекомых. Для экспрессии в трансгенных растениях может потребоваться модификация и оптимизация нуклеотидных последовательностей по настоящему изобретению. Хотя во многих случаях гены микроорганизмов могут экспрессироваться в растениях на высоких уровнях и без модификации, низкий уровень экспрессии в трансгенных растениях может быть обусловлен нуклеотидными последовательностями микроорганизмов, имеющими кодоны, которые не являются предпочтительными для растений. Как известно из уровня техники, для живых организмов характерны определенные предпочтения в отношении частоты использования кодонов, и поэтому кодоны нуклеотидных последовательностей, описанных в данном изобретении, могут быть изменены в соответствии с характерными для растений предпочтениями, при этом с сохранением аминокислот, кодируемых ими. Кроме того, высокий уровень экспрессии в растениях, например растениях кукурузы, лучше всего достигается в случае кодирующих последовательностей, которые характеризуются по меньшей мере приблизительно 35% содержанием GC, или по меньшей мере приблизительно 45%, или по меньшей мере приблизительно 50% или по меньшей мере приблизительно 60%. Нуклеотидные последовательности микроорганизмов, которые характеризуются низким содержанием GC, могут экспрессироваться в растениях на недостаточном уровне в связи с наличием мотивов АТТТА, которые могут дестабилизировать транскрипты, и мотивов ААТААА, которые могут обуславливать ненадлежащее полиаденилирование. Хотя определенные последовательности генов могут надлежащим образом экспрессироваться как в видах однодольных, так и двудольных растений, последовательности можно модифицировать с учетом предпочтений в отношении кодонов и предпочтений в отношении содержания GC для однодольных растений или двудольных растений, поскольку было показано, что эти предпочтения отличаются (Murray et al. Nucl. Acids Res. 17: 477-498 (1989)). Кроме того, нуклеотидные последовательности подвергают скринингу на наличие неправильных сайтов сплайсинга, которые могут вызывать усечение транскрипта. Все изменения, которые требуется выполнить в пределах нуклеотидных последовательностей, такие как описанные выше, выполняют с применением хорошо известных методик сайт-направленного мутагенеза, ПЦР и конструирования синтетических генов с помощью способов, описанных, например, в патентах США №№5625136; 5500365 и 6013523.
[00143] В некоторых вариантах осуществления настоящего изобретения предусмотрены синтетические гены, полученные согласно процедуре, раскрытой в патенте США №5625136, включенном в данный документ посредством ссылки. В этой процедуре применяют предпочтительные для маиса кодоны, т.е. один кодон, который чаще всего кодирует данную аминокислоту в маисе. Предпочтительный для маиса кодон, кодирующий конкретную аминокислоту, может быть определен, например, на основании известных последовательностей генов маиса. Например, данные о частоте использования кодонов у маиса для 28 генов из растений маиса можно найти в Murray et al., Nucleic Acids Research 17: 477-498 (1989), раскрытие которого включено в данный документ посредством ссылки. Специально приведенные в качестве примера синтетические последовательности по настоящему изобретению, полученные с применением кодонов, оптимизированных для маиса, представлены любой из SEQ ID NO: 13-20. Подобным образом нуклеотидные последовательности могут быть оптимизированы для экспрессии в любом растении. Следует понимать, что вся нуклеотидная последовательность или любая ее часть могут быть оптимизированными или синтетическими. То есть полинуклеотид может содержать нуклеотидную последовательность, которая частично является нативной последовательностью и частично является синтетической оптимизированной последовательностью.
[00144] Для эффективной инициации трансляции может потребоваться модификация последовательностей, прилегающих к инициирующему метионину. Например, их можно модифицировать путем включения последовательностей, которые, как известно, являются эффективными в растениях. Joshi предложил подходящую консенсусную последовательность для растений (NAR 15: 6643-6653 (1987)), а Clonetech предлагает дополнительную консенсусную последовательность, являющуюся инициатором трансляции (каталог 1993/1994, стр. 210). Эти консенсусные последовательности подходят для использования с нуклеотидными последовательностями по настоящему изобретению. Последовательности встраивают в конструкции, содержащие нуклеотидные последовательности, выше и включительно ATG (при этом вторая аминокислота остается немодифицированной) или в качестве альтернативы выше и включительно GTC, расположенного после ATG (с возможностью модифицирования второй аминокислоты трансгена).
[00145] Последовательности, кодирующие новый белок cry по настоящему изобретению, либо в виде их нативной последовательности, либо в виде синтетических последовательностей, как описано выше, могут быть функционально связаны с целым рядом промоторов для экспрессии в растениях, включая конститутивные, индуцируемые, регулируемые во времени, регулируемые в процессе развития, химически регулируемые, тканепредпочтительные и тканеспецифические промоторы, для получения молекул рекомбинантных ДНК, то есть химерных генов. Выбор промотора будет различаться в зависимости от временных и пространственных требований для экспрессии, а также в зависимости от целевого вида. Таким образом, предпочтительной является экспрессия нуклеотидных последовательностей по настоящему изобретению в листьях, в цветоножках или стеблях, в колосьях, в соцветиях (например, колосках, метелках, початках и т.д.), в корнях и/или проростках. Во многих случаях, однако, требуется защита от более чем одного типа насекомого-вредителя, и, следовательно, желательна экспрессия в нескольких тканях. Хотя, как было показано, многие промоторы из двудольных растений функционируют у однодольных растений и наоборот, по возможности промоторы двудольных выбирают для экспрессии у двудольных растений, а промоторы однодольных выбирают для экспрессии у однодольных растений. Однако не существует каких-либо ограничений в отношении происхождения выбранных промоторов, достаточно того, что они являются функциональными в управлении экспрессией нуклеотидных последовательностей в требуемой клетке.
[00146] Примеры конститутивных промоторов, применимых в настоящем изобретении, включают 35S и 19S промоторы CaMV (Fraley et al., патент США №5352605, включенный в данный документ посредством ссылки). Кроме того, промотор получают из любого из нескольких генов актина, экспрессируемых в большинстве типов клеток. Кассеты экспрессии с промотором, описанные McElroy et al. (Mol. Gen. Genet. 231: 150-160 (1991)), можно легко модифицировать для экспрессии гена нового токсина, и они являются особенно подходящими для применения у однодольных растений-хозяев. Еще один конститутивный промотор получают из гена убиквитина, который представляет собой еще один генный продукт, который, как известно, накапливается во многих типах клеток. Убиквитиновый промотор был клонирован из нескольких видов для применения в трансгенных растениях, например, подсолнечнике (Binet et al., 1991. Plant Science 79: 87-94), маисе (Christensen et al., 1989. Plant Molec. Biol. 12: 619-632) и Arabidopsis (Norris et al. 1993. Plant Molec. Biol. 21: 895-906). Убиквитиновый промотор маиса был разработан для трансгенных систем однодольных растений, и его последовательность и векторы, сконструированные для трансформации однодольных растений, раскрыты в патентной заявке ЕР 0342926. Убиквитиновый промотор подходит для экспрессии гена нового токсина в трансгенных растениях, в частности однодольных.
[00147] Тканеспецифические или тканепредпочтительные промоторы, применимые для экспрессии последовательностей, кодирующих новый белок cry по настоящему изобретению, в растениях, в частности маисе, представляют собой промоторы, которые управляют экспрессией в корне, паренхиме, листе или пыльце. Такие промоторы раскрыты в патенте США №5625136, включенном в данный документ посредством ссылки во всей своей полноте. Другие тканеспецифические промоторы, применимые в настоящем изобретении, включают промотор гена rubisco хлопчатника, раскрытый в патенте США №6040504; промотор гена сахарозосинтазы риса, раскрытый в патенте США №5604121; и промотор вируса желтой курчавости листьев цеструма, раскрытый в патенте США №7166770, все включены посредством ссылки во всей своей полноте. Химически индуцируемые промоторы, применимые для управления экспрессией гена нового токсина в растениях, раскрыты в патенте США №5614395, включенном в данный документ посредством ссылки во всей своей полноте.
[00148] Нуклеотидные последовательности по настоящему изобретению также могут экспрессироваться под контролем промоторов, которые регулируются химическим путем. Это обеспечивает возможность синтеза белков Cry по настоящему изобретению только в случае обработки культурных растений индуцирующими химическими веществами. Примеры такой технологии химической индукции экспрессии генов подробно описаны в публикации заявки ЕР 0332104 и патенте США №5614395. В одном варианте осуществления химически регулируемый промотор представляет собой промотор PR-1a табака.
[00149] Другая категория промоторов, применимых в настоящем изобретении, включает промотор, который индуцируется ранением. Были описаны многочисленные промоторы, которые экспрессируются в участках ранения, а также в участках инфицирования фитопатогеном. В идеальном случае такой промотор должен активироваться локально в участках инвазии насекомых и, таким образом, инсектицидные белки накапливаются исключительно в клетках, где необходим синтез инсектицидных белков для уничтожения нападающего насекомого-вредителя. Примеры промоторов этого типа включают таковые, описанные Stanford et al. Mol. Gen. Genet. 215: 200-208 (1989), Xu et al. Plant Molec. Biol. 22: 573-588 (1993), Logemann et al. Plant Cell 1: 151-158 (1989), Rohrmeier & Lehle, Plant Molec. Biol. 22: 783-792 (1993), Firek et al. Plant Molec. Biol. 22: 129-142 (1993), and Warner et al. Plant J. 3: 191-201 (1993).
[00150] Неограничивающие примеры промоторов, обуславливающих тканеспецифические паттерны экспрессии, применимые в настоящем изобретении, включают специфические для зеленой ткани, специфические для корня, специфические для стебля и/или специфические для цветка. Промоторы, подходящие для экспрессии в зеленой ткани, включают множество промоторов, которые осуществляют регуляцию генов, участвующих в фотосинтезе, и многие из них были клонированы как из однодольных растений, так и из двудольных растений. Одним из таких промоторов является промотор РЕРС маиса из гена фосфоенолкарбоксилазы (Hudspeth & Grula, Plant Molec. Biol. 12: 579-589 (1989)). Другим промотором специфической для корня экспрессии является промотор, описанный de Framond (FEBS 290: 103-106 (1991) или в патенте США №5466785). Другой промотор, применимый в настоящем изобретении, представляет собой специфический для стебля промотор, описанный в патенте США №5625136, который в естественных условиях управляет экспрессией гена trpA маиса.
[00151] В дополнение к выбору подходящего промотора конструкциям для экспрессии инсектицидного токсина в растениях требуется соответствующий терминатор транскрипции, который будет функционально связан ниже гетерологичной нуклеотидной последовательности. Несколько таких терминаторов доступны и известны в данной области техники (например, tml из CaMV, E9 из rbcS). В контексте настоящего изобретения можно применять любой доступный терминатор, о котором известно, что он функционирует в растениях.
[00152] В кассеты экспрессии, описанные в настоящем изобретении, можно вводить множество других последовательностей. Они предусматривают последовательности, которые, как показано, усиливают экспрессию, как, например, интронные последовательности (например, из Adh1 и bronze 1) и вирусные лидерные последовательности (например, из TMV, MCMV и AMV).
[00153] Предпочтительным может быть нацеливание экспрессии нуклеотидных последовательностей по настоящему изобретению в различные клеточные локализации в растении. В некоторых случаях может быть желательной локализация в цитозоле, тогда как в других случаях предпочтительной может быть локализация в определенной субклеточной органелле. Для осуществления настоящего изобретения на практике можно применять любой механизм нацеливания генных продуктов, например в растениях, и, как известно, такие механизмы существуют в растениях, и последовательности, регулирующие функционирование таких механизмов, были описаны довольно подробно. Были охарактеризованы последовательности, которые обеспечивают нацеливание генных продуктов в другие компартменты клетки. Аминоконцевые последовательности могут обусловливать нацеливание представляющего интерес белка в любой компартмент клетки, такой как вакуоль, митохондрия, пероксисома, белковые тельца, эндоплазматический ретикулум, хлоропласт, крахмальное зерно, амилопласт, апопласт или клеточная стенка растения (например, Unger et. al. Plant Molec. Biol. 13: 411-418 (1989); Rogers et. al. (1985) Proc. Natl. Acad. Sci. USA 82: 6512-651; патент США №7102057; WO 2005/096704, все из которых включены в данный документ посредством ссылки. Необязательно, сигнальная последовательность может представлять собой N-концевую сигнальную последовательность из waxy, N-концевую сигнальную последовательность из гамма-зеина, домен, связывающий крахмал, С-концевой домен, связывающий крахмал, последовательность, нацеливающую в хлоропласт, которая обеспечивает доставку зрелого белка в хлоропласт (Comai et. al. (1988) J. Biol. Chem. 263: 15104-15109; van den Broeck, et. al. (1985) Nature 313: 358-363; патент США №5639949) или сигнальную последовательность секреции из клеток алейронового слоя (Koehler & Но, Plant Cell 2: 769-783 (1990)). Кроме того, аминоконцевые последовательности вместе с карбоксиконцевыми последовательностями обусловливают нацеливание генных продуктов в вакуоль (Shinshi et. al. (1990) Plant Molec. Biol. 14: 357-368). В одном варианте осуществления выбранная сигнальная последовательность включает известный сайт расщепления, и при конструировании слияния учитываются любые аминокислоты после сайта(ов) расщепления, необходимые для расщепления. В некоторых случаях это требование может быть выполнено путем добавления небольшого числа аминокислот между сайтом расщепления и ATG трансгена или, в качестве альтернативы, путем замещения некоторых аминокислот в пределах последовательности трансгена. Эти методики конструирования хорошо известны из уровня техники и одинаково применимы к любому клеточному компартменту.
[00154] Будет понятно, что описанные выше механизмы нацеливания в клетке можно использовать не только с сочетании когнатными для них промоторами, но также в сочетании с гетерологичными промоторами, так что специфическая задача нацеливания в клетке осуществляется под транскрипционным контролем промотора, характеризующегося паттерном экспрессии, отличный от такового для промотора, из которого получен нацеливающий сигнал.
Трансформация растений
[00155] Процедуры трансформации растений хорошо известны и общеприняты в данной области техники и описаны в литературе во всех отношениях. Неограничивающие примеры способов трансформации растений включают трансформацию с помощью доставки нуклеиновых кислот, опосредованной бактериями (например, с помощью Agrobacterium), доставки нуклеиновых кислот, опосредованной вирусами, доставки нуклеиновых кислот, опосредованной карбидом кремния или микроиглами с нуклеиновыми кислотами, доставки нуклеиновых кислот, опосредованной липосомами, микроинъекцию, бомбардировку микрочастицами, трансформацию, опосредованную фосфатом кальция, трансформацию, опосредованную циклодекстринами, электропорацию, трансформацию, опосредованную наночастицами, обработку ультразвуком, инфильтрацию, поглощение нуклеиновых кислот, опосредованное PEG, а также любой другой электрический, химический, физический (механический) и/или биологический механизм, который приводит к введению нуклеиновой кислоты в растительную клетку, включая любую их комбинацию. Общие руководства по разнообразным способам трансформации растений, известным в данной области техники, включают Miki et al. ("Procedures for Introducing Foreign DNA into Plants" в Methods in Plant Molecular Biology and Biotechnology, Glick, B.R. and Thompson, J.E., Eds. (CRC Press, Inc., Boca Raton, 1993), pages 67-88) и Rakowoczy-Trojanowska (Cell. Mol. Biol. Lett. 7: 849-858 (2002)).
[00156] Для трансформации, опосредованной Agrobacterium, подходят бинарные векторы или векторы, несущие по меньшей мере одну граничную последовательность T-DNA, тогда как для прямого переноса генов (например, с помощью бомбардировки частицами и т.п.) подходит любой вектор, при этом можно применять линейную ДНК, содержащую только представляющую интерес конструкцию. В случае прямого переноса генов можно применять трансформацию с помощью одного вида ДНК или котрансформацию (Schocher et al., Biotechnology 4: 1093-1096 (1986)). В случае как прямого переноса генов, так и переноса, опосредованного Agrobacterium, трансформацию обычно (но не обязательно) выполняют с селектируемым маркером, который может представлять собой средство для позитивного отбора (фосфоманнозоизомераза), которое обеспечивает устойчивость к антибиотику (канамицину, гигромицину или метотрексату) или гербициду (глифосату или глюфосинату). Однако выбор селектируемого маркера не является критически важным для настоящего изобретения.
[00157] Трансформация, опосредованная Agrobacterium, представляет собой способ, широко применяемый для трансформации растений, в частности двудольных растений, в связи с высокой эффективностью трансформации и в связи с широкой применимостью в отношении множества различных видов. Трансформация, опосредованная Agrobacterium, как правило, предполагает перенос бинарного вектора, несущего представляющую интерес чужеродную ДНК в соответствующий штамм Agrobacterium, что может зависеть от набора vir-генов штамма-хозяина Agrobacterium, расположенного либо на корезидентной Ti-плазмиде, либо на хромосоме (Uknes et al. (1993) Plant Cell 5: 159-169). Перенос рекомбинантного бинарного вектора в Agrobacterium можно выполнять с помощью процедуры трехродительского скрещивания с применением Escherichia coli, несущей рекомбинантный бинарный вектор, хелперного штамма Е. coli, несущего плазмиду, которая способна мобилизовать рекомбинантный бинарный вектор в целевом штамме Agrobacterium. В качестве альтернативы рекомбинантный бинарный вектор можно переносить в Agrobacterium путем трансформации нуклеиновой кислотой ( & Willmitzer (1988) Nucleic Acids Res. 16: 9877).
[00158] Трансформация растения с помощью рекомбинантной Agrobacterium обычно включает совместное культивирование Agrobacterium с эксплантатами растения, и ее проводят в соответствии со способами, хорошо известными из уровня техники. Трансформированную ткань регенерируют на селективной среде, содержащей маркер устойчивости к антибиотикам или гербицидам между граничными последовательностями T-DNA бинарной плазмиды.
[00159] Как обсуждалось ранее, другой способ трансформации растений, частей растений и растительных клеток включает внедрение инертных или биологически активных частиц в растительные ткани и клетки. См, например, патенты США №№4945050; 5036006 и 5100792. В общем случае этот способ включает внедрение в растительные клетки инертных или биологически активных частиц в условиях, эффективных для проникновения через наружную поверхность клетки и возможности включения в ее внутреннюю часть. При использовании инертных частиц вектор можно вводить в клетку путем покрытия частиц вектором, содержащим представляющую интерес нуклеиновую кислоту. В качестве альтернативы клетка или клетки могут быть окружены вектором так, чтобы вектор переносился в клетку вслед за частицей. Биологически активные частицы (например, высушенная дрожжевая клетка, высушенная бактерия или бактериофаг, каждая(каждый) из которых содержит одну или несколько нуклеиновых кислот, подлежащих введению) также можно внедрять в растительную ткань.
[00160] В другом варианте осуществления полинуклеотид по настоящему изобретению можно напрямую вводить в геном пластид путем трансформации. Основное преимущество трансформации пластид состоит в том, что пластиды обычно способны экспрессировать бактериальные гены без существенной модификации, при этом пластиды способны экспрессировать несколько открытых рамок считывания под контролем одного промотора. Технология трансформации пластид подробно описана в патентах США №№5451513, 5545817 и 5545818, в заявке согласно РСТ №WO 95/16783 и в McBride et al. (1994) Proc. Nati. Acad. Sci. USA 91, 7301-7305. Основная методика трансформации хлоропластов включает введение участков клонированной пластидной ДНК, фланкирующих селектируемый маркер, вместе с представляющим интерес геном в подходящую целевую ткань, например, с применением биолистики или трансформации протопластов (например, трансформации, опосредованной хлоридом кальция или PEG). Фланкирующие участки размером 1-1,5 т. о., называемые нацеливающими последовательностями, содействуют гомологичной рекомбинации с геномом пластид и, таким образом, обеспечивают замещение или модификацию специфических участков пластома. Вначале в качестве селектируемых маркеров для трансформации можно использовать точковые мутации в 16S рРНК и генах rps12 хлоропластов, придающие устойчивость к спектиномицину и/или стрептомицину (Svab, Z., Hajdukiewicz, Р., и Maliga, Р. (1990) Proc. Natl. Acad. Sci. USA 87, 8526-8530; Staub, J.M., и Maliga, P. (1992) Plant Cell 4, 39-45). Наличие сайтов клонирования между данными маркерами позволяет создавать вектор, нацеленный на пластиды, для введения чужеродных генов (Staub, J.M., и Maliga, Р. (1993) ЕМВО J. 12, 601-606). Существенного повышения частоты трансформации можно достичь путем замещения рецессивных генов рРНК или r-белков, обеспечивающих устойчивость к антибиотикам, доминантным селектируемым маркером, бактериальным геном aadA, кодирующим фермент аминогликозид-3'-аденилтрансферазу, обезвреживающий спекгиномицин (Svab, Z., и Maliga, P. (1993) Proc. Natl. Acad. Sci. USA 90, 913-917). Ранее этот маркер успешно применяли для трансформации генома пластид зеленой водоросли Chlamydomonas reinhardtii с высокой частотой (Goldschmidt-Clermont, М. (1991) Nucl. Acids Res. 19: 4083-4089). Другие селектируемые маркеры, применимые для трансформации пластид, известны из уровня техники и включены в объем настоящего изобретения. Как правило, для достижения состояния, при котором все пластиды являются одинаковыми, требуется около 15-20 циклов клеточного деления после трансформации. При экспрессии в пластидах, при которой гены вставлены с помощью гомологической рекомбинации во все несколько тысяч копий кольцевого пластидного генома, присутствующего в каждой растительной клетке, используют преимущество огромного числа копий по сравнению с генами, экспрессируемыми в ядре, что допускает уровни экспрессии, которые легко могут превышать 10% общего количества растворимых растительных белков. В одном варианте осуществления полинуклеотид по настоящему изобретению может быть вставлен в вектор, нацеленный на пластиды, и введен в геном пластид требуемого растения-хозяина путем трансформации. Таким образом, можно получить растения, гомопластические в отношении геномов пластид, содержащих нуклеотидную последовательность по настоящему изобретению, способные экспрессировать полинуклеотид на высоком уровне.
[00161] Способы отбора трансформированных трансгенных растений, растительных клеток и/или культур растительных тканей являются общепринятыми в данной области техники и могут использоваться в способах настоящего изобретения, предусмотренных в данном документе. Например, рекомбинантный вектор по настоящему изобретению также может включать кассету экспрессии, содержащую нуклеотидную последовательность селектируемого маркера, который можно применять для отбора трансформированного растения, части растения и/или растительной клетки. Применяемое в данном документе выражение "селектируемый маркер" означает нуклеотидную последовательность, которая при экспрессии придает отличительный фенотип растению, части растения и/или растительной клетке, экспрессирующим данный маркер, и, таким образом, позволяет отличать такие трансформированные растения, части растений и/или растительные клетки от тех, которые не имеют маркера. Такая нуклеотидная последовательность может кодировать либо селектируемый, либо подвергаемый скринингу маркер в зависимости от того, придает ли маркер признак, по которому можно провести отбор с помощью химических средств, например, с помощью селективного средства (например, антибиотика, гербицида и т.п.), или от того, является ли маркер просто признаком, который можно идентифицировать посредством наблюдения или тестирования, например, путем скрининга (например, признаком, определяемым в R-локусе). Разумеется, существует много примеров подходящих селектируемых маркеров, которые известны из уровня техники и могут применяться в кассетах экспрессии, описываемых в данном документе.
[00162] Примеры селектируемых маркеров включают без ограничения нуклеотидную последовательность, кодирующую neo или nptII, придающие устойчивость к канамицину, G418 и т.п. (Potrykus et al. (1985) Mol. Gen. Genet. 199: 183-188); нуклеотидную последовательность, кодирующую bar, придающий устойчивость к фосфинотрицину; нуклеотидную последовательность, кодирующую измененную 5-енолпирувилшикимат-3-фосфатсинтазу (EPSP-синтазу), придающую устойчивость к глифосату (Hinchee et al. (1988) Biotech. 6: 915-922); нуклеотидную последовательность, кодирующую нитрилазу, такую как bxn из Klebsiella ozaenae, придающую устойчивость к бромоксинилу (Stalker et al. (1988) Science 242: 419-423); нуклеотидную последовательность, кодирующую измененную ацетолактатсинтазу (ALS), придающую устойчивость к имидазолинону, сульфонилмочевине или другим ингибирующим ALS химическим веществам (заявка на европейский патент ЕР №154204); нуклеотидную последовательность, кодирующую устойчивую к метотрексату дигидрофолатредуктазу (DHFR) (Thillet et al. (1988) J. Biol. Chem. 263: 12500-12508); нуклеотидную последовательность, кодирующую далапондегалогеназу, придающую устойчивость к далапону; нуклеотидную последовательность, кодирующую маннозо-6-фосфатизомеразу (также называемую фосфоманнозоизомеразой (PMI)), которая придает способность к метаболизму маннозы (патенты США №№5767378 и 5994629); нуклеотидную последовательность, кодирующую измененную антранилатсинтазу, придающую устойчивость к 5-метилтриптофану; и/или нуклеотидную последовательность, кодирующую hph, придающий устойчивость к гигромицину. Специалист в данной области способен выбрать подходящий селектируемый маркер для применения в кассете экспрессии по настоящему изобретению.
[00163] Дополнительные селектируемые маркеры включают без ограничения нуклеотидную последовательность, кодирующую β-глюкуронидазу или uidA (GUS), который кодирует фермент, для которого известны различные хромогенные субстраты; нуклеотидную последовательность R-локуса, которая кодирует продукт, регулирующий продуцирование антоцианиновых пигментов (красного цвета) в растительных тканях (Dellaporta et al., "Molecular cloning of the maize R-nj allele by transposon-tagging with Ac," pp. 263-282, в Chromosome Structure and Function: Impact of New Concepts, 18th Stadler Genetics Symposium (Gustafson & Appels eds., Plenum Press 1988)); нуклеотидную последовательность, кодирующую β-лактамазу, фермент, для которого известны различные хромогенные субстраты (например, PADAC, хромогенный цефалоспорин) (Sutcliffe (1978) Proc. Natl. Acad. Sci. USA 75: 3737-3741); нуклеотидную последовательность, кодирующую xylE, который кодирует катехолдиоксигеназу (Zukowsky et al. (1983) Proc. Natl. Acad. Sci. USA 80: 1101-1105); нуклеотидную последовательность, кодирующую тирозиназу, фермент, способный окислять тирозин до DOPA и допахинона, который, в свою очередь, конденсируется с образованием меланина (Katz et al. (1983) J. Gen. Microbiol. 129: 2703-2714); нуклеотидную последовательность, кодирующую β-галактозидазу, фермент, для которого существуют хромогенные субстраты; нуклеотидную последовательность, кодирующую люциферазу (lux), которая обеспечивает выявление с помощью биолюминесценции (Ow et al. (1986) Science 234: 856-859); нуклеотидную последовательность, кодирующую экворин, который может быть использован в обнаружении чувствительной к кальцию биолюминесценции (Prasher et al. (1985) Biochem. Biophys. Res. Comm. 126: 1259-1268); или нуклеотидную последовательность, кодирующую зеленый флуоресцентный белок (Niedz et al. (1995) Plant Cell Reports 14: 403-406). Специалист в данной области способен выбрать подходящий селектируемый маркер для применения в кассете экспрессии по настоящему изобретению.
[00164] Дополнительно, как хорошо известно из уровня техники, целые трансгенные растения можно регенерировать из трансформированных растительных клеток, культур растительных тканей и/или культивируемых протопластов с помощью любой из множества известных методик. Регенерация растений из растительных клеток, культуры растительных тканей и/или культивируемых протопластов описана, например, в Evans et al. (Handbook of Plant Cell Cultures, Vol. 1, MacMilan Publishing Co. New York (1983)); и Vasil I.R. (ed.) (Cell Culture and Somatic Cell Genetics of Plants, Acad. Press, Orlando, Vol. I (1984), and Vol. II (1986)).
[00165] Кроме того, описанные выше свойства генов, обеспеченные с помощью методов генной инженерии в трансгенных семенах и растениях, частях растения и/или растительных клетках по настоящему изобретению, могут передаваться путем полового размножения или вегетативного роста и, следовательно, могут поддерживаться и передаваться по наследству растениям-потомкам. Как правило, при поддержании и передаче по наследству применяют известные сельскохозяйственные способы, разработанные для соответствия конкретным целям, таким как уборка урожая, посев или возделывание.
[00166] Следовательно, полинуклеотид можно вводить в растение, часть растения и/или растительную клетку с помощью любого из целого ряда способов, хорошо известных из уровня техники, как описано выше. Следовательно, не придерживаются какого-либо конкретного способа введения одного или нескольких полинуклеотидов в растение, а наоборот, можно применять любой способ, обеспечивающий стабильную интеграцию одного или нескольких полинуклеотидов в геном растения. Если требуется ввести более одного полинуклеотида, то соответствующие полинуклеотиды можно собрать как части одной молекулы нуклеиновой кислоты или как отдельные молекулы нуклеиновых кислот и можно расположить в пределах одной и той же или различных молекул нуклеиновых кислот. Соответственно, введение полинуклеотидов в представляющую интерес клетку можно осуществлять в ходе одного события трансформации, в ходе отдельных событий трансформации или, например, в растения, в виде части протокола скрещивания.
[00167] Дополнительные варианты осуществления настоящего изобретения включают собранные продукты, полученные из трансгенных растений и/или их частей по настоящему изобретению, а также переработанный продукт, полученный из данных собранных продуктов. Собранный продукте может представлять собой целое растение или любую часть растения, как раскрыто в данном документе. Таким образом, в некоторых вариантах осуществления неограничивающие примеры собранного продукта включают семя, плод, цветок или его часть (например, пыльник, рыльце и т.п.), лист, стебель и т.п. В других вариантах осуществления переработанный продукт включает без ограничений муку тонкого помола, муку грубого помола, масло, крахмал, крупу и т.п., полученные из собранного семени или другой части растения по настоящему изобретению, при этом указанное семя или другая часть растения содержат молекулу нуклеиновой кислоты/полинуклеотид/нуклеотидную последовательность по настоящему изобретению.
[00168] В других вариантах осуществления настоящего изобретения предусмотрен экстракт из трансгенного семени и/или трансгенного растения по настоящему изобретению, при этом экстракт содержит молекулу нуклеиновой кислоты, полинуклеотид, нуклеотидную последовательность или токсичный белок по настоящему изобретению. Экстракты из растений или частей растений можно получить согласно процедурам, хорошо известным из уровня техники (см., de la Torre et al., Food, Agric. Environ. 2(1): 84-89 (2004); Guidet, Nucleic Acids Res. 22(9): 1772-1773 (1994); Lipton et al.. Food Agric. Immun. 12: 153-164 (2000)).
Инсектицидные композиции
[00169] В некоторых вариантах осуществления настоящего изобретения предусмотрена инсектицидная композиция, содержащая белок Cry по настоящему изобретению в приемлемом с точки зрения сельского хозяйства носителе. Применяемое в данном документе выражение "приемлемый с точки зрения сельского хозяйства носитель" может включать природный или синтетический, органический или неорганический материал, который объединен с активным компонентом для содействия его применения по отношению к растению или его части. Примеры приемлемых с точки зрения сельского хозяйства носителей включают без ограничения порошки, дусты, пеллеты, гранулы, аэрозоли, эмульсии, коллоиды и растворы. Приемлемые с точки зрения сельского хозяйства носители дополнительно включают без ограничения инертные компоненты, диспергирующие вещества, поверхностно-активные вещества, вспомогательные вещества, придающие липкость вещества, клейкие вещества, связующие вещества или их комбинации, которые можно применять в составах, используемых в сельском хозяйстве. Такие композиции можно применять любым способом, посредством которого пестицидные белки или другие средства для контроля вредителей приводят в контакт с вредителями. Соответственно, композиции можно наносить на поверхности растений или частей растений, в том числе на семена, листья, цветки, стебли, клубни, корни и т.п. Другим приемлемым с точки зрения сельского хозяйства носителем может быть трансгенное растение или часть растения.
[00170] В дополнительных вариантах осуществления инсектицидная композиция содержит трансгенную бактериальную клетку по настоящему изобретению, при этом бактериальная клетка содержит химерный ген по настоящему изобретению. Например, такую инсектицидную композицию можно получить путем высушивания, лиофилизации, гомогенизации, экстракции, фильтрации, центрифугирования, осаждения или концентрирования культуры клеток Bacillus thuringiensis, содержащих полинуклеотид по настоящему изобретению. В дополнительных вариантах осуществления композиция содержит от приблизительно 1% до приблизительно 99% по весу белка Cry по настоящему изобретению.
[00171] Белки Cry по настоящему изобретению можно применять в комбинации с другими средствами для контроля вредителей для увеличения спектра целевых вредителей или для предупреждения и/или управления устойчивостью насекомых. Следовательно, в некоторых вариантах осуществления настоящего изобретения предусмотрена композиция, обеспечивающая контроль одного или нескольких вредителей растений, при этом композиция содержит первый белок Cry по настоящему изобретению и второе средство для контроля вредителей, отличное от первого белка Cry. В других вариантах осуществления композиция представляет собой состав для местного нанесения на растение. В еще одних вариантах осуществления композиция представляет собой трансгенное растение. В дополнительных вариантах осуществления композиция представляет собой комбинацию, предусматривающую состав и трансгенное растение, на которое он наносится. В одном варианте осуществления состав содержит первый белок Cry по настоящему изобретению, если трансгенное растение содержит второе средство для контроля вредителей. В другом варианте осуществления состав содержит второе средство для контроля вредителей, если трансгенное растение содержит первый белок Cry по настоящему изобретению.
[00172] В некоторых вариантах осуществления второе средство для контроля вредителей может представлять собой средство, выбранное из группы, состоящей из химического пестицида, инсектицидного белка Bacillus thuringiensis (Bt), инсектицидного белка Xenorhabdus, инсектицидного белка Photorhabdus, инсектицидного белка Brevibacillus laterosporus, инсектицидного белка Bacillus sphaericus, ингибиторов протеаз (как сериновых, так и цистеиновых типов), пектинов, альфа-амилазы, пероксидазы и холестериноксидазы.
[00173] В других вариантах осуществления второе средство для контроля вредителей представляет собой химический пестицид, выбранный из группы, состоящей из пиретроидов, карбаматов, неоникотиноидов, блокаторов натриевых каналов нейронов, инсектицидных макроциклических лактонов, антагонистов гамма-аминомасляной кислоты (GABA), инсектицидных мочевин и миметиков ювенильного гормона. В другом варианте осуществления химический пестицид выбран из группы, состоящей из абамектина, ацефата, ацетамиприда, амидофлумета (S-1955), авермектина, азадирахтина, азинфос-метила, бифентрина, бинфеназата, бупрофезина, карбофурана, хлорфенапира, хлорфлуазурона, хлорпирифоса, хлорпирифос-метила, хромафенозида, клотианидина, цифлутрина, бета-цифлутрина, цигалотрина, лямбда-цигалотрина, циперметрина, циромазина, дельтаметрина, диафентиурона, диазинона, дифлубензурона, диметоата, диофенолана, эмамектина, эндосульфана, эсфенвалерата, этипрола, фенотикарба, феноксикарба, фенпропатрина, фенпроксимата, фенвалерата, фипронила, флоникамида, флуцитрината, тау-флювалината, флуфенерима (UR-50701), флуфеноксурона, фонофоса, галофенозида, гексафлумурона, имидаклоприда, индоксакарба, изофенфоса, луфенурона, малатиона, метальдегида, метамидофоса, метидатиона, метомила, метопрена, метоксихлора, монокротофоса, метоксифенозида, нитиазина, новалурона, новифлумурона (XDE-007), оксамила, паратиона, паратион-метила, перметрина, фората, фозалона, фосмета, фосфамидона, пиримикарба, профенофоса, пиметрозина, пиридалила, пирипроксифена, ротенона, спиносада, спиромезифена (BSN 2060), сульпрофоса, тебуфенозида, тефлубензурона, тефлутрина, тербуфоса, тетрахлорвинфоса, тиаклоприда, тиаметоксама, тиодикарба, тиосултап-натрия, тралометрина, трихлорфона и трифлумурона, алдикарба, оксамила, фенамифоса, амитраза, хинометионата, хлоробензилата, цигексатина, дикофола, диенохлора, этоксазола, феназаквина, оксида фенбутатина, фенпропатрина, фенпироксимата, гекситиазокса, пропаргита, пиридабена и тебуфенпирада. В другом варианте осуществления химический пестицид выбран из группы, состоящей из циперметрина, цигалотрина, цифлутрина и бета-цифлутрина, эсфенвалерата, фенвалерата, тралометрина, фенотикарба, метомила, оксамила, тиодикарба, клотианидина, имидаклоприда, тиаклоприда, индоксакарба, спиносада, абамектина, авермектина, эмамектина, эндосульфана, этипрола, фипронила, флуфеноксурона, трифлумурона, диофенолана, пирипроксифена, пиметрозина и амитраза.
[00174] В дополнительных вариантах осуществления второе средство для контроля вредителей может представлять собой один или несколько из любого числа инсектицидных белков Bacillus thuringiensis, в том числе без ограничения белок Cry, вегетативный инсектицидный белок (VIP) и инсектицидные химерные варианты любого из перечисленных выше инсектицидных белков. В других вариантах осуществления второе средство для контроля вредителей представляет собой белок Cry, выбранный из группы, состоящей из Cry1Aa, Cry1Ab, Cry1Ac, Cry1Ad, Cry1Ae, Cry1Af, Cry1Ag, Cry1Ah, Cry1Ai, Cry1Aj, Cry1Ba, Cry1Bb, Cry1Bc, Cry1Bd, Cry1Be, Cry1Bf, Cry1Bg, Cry1Bh, Cry1Bi, Cry1Ca, Cry1Cb, Cry1Da, Cry1Db, Cry1Dc, Cry1Dd, Cry1Ea, Cry1Eb, Cry1Fa, Cry1Fb, Cry1Ga, Cry1Gb, CryGc, Cry1Ha, Cry1Hb, Cry1Hc, Cry1Ia, Cry1Ib, Cry1Ic, Cry1Id, Cry1Ie, Cry1If, Cry1Ig, Cry1Ja, Cry1Jb, Cry1Jc, Cry1Jd, Cry1Ka, Cry1La, Cry1Ma, Cry1Na, Cry1Nb, Cry2Aa, Cry2Ab, Cry2Ac, Cry2Ad, Cry2Ae, Cry2Af, Cry2Ag, Cry2Ah, Cry2Ai, Cry2Aj, Cry2Ak,Cry2Al, Cry2Ba, Cry3Aa, Cry3Ba, Cry3Bb, Cry3Ca, Cry4Aa, Cry4Ba, Cry4Ca, Cry4Cb, Cry4Cc, Cry5Aa, Cry5Ab, Cry5Ac, Cry5Ad, Cry5Ba, Cry5Ca, Cry5Da, Cry5Ea, Cry6Aa, Cry6Ba, Cry7Aa, Cry7Ab, Cry7Ac, Cry7Ba, Cry7Bb, Cry7Ca, Cry7Cb, Cry7Da, Cry7Ea, Cry7Fa, Cry7Fb, Cry7Ga, Cry7Gb, Cry7Gc, Cry7Gd, Cry7Ha, Cry7Ia, Cry7Ja, Cry7Ka, Cry7Kb, Cry7La, Cry8Aa, Cry8Ab, Cry8Ac, Cry8Ad, Cry8Ba, Cry8Bb, Cry8Bc, Cry8Ca, Cry8Da, Cry8Db, Cry8Ea, Cry8Fa, Cry8Ga, Cry8Ha, Cry8Ia, Cry8Ib, Cry8Ja, Cry8Ka, Cry8Kb, Cry8La, Cry8Ma, Cry8Na, Cry8Pa, Cry8Qa, Cry8Ra, Cry8Sa, Cry8Ta, Cry9Aa, Cry9Ba, Cry9Bb, Cry9Ca, Cry9Da, Cry9Db, Cry9Dc, Cry9Ea, Cry9Eb, Cry9Ec, Cry9Ed, Cry9Ee, Cry9Fa, Cry9Ga, Cry10Aa, Cry11Aa, Cry11Ba, Cry11Bb, Cry12Aa,Cry13Aa, Cry14Aa, Cry14Ab, Cry15Aa, Cry16Aa, Cry17Aa, Cry18Aa, Cry18Ba, Cry18Ca, Cry19Aa, Cry19Ba, Cry19Ca, Cry20Aa, Cry20Ba, Cry21Aa, Cry21Ba, Cry21Ca, Cry21Da, Cry21Ea, Cry21Fa, Cry21Ga, Cry21Ha, Cry22Aa, Cry22Ab, Cry22Ba, Cry22Bb, Cry23Aa, Cry24Aa, Cry24Ba, Cry24Ca, Cry25Aa, Cry26Aa, Cry27Aa, Cry28Aa, Cry29Aa, Cry29Ba, Cry30Aa, Cry30Ba, Cry30Ca, Cry30Da, Cry30Db, Cry30Ea, Cry30Fa, Cry30Ga,Cry31Aa, Cry31Ab, Cry31Ac, Cry31Ad, Cry32Aa, Cry32Ab, Cry32Ba, Cry32Ca, Cry32Cb, Cry32Da, Cry32Ea, Cry32Eb, Cry32Fa, Cry32Ga, Cry32Ha, Cry32Hb, Cry32Ia, Cry32Ja, Cry32Ka, Cry32La, Cry32Ma, Cry32Mb, Cry32Na, Cry32Oa, Cry32Pa, Cry32Qa, Cry32Ra, Cry32Sa, Cry32Ta, Cry32Ua, Cry33Aa, Cry34Aa, Cry34Ab, Cry34Ac, Cry34Ba, Cry35Aa, Cry35Ab, Cry35Ac, Cry35Ba, Cry36Aa, Cry37Aa, Cry38Aa, Cry39Aa, Cry40Aa, Cry40Ba, Cry40Ca, Cry40Da, Cry41Aa, Cry41Ab, Cry41Ba, Cry42Aa, Cry43Aa, Cry43Ba, Cry43Ca, Cry43Cb, Cry43Cc, Cry44Aa, Cry45Aa, Cry46Aa Cry46Ab, Cry47Aa, Cry48Aa, Cry48Ab, Cry49Aa, Cry49Ab, Cry50Aa, Cry50Ba, Cry51Aa, Cry52Aa, Cry52Ba, Cry53Aa, Cry53Ab, Cry54Aa, Cry54Ab, Cry54Ba, Cry55Aa, Cry56Aa, Cry57Aa, Cry57Ab, Cry58Aa, Cry59Aa, Cry59Ba, Cry60Aa, Cry60Ba, Cry61Aa, Cry62Aa, Cry63Aa, Cry64Aa, Cry65Aa, Cry66Aa, Cry67Aa, Cry68Aa, Cry69Aa, Cry69Ab, Cry70Aa, Cry70Ba, Cry70Bb, Cry71Aa, Cry72Aa и Cry73Aa.
[00175] В дополнительных вариантах осуществления второе средство для контроля вредителей представляет собой вегетативный инсектицидный белок Vip3, выбранный из группы, состоящей из Vip3Aa1, Vip3Aa2, Vip3Aa3, Vip3Aa4, Vip3Aa5, Vip3Aa6, Vip3Aa7, Vip3Aa8, Vip3Aa9, Vip3Aa10, Vip3Aa11, Vip3Aa12, Vip3Aa13, Vip3Aa14, Vip3Aa15, Vip3Aa16, Vip3Aa17, Vip3Aa18, Vip3Aa19, Vip3Aa20, Vip3Aa21, Vip3Aa22, Vip3Aa2, Vip3Aa24, Vip3Aa25, Vip3Aa26, Vip3Aa27, Vip3Aa28, Vip3Aa29, Vip3Aa30, Vip3Aa31, Vip3Aa32, Vip3Aa33, Vip3Aa34, Vip3Aa35, Vip3Aa36, Vip3Aa37, Vip3Aa38, Vip3Aa39, Vip3Aa40, Vip3Aa41, Vip3Aa42, Vip3Aa43, Vip3Aa44, Vip3Ab1, Vip3Ab2, Vip3Ac1, Vip3Ad1, Vip3Aa2, Vip3Ae1, Vip3Af1, Vip3Af2, Vip3Af3, Vip3Ag1, Vip3Ag2, Vip3Ag3 HM117633, Vip3Ag4, Vip3Ag5, Vip3Ah1, Vip3Ba1, Vip3Ba2, Vip3Bb1, Vip3Bb2 и Vip3Bb3.
[00176] В еще одних вариантах осуществления первый белок Cry по настоящему изобретению и второе средство для контроля вредителей коэкспрессируются в трансгенном растении. Такой коэкспрессии нескольких пестицидных компонентов в одном и том же трансгенном растении можно достигнуть путем получения растения, содержащего и экспрессирующего все необходимые гены, с помощью методов генной инженерии. В качестве альтернативы растение, родитель 1, может быть получено с помощью методов генной инженерии для экспрессии белка Cry по настоящему изобретению. Второе растение, родитель 2, может быть получено с помощью методов генной инженерии для экспрессии второго средства для контроля вредителей. Путем скрещивания родителя 1 с родителем 2 получают растений-потомков, которые экспрессируют все гены, введенные в родителей 1 и 2.
[00177] В дополнительных вариантах осуществления предусмотрен способ получения белка, токсичного по меньшей мере для совки-ипсилон (Agrotis ipsilon), при этом способ включает культивирование трансгенной клетки-хозяина, отличной от клетки человека, которая содержит полинуклеотид, или химерный ген, или молекулу нуклеиновой кислоты, или рекомбинантный вектор по настоящему изобретению, в условиях, при которых хозяин продуцирует белок, токсичный по меньшей мере для совки-ипсилон (Agrotis ipsilon). В некоторых вариантах осуществления трансгенная клетка-хозяин, отличная от клетки человека, представляет собой растительную клетку. В одном варианте осуществления растительная клетка представляет собой клетку маиса. В других вариантах осуществления условия, при которых выращивают растительную клетку или клетку маиса, включают естественный солнечный свет. В других вариантах осуществления трансгенная клетка-хозяин, отличная от клетки человека, представляет собой бактериальную клетку. В еще одних вариантах осуществления трансгенная клетка-хозяин, отличная от клетки человека, представляет собой дрожжевую клетку.
[00178] В других вариантах осуществления продуцируемый белок обладает инсектицидной активностью в отношении по меньшей мере одного дополнительного насекомого, при этом дополнительное насекомое выбрано из группы, состоящей из кукурузного мотылька (Ostrinia nubilalis), совки травяной (Spodoptera frugiperda), американской кукурузной совки (Helicoverpa zea), огневки тростниковой (Diatraea saccharalis), гусеницы совки бархатных бобов (Anticarsia gemmatalis), соевой совки (Chrysodeixis includes), огневки кукурузной юго-западной (Diatraea grandiosella), западной бобовой совки (Richia albicosta), табачной совки (Heliothis virescens), восточного кукурузного мотылька (Ostrinia furnacalis), хлопковой совки (Helicoverpa armigera), огневки желтой рисовой (Chilo suppressalis), розовой стеблевой совки (Sesamia calamistis) или огневки рисовой (Cnaphalocrocis medinalis) и любой их комбинации.
[00179] В других вариантах осуществления химерный ген содержит любую из SEQ ID NO: 1-4. В еще одних вариантах осуществления продуцируемый белок содержит аминокислотную последовательность под любой из SEQ ID NO: 13-16.
[00180] В некоторых вариантах осуществления химерный ген содержит нуклеотидную последовательность, кодон-оптимизированную для экспрессии в растении. В других вариантах осуществления химерный ген содержит любую из SEQ ID NO: 5-12. В дополнительных вариантах осуществления продуцируемый белок содержит аминокислотную последовательность под любой из SEQ ID NO: 13-20.
[00181] В дополнительных вариантах осуществления настоящего изобретения предусмотрен способ получения устойчивого к вредителям (например, устойчивого к насекомым) трансгенного растения, включающий введение в растение полинуклеотида, химерного гена, рекомбинантного вектора, кассеты экспрессии или молекулы нуклеиновой кислоты по настоящему изобретению, содержащих нуклеотидную последовательность, которая кодирует белок Cry по настоящему изобретению, где нуклеотидная последовательность экспрессируется в растении, за счет чего растению придается устойчивость по меньшей мере к кукурузному мотыльку, и получение устойчивого к вредителям (например, устойчивого к насекомым) трансгенного растения. В некоторых вариантах осуществления устойчивое к вредителям трансгенное растение является устойчивым к по меньшей мере совке-ипсилон (Agrotis ipsilon) в сравнении с контрольным растением, у которого отсутствует полинуклеотид, химерный ген, рекомбинантный вектор, кассета экспрессии или молекула нуклеиновой кислоты по настоящему изобретению. В некоторых вариантах осуществления введение достигается путем трансформации растения. В других вариантах осуществления введение достигается путем скрещивания первого растения, содержащего химерный ген, рекомбинантный вектор, кассету экспрессии или молекулу нуклеиновой кислоты по настоящему изобретению, с отличающимся вторым растением.
[00182] В некоторых вариантах осуществления трансгенное растение по настоящему изобретению, устойчивое к по меньшей мере совке-ипсилон (Agrotis ipsilon), дополнительно является устойчивым к одному дополнительному насекомому, где дополнительное насекомое включает без ограничения кукурузного мотылька (Ostrinia nubilalis), совку травяную (Spodoptera frugiperda), американскую кукурузную совку (Helicoverpa zea), огневку тростниковую (Diatraea saccharalis), гусеницу совки бархатных бобов (Anticarsia gemmatalis), соевую совку (Chrysodeixis includes), огневку кукурузную юго-западную (Diatraea grandiosella), западную бобовую совку (Richia albicosta), табачную совку (Heliothis virescens), восточного кукурузного мотылька (Ostrinia furnacalis), хлопковую совку (Helicoverpa armigera), огневку желтую рисовую (Chilo suppressalis), розовую стеблевую совку (Sesamia calamistis) или огневку рисовую (Cnaphalocrocis medinalis) и любую их комбинацию.
[00183] В дополнительных вариантах осуществления предусмотрен способ контроля по меньшей мере насекомых, представляющих собой совку-ипсилон (Agrotis ipsilon), при этом способ включает доставку в насекомых эффективного количества белка Cry по настоящему изобретению. Для эффективного воздействия белок Cry вначале попадает в насекомое пероральным путем. Однако белок Cry может доставляться в насекомое с помощью многих известных способов. Способы доставки белка в насекомое пероральным путем включают без ограничения обеспечение белка (1) в трансгенном растении, при этом насекомое съедает (поглощает) одну или несколько частей трансгенного растения, поглощая тем самым полипептид, экспрессируемый в трансгенном растении; (2) в составленной белковой композиции(ях), которую можно наносить, например, на питательную среду насекомых или включать в ее состав; (3) в белковой композиции(ях), которую можно наносить на поверхность, например, путем опрыскивания поверхности части растения, и которая затем заглатывается насекомым в силу того, что насекомое съедает одну или несколько подвергнутых опрыскиванию частей растения; (4) в матрице приманки; (5) путем инъекции в насекомое; или (6) с помощью любой другой известной из уровня техники системы доставки белков. Таким образом, для доставки токсичных белков Cry по настоящему изобретению можно применять любой способ пероральной доставки в насекомое. В некоторых конкретных вариантах осуществления белок Cry по настоящему изобретению доставляют в насекомое пероральным путем, при этом насекомое поедает одну или несколько частей трансгенного растения.
[00184] В других вариантах осуществления белок Cry по настоящему изобретению доставляют в насекомое пероральным путем, при этом насекомое поедает одну или несколько частей растения, подвергнутых опрыскиванию композицией, содержащей белки Cry по настоящему изобретению. Доставку композиций по настоящему изобретению на поверхность растения можно осуществлять с помощью любого способа нанесения соединений, композиций, составов и т.п. на поверхности растений, известного специалистам в данной области. Некоторые неограничивающие примеры доставки на растение или его часть или приведения в контакт с ними включают опрыскивание, опыливание, посыпание, распыление, орошение туманом, мелкодисперсное разбрызгивание, разбрасывание, пропитывание, впрыскивание в почву, введение в почву, смачивание (например, обработку корней, почвы), погружение, полив, нанесение покрытия, впитывание в листья или стебли, внесение в междурядья или обработку семян и т.п. и их комбинации. Эти и другие процедуры приведения растения или его части в контакт с соединением(ями), композицией(ями) или составом(ами) хорошо известны специалистам в данной области.
[00185] В некоторых вариантах осуществления настоящее изобретение охватывает способ предоставления фермеру средств для контроля чешуекрылых насекомых-вредителей, при этом способ включает поставку и продажу фермеру растительного материала, такого как семя, при этом растительный материал содержит полинуклеотид, химерный ген, кассету экспрессии или рекомбинантный вектор, способные экспрессировать белок Cry по настоящему изобретению, как описано выше.
[00186] Варианты осуществления настоящего изобретения можно лучше понять со ссылкой на следующие примеры. Предполагается, что предыдущее и последующее описание вариантов осуществления настоящего изобретения и различные варианты осуществления не ограничивают формулу изобретения, а скорее иллюстрируют ее. Таким образом, будет понятно, что формула изобретения не ограничивается конкретными подробностями данных примеров. Специалистам в данной области будет понятно, что другие варианты осуществления настоящего изобретения могут быть осуществлены на практике без отклонения от сущности и объема данного раскрытия, объем которого определяется прилагаемой формулой изобретения.
ПРИМЕРЫ
Пример 1. Идентификация активных штаммов Bt
[00187] Изоляты Bacillus thuringiensis культивировали из спор, присутствующих в текущих коллекциях, и поддерживали на чашках с и Т3 + агаром с добавлением пенициллина. Каждый изолят выращивали в аэробных условиях в 24-луночных планшетах с глубокими лунками в течение приблизительно 10 дней при 28°С до споруляции, которую подтверждали с помощью окрашивания раствором кумасси синего/уксусной кислоты и визуализации с помощью микроскопа. После споруляции как растворимые, так и нерастворимые фракции тестировали, чтобы определить активность в отношении представляющих интерес видов чешуекрылых. Фракции тестировали в биологическом анализе контаминации поверхности, при котором фракциями покрывали искусственную питательную среду для культивирования множества видов. Каждый изолят подвергали скринингу в отношении по меньшей мере четырех видов чешуекрылых, в том числе Helicoverpa zea (американская кукурузная совка), Agrotis ipsilon (совка-ипсилон), Ostrinia nubilalis (кукурузный мотылек) и Spodoptera frugiperda (совка травяная), при размере выборки 12 новорожденных личинок. Продолжительность каждого анализа составляла приблизительно 7 дней при комнатной температуре; планшеты оценивали в отношении смертности, а также ингибирования роста личинок. Наблюдаемое повышение смертности на 30% по сравнению с отрицательным контролем считалось показателем активности. На основе результатов первичного тестирования на насекомых для дальнейшего анализа отобрали штаммы С0633, С2080, М0262 и М1455.
Пример 2. Выделение и секвенирование генов Bt
[00188] Конструирование фосмидной геномной библиотеки: Для некоторых штаммов Bt, идентифицированных в примере 1, гены, кодирующие предположительно активные белки, выделяли с применением способа фосмидной библиотеки, описанного в Park et al. (FEMS Microbiol. Lett. 284: 28-34 (2008). Фосмидную библиотеку конструировали с применением набора для получения фосмидных библиотек CopyControl™ (Epicentre, Мэдисон, Висконсин) согласно протоколу производителя. Вкратце, очищенную ДНК из каждого штамма Bt (примерно 0,5 мкг) обрабатывали ферментами для репарации концов с образованием "тупых" концов и затем лигировали в фосмидный вектор pCC1FOS (Epicentre). После упаковки in vitro в фаги лямбда и инфицирования Escherichia coli (Е. coli) EPI1300-T1® бактериальные клетки высевали на среду Лурия-Бертани (LB), содержащую 12,5 мкг/мл хлорамфеникола. До отбора колоний планшеты инкубировали при приблизительно 37°С в течение 24 ч. Трансфицированные колонии Е. coli переносили в 96-луночные планшеты, содержащие 150 мкл LB-среды, содержащей хлорамфеникол, и инкубировали при 37°С в течение 24 ч.
[00189] Скрининг колоний с помощью гибридизации: Фосмидную библиотеку высевали при плотности 300 КОЕ на 100×15 мм чашку с L-агаром и 15 мкг/мл хлорамфеникола. В общей сложности высевали 3000 бактерий с фосмидами. Гибридизации на фильтре осуществляли с применением фильтров в виде кружков Immobilon-Ny+ размером 87 мм (EMD Millipore, Биллерика, Массачусетс). Перенос колоний выполняли следующим образом: фильтры помещали на чашки приблизительно на 5 мин., затем с помощью пинцета фильтры снимали с поверхности агара и помещали стороной с колониями кверху на фильтровальную бумагу Ватмана, пропитанную 0,5 М NaOH, на 5 мин. Затем фильтры с колониями помещали на фильтровальную бумагу Ватмана, пропитанную 2Х SSC, на 5 мин. ДНК иммобилизировали на мембране с применением UV Stratalinker®, установленного на 2000×100 мДж (Stratagene, Inc., Ла-Хойя, Калифорния). Затем фильтры сушили на воздухе на фильтровальной бумаге Ватмана. Фильтры подвергали предварительной гибридизации и гибридизации в 250 мМ NaPO4, рН 7,0, 7% SDS, 1% BSA при 65°С согласно описанию поставщика. Гибридизационные фильтры промывали в 2Х SSC, 0,5% SDS в течение 30 мин. при 65°С, затем в 0,2Х SSC, 0,2% SDS в течение 30 мин. при 65°С. Фильтры экспонировали на рентгеновскую пленку (Kodak® BIOMAX® XAR, Fisher Scientific, Питтсбург, Пенсильвания) в течение ночи с применением усиливающих экранов при -80°С. Положительные колонии переносили на L-агар с 15 мкг/мл хлорамфеникола.
[00190] Гибридизационные зонды: Конструировали ПЦР-праймеры для амплификации фрагмента cry9B-подобного гена размером 720 п. о. из геномной ДНК штамма Bt, обозначенного как С0633. Пара праймеров включала прямой праймер, обозначенный OAR2613a, имеющий последовательность AAACATGAACCGAAATAATCAAAATG (SEQ ID NO: 21), и обратный праймер, обозначенный OAR2615a, имеющий последовательность ATCCGTCCCTTGTGCGTGTAAA (SEQ ID NO: 22). ПЦР-реакцию проводили при следующих условиях проведения циклов: [94°С, 5 мин.], 12х [94°С, 30 с, от 57°С до 51°С, снижение на 0,5°С в каждом цикле, 30 с, 72°С, 2,5 мин.] и 35х[94°С, 30 с, 52°С, 30 с, 72°С, 2,5 мин.]. Реакционная смесь содержала 1X буфер One Taq® (New England Biolabs, Беверли, Массачусетс), 200 мкМ dNTP, 80 нг ДНК, 2,5 ед. ДНК-полимеразы One Taq®, по 50 нг каждого праймера и стерильную дистиллированную воду, доводящую общий объем реакционной смеси до 50 мкл.
[00191] Полученный ампликон отделяли на 1% агарозном геле с ТАЕ, содержащем бромистый этидий. Ампликон визуализировали под УФ-светом и вырезали из геля. ДНК выделяли с применением набора для экстракции из геля согласно описанию поставщика (Qiagen, Валенсия, Калифорния). Зонды метили с помощью Easy Tide () dCTP, 3000 Ки/ммоль (Perkin Elmer, Уолтем, Массачусетс) с применением системы мечения произвольных праймеров Rediprime II (GE Healthcare, Питтсбург, Пенсильвания). Невстроившиеся нуклеотиды удаляли с применением хроматографических колонок Micro Bio-Spin 30 (Biorad, Геркулес, Калифорния). Зонды нагревали при 95°С в течение 5 мин. перед добавлением в раствор для гибридизации.
[00192] Секвенирование генов Bt: Препараты ДНК для 2-4 независимых клонов готовили в соответствии с инструкциями производителя (Qiagen). Реакции секвенирования с праймерами, сконструированными к двум нитям прогнозируемой представляющей интерес нуклеотидной последовательности, осуществляли с применением набора BigDye™ Terminator (Applied Biosystems, Фостер Сити, Калифорния) в соответствии с инструкциями производителя. Продукты реакции подвергали электрофоретическому разделению на приборах для секвенирования ABI373 или ABI377. Все данные секвенирования анализировали с применением пакета программного обеспечения Phred/Phrap/Consed (Вашингтонский университет) с частотой ошибок, равной или меньше 10-4, на уровне консенсусной последовательности. Последовательность собирали с помощью программы Sequencher™ (версия 4.7, Gene Codes Corp., Энн-Арбор, Мичиган). Каждый ген секвенировали с 4Х перекрыванием.
Пример 3. Клонирование и синтез генов Bt
[00193] Конструировали пары Cry9-специфических праймеров для облегчения идентификации и клонирования генов типа cry9. Пары праймеров конструировали для гибридизации с 5'-концом гена типа cry9 с добавлением сайта рестрикции для PmeI и с 3'-концом с добавлением сайта рестрикции для AscI. Пара праймеров, применяемая для амплификации 5'-конца, включала прямой праймер, имеющий последовательность GTTTAAACATGAATCGAAATAATCAAAATG (SEQ ID NO: 23), и обратный праймер, имеющий последовательность GGCGCGCCCTACTCTTGTGTTTCAATAAA (SEQ ID NO: 24). Пара праймеров, применяемая для амплификации 3'-конца, включала прямой праймер, имеющий последовательность GTTTAAACATGAATCAAAATAAACACGGA (SEQ ID NO: 25), и обратный праймер, имеющий последовательность GGCGCGCCTTACTGTTGGGTTTCCATGAACT (SEQ ID NO: 26). Вставленные сайты рестрикции подчеркнуты в соответствующих праймерах. ПЦР-реакции осуществляли с применением следующих условий проведения циклов: [94°С, 5 мин.] и 30х [94°С, 30 с, 45°С, 30 с, 72°С, 3,5 мин.]. Реакционная смесь содержала 1X буфер OneTaq, 200 мкМ dNTP, 80 нг ДНК, 2,5 ед. ДНК-полимеразы One Taq (New England Biolabs), no 50 нг каждого праймера и стерильную дистиллированную воду, доводящую общий объем реакционной смеси до 50 мкл.
[00194] Полученный ампликон клонировали в вектор ТОРО pCR 4.0 согласно описанию поставщика (Life Technologies). Выделенную плазмидную ДНК расщепляли с применением PmeI и AscI согласно описанию поставщика (New England Biolabs).
[00195] Фрагмент PmeI/AscI клонировали в челночный вектор, обозначенный pCIB5634' сконструированный для экспрессии как в Е. coli,, так и в В. thuringiensis. Вектор pCIB5634' расщепляли с применением PmeI и AscI. Расщепленный вектор и фрагмент гена очищали путем прогона на 1% агарозном геле на основе буфера, содержащего трис-ацетат-EDTA. Фрагменты вырезали из геля и очищали с применением набора для экстракции из геля от QIAGEN согласно описанию поставщика. Фрагменты лигировали вместе с применением набора для лигирования от New England Biolabs согласно описанию поставщика. Продукты реакции лигирования трансформировали в клетки ТОР10 (Life Technologies) согласно описанию поставщика и высевали их на L-агар, содержащий 100 мг/мл ампициллина. Плазмидную ДНК выделяли из отдельной колонии и идентифицированный клон снова секвенировали с 2Х перекрыванием с целью подтверждения правильной последовательности.
[00196] Некоторые гены Bt, которые были отобраны для рекомбинантной продукции, но не были напрямую клонированы из геномной ДНК, были переданы сторонним подрядчикам для синтеза полного гена. Эти синтезированные гены Bt субклонировали в описанные выше челночные векторы для последующей экспрессии и дальнейшего тестирования биологической активности.
Пример 4. Сборка и анализ генома
[00197] Некоторые гены Bt по настоящему изобретению идентифицировали с применением подхода на основе секвенирования полного генома. Вкратце, ДНК Bacillus разрезали с помощью ультразвукового прибора S2 от Covaris (Covaris, Inc., Вобурн, Массачусетс) с применением программы DNA_400bp с такими установками: рабочий режим: 10%; интенсивность: 4; циклы/импульс: 200. ДНК обрабатывали с помощью модуля для репарации концов/добавления dA-хвоста NEBNext® Ultra™ (New England Biolabs, Inc. Ипсвич, Массачусетс). Индексные адаптеры 1-57 от Biooscience (1-27 Бразилия, 28-57 США, Великобритания и Швейцария) лигировали с применением NEB Quick Ligation™ согласно описанию поставщика (New England Biolabs, Inc. Ипсвич, Массачусетс). Продукты лигирования очищали с применением гранул Agencourt AMPure XP согласно описанию поставщика (Beckman Coulter, Inc., Индианаполис, Индиана).
[00198] Библиотеку разделяли на фракции по размеру следующим образом: 50 мкл образца смешивали с 45 мкл 75% смеси гранул (25% гранул AMPure и 75% раствора NaCl/PEG от TekNova, № по кат. Р4136). Смесь перемешивали и помещали на магнитную подставку. Полученный супернатант переносили в новую лунку и добавляли 45 мкл 50% смеси гранул (50% гранул AMPure и 50% раствора NaCl/PEG от TekNova, № по кат. Р4136). Данную смесь перемешивали и помещали на магнитную подставку. Полученный супернатант удаляли и гранулы промывали 80% этанолом. Добавляли 25 мкл элюирующего буфера (ЕВ) и смесь помещали на магнитную подставку. Полученный конечный супернатант удаляли и помещали в пробирку на 1,5 мл. Этот способ позволяет получать библиотеки с диапазоном размеров ДНК 525 пар оснований (п. о.) (вставка плюс адаптер).
[00199] Отсортированную по размеру ДНК-библиотеку амплифицировали с применением KAPA Biosystem HiFi Hot Start (Kapa Biosystems, Inc., Уилмингтон, Массачусетс) с применением следующих условий проведения циклов: [98°С, 45 с]; 12 х [98°С, 15 с, 60°С, 30 с, 72°С, 30 с]; [72°С, 1 мин.]. Каждая реакционная смесь содержала: 5 мкл ДНК-библиотеки, 1 мкл универсальных праймеров от Bioscience (25 мкМ), 18 мкл стерильной воды, 1 мкл индексированных праймеров от Bioscience (25 мкМ), 25 мкл 2Х полимеразы KAPA HiFi.
[00200] Библиотеки анализировали на биоанализаторе Agilent 2100 (Agilent Technologies, Санта-Клара, Калифорния) с применением высокочувствительных чипов для определения диапазона размеров и среднего размера вставок в библиотеке. Все библиотеки подвергали секвенированию спаренных концов (РЕ) (100 циклов на рид; 12-24 библиотек на дорожку) в системе секвенирования HiSeq 2500 с применением стандартных протоколов секвенирования от производителя (Illumina, Inc., Сан-Диего, Калифорния).
[00201] Разрабатывали инструмент для проведения расчетов в отношении Bacillus, чтобы идентифицировать и охарактеризовать вероятные гены токсинов для расстановки приоритетов в отношении направлений дополнительных лабораторных тестов.
[00202] Сборка и анализ генома, а также анализ геномной библиотеки, описанный выше, привели к идентификации в штаммах Bacillus thuringiensis четырех Cry9-подобных генов, проявляющих токсичность в отношении по меньшей мере совки-ипсилон (Agrotis ipsilon). Идентификационные характеристики Сгу9-подобных генов и белков приведены в таблице 1.
Пример 5. Гомология ВТ0044, ВТ0051, ВТ0068 и ВТ0128 с известными белками CryBt
[00203] Поиск по базам данных белков с применением аминокислотных последовательностей белков по настоящему изобретению показал, что они являются гомологичными известным инсектицидным белкам. Сравнение аминокислотных последовательностей белков по настоящему изобретению с неизбыточной (nr) базой данных, поддерживаемой NCBI, с применением алгоритма BLAST позволило выявить следующие белки, как характеризующиеся совокупностью аминокислот с самыми высокими значениями идентичности относительно последовательностей по настоящему изобретению (таблица 2).
Пример 6. Экспрессия белков Bt в рекомбинантных клетках-хозяевах
[00204] Экспрессия в Bacillus. Представляющие интерес гены экспрессировали в не образующем кристаллы штамме Bacillus, который не характеризовался активностью в отношении жесткокрылых или чешуекрылых, с помощью вектора экспрессии pCIB5634' описанного выше, который содержал соответствующий промотор гена белка Cry и маркер устойчивости к эритромицину. Конструкции трансформировали в штамм-хозяин посредством электропорации и проводили последующий отбор на чашках с агаром, содержащим эритромицин. Эти рекомбинантные штаммы выращивали до фазы споруляции на среде Т3 при 28°С в течение 4-5 дней. Клеточные осадки собирали и промывали несколько раз перед солюбилизацией в карбонатном буфере с высоким рН (50 мМ), содержащем 2 мМ DTT.
[00205] Экспрессия в Е. coli. Представляющие интерес гены экспрессировали в различных штаммах Е. coli с применением векторов рЕТ28а или рЕТ29а (EMD Millipore). Конструкции трансформировали посредством электропорации и проводили последующий отбор на чашках с агаром, содержащим канамицин. Эти рекомбинантные штаммы выращивали, а экспрессию индуцировали с применением индукции с помощью IPTG при 28°С. Клетки ресуспендировали в карбонатном буфере с высоким рН (50 мМ), содержащем 2 мМ DTT, а затем разрушали с применением гомогенизатора Microfluidics LV-1.
[00206] Анализ экспрессии. Полученные лизаты клеток (каждого хозяина) затем очищали путем центрифугирования и образцы анализировали в отношении чистоты с помощью SDS-PAGE и электрофореграммы (BioRad Experion). Концентрации общего белка определяли с помощью анализа по Брэдфорду или Thermo 660. Очищенные белки Cry затем тестировали в биологических анализах.
Пример 7. Активность белков Cry в биологических анализах
[00207] Белки, полученные в примере 6, тестировали с применением известного из уровня техники биологического анализа с использованием искусственной питательной среды в отношении одного или нескольких следующих видов насекомых-вредителей: совка травяная (FAW; Spodoptera frugiperda), американская кукурузная совка (CEW; Helicoverpa zea), кукурузный мотылек (ЕСВ; Ostrinia nubilalis), совка-ипсилон (BCW; Agrotis ipsilon), огневка тростниковая (SCB; Diatraea saccharlis), гусеница совки бархатных бобов (VBC; Anticarsia gemmatalis), соевая совка (SBL; Pseudoplusia includens), огневка кукурузная юго-западная (SWCB; Diatraea grandiosella), западная бобовая совка (WBCW; Striacosta albicosta), табачная совка (TBW; Heliothis virescens), восточный кукурузный мотылек (АСВ; Ostrinia furnacalis), хлопковая совка (CBW; Helicoverpa armigera), огневка желтая рисовая (SSB; Chilo suppressalis), розовая стеблевая совка (PSB; Sesamia inferens) и огневка рисовая (RLF; Cnaphalocrocis medinails).
[00208] Равное количество белка в виде раствора наносили на поверхность искусственной питательной среды для насекомых (Bioserv, Inc., Френчтаун, Нью-Джерси) в 24-луночных планшетах. После высыхания поверхности питательной среды в каждый планшет добавляли личинок видов насекомых, подлежащих тестированию. Планшеты запечатывали и выдерживали в окружающих условиях лаборатории с учетом температуры, освещения и относительной влажности. Группа положительного контроля состояла из личинок, подвергаемых воздействию очень активного штамма Bacillus дикого типа с широким спектром действия. Группы отрицательного контроля состояли из личинок, подвергаемых воздействию питательной среды для насекомых, обработанной только буферным раствором, и личинок на необработанной питательной среде для насекомых; то есть только на питательной среде. Смертность определяли через приблизительно 120 часов и оценивали в баллах в сравнении с контролями.
[00209] Результаты показаны в таблице 3, где "-" означает отсутствие активности в сравнении с контролем, "+/-" означает 0-10% активность в сравнении с контролем (эта категория также включала 0% смертность при сильном ингибировании роста личинок), "+" означает 10-25% активность в сравнении с контролем, "++" означает 25-75% активность в сравнении с контролем, а "+++" означает 75-100% активность в сравнении с контролем.
Пример 8. Преобразование белков Cry в анализе с использованием искусственного желудочного сока
[00210] Некоторые белки Cry уже экспрессировали в растениях, и семена таких растений ежегодно продаются фермерам для применения в контроле различных насекомых-вредителей. Такие самозащищенные пестицидные продукты рассматриваются и регистрируются различными регулирующими органами, включая, например. Агентство по охране окружающей среды США (ЕРА).
[00211] Воздействие при поступлении с пищей является основным путем, за счет которого люди могут подвергаться воздействию белков Cry, экспрессируемых трансгенными растениями. Острая пероральная токсичность для млекопитающих и переваримость белка являются конечными точками оценки риска для здоровья человека, определяемыми ЕРА. Дополнительными научными доказательствами безопасности белков Cry является то, что они, как было показано, быстро расщепляются in vitro под действием искусственного желудочного сока. Результаты семи исследований in vitro, проведенных с репрезентативными белками Cry1, Cry2 и Cry3, показали, что белки быстро расщепляются, как правило, в течение 30 секунд. Эти результаты подтверждают более широкий вывод о том, что члены этих групп белков Cry (которые обладают значительной идентичностью аминокислотных последовательностей), вероятно, быстро расщепляются после поедания человеком. Другая область рассмотрения заключается в определении того, могут ли белки Cry вызывать аллергическую реакцию. Продемонстрированное быстрое расщепление белков Cry in vitro должно сводить к минимуму возможность такого явления. Для сравнения, пищевые аллергены обычно не подвергаются распадению в in vitro модели желудочно-кишечного тракта, тогда как обычные белки пищи, для которых не показана аллергенность, быстро расщепляются в искусственном желудочном соке (Metcalfe et al., 1996).
[00212] Дополнительные понимание, касающееся потенциальной аллергенности белка, можно получить с помощью анализа переваримости белка в искусственном желудочном соке (SGF). Почти все белки Cry, экспрессируемые в трансгенных растениях, которые были протестированы на сегодняшний день, быстро переваривались и, следовательно, были определены как неаллергенные. Однако было обнаружено, что белок Cry9C, находящийся в продукте трансгенной кукурузы, известном как Starlink, является частично устойчивым к SGF. Хотя Cry9C Starlink не токсичен для животных, свойства частичной переваримости и частичной стабильности при обработке не позволили ЕРА абсолютно исключить возможность того, что белок Cry9C Starlink может действовать как пищевой аллерген, что в конечном счете привело к тому, что компания, которая разработала Starlink, отозвала продукты с рынка США.
[00213] В настоящее время не существует доказательных тестов для определения аллергенного потенциала новых белков. Таким образом, ЕРА применяет подход, основанный на совокупности доказательств, в котором рассматриваются следующие факторы: источник признака; сравнение аминокислотной последовательности с известными аллергенами и биохимические свойства белка, включая in vitro переваримость в искусственном желудочном соке (SGF) и степень гликозилирования.
[00214] С помощью анализа с использованием искусственного желудочного сока (SGF) измеряют in vitro переваримость тестируемого белка в строго контролируемых условиях, характерных для пищеварительного тракта высших млекопитающих. Вкратце, полученный в бактериях тестируемый белок Cry (в концентрации 0,5-5 мг/мл) подвергали воздействию фермента пепсина (из слизистой оболочки желудка свиньи, растворенного в 2 мг/мл NaCl, pH 1,2) в соотношении 10 единиц активности пепсина/мкг тестируемого белка в течение периода времени, составляющего один час, при 37°С. Образцы отбирали на 1, 2, 5, 10, 30 и 60 минуте и сразу же блокировали путем добавления предварительно нагретого (95°С - 2 минуты) стоп-буфера (65% 0,5 М бикарбоната натрия, pH 11, 35% трициновый загрузочный буфер) для немедленной инактивации пепсина, и снова нагревали в течение дополнительных 5 минут. После завершения анализа образцы, взятые в определенные моменты времени, и контроли (только тестируемый белок, только пепсин) исследовали с помощью SDS-PAGE в геле с 10-20% трис-глицина (при этом пептиды были визуально различимы вплоть до 1 кДа) для отслеживания кинетики и уровня переваривания, осуществляемого пепсином.
[00215] Результаты анализов с SGF продемонстрировали, что все белки Cry по настоящему изобретению расщеплялись очень быстро. Эти результаты предоставили доказательство того, что хотя белки Cry по настоящему изобретению относятся к семейству белков Cry9, они совершенно отличаются от них с точки зрения ответа в анализе с SGF при сравнении с некоторыми опубликованными результатами, например, касающимися Cry9C Starlink, что предполагает существенные структурные отличия в ключевых сайтах расщепления для пепсина в белке. Эти результаты дополнительно позволяют предположить, что аллергенный потенциал белков Cry по настоящему изобретению является минимальным.
Пример 9. Мутагенез ВТ-0051
[00216] Прогнозирование антигенных участков в белке является полезным для рационального подхода к синтезу пептидов, которые могут вызывать образование антител, реактивных в отношении интактного белка, и дифференцировать близкородственные белки. В этом примере аминокислотная последовательность нативного ВТ-0051 (SEQ ID NO: 6) была наложена на кристаллическую структуру белка Cry8Ea1 (номер доступа 3ЕВ7; Protein Databank во всемирной сети Интернет по адресу rcsb.org/pdb/; см. также Berman et al., 2000. Nuc. Acids Res. 28: 235-242), и антигенные участки, спрогнозированные с применением Vector NTI 8.0 (Thermo Fisher Scientific, Inc., Уолтгем, Массачусетс; см. также Welling et al. 1985. FEBS Lett. 188: 215-218) картировали на данной структуре. Отбор подходящего участка для мутагенеза состоял в выборе петлевых доменов в неконсервативных участках за пределами домена I. Петли, которые, как известно, были вовлечены в распознавание рецептора белка Cry, были исключены из отбора, как и любые остатки, которые, согласно прогнозу, вовлечены в активацию под действием протеазы. В результате остался один участок для мутагенеза, представленный аминокислотами 342-354 из SEQ ID NO: 6. Изменения L350I, N351Q и T354S были выбраны (SEQ ID NO: 18) исходя из ожидания, что они приведут к минимальному структурному изменению или функциональному изменению относительно нативного ВТ-0051. Такие изменения привели к образованию антигенного участка, который позволяет отличить мутантный ВТ-0051 (mBT-0051; SEQ ID NO: 18) от нативного ВТ-0051(SEQ ID NO: 14) и от других родственных белков Cry9.
Пример 10. Введение генов в вектор для экспрессии в растении
[00217] Перед экспрессией в растениях синтетический полинуклеотид, содержащий нуклеотидную последовательность, кодирующую каждый из белков Cry Bt, BT-0044, ВТ-0051, ВТ-0068 и ВТ-0128 (SEQ ID N0:5-8 соответственно), и синтетический полинуклеотид, содержащий нуклеотидную последовательность, кодирующую каждый из мутантных белков Cry Bt, mBT-0044, mBT-0051, mBT-0068 и mBT-0128 (SEQ ID NO: 17-20 соответственно), синтезировали в автоматизированной системе для синтеза генов (Genscript, Inc., Пискатауэй, Нью-Джерси). В этом примере получали первую кассету экспрессии, содержащую убиквитиновый промотор маиса (Ubi1), функционально связанный с последовательностью, кодирующей белок Cry, которая была функционально связана с терминатором NOS, а также получали вторую кассету экспрессии, содержащую промотор Ubi1, функционально связанный с последовательностью, кодирующей фосфоманнозоизомеразу (PMI), которая была функционально связана с терминатором NOS. Экспрессия PMI позволяет осуществлять положительную селекцию трансгенных растений на маннозе. Обе кассеты экспрессии клонировали в подходящий вектор для трансформации маиса, опосредованной Agrobacterium.
Пример 11. Экспрессия белков Cry в растениях
[00218] Трансформацию незрелых зародышей маиса выполняли, главным образом, как описано в Negrotto et al., 2000, Plant Cell Reports 19: 798 803. Вкратце, штамм Agrobacterium LBA4404 (pSB1), содержащий вектор, описанный в примере 12, выращивали на твердой среде YEP (дрожжевой экстракт (5 г/л), пептон (10 г/л), NaCl (5 г/л), 15 г/л агара, рН 6,8) в течение 2-4 дней при 28°С. Примерно 0,8Х 109 клеток. Agrobacterium суспендировали в среде LS-inf, дополненной 100 мкМ As. Бактерий предварительно индуцировали в данной среде в течение примерно 30-60 минут.
[00219] Незрелых зародышей инбредной линии маиса вырезали из початков возрастом 8-12 дней с переносом в жидкую среду LS-inf + 100 мкМ As. Зародышей однократно ополаскивали свежей средой для инфицирования. Затем добавляли раствор Agrobacterium, и зародышей перемешивали на вихревой мешалке в течение 30 секунд и оставляли осесть с бактериями в течение 5 минут. Затем зародышей переносили стороной со щитком зародыша кверху на среду LSAs и культивировали в темноте в течение двух-трех дней. Впоследствии примерно 20-25 зародышей на чашку Петри переносили на среду LSDc, дополненную цефотаксимом (250 мг/л) и нитратом серебра (1,6 мг/л), и культивировали в темноте при примерно 28°С в течение 10 дней.
[00220] Незрелых зародышей, образующих эмбриогенный каллюс, переносили в среду LSD1M0.5S. Селекцию культур на этой среде осуществляли в течение примерно 6 недель, при этом через приблизительно 3 недели проводили стадию субкультивирования. Выжившие каллюсы переносили на среду Reg1, дополненную маннозой. После культивирования на свету (в режиме 16 часов света/8 часов темноты) зеленые ткани затем переносили на среду Reg2 без регуляторов роста и инкубировали в течение приблизительно 1-2 недель. Проростки переносили в контейнеры Magenta GA-7 (Magenta Corp, Чикаго, Иллинойс), содержащие среду Reg3, и выращивали на свету. Спустя приблизительно 2-3 недели растения тестировали с помощью ПЦР в отношении наличия генов PMI, а также гена cry Bt. Растения, показавшие положительные результаты в ПЦР-анализе, переносили в теплицу для дальнейшей оценки.
[00221] Трансгенные растения оценивали в отношении числа копий (определяли с помощью анализа Taqman), уровня экспрессия белка (определяли с помощью ELISA) и эффективности против представляющих интерес видов насекомых в биологических анализах с вырезанием листа. В частности, ткань листа вырезали из однокопийных объектов (на стадии V3-V4) и заражали новорожденными личинками, затем инкубировали при комнатной температуре в течение 5 дней. Размер выборки для биологического анализа с листовыми дисками варьировал в зависимости от тестируемого вида насекомых (кукурузный мотылек (ЕСВ), n=10; американская кукурузная совка (CEW), n=3, совка-ипсилон (BCW), n=5). Снятие показаний для оценки повреждения ткани и смертности получали примерно в день 3 и день 5; образцы оценивали в отношении повреждения относительно отрицательного контроля с применением следующей шкалы: "+": <5% повреждение ткани, все личинки мертвые;"+/-": 5-20% повреждение ткани, все личинки мертвые; или "-": >20% повреждение ткани, некоторые личинки живые и/или развились до 2ой личиночной стадии.
[00222] Результаты биологического анализа на ткани трансгенного растения подтверждают, что при экспрессии в трансгенных растениях белки Cry по настоящему изобретению токсичны для целевых насекомых. Например, mBT-0051, экспрессируемый в растении маиса, стабильно трансформированном химерным геном по настоящему изобретению, активен в отношении по меньшей мере совки-ипсилон (Agrotis ipsilon), а также восточного кукурузного мотылька (Ostrinia furnacalis), огневки желтой рисовой (Chilo suppressalis) и хлопковой совки (Helicoverpa armigera).
--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> ЗИНГЕНТА ПАРТИСИПЕЙШНС АГ
<120> Композиции и способы контроля вредителей растений
<130> 80668-WO-REG-ORG-P-1
<160> 26
<170> PatentIn версия 3.5
<210> 1
<211> 3444
<212> ДНК
<213> Bacillus thuringiensis
<400> 1
atggatttag acggtaataa aactgaaact gagactgaaa ttgtaaatgg ttccgaaagt 60
agtatcgatc catcaagcgt gtcttatgcg ggaaataaca gctattcttc cgctttgaat 120
ctcaattctt gtcaaaacag agggattgca cagtgggtta atacgcttgg aggtgcaatc 180
ggtcaggctg tatccatagg aacatccatc atttccttgc ttgcggcgcc tacgcttact 240
ggaagtattt cgttagcttt taatcttata aggagaatgg ggacaggcag taatggaagc 300
tctatttcgg acttgtcaat atgtgactta ctatccataa ttaatttacg tgtaagtcaa 360
gctgtattga acgacgggat tgcagatttt aacggctcag tggctgtata tgatctctat 420
ttgcatgctt tacgcagttg gaacaataac cctaatgctg ctaccgcgga ggaacttcgc 480
actcgttttc gtattgcaga ttccgaattc gaacgtatct taacgcgggg gtccttgaca 540
catggtggtt cattagctag acaagatgct caagtgttac tgttaccttc ttttgtaaat 600
gctgcctatc ttcatttact tatattaagg gatgctagca gatatggggc tagctggggc 660
ttgtttaata cgacaccaca tatcaattat ccagtaagat tacaacaact tattggttct 720
tatacccatt actgcacaca ttggtataat caaggtttaa atgaaatcag acaacgaggc 780
aatacggctg tcaattggtt ggaatttcat agatacagaa gagatatgac attaatggta 840
ctagatgttg tgtcattatt ttcagcgctt gatactataa ggtatccgaa cgcaaccgtt 900
gtccaattaa gcagaaccgt ttatacagac ccgattggtt ttgtaaatcg tggaagcggc 960
aacagattaa gctggtttga ttggcggaat caagctaatt tttcaacgct agaaagtgaa 1020
atgccaaccc cctcgtctcc actttctttg aatcatatga gtatatttac gggtcccctt 1080
actttacctg tctctcctaa tacccataga gccagggtat ggtatggcaa tcaaaatatg 1140
ttcacaacgg gtagtcaaaa ttcaggtcaa acaacaaact ctattcaaaa catttcgggt 1200
ttagaaatat ttagaataga ttctcaagcc tgtaatctaa acaataattc gtatggcgtg 1260
aaccgagctg aattttttca tggcgctagt cagggctccc aaagatctgt ttatcaaggc 1320
tatattagac aaagtggatt ggacaacccg gtagttatga atcttcaaag ctttttacct 1380
ggcgaaaatt cagcgacacc aaccgcacaa gattatacgc atatattaag taatcctgtt 1440
aatataagag gaggacttcg acaaatagta gctgatcgtc gttcttctgt agtcgtttat 1500
ggttggacac acaaaagttt gagtcgacgt agtttagttg caccagatca aattactcaa 1560
gtacctgctg ttaaagcaag tccctcatcc cattgtacca tcattgcagg acctggattt 1620
acgggcgggg atctcgtaag tctgcaacca aatggacaac tcgttatacc gtttcaggta 1680
tcggcgccag aaacaaatta tcatattcga atatgttatg tttctacgtc cgactgttcc 1740
ataaatacaa tatgtaatga tgagacccat ttaagtacgt tgccttccac aacctcatca 1800
cttgaaaatt tacaatgtaa ccatttgcat tattttaacg tgggcacttt caaacctacg 1860
atagatagta aactaacgct tgtaaataca agtccaaatg caaatattat catcgacaaa 1920
attgaattta ttcccgtaga tacggcccaa caacaaaatg aggatctaga agcagcaaaa 1980
aaagcggtgg cgagcttgtt tacacgcaca agggacggat tacaagtaaa tgtgaaagat 2040
tatcaagtcg atcaagcggc aaatttagtg tcatgcttat cagatgaaca atatgggtat 2100
gacaaaaaga tgttattgga agcggtacgt gcggcaaaac gacttagccg agaacgcaac 2160
ttacttcagg acccagattt taatacaatc aatagtacag aagaaaatgg atggaaagca 2220
agtaacggcg ttactattag tgagggcggg ccattctata aaggccgtgc aattcagcta 2280
gcaagtgcac gagaaaatta cccaacatac atctatcaaa aagtagatgc atcggagtta 2340
aagccgtata cacgttatag actggatggg ttcgtgaaga gtagtcaaga tttagaaatt 2400
gatctcattc accatcataa agtccatctt gtgaaaaatg taccagataa tttagtatct 2460
gatacttacc cagatgattc ttgtagtgga atcaatcgat gtcaggaaca acagatggta 2520
aatgcgcaac tggaaacaga gcatcatcat ccgatggatt gctgtgaagc agctcaaaca 2580
catgagtttt cttcctatat tgatacaggg gatttaaatt cgagtgtaga ccagggaatc 2640
tgggcgatct ttaaagttcg aacaaccgat ggttatgcga cgttaggaaa tcttgaattg 2700
gtagaggtcg gaccgttatc gggtgaatct ttagaacgtg aacaaaggga taatacaaaa 2760
tggagtgcag agctaggaag aaagcgtgca gaaacagatc gcgtgtatca agatgccaaa 2820
caatccatca atcatttatt tgtggattat caagatcaac aattaaatcc agaaataggg 2880
atggcagata ttatggacgc tcaaaatctt gtcgcatcaa tttcagatgt atatagcgat 2940
gccgtactgc aaatccctgg aattaactat gagatttaca cagagctgtc caatcgctta 3000
caacaagcat cgtatctgta tacgtctcga aatgcggtgc aaaatgggga ctttaacaac 3060
gggctagata gctggaatgc aacagcgggt gcatcggtac aacaggatgg caatacgcat 3120
ttcttagttc tttctcattg ggatgcacaa gtttctcaac aatttagagt gcagccgaat 3180
tgtaaatatg tattacgtgt aacagcagag aaagtaggcg gcggagacgg atacgtgact 3240
atccgggatg atgctcatca tacagaaacg cttacattta atgcatgtga ttatgatata 3300
aatggcacgt acgtgactga taatacgtat ctaacaaaag aagtggtatt ccatccggag 3360
acacaacaca tgtgggtaga ggtaaatgaa acagaaggtg catttcatat agatagtatt 3420
gaattcgttg aaacagaaaa gtaa 3444
<210> 2
<211> 3474
<212> ДНК
<213> Bacillus thuringiensis
<400> 2
atgaatcgaa ataatcaaaa tgaatatgaa attattgatg ccccccattg tgggtgtcca 60
tcagatgacg atgtgaagta tcctttggca agtgacccaa atgcagcgtt acaaaatatg 120
aactataaag attacttaca aatgacagat gaggactaca ctgattctta tataaatcct 180
agtttatcta ttagtggtag agatgcagtt cagactgcgc ttactgttgt tgggagaata 240
ctcggggctt taggtgttcc gttttctgga caaatagtga gtttttatca attcctttta 300
aatacactgt ggccagttaa tgatacagct atatgggaag ctttcatgcg acaggtggag 360
gaacttgtca atcaacaaat aacagaattt gcaagaaatc aggcacttgc aagattgcaa 420
ggattaggag attcttttaa tgtatatcaa cgttcccttc aaaattggtt ggctgatcga 480
aatgatacac gaaatttaag tgttgttcgt gctcaattta tagctttaga ccttgatttt 540
gttaatgcta ttccattgtt tgcagtaaat ggacagcagg ttccattact gtcagtatat 600
gcacaagctg tgaatttaca tttgttatta ttaaaagatg catctctttt tggagaagga 660
tggggattca cacaggggga aatttccaca tattatgacc gtcaattgga actaaccgct 720
aggtacacta attactgtga aacttggtat aatacaggtt tagatcgttt aagaggaaca 780
aatactgaaa gttggttaag atatcatcaa ttccgtagag aaatgacttt agtggtatta 840
gatgttgtgg cgctatttcc atattatgat gtacgacttt atccaacggg atcaaaccca 900
cagcttacac gtgaggtata tacagatccg attgtattta atccaccagc taatgttgga 960
ctttgccgac gttggggtac taatccctat aatacttttt ctgagctcga aaatgccttc 1020
attcgcccac cacatctttt tgataggctg aatagcttaa caatcagcag taatcgattt 1080
ccagtttcat ctaattttat ggattattgg tcaggacata cgttacgccg tagttatctg 1140
aacgattcag cagtacaaga agatagttat ggcctaatta caaccacaag agcaacaatt 1200
aatcccggag ttgatggaac aaaccgcata gagtcaacgg cagtagattt tcgttctgca 1260
ttgataggta tatatggcgt gaatagagct tcttttgtcc caggaggctt gtttaatggt 1320
acgacttctc ctgctaatgg aggatgtaga gatctctatg atacaaatga tgaattacca 1380
ccagatgaaa gtaccggaag ttcaacccat agactatctc atgttacctt ttttagcttt 1440
caaactaatc aggctggatc tatagctaat gcaggaagtg tacctactta tgtttggacc 1500
cgtcgtgatg tggaccttaa taatacgatt accccaaata gaattacaca attaccattg 1560
gtaaaggcat ctgcacctgt ttcgggtact acggtcttaa aaggtccagg atttacagga 1620
gggggtatac tccgaagaac aactaatggc acatttggaa cgttaagagt aacggttaat 1680
tcaccattaa cacaacaata tcgcctaaga gttcgttttg cctcaacagg aaatttcagt 1740
ataaggttac tccgtggagg ggtttctatc ggtgatgtta gattagggag cacaatgaac 1800
agagggcagg aactaactta cgaatccttt ttcacaagag agtttactac tactggtccg 1860
ttcaatccgc cttttacatt tacacaagct caagagattc taacagtgaa tgcagaaggt 1920
gttagcaccg gtggtgaata ttatatagat agaattgaaa ttgtccctgt gaatccggca 1980
cgagaagcgg aagaggattt agaagcggcg aagaaagcgg tggcgagctt gtttacacgt 2040
acaagagatg gattacaggt aaatgtgaca gattaccaag tggatcgagc ggcaaattta 2100
gtgtcatgct tatcagatga acaatattcg catgataaaa agatgttatt ggaagccgta 2160
cgcgcagcaa aacgcctcag ccgcgaacgc aacttacttc aagatccaga ttttaataca 2220
atcaatagta cagaagaaaa tggctggaag gcaagtaacg gtgttactat tagcgagggc 2280
ggtccattct ttaaaggtcg tgcacttcag ttagcaagcg caagagaaaa ttatccaaca 2340
tacatttatc aaaaagtaga tgcatcggtg ttaaagcctt atacacgcta tagactagat 2400
ggatttgtga agagtagtca agatttagaa attgatctca tccaccatca taaagtccat 2460
cttgtaaaaa atgtaccaga taatttagta tctgatactt actcagatgg ttcttgcagc 2520
ggaatcaacc gttgtgatga acagcagcag gtagatatgc agctagatgc ggagcatcat 2580
ccaatggatt gctgtgaagc ggctcaaaca catgagtttt cttcctatat taatacaggg 2640
gatctaaatg caagtgtaga tcagggcatt tgggttgtat taaaagttcg aacaacagat 2700
gggtatgcga cgttaggaaa tcttgaattg gtagaggttg ggccattatc gggtgaatct 2760
ctagaacgcg aacaaagaga taatgcgaaa tggaatgcag agctaggaag aaagcgtgca 2820
gaaacagatc gcgtgtatct agctgcgaaa caagcaatta atcatctatt tgtagactat 2880
caagatcaac aattaaatcc agaaattggg ctagcggaaa taaatgaagc ttcaaatctt 2940
gtgaagtcaa tttcgggtgt atatagtgat acactattac agattcctgg aattaactac 3000
gaaatttaca cagagttatc cgatcgatta caacaagcat cgtatctgta tacgtctcga 3060
aatgccgtgc aaaatggaga ctttaacagt ggtctagata gttggaatgc aacaacagat 3120
gcatcggttc agcaagatgg cagtacacat ttcttagttc tttcgcattg ggatgcacaa 3180
gtttcccaac aaatgagagt aaatttgaat tgtaagtatg ttttacgtgt aacagcaaaa 3240
aaagtaggag gcggagatgg atacgtcaca atccgagatg gcgctcatca ccaagaaact 3300
cttacattta atgcatgtga ctacgatgta aatggtacgt atgtcaatga caattcgtac 3360
ataacaaaag aagtggtatt ctacccagag acaaaacata tgtgggtaga ggtgagtgaa 3420
tccgaaggtt cattctatat agacagtatt gagtttattg aaacacaaga gtag 3474
<210> 3
<211> 3522
<212> ДНК
<213> Bacillus thuringiensis
<400> 3
atgaatcgaa ataatcaagg tgaatatgaa attattgacg cttccacttg tggttgttcg 60
tcagatgatg ttgttcaata tcctttggca agagatccga atgctgcatt ccaaaatatg 120
aattataaag attatttgaa aatgtctgac ggagactacg tcgattctta tataaaccca 180
ggcttatcta ttggtcgtag agatgtgacc ctaactggag ttggtattgt tgcgctaata 240
gtagggactt taggtggtcc agttgggggt atagtaactg gcttgatttc ctctctttta 300
ggattattgt ggccaagtaa tgataatgat gtatgggaag cttttatggc acaaatagaa 360
gagctaattg aacaaaggat agcagatcaa gtagtaagga atgcactcga taacttaact 420
ggattgcgcg attattataa tcaataccta ttagcattgg aggagtggca ggaaaggccg 480
aacgctgtaa gatctacctt agtttttaat agatttgaaa ccctgcattc tcactttgta 540
actagtatgc caagctttgg tagtggccct ggaagtgaaa ggtatgcggt acaattgctg 600
acagtttatg cacaagcggc aaatctgcat ttgttattat taagagatgc tgacatttat 660
ggggcaaggt ggggacttcg tgaatctcag attgatttat attttaatga gctacaaaat 720
cgtactcgag attataccaa tcattgtgta actgcgtaca ataatgggtt agaggagata 780
cgaggaacaa gccctgcaag ttggttgagg taccatcaat tccgtagaga gacaacacta 840
atagcattgg atttagtggc gatattccca tattacaacg tacgagaata tccaattggg 900
gtaaatcctc agcttacacg tgatgtatat acagatccaa taggggttac tttcagaaga 960
gaagattggg aaacaggagt agaatgcaga ccatgggtaa atactcctta catgagcttt 1020
tcggatcttg aaaatgcaat aattcgtcca ccacatctat ttgaaacatt acgtaattta 1080
acaattcata caggtcgata taacctagta ggaggggcga gatttattga aggatgggtc 1140
ggacattctg taacaaatac tcgcttgggt aattcaacag tatttacaag taattatggt 1200
tctttgccac ctcgttttca agtttttaat tttactaatt ttgatgttta ccaaattaat 1260
acgagagcag attctacagg tacctttaga atccctggat ttgcagttac aagggcccaa 1320
ttcattccgg gtgggactta ttcagtagct caccgagatc caggggcatg tcaacaagat 1380
tatgattcaa ttgaagagtt accaagtcta gacccggatg aacctattaa tagaagttat 1440
agtcatagat tatcgcatgt taccctttat aaatatactc tctcagatac agattatgga 1500
gttatcaatt atacagatta tggaagtatg cctgcatatg tctggacaca tcgcgatgtg 1560
gaccttacta acacgattac tgcagataga attacacaac tcccattagt aaaggcatct 1620
acactacctg cgggtactac tgtggtaaaa ggcccaggat ttacaggagg agatatactc 1680
cgaagaacaa ctaatggaac atttgggaca ttacatgtaa gggttaattc accattaaca 1740
caacaatatc gcctaagagt tcgttttgcc tcaacaggaa atttcagtat aagggtactc 1800
cgtggaggga cttctatcgg tgatgctaga tttgggagca caatgaacag aggacaggaa 1860
ctaacttacg aatcctttgt cacaagagag tttactacta ctggtccgtt caatccgcct 1920
tttacattta cacaaactca agaaattcta acagtgaatg cagaaggtgt tagcaccggt 1980
ggtgaatatt atatagatag tattgagatt gttcctgtaa atccgacgcg agaggcggaa 2040
gaggatctag aagcagcgaa gaaagcggtg gcgagcttgt ttacacgtac aagggacgga 2100
ttacaagtaa atgtgacaga ttaccaagtg gatcgagcgg caaatttagt gttatgctta 2160
tcagatgaac aatatgcgca tgataaaaag atgttattgg aagccgtacg cgcagccaaa 2220
cgactcagcc gcgagcgtaa cttgcttcaa gatccagatt tcaatgaaat aaatagtacg 2280
gaagatagtg gttggaagac aagtaacggc attatcatta gtgagggtgg tccattcttt 2340
aaaggtcgtg cccttcagct agcaagcgca cgtgaaaatt acccaacata catctatcaa 2400
aaggtagact catcaatgtt aaaaccttat acacgatata aactagatgg atttgtgcaa 2460
agtagtcaag atttagaaat tgaactcatt caccatcata aagtccacct cgtgaaaaat 2520
gtaccagata atttagtact tgatacttac ccagatggtt cttgcaacgg aattaaccga 2580
tgtgaggaac aacagatggt gaattcgcaa ctagaaacag aacatcatcc aatggattgc 2640
tgtgaagcat cccaaacaca tgagttttct tcctatattc atacaggtga cctaaatgca 2700
agtgtagatc aaggcatttg ggttgtattg aagattcgga caacagatgg ttctgcgacg 2760
ttaggaaatc ttgaattggt agaggttggt ccattatcgg gtgaatctct agaacgtgaa 2820
caaagagata atgcgaaatg gaatgcagag ttaggaagga agcgtgcaga agcagatcgc 2880
gtgtatcaag gtgcgaaaca agcaattaac catctatttg tagactatca agatcaacaa 2940
ttaaatccag aagttgggct agcagaaatt agtgaagctc gaaatcttat cgaatcaatt 3000
tcagatgtat attgcgatgc agtactgcga attcctggaa ttaactacga gatgtataca 3060
gagttatcta atcgtctaca acaagcagcg tatctgtata cgtctcgaaa tgccgtgcaa 3120
aacggggact ttaacagcgg tttagatagt tggaatgcaa caactgatgc gacggttcag 3180
caggatggca atatgtattt cttagttctt tcccattggg atgcacaagt ttctcaacaa 3240
tttagagtac agccgaattg taaatatgtg ttacgtgtga cagcgaagaa agtagggaac 3300
ggagatggat atgttacgat ccaagatggc gctcatcacc gagaaacact tacattcaat 3360
gcatgtgact acgatgtaaa tggtacgcat gtaaatgaca attcgtatat tacaaaagaa 3420
ttggagttct atccaaagac agaacatatg tgggtagagg taagtgaaac agaaggtacc 3480
ttctatatag acagcattga gctaattgaa acacaagagt ag 3522
<210> 4
<211> 3540
<212> ДНК
<213> Bacillus thuringiensis
<400> 4
atgggaggaa aaagtatgaa tcgaaataat caaggtgaat atgaaattat tgacgcttcc 60
acttgtggtt gttcgtcaga tgatgttgtt caatatcctt tggcaagaga tccgaatgct 120
gcattccaaa atatgaatta taaagattat ttgaaaatgt ctgacggaga ctacgtcgat 180
tcttatataa acccaggctt atctattggt cgtagagatg tgaccctaac tggagttggt 240
attgttgcgc taatagtagg gactttaggt ggtccagttg ggggtatagt aactggcttg 300
atttcctctc ttttaggatt attgtggcca agtaatgata atgatgtatg ggaagctttt 360
atggcacaaa tagaagagct aattgaacaa aggatagcag atcaagtagt aaggaatgca 420
ctcgataact taactggatt gcgcgattat tataatcaat acctattagc attggaggag 480
tggcaggaaa ggccgaacgc tgtaagatct accttagttt ttaatagatt tgaaaccctg 540
cattctcact ttgtaactag tatgccaagc tttggtagtg gccctggaag tgaaaggtat 600
gcggtacaat tgctgacagt ttatgcacaa gcggcaaatc tgcatttgtt attattaaga 660
gatgctgaca tttatggggc aaggtgggga cttcgtgaat ctcagattga tttatatttt 720
aatgagctac aaaatcgtac tcgagattat accaatcatt gtgtaactgc gtacaataat 780
gggttagagg agatacgagg aacaagccct gcaagttggt tgaggtacca tcaattccgt 840
agagagacaa cactaatagc attggattta gtggcgatat tcccatatta caacgtacga 900
gaatatccaa ttggggtaaa tcctcagctt acacgtgatg tatatacaga tccaataggg 960
gttactttca gaagagaaga ttgggaaaca ggagtagaat gcagaccatg ggtaaatact 1020
ccttacatga gcttttcgga tcttgaaaat gcaataattc gtccaccaca tctatttgaa 1080
acattacgta atttaacaat tcatacaggt cgatataacc tagtaggagg ggcgagattt 1140
attgaaggat gggtcggaca ttctgtaaca aatactcgct tgggtaattc aacagtattt 1200
acaagtaatt atggttcttt gccacctcgt tttcaagttt ttaattttac taattttgat 1260
gtttaccaaa ttaatacgag agcagattct acaggtacct ttagaatccc tggatttgca 1320
gttacaaggg cccaattcat tccgggtggg acttattcag tagctcaccg agatccaggg 1380
gcatgtcaac aagattatga ttcaattgaa gagttaccaa gtctagaccc ggatgaacct 1440
attaatagaa gttatagtca tagattatcg catgttaccc tttataaata tactctctca 1500
gatacagatt atggagttat caattataca gattatggaa gtatgcctgc atatgtctgg 1560
acacatcgcg atgtggacct tactaacacg attactgcag atagaattac acaactccca 1620
ttagtaaagg catctacact acctgcgggt actactgtgg taaaaggccc aggatttaca 1680
ggaggagata tactccgaag aacaactaat ggaacatttg ggacattaca tgtaagggtt 1740
aattcaccat taacacaaca atatcgccta agagttcgtt ttgcctcaac aggaaatttc 1800
agtataaggg tactccgtgg agggacttct atcggtgatg ctagatttgg gagcacaatg 1860
aacagaggac aggaactaac ttacgaatcc tttgtcacaa gagagtttac tactactggt 1920
ccgttcaatc cgccttttac atttacacaa actcaagaaa ttctaacagt gaatgcagaa 1980
ggtgttagca ccggtggtga atattatata gatagtattg agattgttcc tgtaaatccg 2040
acgcgagagg cggaagagga tctagaagca gcgaagaaag cggtggcgag cttgtttaca 2100
cgtacaaggg acggattaca agtaaatgtg acagattatc aagtcgatca agcggcaaat 2160
ttagtgtcat gcttatcaga tgaacaatat gggtatgaca aaaagatgtt attggaagcg 2220
gtacgcgcgg caaaacgcct cagccgagaa cgtaacttac ttcaagatcc agattttaat 2280
acaatcaata gtacagaaga aaatggatgg aaagcaagta acggcgttac tattagtgag 2340
ggcggtccat tctataaagg ccgtgcactt cagctagcaa gtgcacgaga aaattatcca 2400
acatacattt atcaaaaagt agatgcatcg gagttaaaac cttatacacg atatagacta 2460
gatgggttcg tgaagagtag tcaagattta gaaattgatc tcattcacca tcataaagtc 2520
catcttgtga aaaatgtacc agataattta gtatctgata cttacccaga tgattcttgt 2580
agtggaatca atcgatgtca ggaacaacag atggtaaatg cgcaactgga aacagagcat 2640
catcatccga tggattgctg tgaagcagct caaacacatg agttttcttc ctatattgat 2700
acaggggatt taaattcgag tgtagaccag ggaatctggg cgatctttaa agttcgaaca 2760
accgatggtt atgcgacgtt aggaaatctt gaattggtag aggtcggacc gttatcgggt 2820
gaatctttag aacgtgaaca aagggataat acaaaatgga gtgcagagct aggaagaaag 2880
cgtgcagaaa cagatcgcgt gtatcaagat gccaaacaat ccatcaatca tttatttgtg 2940
gattatcaag atcaacaatt aaatccagaa atagggatgg cagatattat ggacgctcaa 3000
aatcttgtcg catcaatttc agatgtatat agcgatgccg tactgcaaat ccctggaatt 3060
aactatgaga tttacacaga gctgtccaat cgcttacaac aagcatcgta tctgtatacg 3120
tctcgaaatg cggtgcaaaa tggggacttt aacaacgggc tagatagctg gaatgcaaca 3180
gcgggtgcat cggtacaaca ggatggcaat acgcatttct tagttctttc tcattgggat 3240
gcacaagttt ctcaacaatt tagagtgcag ccgaattgta aatatgtatt acgtgtaaca 3300
gcagagaaag taggcggcgg agacggatac gtgactatcc gggatggtgc tcatcataca 3360
gaaacgctta catttaatgc atgtgattat gatataaatg gcacgtacgt gactgataat 3420
acgtatctaa caaaagaagt gatattctat tcacatacag aacacatgtg ggtagaggta 3480
aatgaaacag aaggtgcatt tcatatagat agtattgaat tcgttgaaac agaaaagtaa 3540
<210> 5
<211> 3444
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 5
atggacctgg atgggaataa gacagagaca gagaccgaga ttgtgaatgg gagcgagagc 60
agcattgacc cgagcagcgt ttcgtacgct gggaacaata gctactccag cgccctgaac 120
ctcaattcgt gccagaatag gggcatcgct cagtgggtta acacgctggg cggggctatt 180
gggcaggccg tgagcatcgg cacatctatc atttcactcc tggccgcgcc gacactcact 240
gggtctattt cactggcctt caatctcatc aggaggatgg ggaccggctc caacggctcg 300
tctatttccg acctgagcat ctgcgatctc ctgagcatca ttaacctgcg ggtttcgcag 360
gctgtgctca acgacgggat cgctgatttc aatggctccg ttgctgtgta cgacctgtac 420
ctccacgccc tgcgcagctg gaacaataac cctaacgctg ctactgctga ggagctgagg 480
acccgcttca ggatcgccga ttcggagttc gagaggattc tgacgagggg ctcgctcaca 540
catggcggct ccctcgcccg ccaggacgct caggtcctcc tgctcccgtc cttcgttaac 600
gcggcttacc tgcacctgct catcctccgc gatgcttcgc gctacggggc ctcttggggc 660
ctcttcaaca ccacgccgca tatcaattac cccgtgaggc tgcagcagct cattggcagc 720
tacacgcact actgcacaca ttggtacaac caggggctga atgagatccg gcagcgcggc 780
aacactgccg tgaattggct cgagttccac cgctaccgcc gcgacatgac gctgatggtc 840
ctcgatgtgg tctcgctgtt ctctgccctc gacacgatcc gctacccgaa cgctacagtt 900
gtgcagctca gccgcactgt ctacaccgat ccgattggct tcgttaaccg cgggtcaggc 960
aataggctgt cctggttcga ctggaggaac caggcgaatt tctctactct cgagtcagag 1020
atgccgaccc cctcatcccc actgagcctc aaccacatgt cgatcttcac tgggcctctg 1080
accctcccag tgtcccctaa cacgcatagg gcccgggtct ggtacggcaa ccagaatatg 1140
ttcacaactg ggtcacagaa ctccggccag accacgaact ctattcagaa tatctcaggc 1200
ctggagattt tccgcatcga ctctcaggcg tgcaatctca ataacaattc atacggcgtg 1260
aacagggcgg agttcttcca cggggctagc cagggctcgc agcggtctgt ctaccaggga 1320
tacatccgcc agagcggcct ggacaaccct gtcgttatga atctgcagtc tttcctccca 1380
ggcgagaact cagccacccc tacggcgcag gattacaccc acattctgtc caacccggtt 1440
aatatcaggg gcgggctcag gcagattgtg gccgacaggc gctcctccgt ggtcgtttac 1500
ggctggacgc acaagtccct gagcaggagg tcactcgtgg ctccagacca gatcacccag 1560
gtcccagccg ttaaggcgtc cccttcttca cattgcacta tcattgccgg cccaggcttc 1620
accggcgggg acctggtgtc gctccagccc aacggccagc tcgtcatccc gttccaggtt 1680
tctgcgcccg agacgaacta ccacattcgc atctgctacg tctcgacgtc tgattgcagc 1740
attaacacaa tctgcaatga cgagacgcat ctgtccacac tcccgagcac aacttccagc 1800
ctggagaacc tccagtgcaa tcacctgcat tacttcaacg tgggcacttt caagccaacc 1860
atcgactcga agctgacgct cgtcaacaca tctcctaacg ctaacatcat tatcgacaag 1920
atcgagttca tcccggtgga taccgcccag cagcagaacg aggacctcga ggccgcgaag 1980
aaggctgtcg cctccctgtt cacacgcact agggacggcc tccaggtcaa tgttaaggac 2040
taccaggtgg atcaggctgc caacctggtc tcatgcctct ccgacgagca gtacggctac 2100
gataagaaga tgctgctcga ggccgtgagg gctgctaaga ggctgagcag ggagaggaac 2160
ctgctccagg accccgattt caacacaatc aactcgaccg aggagaacgg gtggaaggcg 2220
tcaaatggcg tcaccatctc cgagggcggg ccattctaca agggcagggc tattcagctc 2280
gcgtctgctc gggagaacta ccccacatac atctaccaga aggtggatgc ctccgagctg 2340
aagccataca cccgctaccg cctcgacggc ttcgtcaagt cgtctcagga cctggagatt 2400
gatctcatcc accatcacaa ggtgcacctg gtcaagaacg ttccggacaa tctcgtgagc 2460
gatacgtacc ccgacgattc atgctccgga atcaacaggt gccaggagca gcagatggtc 2520
aacgcgcagc tggagaccga gcatcaccat ccgatggact gctgcgaggc tgctcagacg 2580
cacgagttct catcctacat cgacacaggg gatctgaaca gctcggtcga tcagggcatt 2640
tgggccatct tcaaggttag gaccacggac gggtacgcta ccctcggcaa cctggagctg 2700
gtggaggtcg ggccactgag cggcgagtcg ctcgagaggg agcagaggga caacactaag 2760
tggtccgctg agctgggccg caagagggct gagaccgacc gcgtctacca ggatgccaag 2820
cagagcatca atcacctgtt cgttgactac caggatcagc agctcaaccc cgagattggc 2880
atggcggaca tcatggatgc tcagaacctg gtggccagca tctcggacgt gtacagcgat 2940
gcggtcctcc agattccagg aatcaactac gagatctaca cggagctgtc gaacaggctc 3000
cagcaggcct cctacctgta cacaagccgg aacgcggtcc agaatgggga cttcaacaat 3060
ggcctcgatt catggaatgc tacggctggg gcttccgtgc agcaggatgg caacacacac 3120
ttcctggtcc tctcccattg ggacgcgcag gttagccagc agttccgcgt gcagccgaac 3180
tgcaagtatg tgctgagggt cactgctgag aaggttggcg ggggcgacgg ctacgtgacc 3240
atcagggacg atgcgcacca taccgagacg ctgacattca acgcttgcga ctacgacatc 3300
aacggcacct acgtgacaga caacacttac ctaaccaagg aggtggtctt ccacccggag 3360
actcagcata tgtgggttga ggtgaacgag accgagggcg ccttccacat agactccatc 3420
gagttcgtcg agaccgagaa gtga 3444
<210> 6
<211> 3474
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 6
atgaacagga acaaccagaa cgagtacgag attattgacg ccccccattg cggctgcccc 60
tccgacgacg atgtgaagta cccactggct agcgacccca acgctgctct gcagaacatg 120
aattacaagg attacctcca gatgaccgac gaggattaca cggactcgta catcaaccca 180
tccctcagca tttcgggcag ggacgctgtc cagacagccc tgactgtggt cggccgcatc 240
ctcggggcgc tgggcgttcc cttctcaggc cagattgtgt ccttctacca gttcctcctg 300
aataccctct ggccagtgaa cgacacggcg atctgggagg ctttcatgcg ccaggtggag 360
gagctggtca atcagcagat tacggagttc gccaggaacc aggctctcgc gcggctgcag 420
ggcctcgggg actccttcaa tgtctaccag aggagcctgc agaactggct cgccgaccgc 480
aacgatacca ggaatctctc cgttgtgcgc gcccagttca tcgcgctcga cctggatttc 540
gtgaatgcca ttcctctgtt cgctgtgaac ggccagcagg tcccgctcct gtccgtttac 600
gctcaggccg tgaacctgca tctcctgctc ctgaaggatg cttcgctctt cggcgagggg 660
tggggcttca cacagggcga gatctctact tactacgacc gccagctcga gctgacagcg 720
aggtacacta attactgcga gacctggtac aacacggggc tggacaggct caggggaacc 780
aacacggagt cctggctccg ctaccaccag ttccgcaggg agatgactct ggtcgttctc 840
gatgtggtcg ccctgttccc atactacgac gtccgcctct acccaaccgg ctccaaccct 900
cagctgacaa gggaggtgta cactgaccct atcgtcttca acccaccagc taatgtgggg 960
ctctgcaggc gctggggaac caacccgtac aatacgttca gcgagctgga gaacgcgttc 1020
atccggccac ctcatctgtt cgatcgcctc aactctctca ccatttccag caataggttc 1080
cctgtctcgt ctaacttcat ggactactgg tctggccaca cgctgaggcg gagctacctc 1140
aacgattcgg ctgtgcagga ggactcctac ggcctcatca ccacgacacg ggccaccatt 1200
aacccggggg tcgatggcac caaccggatc gagtcgacgg cggtggactt ccgctctgct 1260
ctcatcggga tttacggcgt taacagggct tccttcgtgc caggcgggct gttcaatggc 1320
actaccagcc cagctaacgg cgggtgcagg gacctgtacg ataccaacga cgagctgcca 1380
ccagacgagt ccacaggctc atccactcat cgcctctcgc acgtcacatt cttctctttc 1440
cagactaatc aggccgggtc aatcgcgaac gctggctccg ttcccaccta cgtgtggacg 1500
cgcagggacg tcgatctgaa caacacgatc actccgaacc gcattacgca gctcccactg 1560
gtgaaggctt ctgctccagt ctcaggcacg acagttctga aggggcccgg cttcaccggc 1620
gggggcatcc tccggcgcac taccaatggg accttcggca cgctgagggt gaccgtcaac 1680
agcccactga cgcagcagta caggctccgc gtgaggttcg cttctacggg caatttctca 1740
atcaggctcc tgaggggggg cgtgagcatt ggggacgtca ggctgggctc gacaatgaac 1800
cggggccagg agctgacata cgagagcttc ttcactcgcg agttcacgac aactggccca 1860
ttcaatccac ctttcacctt cacgcaggcc caggagatcc tcacagttaa cgctgagggc 1920
gtgtcgactg ggggcgagta ctacattgat aggatcgaga ttgttccagt gaacccagct 1980
agggaggctg aggaggacct ggaggctgcc aagaaggctg tggccagcct gttcacacgc 2040
actagggacg gcctccaggt caatgttacc gattaccagg tcgacagggc ggctaacctg 2100
gtttcatgcc tctccgatga gcagtactcc cacgacaaga agatgctcct ggaggccgtc 2160
cgggctgcta agcgcctgtc acgggagcgc aacctcctgc aggaccctga tttcaacacg 2220
atcaactcca ctgaggagaa tgggtggaag gccagcaacg gcgtgaccat ttcggagggg 2280
ggcccgttct tcaagggccg cgcgctccag ctggctagcg ctagggagaa ctaccctacg 2340
tacatctacc agaaggtcga tgcgtcggtt ctgaagccgt acacacgcta ccgcctcgac 2400
ggcttcgtga agtcctccca ggatctggag atcgacctca ttcaccatca caaggtccat 2460
ctggttaaga acgtgcccga caatctcgtc tccgatacct acagcgacgg gtcctgcagc 2520
ggaatcaacc gctgcgatga gcagcagcag gtggatatgc agctcgacgc cgagcatcac 2580
ccaatggact gctgcgaggc tgcccagacc cacgagttct cttcctacat caatacgggg 2640
gatctgaacg cctccgttga ccagggcatt tgggttgtgc tcaaagtgag gaccacggac 2700
gggtacgcta ccctgggcaa cctcgagctg gtggaggtcg ggccgctgag cggcgagtcg 2760
ctcgagaggg agcagaggga taacgctaag tggaatgctg agctgggcag gaagagggct 2820
gagaccgaca gggtctacct ggctgctaag caggcgatca atcacctctt cgtggattac 2880
caggaccagc agctgaaccc tgagatcggc ctcgctgaga ttaacgaggc ctctaatctg 2940
gtcaagtcga tctctggggt ttactcagat actctcctgc agatcccggg aattaactac 3000
gagatttaca ccgagctgtc cgaccggctc cagcaggctt cctacctcta cacgagccgc 3060
aacgccgtgc agaatgggga tttcaactcg ggcctggact cttggaacgc gacaactgat 3120
gcttctgtcc agcaggacgg ctcaacccat ttcctcgtgc tgtcacactg ggacgctcag 3180
gtgtcccagc agatgagggt caacctgaat tgcaagtacg tcctcagggt tacggcgaag 3240
aaggtcgggg gcggggatgg ctacgtcaca atcagggacg gcgcgcatca ccaggagacc 3300
ctcacgttca atgcttgcga ctacgatgtc aacggcacat acgttaacga caattcctac 3360
atcactaagg aggtcgtttt ctaccccgag accaagcaca tgtgggttga ggtgtctgag 3420
tcggagggct cgttctacat tgatagcatt gagttcattg agacgcagga gtga 3474
<210> 7
<211> 3522
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 7
atgaaccgga acaaccaggg cgagtacgag attattgatg cctccacttg cggctgctcc 60
tcagatgatg tcgtccagta cccactcgct cgcgacccga acgctgcttt ccagaacatg 120
aattacaagg actacctgaa gatgtctgac ggcgattacg tcgattcata cattaaccca 180
ggcctgtcca tcgggaggag ggacgtcacg ctcacaggcg tcgggatcgt tgctctcatt 240
gtgggcaccc tgggcggccc agttggcggg attgtgacgg gcctgatctc cagcctcctg 300
gggctcctgt ggccaagcaa cgacaatgat gtgtgggagg ccttcatggc gcagatcgag 360
gagctgattg agcagaggat cgctgaccag gtggtccgga acgccctgga caatctcacc 420
ggcctgaggg attactacaa ccagtacctc ctggctctcg aggagtggca ggagaggccc 480
aatgccgtga ggtctacgct ggtcttcaac cggttcgaga cgctccattc acacttcgtg 540
acatcaatgc catccttcgg cagcgggcct ggcagcgagc gctacgcggt tcagctcctg 600
accgtgtacg ctcaggctgc caacctgcac ctcctgctcc tgagggacgc tgatatctac 660
ggcgctcggt gggggctcag ggagtcccag atcgacctct acttcaacga gctgcagaat 720
cggacgcgcg attacacaaa ccattgcgtc acagcctaca acaatggcct ggaggagatc 780
agggggactt cgccagcttc ttggctgcgc taccaccagt tccggcgcga gaccacgctc 840
attgccctcg acctggtggc gatcttccca tactacaatg tcagggagta cccaattggc 900
gttaaccctc agctcacgcg ggacgtgtac acagatccga tcggcgtcac gttcaggcgg 960
gaggactggg agacaggcgt cgagtgcagg ccgtgggtta ataccccata catgtctttc 1020
tcagatctgg agaacgccat cattaggccg ccccatctct tcgagacgct ccggaatctg 1080
acgattcaca caggcaggta caacctggtc ggcggggcga ggttcatcga gggctgggtc 1140
gggcattccg ttactaatac caggctgggc aacagcactg tgttcaccag caattacggg 1200
tcgctcccac ctcggttcca ggtgttcaac ttcacgaatt tcgacgtcta ccagatcaac 1260
acacgggccg attcgacggg cacattccgc attccggggt tcgcggtcac tagggctcag 1320
ttcatccccg gcgggaccta ctccgtggct caccgcgacc caggcgcttg ccagcaggac 1380
tacgattcaa ttgaggagct gccctccctg gacccagatg agcctatcaa ccggtcctac 1440
agccatcgcc tctcacacgt caccctgtac aagtacactc tctccgacac cgattacggc 1500
gtgatcaatt acaccgacta cgggagcatg ccagcttacg tgtggacgca tcgcgacgtc 1560
gatctgacta acaccattac ggcggatagg atcacgcagc tcccgctggt gaaggcttcg 1620
acactccccg ccggcacaac tgttgtgaag gggcccggct tcaccggcgg ggacatcctg 1680
aggaggacca cgaatggcac gttcgggaca ctccacgtga gggtcaacag cccactgacc 1740
cagcagtaca ggctccgggt ccgcttcgct tcgacgggca acttctctat tagggtgctg 1800
aggggcggga catctatcgg cgacgctcgc ttcgggtcaa ctatgaacag gggccaggag 1860
ctgacttacg agtccttcgt gacccgcgag ttcacaacta ccggcccgtt caatccgccc 1920
ttcacattca ctcagaccca ggagatcctg actgtcaacg ctgagggcgt ttcgaccggc 1980
ggggagtact acatcgactc tattgagatc gttccagtga acccaaccag ggaggctgag 2040
gaggatctcg aggctgctaa gaaggccgtc gcgagcctgt tcacgaggac acgggacggc 2100
ctccaggtca atgttacgga ctaccaggtt gatagggctg ctaacctcgt gctgtgcctc 2160
tccgacgagc agtacgccca cgataagaag atgctcctgg aggcggtgag ggctgctaag 2220
aggctgagca gggagaggaa cctcctgcag gaccctgatt tcaacgagat caattctact 2280
gaggactcag gctggaagac cagcaacggg atcattatct cggagggcgg gccgttcttc 2340
aagggccggg ccctgcagct cgcttccgct cgcgagaact accctaccta catctaccag 2400
aaggtggact cgtctatgct gaagccgtac acgaggtaca agctcgacgg cttcgtgcag 2460
tcatcccagg atctcgagat tgagctgatc caccatcaca aggtgcacct cgtcaagaac 2520
gttccagaca atctggtcct cgacacctac cctgatggct cgtgcaacgg aatcaaccgc 2580
tgcgaggagc agcagatggt gaactctcag ctggagacgg agcatcaccc tatggactgc 2640
tgcgaggcct cacagactca tgagttcagc tcgtacatcc acaccggcga cctcaacgcg 2700
tctgtcgatc aggggatttg ggtcgttctg aagatcagga cgacagacgg ctcggctacc 2760
ctcgggaacc tggagctggt ggaggtcggc cccctgtcag gggagtccct cgagagggag 2820
cagagggaca acgccaagtg gaatgctgag ctgggccgga agcgcgctga ggctgatcgc 2880
gtgtaccagg gcgctaagca ggccatcaat cacctcttcg tcgactacca ggatcagcag 2940
ctgaaccctg aggttggcct cgcggagatc agcgaggctc ggaacctgat tgagtcgatc 3000
tctgacgtgt actgcgatgc cgtcctccgc attccgggaa tcaactacga gatgtacacg 3060
gagctgtcca acaggctgca gcaggctgct tacctgtaca caagccgcaa cgcggtgcag 3120
aatggcgact tcaactccgg gctcgatagc tggaatgcta ctaccgacgc caccgttcag 3180
caggatggca acatgtactt cctggtgctc agccactggg acgcccaggt ttcgcagcag 3240
ttccgcgtgc agccaaattg caagtatgtg ctgagggtca cagcgaagaa ggtcgggaac 3300
ggcgacggct acgtgactat ccaggatggc gcgcatcacc gcgagactct gaccttcaat 3360
gcttgcgact acgatgttaa cggcacgcat gtgaacgaca attcctacat tacaaaggag 3420
ctggagttct acccgaagac tgagcacatg tgggttgagg tgagcgagac tgagggcacc 3480
ttctacatag attcgatcga gctgattgag acccaggagt ga 3522
<210> 8
<211> 3540
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 8
atggggggga agtctatgaa caggaacaac cagggcgagt acgagattat tgatgcctcc 60
acatgcgggt gctccagcga cgacgtggtc cagtacccac tcgctcgcga ccctaacgct 120
gctttccaga acatgaatta caaggactac ctgaagatgt ccgacggcga ttacgtggat 180
agctacatta acccaggcct ctcgatcggg aggagggacg tcactctgac cggggttggc 240
atcgtggcgc tgattgttgg cacactcggc gggcctgtgg gcgggattgt cactggcctc 300
atctccagcc tcctggggct cctgtggcca tccaacgaca atgatgtctg ggaggcgttc 360
atggctcaga tcgaggagct gattgagcag cgcatcgcgg accaggtggt caggaacgct 420
ctcgacaatc tgaccggcct cagggattac tacaaccagt acctcctggc tctcgaggag 480
tggcaggaga ggccaaatgc cgtgcgctcc acgctcgttt tcaaccgctt cgagaccctg 540
cacagccatt tcgtgacgag catgccgtcg ttcgggtctg gccccgggtc ggagcgctac 600
gctgtgcagc tcctgaccgt ctacgcccag gctgccaacc tccacctcct gctcctgcgc 660
gacgctgata tctacggcgc caggtggggg ctcagggaga gccagatcga cctgtacttc 720
aacgagctgc agaatcggac acgcgattac actaaccact gcgtcaccgc ctacaacaat 780
ggcctcgagg agatcagggg gacgtcacca gcttcctggc tccgctacca ccagttccgg 840
agggagacca cgctgattgc gctcgacctg gtggctatct tcccctacta caatgtgcgc 900
gagtacccga ttggcgtcaa cccccagctg accagggacg tttacaccga cccgatcggc 960
gtgacattca ggcgggagga ctgggagact ggcgtggagt gcaggccgtg ggtcaatacc 1020
ccatacatgt ctttctcaga cctcgagaac gccatcatta ggccgcccca cctgttcgag 1080
acgctgagga atctcaccat tcatacgggc aggtacaacc tggtcggcgg ggcgcgcttc 1140
atcgagggct gggttgggca ctcagtgacg aacacaaggc tcggcaattc cacagtgttc 1200
acttccaact acggcagcct gccacctcgg ttccaggttt tcaacttcac aaatttcgac 1260
gtgtaccaga tcaacactag ggccgattcg actggcacct tccggattcc agggttcgcc 1320
gttacccgcg cgcagttcat ccctggcggg acgtactccg tggctcaccg cgacccgggc 1380
gcttgccagc aggactacga tagcattgag gagctgccct cgctcgaccc agatgagcct 1440
atcaacaggt cctacagcca ccggctgtct catgtcaccc tctacaagta caccctgtca 1500
gacacggatt acggcgtgat caattacacc gactacgggt ccatgccagc ttacgtttgg 1560
acgcaccggg acgtggatct cacgaacaca attactgccg accgcatcac acagctccca 1620
ctggtgaagg ccagcactct gcctgcgggc acaactgttg tgaagggccc tgggttcacc 1680
ggcggggaca tcctcaggag gaccacgaat ggcaccttcg ggacgctgca tgtccgcgtt 1740
aactccccgc tcacacagca gtacaggctg cgggtgcgct tcgcttcgac tggcaacttc 1800
tctattcgcg tcctcagggg cgggacctcc atcggcgacg ctaggttcgg gagcacgatg 1860
aacaggggcc aggagctgac atacgagtcc ttcgtcacta gggagttcac aactaccggc 1920
ccgttcaatc cgcccttcac cttcacgcag acacaggaga ttctcaccgt taacgctgag 1980
ggcgtgagca cgggcgggga gtactacatc gactcgatcg agattgtgcc agtcaaccca 2040
accagggagg ctgaggagga tctggaggct gctaagaagg ccgtggcgag cctcttcact 2100
aggacccggg acggcctgca ggttaatgtg acggactacc aggtcgatca ggccgcgaac 2160
ctggttagct gcctctcgga cgagcagtac ggctacgata agaagatgct cctggaggcc 2220
gtccgcgctg ctaagaggct ctcgagggag aggaacctcc tgcaggaccc cgatttcaac 2280
acaattaatt ctactgagga gaacggctgg aaggcctcta atggggtgac catctcagag 2340
ggcgggccat tctacaaggg cagggcgctc cagctggctt cagctcggga gaactacccc 2400
acctacatct accagaaggt cgacgcctcc gagctgaagc catacacgcg ctaccgcctg 2460
gatggcttcg tgaagtcgtc tcaggacctg gagatcgatc tcattcacca tcacaaggtc 2520
cacctcgtta agaacgtgcc ggacaatctg gtctccgata cctaccccga cgattcgtgc 2580
tctggaatca acaggtgcca ggagcagcag atggtgaacg cccagctcga gacggagcat 2640
caccatccta tggactgctg cgaggcggct cagacccatg agttctcatc ctacatcgac 2700
acgggcgatc tcaacagctc ggtcgaccag gggatctggg cgattttcaa ggttaggacg 2760
acagatggct acgctaccct ggggaatctc gagctggtcg aggttggccc cctctctggg 2820
gagtcactgg agagggagca gagggacaac acaaagtggt ctgctgagct gggcaggaag 2880
cgggctgaga ctgaccgcgt ctaccaggat gccaagcagt ccatcaatca cctcttcgtg 2940
gactaccagg atcagcagct gaaccctgag attggcatgg ctgacatcat ggatgcccag 3000
aacctcgtcg cgtcaatctc cgacgtctac agcgatgcgg ttctgcagat cccgggcatt 3060
aattacgaga tctacacaga gctgtcgaac aggctccagc aggcgtcata cctctacacg 3120
tcccggaacg ctgtgcagaa tggcgacttc aacaatgggc tggattcgtg gaatgcgaca 3180
gctggcgcct ctgtgcagca ggacgggaac actcacttcc tcgtcctgtc tcattgggat 3240
gcccaggtct cacagcagtt ccgggttcag ccgaactgca agtatgtgct gcgcgttacc 3300
gctgagaaag tgggcggggg cgacggctac gtcacgatcc gcgatggggc tcaccatacg 3360
gagacactca ctttcaacgc ctgcgactac gatatcaatg gcacatacgt tactgacaac 3420
acctacctga cgaaggaggt catcttctac tcccacacag agcatatgtg ggtggaggtc 3480
aacgagactg agggcgcctt ccacatcgac agcattgagt tcgtggagac cgagaagtga 3540
<210> 9
<211> 3444
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 9
atggacctgg atgggaataa gacagagaca gagaccgaga ttgtgaatgg gagcgagagc 60
agcattgacc cgagcagcgt ttcgtacgct gggaacaata gctactccag cgccctgaac 120
ctcaattcgt gccagaatag gggcatcgct cagtgggtta acacgctggg cggggctatt 180
gggcaggccg tgagcatcgg cacatctatc atttcactcc tggccgcgcc gacactcact 240
gggtctattt cactggcctt caatctcatc aggaggatgg ggaccggctc caacggctcg 300
tctatttccg acctgagcat ctgcgatctc ctgagcatca ttaacctgcg ggtttcgcag 360
gctgtgctca acgacgggat cgctgatttc aatggctccg ttgctgtgta cgacctgtac 420
ctccacgccc tgcgcagctg gaacaataac cctaacgctg ctactgctga ggagctgagg 480
acccgcttca ggatcgccga ttcggagttc gagaggattc tgacgagggg ctcgctcaca 540
catggcggct ccctcgcccg ccaggacgct caggtcctcc tgctcccgtc cttcgttaac 600
gcggcttacc tgcacctgct catcctccgc gatgcttcgc gctacggggc ctcttggggc 660
ctcttcaaca ccacgccgca tatcaattac cccgtgaggc tgcagcagct cattggcagc 720
tacacgcact actgcacaca ttggtacaac caggggctga atgagatccg gcagcgcggc 780
aacactgccg tgaattggct cgagttccac cgctaccgcc gcgacatgac gctgatggtc 840
ctcgatgtgg tctcgctgtt ctctgccctc gacacgatcc gctacccgaa cgctacagtt 900
gtgcagctca gccgcactgt ctacaccgat ccgattggct tcgttaaccg cgggtcaggc 960
aataggctgt cctggttcga ctggaggaac caggcgaatt tctctactct cgagtcagag 1020
atgccgaccc cctcatcccc actgagcctc aaccacatgt cgatcttcac tgggcctctg 1080
accctcccag tgtcccctaa cacgcatagg gcccgggtct ggtacggcaa ccagaatatg 1140
ttcacaactg ggtcacagaa ctccggccag accacgaact ctattcagaa tatctcaggc 1200
ctggagattt tccgcatcga ctctcaggcg tgcaatctca ataacaattc atacggcgtg 1260
aacagggcgg agttcttcca cggggctagc cagggctcgc agcggtctgt ctaccaggga 1320
tacatccgcc agagcggcct ggacaaccct gtcgttatga atctgcagtc tttcctccca 1380
ggcgagaact cagccacccc tacggcgcag gattacaccc acattctgtc caacccggtt 1440
aatatcaggg gcgggctcag gcagattgtg gccgacaggc gctcctccgt ggtcgtttac 1500
ggctggacgc acaagtccct gagcaggagg tcactcgtgg ctccagacca gatcacccag 1560
gtcccagccg ttaaggcgtc cccttcttca cattgcacta tcattgccgg cccaggcttc 1620
accggcgggg acctggtgtc gctccagccc aacggccagc tcgtcatccc gttccaggtt 1680
tctgcgcccg agacgaacta ccacattcgc atctgctacg tctcgacgtc tgattgcagc 1740
attaacacaa tctgcaatga cgagacgcat ctgtccacac tcccgagcac aacttccagc 1800
ctggagaacc tccagtgcaa tcacctgcat tacttcaacg tgggcacttt caagccaacc 1860
atcgactcga agctgacgct cgtcaacaca tctcctaacg ctaacatcat tatcgacaag 1920
atcgagttca tcccggtgga taccgcccag cagcagaacg aggacctcga ggccgcgaag 1980
aaggctgtcg cctccctgtt cacacgcact agggacggcc tccaggtcaa tgttaaggac 2040
taccaggtgg atcaggctgc caacctggtc tcatgcctct ccgacgagca gtacggctac 2100
gataagaaga tgctgctcga ggccgtgagg gctgctaaga ggctgagcag ggagaggaac 2160
ctgctccagg accccgattt caacacaatc aactcgaccg aggagaacgg gtggaaggcg 2220
tcaaatggcg tcaccatctc cgagggcggg ccattctaca agggcagggc tattcagctc 2280
gcgtctgctc gggagaacta ccccacatac atctaccaga aggtggatgc ctccgagctg 2340
aagccataca cccgctaccg cctcgacggc ttcgtcaagt cgtctcagga cctggagatt 2400
gatctcatcc accatcacaa ggtgcacctg gtcaagaacg ttccggacaa tctcgtgagc 2460
gatacgtacc ccgacgattc atgctccgga atcaacaggt gccaggagca gcagatggtc 2520
aacgcgcagc tggagaccga gcatcaccat ccgatggact gctgcgaggc tgctcagacg 2580
cacgagttct catcctacat cgacacaggg gatctgaaca gctcggtcga tcagggcatt 2640
tgggccatct tcaaggttag gaccacggac gggtacgcta ccctcggcaa cctggagctg 2700
gtggaggtcg ggccactgag cggcgagtcg ctcgagaggg agcagaggga caacactaag 2760
tggtccgctg agctgggccg caagagggct gagaccgacc gcgtctacca ggatgccaag 2820
cagagcatca atcacctgtt cgttgactac caggatcagc agctcaaccc cgagattggc 2880
atggcggaca tcatggatgc tcagaacctg gtggccagca tctcggacgt gtacagcgat 2940
gcggtcctcc agattccagg aatcaactac gagatctaca cggagctgtc gaacaggctc 3000
cagcaggcct cctacctgta cacaagccgg aacgcggtcc agaatgggga cttcaacaat 3060
ggcctcgatt catggaatgc tacggctggg gcttccgtgc agcaggatgg caacacacac 3120
ttcctggtcc tctcccattg ggacgcgcag gttagccagc agttccgcgt gcagccgaac 3180
tgcaagtatg tgctgagggt cactgctgag aaggttggcg ggggcgacgg ctacgtgacc 3240
atcagggacg atgcgcacca taccgagacg ctgacattca acgcttgcga ctacgacatc 3300
aacggcacct acgtgacaga caacacttac atcaccaagg aggtggtctt ccacccggag 3360
actcagcata tgtgggttga ggtgaacgag accgagggcg ccttccacct tgactccatc 3420
gagttcgtcg agaccgagaa gtga 3444
<210> 10
<211> 3474
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 10
atgaacagga acaaccagaa cgagtacgag attattgacg ccccccattg cggctgcccc 60
tccgacgacg atgtgaagta cccactggct agcgacccca acgctgctct gcagaacatg 120
aattacaagg attacctcca gatgaccgac gaggattaca cggactcgta catcaaccca 180
tccctcagca tttcgggcag ggacgctgtc cagacagccc tgactgtggt cggccgcatc 240
ctcggggcgc tgggcgttcc cttctcaggc cagattgtgt ccttctacca gttcctcctg 300
aataccctct ggccagtgaa cgacacggcg atctgggagg ctttcatgcg ccaggtggag 360
gagctggtca atcagcagat tacggagttc gccaggaacc aggctctcgc gcggctgcag 420
ggcctcgggg actccttcaa tgtctaccag aggagcctgc agaactggct cgccgaccgc 480
aacgatacca ggaatctctc cgttgtgcgc gcccagttca tcgcgctcga cctggatttc 540
gtgaatgcca ttcctctgtt cgctgtgaac ggccagcagg tcccgctcct gtccgtttac 600
gctcaggccg tgaacctgca tctcctgctc ctgaaggatg cttcgctctt cggcgagggg 660
tggggcttca cacagggcga gatctctact cactacgacc gccagctcga gctgacagcg 720
aggtacacta attactgcga gacctggtac aacacggggc tggacaggct caggggaacc 780
aacacggagt cctggctccg ctaccaccag ttccgcaggg agatgactct ggtcgttctc 840
gatgtggtcg ccctgttccc atactacgac gtccgcctct acccaaccgg ctccaaccct 900
cagctgacaa gggaggtgta cactgaccct atcgtcttca acccaccagc taatgtgggg 960
ctctgcaggc gctggggaac caacccgtac aatacgttca gcgagctgga gaacgcgttc 1020
atccggccac ctcatctgtt cgatcgcatc cagtctctct caatttccag caataggttc 1080
cctgtctcgt ctaacttcat ggactactgg tctggccaca cgctgaggcg gagctacctc 1140
aacgattcgg ctgtgcagga ggactcctac ggcctcatca ccacgacacg ggccaccatt 1200
aacccggggg tcgatggcac caaccggatc gagtcgacgg cggtggactt ccgctctgct 1260
ctcatcggga tttacggcgt taacagggct tccttcgtgc caggcgggct gttcaatggc 1320
actaccagcc cagctaacgg cgggtgcagg gacctgtacg ataccaacga cgagctgcca 1380
ccagacgagt ccacaggctc atccactcat cgcctctcgc acgtcacatt cttctctttc 1440
cagactaatc aggccgggtc aatcgcgaac gctggctccg ttcccaccta cgtgtggacg 1500
cgcagggacg tcgatctgaa caacacgatc actccgaacc gcattacgca gctcccactg 1560
gtgaaggctt ctgctccagt ctcaggcacg acagttctga aggggcccgg cttcaccggc 1620
gggggcatcc tccggcgcac taccaatggg accttcggca cgctgagggt gaccgtcaac 1680
agcccactga cgcagcagta caggctccgc gtgaggttcg cttctacggg caatttctca 1740
atcaggctcc tgaggggggg cgtgagcatt ggggacgtca ggctgggctc gacaatgaac 1800
cggggccagg agctgacata cgagagcttc ttcactcgcg agttcacgac aactggccca 1860
ttcaatccac ctttcacctt cacgcaggcc caggagatcc tcacagttaa cgctgagggc 1920
gtgtcgactg ggggcgagta ctacattgat aggatcgaga ttgttccagt gaacccagct 1980
agggaggctg aggaggacct ggaggctgcc aagaaggctg tggccagcct gttcacacgc 2040
actagggacg gcctccaggt caatgttacc gattaccagg tcgacagggc ggctaacctg 2100
gtttcatgcc tctccgatga gcagtactcc cacgacaaga agatgctcct ggaggccgtc 2160
cgggctgcta agcgcctgtc acgggagcgc aacctcctgc aggaccctga tttcaacacg 2220
atcaactcca ctgaggagaa tgggtggaag gccagcaacg gcgtgaccat ttcggagggg 2280
ggcccgttct tcaagggccg cgcgctccag ctggctagcg ctagggagaa ctaccctacg 2340
tacatctacc agaaggtcga tgcgtcggtt ctgaagccgt acacacgcta ccgcctcgac 2400
ggcttcgtga agtcctccca ggatctggag atcgacctca ttcaccatca caaggtccat 2460
ctggttaaga acgtgcccga caatctcgtc tccgatacct acagcgacgg gtcctgcagc 2520
ggaatcaacc gctgcgatga gcagcagcag gtggatatgc agctcgacgc cgagcatcac 2580
ccaatggact gctgcgaggc tgcccagacc cacgagttct cttcctacat caatacgggg 2640
gatctgaacg cctccgttga ccagggcatt tgggttgtgc tcaaagtgag gaccacggac 2700
gggtacgcta ccctgggcaa cctcgagctg gtggaggtcg ggccgctgag cggcgagtcg 2760
ctcgagaggg agcagaggga taacgctaag tggaatgctg agctgggcag gaagagggct 2820
gagaccgaca gggtctacct ggctgctaag caggcgatca atcacctctt cgtggattac 2880
caggaccagc agctgaaccc tgagatcggc ctcgctgaga ttaacgaggc ctctaatctg 2940
gtcaagtcga tctctggggt ttactcagat actctcctgc agatcccggg aattaactac 3000
gagatttaca ccgagctgtc cgaccggctc cagcaggctt cctacctcta cacgagccgc 3060
aacgccgtgc agaatgggga tttcaactcg ggcctggact cttggaacgc gacaactgat 3120
gcttctgtcc agcaggacgg ctcaacccat ttcctcgtgc tgtcacactg ggacgctcag 3180
gtgtcccagc agatgagggt caacctgaat tgcaagtacg tcctcagggt tacggcgaag 3240
aaggtcgggg gcggggatgg ctacgtcaca atcagggacg gcgcgcatca ccaggagacc 3300
ctcacgttca atgcttgcga ctacgatgtc aacggcacat acgttaacga caattcctac 3360
atcactaagg aggtcgtttt ctaccccgag accaagcaca tgtgggttga ggtgtctgag 3420
tcggagggct cgttctacat tgatagcatt gagttcattg agacgcagga gtga 3474
<210> 11
<211> 3522
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 11
atgaaccgga acaaccaggg cgagtacgag attattgatg cctccacttg cggctgctcc 60
tcagatgatg tcgtccagta cccactcgct cgcgacccga acgctgcttt ccagaacatg 120
aattacaagg actacctgaa gatgtctgac ggcgattacg tcgattcata cattaaccca 180
ggcctgtcca tcgggaggag ggacgtcacg ctcacaggcg tcgggatcgt tgctctcatt 240
gtgggcaccc tgggcggccc agttggcggg attgtgacgg gcctgatctc cagcctcctg 300
gggctcctgt ggccaagcaa cgacaatgat gtgtgggagg ccttcatggc gcagatcgag 360
gagctgattg agcagaggat cgctgaccag gtggtccgga acgccctgga caatctcacc 420
ggcctgaggg attactacaa ccagtacctc ctggctctcg aggagtggca ggagaggccc 480
aatgccgtga ggtctacgct ggtcttcaac cggttcgaga cgctccattc acacttcgtg 540
acatcaatgc catccttcgg cagcgggcct ggcagcgagc gctacgcggt tcagctcctg 600
accgtgtacg ctcaggctgc caacctgcac ctcctgctcc tgagggacgc tgatatctac 660
ggcgctcggt gggggctcag ggagtcccag atcgacctct acttcaacga gctgcagaat 720
cggacgcgcg attacacaaa ccattgcgtc acagcctaca acaatggcct ggaggagatc 780
agggggactt cgccagcttc ttggctgcgc taccaccagt tccggcgcga gaccacgctc 840
attgccctcg acctggtggc gatcttccca tactacaatg tcagggagta cccaattggc 900
gttaaccctc agctcacgcg ggacgtgtac acagatccga tcggcgtcac gttcaggcgg 960
gaggactggg agacaggcgt cgagtgcagg ccgtgggtta ataccccata catgtctttc 1020
tcagatctgg agaacgccat cattaggccg ccccatctct tcgagacgct ccggaatctg 1080
acgattcaca caggcaggta caacctggtc ggcggggcga ggttcatcga gggctgggtc 1140
gggcattccg ttactaatac caggctgggc aacagcactg tgttcaccag caattacggg 1200
tcgctcccac ctcggttcca ggtgttcaac ttcacgaatt tcgacgtcta ccagatcaac 1260
acacgggccg attcgacggg cacattccgc attccggggt tcgcggtcac tagggctcag 1320
ttcatccccg gcgggaccta ctccgtggct caccgcgacc caggcgcttg ccagcaggac 1380
tacgattcaa ttgaggagct gccctccctg gacccagatg agcctatcaa ccggtcctac 1440
agccatcgcc tctcacacgt caccctgtac aagtacactc tctccgacac cgattacggc 1500
gtgatcaatt acaccgacta cgggagcatg ccagcttacg tgtggacgca tcgcgacgtc 1560
gatctgacta acaccattac ggcggatagg atcacgcagc tcccgctggt gaaggcttcg 1620
acactccccg ccggcacaac tgttgtgaag gggcccggct tcaccggcgg ggacatcctg 1680
aggaggacca cgaatggcac gttcgggaca ctccacgtga gggtcaacag cccactgacc 1740
cagcagtaca ggctccgggt ccgcttcgct tcgacgggca acttctctat tagggtgctg 1800
aggggcggga catctatcgg cgacgctcgc ttcgggtcaa ctatgaacag gggccaggag 1860
ctgacttacg agtccttcgt gacccgcgag ttcacaacta ccggcccgtt caatccgccc 1920
ttcacattca ctcagaccca ggagatcctg actgtcaacg ctgagggcgt ttcgaccggc 1980
ggggagtact acatcgactc tattgagatc gttccagtga acccaaccag ggaggctgag 2040
gaggatctcg aggctgctaa gaaggccgtc gcgagcctgt tcacgaggac acgggacggc 2100
ctccaggtca atgttacgga ctaccaggtt gatagggctg ctaacctcgt gctgtgcctc 2160
tccgacgagc agtacgccca cgataagaag atgctcctgg aggcggtgag ggctgctaag 2220
aggctgagca gggagaggaa cctcctgcag gaccctgatt tcaacgagat caattctact 2280
gaggactcag gctggaagac cagcaacggg atcattatct cggagggcgg gccgttcttc 2340
aagggccggg ccctgcagct cgcttccgct cgcgagaact accctaccta catctaccag 2400
aaggtggact cgtctatgct gaagccgtac acgaggtaca agctcgacgg cttcgtgcag 2460
tcatcccagg atctcgagat tgagctgatc caccatcaca aggtgcacct cgtcaagaac 2520
gttccagaca atctggtcct cgacacctac cctgatggct cgtgcaacgg aatcaaccgc 2580
tgcgaggagc agcagatggt gaactctcag ctggagacgg agcatcaccc tatggactgc 2640
tgcgaggcct cacagactca tgagttcagc tcgtacatcc acaccggcga cctcaacgcg 2700
tctgtcgatc aggggatttg ggtcgttctg aagatcagga cgacagacgg ctcggctacc 2760
ctcgggaacc tggagctggt ggaggtcggc cccctgtcag gggagtccct cgagagggag 2820
cagagggaca acgccaagtg gaatgctgag ctgggccgga agcgcgctga ggctgatcgc 2880
gtgtaccagg gcgctaagca ggccatcaat cacctcttcg tcgactacca ggatcagcag 2940
ctgaaccctg aggttggcct cgcggagatc agcgaggctc ggaacctgat tgagtcgatc 3000
tctgacgtgt actgcgatgc cgtcctccgc attccgggaa tcaactacga gatgtacacg 3060
gagctgtcca acaggctgca gcaggctgct tacctgtaca caagccgcaa cgcggtgcag 3120
aatggcgact tcaactccgg gctcgatagc tggaatgcta ctaccgacgc caccgttcag 3180
caggatggca acatgtactt cctggtgctc agccactggg acgcccaggt ttcgcagcag 3240
ttccgcgtgc agccaaattg caagtatgtg ctgagggtca cagcgaagaa ggtcgggaac 3300
ggcgacggct acgtgactat ccaggatggc gcgcatcacc gcgagactct gaccttcaat 3360
gcttgcgact acgatgttaa cggcacgcat gtgaacgaca attcctacct cacaaaggag 3420
ctggagttct acccgaagac tgagcacatg tgggttgagg tgagcgagac tgagggcacc 3480
ttctaccttg attcgatcga gctgattgag acccaggagt ga 3522
<210> 12
<211> 3540
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетический ген Cry
<400> 12
atggggggga agtctatgaa caggaacaac cagggcgagt acgagattat tgatgcctcc 60
acatgcgggt gctccagcga cgacgtggtc cagtacccac tcgctcgcga ccctaacgct 120
gctttccaga acatgaatta caaggactac ctgaagatgt ccgacggcga ttacgtggat 180
agctacatta acccaggcct ctcgatcggg aggagggacg tcactctgac cggggttggc 240
atcgtggcgc tgattgttgg cacactcggc gggcctgtgg gcgggattgt cactggcctc 300
atctccagcc tcctggggct cctgtggcca tccaacgaca atgatgtctg ggaggcgttc 360
atggctcaga tcgaggagct gattgagcag cgcatcgcgg accaggtggt caggaacgct 420
ctcgacaatc tgaccggcct cagggattac tacaaccagt acctcctggc tctcgaggag 480
tggcaggaga ggccaaatgc cgtgcgctcc acgctcgttt tcaaccgctt cgagaccctg 540
cacagccatt tcgtgacgag catgccgtcg ttcgggtctg gccccgggtc ggagcgctac 600
gctgtgcagc tcctgaccgt ctacgcccag gctgccaacc tccacctcct gctcctgcgc 660
gacgctgata tctacggcgc caggtggggg ctcagggaga gccagatcga cctgtacttc 720
aacgagctgc agaatcggac acgcgattac actaaccact gcgtcaccgc ctacaacaat 780
ggcctcgagg agatcagggg gacgtcacca gcttcctggc tccgctacca ccagttccgg 840
agggagacca cgctgattgc gctcgacctg gtggctatct tcccctacta caatgtgcgc 900
gagtacccga ttggcgtcaa cccccagctg accagggacg tttacaccga cccgatcggc 960
gtgacattca ggcgggagga ctgggagact ggcgtggagt gcaggccgtg ggtcaatacc 1020
ccatacatgt ctttctcaga cctcgagaac gccatcatta ggccgcccca cctgttcgag 1080
acgctgagga atctcaccat tcatacgggc aggtacaacc tggtcggcgg ggcgcgcttc 1140
atcgagggct gggttgggca ctcagtgacg aacacaaggc tcggcaattc cacagtgttc 1200
acttccaact acggcagcct gccacctcgg ttccaggttt tcaacttcac aaatttcgac 1260
gtgtaccaga tcaacactag ggccgattcg actggcacct tccggattcc agggttcgcc 1320
gttacccgcg cgcagttcat ccctggcggg acgtactccg tggctcaccg cgacccgggc 1380
gcttgccagc aggactacga tagcattgag gagctgccct cgctcgaccc agatgagcct 1440
atcaacaggt cctacagcca ccggctgtct catgtcaccc tctacaagta caccctgtca 1500
gacacggatt acggcgtgat caattacacc gactacgggt ccatgccagc ttacgtttgg 1560
acgcaccggg acgtggatct cacgaacaca attactgccg accgcatcac acagctccca 1620
ctggtgaagg ccagcactct gcctgcgggc acaactgttg tgaagggccc tgggttcacc 1680
ggcggggaca tcctcaggag gaccacgaat ggcaccttcg ggacgctgca tgtccgcgtt 1740
aactccccgc tcacacagca gtacaggctg cgggtgcgct tcgcttcgac tggcaacttc 1800
tctattcgcg tcctcagggg cgggacctcc atcggcgacg ctaggttcgg gagcacgatg 1860
aacaggggcc aggagctgac atacgagtcc ttcgtcacta gggagttcac aactaccggc 1920
ccgttcaatc cgcccttcac cttcacgcag acacaggaga ttctcaccgt taacgctgag 1980
ggcgtgagca cgggcgggga gtactacatc gactcgatcg agattgtgcc agtcaaccca 2040
accagggagg ctgaggagga tctggaggct gctaagaagg ccgtggcgag cctcttcact 2100
aggacccggg acggcctgca ggttaatgtg acggactacc aggtcgatca ggccgcgaac 2160
ctggttagct gcctctcgga cgagcagtac ggctacgata agaagatgct cctggaggcc 2220
gtccgcgctg ctaagaggct ctcgagggag aggaacctcc tgcaggaccc cgatttcaac 2280
acaattaatt ctactgagga gaacggctgg aaggcctcta atggggtgac catctcagag 2340
ggcgggccat tctacaaggg cagggcgctc cagctggctt cagctcggga gaactacccc 2400
acctacatct accagaaggt cgacgcctcc gagctgaagc catacacgcg ctaccgcctg 2460
gatggcttcg tgaagtcgtc tcaggacctg gagatcgatc tcattcacca tcacaaggtc 2520
cacctcgtta agaacgtgcc ggacaatctg gtctccgata cctaccccga cgattcgtgc 2580
tctggaatca acaggtgcca ggagcagcag atggtgaacg cccagctcga gacggagcat 2640
caccatccta tggactgctg cgaggcggct cagacccatg agttctcatc ctacatcgac 2700
acgggcgatc tcaacagctc ggtcgaccag gggatctggg cgattttcaa ggttaggacg 2760
acagatggct acgctaccct ggggaatctc gagctggtcg aggttggccc cctctctggg 2820
gagtcactgg agagggagca gagggacaac acaaagtggt ctgctgagct gggcaggaag 2880
cgggctgaga ctgaccgcgt ctaccaggat gccaagcagt ccatcaatca cctcttcgtg 2940
gactaccagg atcagcagct gaaccctgag attggcatgg ctgacatcat ggatgcccag 3000
aacctcgtcg cgtcaatctc cgacgtctac agcgatgcgg ttctgcagat cccgggcatt 3060
aattacgaga tctacacaga gctgtcgaac aggctccagc aggcgtcata cctctacacg 3120
tcccggaacg ctgtgcagaa tggcgacttc aacaatgggc tggattcgtg gaatgcgaca 3180
gctggcgcct ctgtgcagca ggacgggaac actcacttcc tcgtcctgtc tcattgggat 3240
gcccaggtct cacagcagtt ccgggttcag ccgaactgca agtatgtgct gcgcgttacc 3300
gctgagaaag tgggcggggg cgacggctac gtcacgatcc gcgatggggc tcaccatacg 3360
gagacactca ctttcaacgc ctgcgactac gatatcaatg gcacatacgt tactgacaac 3420
acctacctga cgaaggaggt catcttctac tcccacacag agcatatgtg ggtggaggtc 3480
aacgagactg agggcgcctt ccacctcgac agccttgagt tcgtggagac cgagaagtga 3540
<210> 13
<211> 1147
<212> БЕЛОК
<213> Bacillus thuringiensis
<400> 13
Met Asp Leu Asp Gly Asn Lys Thr Glu Thr Glu Thr Glu Ile Val Asn
1 5 10 15
Gly Ser Glu Ser Ser Ile Asp Pro Ser Ser Val Ser Tyr Ala Gly Asn
20 25 30
Asn Ser Tyr Ser Ser Ala Leu Asn Leu Asn Ser Cys Gln Asn Arg Gly
35 40 45
Ile Ala Gln Trp Val Asn Thr Leu Gly Gly Ala Ile Gly Gln Ala Val
50 55 60
Ser Ile Gly Thr Ser Ile Ile Ser Leu Leu Ala Ala Pro Thr Leu Thr
65 70 75 80
Gly Ser Ile Ser Leu Ala Phe Asn Leu Ile Arg Arg Met Gly Thr Gly
85 90 95
Ser Asn Gly Ser Ser Ile Ser Asp Leu Ser Ile Cys Asp Leu Leu Ser
100 105 110
Ile Ile Asn Leu Arg Val Ser Gln Ala Val Leu Asn Asp Gly Ile Ala
115 120 125
Asp Phe Asn Gly Ser Val Ala Val Tyr Asp Leu Tyr Leu His Ala Leu
130 135 140
Arg Ser Trp Asn Asn Asn Pro Asn Ala Ala Thr Ala Glu Glu Leu Arg
145 150 155 160
Thr Arg Phe Arg Ile Ala Asp Ser Glu Phe Glu Arg Ile Leu Thr Arg
165 170 175
Gly Ser Leu Thr His Gly Gly Ser Leu Ala Arg Gln Asp Ala Gln Val
180 185 190
Leu Leu Leu Pro Ser Phe Val Asn Ala Ala Tyr Leu His Leu Leu Ile
195 200 205
Leu Arg Asp Ala Ser Arg Tyr Gly Ala Ser Trp Gly Leu Phe Asn Thr
210 215 220
Thr Pro His Ile Asn Tyr Pro Val Arg Leu Gln Gln Leu Ile Gly Ser
225 230 235 240
Tyr Thr His Tyr Cys Thr His Trp Tyr Asn Gln Gly Leu Asn Glu Ile
245 250 255
Arg Gln Arg Gly Asn Thr Ala Val Asn Trp Leu Glu Phe His Arg Tyr
260 265 270
Arg Arg Asp Met Thr Leu Met Val Leu Asp Val Val Ser Leu Phe Ser
275 280 285
Ala Leu Asp Thr Ile Arg Tyr Pro Asn Ala Thr Val Val Gln Leu Ser
290 295 300
Arg Thr Val Tyr Thr Asp Pro Ile Gly Phe Val Asn Arg Gly Ser Gly
305 310 315 320
Asn Arg Leu Ser Trp Phe Asp Trp Arg Asn Gln Ala Asn Phe Ser Thr
325 330 335
Leu Glu Ser Glu Met Pro Thr Pro Ser Ser Pro Leu Ser Leu Asn His
340 345 350
Met Ser Ile Phe Thr Gly Pro Leu Thr Leu Pro Val Ser Pro Asn Thr
355 360 365
His Arg Ala Arg Val Trp Tyr Gly Asn Gln Asn Met Phe Thr Thr Gly
370 375 380
Ser Gln Asn Ser Gly Gln Thr Thr Asn Ser Ile Gln Asn Ile Ser Gly
385 390 395 400
Leu Glu Ile Phe Arg Ile Asp Ser Gln Ala Cys Asn Leu Asn Asn Asn
405 410 415
Ser Tyr Gly Val Asn Arg Ala Glu Phe Phe His Gly Ala Ser Gln Gly
420 425 430
Ser Gln Arg Ser Val Tyr Gln Gly Tyr Ile Arg Gln Ser Gly Leu Asp
435 440 445
Asn Pro Val Val Met Asn Leu Gln Ser Phe Leu Pro Gly Glu Asn Ser
450 455 460
Ala Thr Pro Thr Ala Gln Asp Tyr Thr His Ile Leu Ser Asn Pro Val
465 470 475 480
Asn Ile Arg Gly Gly Leu Arg Gln Ile Val Ala Asp Arg Arg Ser Ser
485 490 495
Val Val Val Tyr Gly Trp Thr His Lys Ser Leu Ser Arg Arg Ser Leu
500 505 510
Val Ala Pro Asp Gln Ile Thr Gln Val Pro Ala Val Lys Ala Ser Pro
515 520 525
Ser Ser His Cys Thr Ile Ile Ala Gly Pro Gly Phe Thr Gly Gly Asp
530 535 540
Leu Val Ser Leu Gln Pro Asn Gly Gln Leu Val Ile Pro Phe Gln Val
545 550 555 560
Ser Ala Pro Glu Thr Asn Tyr His Ile Arg Ile Cys Tyr Val Ser Thr
565 570 575
Ser Asp Cys Ser Ile Asn Thr Ile Cys Asn Asp Glu Thr His Leu Ser
580 585 590
Thr Leu Pro Ser Thr Thr Ser Ser Leu Glu Asn Leu Gln Cys Asn His
595 600 605
Leu His Tyr Phe Asn Val Gly Thr Phe Lys Pro Thr Ile Asp Ser Lys
610 615 620
Leu Thr Leu Val Asn Thr Ser Pro Asn Ala Asn Ile Ile Ile Asp Lys
625 630 635 640
Ile Glu Phe Ile Pro Val Asp Thr Ala Gln Gln Gln Asn Glu Asp Leu
645 650 655
Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe Thr Arg Thr Arg Asp
660 665 670
Gly Leu Gln Val Asn Val Lys Asp Tyr Gln Val Asp Gln Ala Ala Asn
675 680 685
Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Gly Tyr Asp Lys Lys Met
690 695 700
Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu Ser Arg Glu Arg Asn
705 710 715 720
Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn Ser Thr Glu Glu Asn
725 730 735
Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser Glu Gly Gly Pro Phe
740 745 750
Tyr Lys Gly Arg Ala Ile Gln Leu Ala Ser Ala Arg Glu Asn Tyr Pro
755 760 765
Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu Leu Lys Pro Tyr Thr
770 775 780
Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser Gln Asp Leu Glu Ile
785 790 795 800
Asp Leu Ile His His His Lys Val His Leu Val Lys Asn Val Pro Asp
805 810 815
Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser Cys Ser Gly Ile Asn
820 825 830
Arg Cys Gln Glu Gln Gln Met Val Asn Ala Gln Leu Glu Thr Glu His
835 840 845
His His Pro Met Asp Cys Cys Glu Ala Ala Gln Thr His Glu Phe Ser
850 855 860
Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Ser Val Asp Gln Gly Ile
865 870 875 880
Trp Ala Ile Phe Lys Val Arg Thr Thr Asp Gly Tyr Ala Thr Leu Gly
885 890 895
Asn Leu Glu Leu Val Glu Val Gly Pro Leu Ser Gly Glu Ser Leu Glu
900 905 910
Arg Glu Gln Arg Asp Asn Thr Lys Trp Ser Ala Glu Leu Gly Arg Lys
915 920 925
Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala Lys Gln Ser Ile Asn
930 935 940
His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu Asn Pro Glu Ile Gly
945 950 955 960
Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val Ala Ser Ile Ser Asp
965 970 975
Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly Ile Asn Tyr Glu Ile
980 985 990
Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln Ala Ser Tyr Leu Tyr Thr
995 1000 1005
Ser Arg Asn Ala Val Gln Asn Gly Asp Phe Asn Asn Gly Leu Asp
1010 1015 1020
Ser Trp Asn Ala Thr Ala Gly Ala Ser Val Gln Gln Asp Gly Asn
1025 1030 1035
Thr His Phe Leu Val Leu Ser His Trp Asp Ala Gln Val Ser Gln
1040 1045 1050
Gln Phe Arg Val Gln Pro Asn Cys Lys Tyr Val Leu Arg Val Thr
1055 1060 1065
Ala Glu Lys Val Gly Gly Gly Asp Gly Tyr Val Thr Ile Arg Asp
1070 1075 1080
Asp Ala His His Thr Glu Thr Leu Thr Phe Asn Ala Cys Asp Tyr
1085 1090 1095
Asp Ile Asn Gly Thr Tyr Val Thr Asp Asn Thr Tyr Leu Thr Lys
1100 1105 1110
Glu Val Val Phe His Pro Glu Thr Gln His Met Trp Val Glu Val
1115 1120 1125
Asn Glu Thr Glu Gly Ala Phe His Ile Asp Ser Ile Glu Phe Val
1130 1135 1140
Glu Thr Glu Lys
1145
<210> 14
<211> 1157
<212> БЕЛОК
<213> Bacillus thuringiensis
<400> 14
Met Asn Arg Asn Asn Gln Asn Glu Tyr Glu Ile Ile Asp Ala Pro His
1 5 10 15
Cys Gly Cys Pro Ser Asp Asp Asp Val Lys Tyr Pro Leu Ala Ser Asp
20 25 30
Pro Asn Ala Ala Leu Gln Asn Met Asn Tyr Lys Asp Tyr Leu Gln Met
35 40 45
Thr Asp Glu Asp Tyr Thr Asp Ser Tyr Ile Asn Pro Ser Leu Ser Ile
50 55 60
Ser Gly Arg Asp Ala Val Gln Thr Ala Leu Thr Val Val Gly Arg Ile
65 70 75 80
Leu Gly Ala Leu Gly Val Pro Phe Ser Gly Gln Ile Val Ser Phe Tyr
85 90 95
Gln Phe Leu Leu Asn Thr Leu Trp Pro Val Asn Asp Thr Ala Ile Trp
100 105 110
Glu Ala Phe Met Arg Gln Val Glu Glu Leu Val Asn Gln Gln Ile Thr
115 120 125
Glu Phe Ala Arg Asn Gln Ala Leu Ala Arg Leu Gln Gly Leu Gly Asp
130 135 140
Ser Phe Asn Val Tyr Gln Arg Ser Leu Gln Asn Trp Leu Ala Asp Arg
145 150 155 160
Asn Asp Thr Arg Asn Leu Ser Val Val Arg Ala Gln Phe Ile Ala Leu
165 170 175
Asp Leu Asp Phe Val Asn Ala Ile Pro Leu Phe Ala Val Asn Gly Gln
180 185 190
Gln Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Val Asn Leu His Leu
195 200 205
Leu Leu Leu Lys Asp Ala Ser Leu Phe Gly Glu Gly Trp Gly Phe Thr
210 215 220
Gln Gly Glu Ile Ser Thr Tyr Tyr Asp Arg Gln Leu Glu Leu Thr Ala
225 230 235 240
Arg Tyr Thr Asn Tyr Cys Glu Thr Trp Tyr Asn Thr Gly Leu Asp Arg
245 250 255
Leu Arg Gly Thr Asn Thr Glu Ser Trp Leu Arg Tyr His Gln Phe Arg
260 265 270
Arg Glu Met Thr Leu Val Val Leu Asp Val Val Ala Leu Phe Pro Tyr
275 280 285
Tyr Asp Val Arg Leu Tyr Pro Thr Gly Ser Asn Pro Gln Leu Thr Arg
290 295 300
Glu Val Tyr Thr Asp Pro Ile Val Phe Asn Pro Pro Ala Asn Val Gly
305 310 315 320
Leu Cys Arg Arg Trp Gly Thr Asn Pro Tyr Asn Thr Phe Ser Glu Leu
325 330 335
Glu Asn Ala Phe Ile Arg Pro Pro His Leu Phe Asp Arg Leu Asn Ser
340 345 350
Leu Thr Ile Ser Ser Asn Arg Phe Pro Val Ser Ser Asn Phe Met Asp
355 360 365
Tyr Trp Ser Gly His Thr Leu Arg Arg Ser Tyr Leu Asn Asp Ser Ala
370 375 380
Val Gln Glu Asp Ser Tyr Gly Leu Ile Thr Thr Thr Arg Ala Thr Ile
385 390 395 400
Asn Pro Gly Val Asp Gly Thr Asn Arg Ile Glu Ser Thr Ala Val Asp
405 410 415
Phe Arg Ser Ala Leu Ile Gly Ile Tyr Gly Val Asn Arg Ala Ser Phe
420 425 430
Val Pro Gly Gly Leu Phe Asn Gly Thr Thr Ser Pro Ala Asn Gly Gly
435 440 445
Cys Arg Asp Leu Tyr Asp Thr Asn Asp Glu Leu Pro Pro Asp Glu Ser
450 455 460
Thr Gly Ser Ser Thr His Arg Leu Ser His Val Thr Phe Phe Ser Phe
465 470 475 480
Gln Thr Asn Gln Ala Gly Ser Ile Ala Asn Ala Gly Ser Val Pro Thr
485 490 495
Tyr Val Trp Thr Arg Arg Asp Val Asp Leu Asn Asn Thr Ile Thr Pro
500 505 510
Asn Arg Ile Thr Gln Leu Pro Leu Val Lys Ala Ser Ala Pro Val Ser
515 520 525
Gly Thr Thr Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Gly Ile Leu
530 535 540
Arg Arg Thr Thr Asn Gly Thr Phe Gly Thr Leu Arg Val Thr Val Asn
545 550 555 560
Ser Pro Leu Thr Gln Gln Tyr Arg Leu Arg Val Arg Phe Ala Ser Thr
565 570 575
Gly Asn Phe Ser Ile Arg Leu Leu Arg Gly Gly Val Ser Ile Gly Asp
580 585 590
Val Arg Leu Gly Ser Thr Met Asn Arg Gly Gln Glu Leu Thr Tyr Glu
595 600 605
Ser Phe Phe Thr Arg Glu Phe Thr Thr Thr Gly Pro Phe Asn Pro Pro
610 615 620
Phe Thr Phe Thr Gln Ala Gln Glu Ile Leu Thr Val Asn Ala Glu Gly
625 630 635 640
Val Ser Thr Gly Gly Glu Tyr Tyr Ile Asp Arg Ile Glu Ile Val Pro
645 650 655
Val Asn Pro Ala Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys
660 665 670
Ala Val Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn
675 680 685
Val Thr Asp Tyr Gln Val Asp Arg Ala Ala Asn Leu Val Ser Cys Leu
690 695 700
Ser Asp Glu Gln Tyr Ser His Asp Lys Lys Met Leu Leu Glu Ala Val
705 710 715 720
Arg Ala Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro
725 730 735
Asp Phe Asn Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser
740 745 750
Asn Gly Val Thr Ile Ser Glu Gly Gly Pro Phe Phe Lys Gly Arg Ala
755 760 765
Leu Gln Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln
770 775 780
Lys Val Asp Ala Ser Val Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp
785 790 795 800
Gly Phe Val Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His
805 810 815
His Lys Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Ser Asp
820 825 830
Thr Tyr Ser Asp Gly Ser Cys Ser Gly Ile Asn Arg Cys Asp Glu Gln
835 840 845
Gln Gln Val Asp Met Gln Leu Asp Ala Glu His His Pro Met Asp Cys
850 855 860
Cys Glu Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly
865 870 875 880
Asp Leu Asn Ala Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val
885 890 895
Arg Thr Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu
900 905 910
Val Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn
915 920 925
Ala Lys Trp Asn Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg
930 935 940
Val Tyr Leu Ala Ala Lys Gln Ala Ile Asn His Leu Phe Val Asp Tyr
945 950 955 960
Gln Asp Gln Gln Leu Asn Pro Glu Ile Gly Leu Ala Glu Ile Asn Glu
965 970 975
Ala Ser Asn Leu Val Lys Ser Ile Ser Gly Val Tyr Ser Asp Thr Leu
980 985 990
Leu Gln Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asp
995 1000 1005
Arg Leu Gln Gln Ala Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val
1010 1015 1020
Gln Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr
1025 1030 1035
Thr Asp Ala Ser Val Gln Gln Asp Gly Ser Thr His Phe Leu Val
1040 1045 1050
Leu Ser His Trp Asp Ala Gln Val Ser Gln Gln Met Arg Val Asn
1055 1060 1065
Leu Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Lys Lys Val Gly
1070 1075 1080
Gly Gly Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Gln
1085 1090 1095
Glu Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp Val Asn Gly Thr
1100 1105 1110
Tyr Val Asn Asp Asn Ser Tyr Ile Thr Lys Glu Val Val Phe Tyr
1115 1120 1125
Pro Glu Thr Lys His Met Trp Val Glu Val Ser Glu Ser Glu Gly
1130 1135 1140
Ser Phe Tyr Ile Asp Ser Ile Glu Phe Ile Glu Thr Gln Glu
1145 1150 1155
<210> 15
<211> 1173
<212> БЕЛОК
<213> Bacillus thuringiensis
<400> 15
Met Asn Arg Asn Asn Gln Gly Glu Tyr Glu Ile Ile Asp Ala Ser Thr
1 5 10 15
Cys Gly Cys Ser Ser Asp Asp Val Val Gln Tyr Pro Leu Ala Arg Asp
20 25 30
Pro Asn Ala Ala Phe Gln Asn Met Asn Tyr Lys Asp Tyr Leu Lys Met
35 40 45
Ser Asp Gly Asp Tyr Val Asp Ser Tyr Ile Asn Pro Gly Leu Ser Ile
50 55 60
Gly Arg Arg Asp Val Thr Leu Thr Gly Val Gly Ile Val Ala Leu Ile
65 70 75 80
Val Gly Thr Leu Gly Gly Pro Val Gly Gly Ile Val Thr Gly Leu Ile
85 90 95
Ser Ser Leu Leu Gly Leu Leu Trp Pro Ser Asn Asp Asn Asp Val Trp
100 105 110
Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile Glu Gln Arg Ile Ala
115 120 125
Asp Gln Val Val Arg Asn Ala Leu Asp Asn Leu Thr Gly Leu Arg Asp
130 135 140
Tyr Tyr Asn Gln Tyr Leu Leu Ala Leu Glu Glu Trp Gln Glu Arg Pro
145 150 155 160
Asn Ala Val Arg Ser Thr Leu Val Phe Asn Arg Phe Glu Thr Leu His
165 170 175
Ser His Phe Val Thr Ser Met Pro Ser Phe Gly Ser Gly Pro Gly Ser
180 185 190
Glu Arg Tyr Ala Val Gln Leu Leu Thr Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Arg Asp Ala Asp Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Arg Glu Ser Gln Ile Asp Leu Tyr Phe Asn Glu Leu Gln Asn
225 230 235 240
Arg Thr Arg Asp Tyr Thr Asn His Cys Val Thr Ala Tyr Asn Asn Gly
245 250 255
Leu Glu Glu Ile Arg Gly Thr Ser Pro Ala Ser Trp Leu Arg Tyr His
260 265 270
Gln Phe Arg Arg Glu Thr Thr Leu Ile Ala Leu Asp Leu Val Ala Ile
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Glu Tyr Pro Ile Gly Val Asn Pro Gln
290 295 300
Leu Thr Arg Asp Val Tyr Thr Asp Pro Ile Gly Val Thr Phe Arg Arg
305 310 315 320
Glu Asp Trp Glu Thr Gly Val Glu Cys Arg Pro Trp Val Asn Thr Pro
325 330 335
Tyr Met Ser Phe Ser Asp Leu Glu Asn Ala Ile Ile Arg Pro Pro His
340 345 350
Leu Phe Glu Thr Leu Arg Asn Leu Thr Ile His Thr Gly Arg Tyr Asn
355 360 365
Leu Val Gly Gly Ala Arg Phe Ile Glu Gly Trp Val Gly His Ser Val
370 375 380
Thr Asn Thr Arg Leu Gly Asn Ser Thr Val Phe Thr Ser Asn Tyr Gly
385 390 395 400
Ser Leu Pro Pro Arg Phe Gln Val Phe Asn Phe Thr Asn Phe Asp Val
405 410 415
Tyr Gln Ile Asn Thr Arg Ala Asp Ser Thr Gly Thr Phe Arg Ile Pro
420 425 430
Gly Phe Ala Val Thr Arg Ala Gln Phe Ile Pro Gly Gly Thr Tyr Ser
435 440 445
Val Ala His Arg Asp Pro Gly Ala Cys Gln Gln Asp Tyr Asp Ser Ile
450 455 460
Glu Glu Leu Pro Ser Leu Asp Pro Asp Glu Pro Ile Asn Arg Ser Tyr
465 470 475 480
Ser His Arg Leu Ser His Val Thr Leu Tyr Lys Tyr Thr Leu Ser Asp
485 490 495
Thr Asp Tyr Gly Val Ile Asn Tyr Thr Asp Tyr Gly Ser Met Pro Ala
500 505 510
Tyr Val Trp Thr His Arg Asp Val Asp Leu Thr Asn Thr Ile Thr Ala
515 520 525
Asp Arg Ile Thr Gln Leu Pro Leu Val Lys Ala Ser Thr Leu Pro Ala
530 535 540
Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu
545 550 555 560
Arg Arg Thr Thr Asn Gly Thr Phe Gly Thr Leu His Val Arg Val Asn
565 570 575
Ser Pro Leu Thr Gln Gln Tyr Arg Leu Arg Val Arg Phe Ala Ser Thr
580 585 590
Gly Asn Phe Ser Ile Arg Val Leu Arg Gly Gly Thr Ser Ile Gly Asp
595 600 605
Ala Arg Phe Gly Ser Thr Met Asn Arg Gly Gln Glu Leu Thr Tyr Glu
610 615 620
Ser Phe Val Thr Arg Glu Phe Thr Thr Thr Gly Pro Phe Asn Pro Pro
625 630 635 640
Phe Thr Phe Thr Gln Thr Gln Glu Ile Leu Thr Val Asn Ala Glu Gly
645 650 655
Val Ser Thr Gly Gly Glu Tyr Tyr Ile Asp Ser Ile Glu Ile Val Pro
660 665 670
Val Asn Pro Thr Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys
675 680 685
Ala Val Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn
690 695 700
Val Thr Asp Tyr Gln Val Asp Arg Ala Ala Asn Leu Val Leu Cys Leu
705 710 715 720
Ser Asp Glu Gln Tyr Ala His Asp Lys Lys Met Leu Leu Glu Ala Val
725 730 735
Arg Ala Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro
740 745 750
Asp Phe Asn Glu Ile Asn Ser Thr Glu Asp Ser Gly Trp Lys Thr Ser
755 760 765
Asn Gly Ile Ile Ile Ser Glu Gly Gly Pro Phe Phe Lys Gly Arg Ala
770 775 780
Leu Gln Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln
785 790 795 800
Lys Val Asp Ser Ser Met Leu Lys Pro Tyr Thr Arg Tyr Lys Leu Asp
805 810 815
Gly Phe Val Gln Ser Ser Gln Asp Leu Glu Ile Glu Leu Ile His His
820 825 830
His Lys Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Leu Asp
835 840 845
Thr Tyr Pro Asp Gly Ser Cys Asn Gly Ile Asn Arg Cys Glu Glu Gln
850 855 860
Gln Met Val Asn Ser Gln Leu Glu Thr Glu His His Pro Met Asp Cys
865 870 875 880
Cys Glu Ala Ser Gln Thr His Glu Phe Ser Ser Tyr Ile His Thr Gly
885 890 895
Asp Leu Asn Ala Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Ile
900 905 910
Arg Thr Thr Asp Gly Ser Ala Thr Leu Gly Asn Leu Glu Leu Val Glu
915 920 925
Val Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn
930 935 940
Ala Lys Trp Asn Ala Glu Leu Gly Arg Lys Arg Ala Glu Ala Asp Arg
945 950 955 960
Val Tyr Gln Gly Ala Lys Gln Ala Ile Asn His Leu Phe Val Asp Tyr
965 970 975
Gln Asp Gln Gln Leu Asn Pro Glu Val Gly Leu Ala Glu Ile Ser Glu
980 985 990
Ala Arg Asn Leu Ile Glu Ser Ile Ser Asp Val Tyr Cys Asp Ala Val
995 1000 1005
Leu Arg Ile Pro Gly Ile Asn Tyr Glu Met Tyr Thr Glu Leu Ser
1010 1015 1020
Asn Arg Leu Gln Gln Ala Ala Tyr Leu Tyr Thr Ser Arg Asn Ala
1025 1030 1035
Val Gln Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala
1040 1045 1050
Thr Thr Asp Ala Thr Val Gln Gln Asp Gly Asn Met Tyr Phe Leu
1055 1060 1065
Val Leu Ser His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val
1070 1075 1080
Gln Pro Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Lys Lys Val
1085 1090 1095
Gly Asn Gly Asp Gly Tyr Val Thr Ile Gln Asp Gly Ala His His
1100 1105 1110
Arg Glu Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp Val Asn Gly
1115 1120 1125
Thr His Val Asn Asp Asn Ser Tyr Ile Thr Lys Glu Leu Glu Phe
1130 1135 1140
Tyr Pro Lys Thr Glu His Met Trp Val Glu Val Ser Glu Thr Glu
1145 1150 1155
Gly Thr Phe Tyr Ile Asp Ser Ile Glu Leu Ile Glu Thr Gln Glu
1160 1165 1170
<210> 16
<211> 1179
<212> БЕЛОК
<213> Bacillus thuringiensis
<400> 16
Met Gly Gly Lys Ser Met Asn Arg Asn Asn Gln Gly Glu Tyr Glu Ile
1 5 10 15
Ile Asp Ala Ser Thr Cys Gly Cys Ser Ser Asp Asp Val Val Gln Tyr
20 25 30
Pro Leu Ala Arg Asp Pro Asn Ala Ala Phe Gln Asn Met Asn Tyr Lys
35 40 45
Asp Tyr Leu Lys Met Ser Asp Gly Asp Tyr Val Asp Ser Tyr Ile Asn
50 55 60
Pro Gly Leu Ser Ile Gly Arg Arg Asp Val Thr Leu Thr Gly Val Gly
65 70 75 80
Ile Val Ala Leu Ile Val Gly Thr Leu Gly Gly Pro Val Gly Gly Ile
85 90 95
Val Thr Gly Leu Ile Ser Ser Leu Leu Gly Leu Leu Trp Pro Ser Asn
100 105 110
Asp Asn Asp Val Trp Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile
115 120 125
Glu Gln Arg Ile Ala Asp Gln Val Val Arg Asn Ala Leu Asp Asn Leu
130 135 140
Thr Gly Leu Arg Asp Tyr Tyr Asn Gln Tyr Leu Leu Ala Leu Glu Glu
145 150 155 160
Trp Gln Glu Arg Pro Asn Ala Val Arg Ser Thr Leu Val Phe Asn Arg
165 170 175
Phe Glu Thr Leu His Ser His Phe Val Thr Ser Met Pro Ser Phe Gly
180 185 190
Ser Gly Pro Gly Ser Glu Arg Tyr Ala Val Gln Leu Leu Thr Val Tyr
195 200 205
Ala Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Asp Ile
210 215 220
Tyr Gly Ala Arg Trp Gly Leu Arg Glu Ser Gln Ile Asp Leu Tyr Phe
225 230 235 240
Asn Glu Leu Gln Asn Arg Thr Arg Asp Tyr Thr Asn His Cys Val Thr
245 250 255
Ala Tyr Asn Asn Gly Leu Glu Glu Ile Arg Gly Thr Ser Pro Ala Ser
260 265 270
Trp Leu Arg Tyr His Gln Phe Arg Arg Glu Thr Thr Leu Ile Ala Leu
275 280 285
Asp Leu Val Ala Ile Phe Pro Tyr Tyr Asn Val Arg Glu Tyr Pro Ile
290 295 300
Gly Val Asn Pro Gln Leu Thr Arg Asp Val Tyr Thr Asp Pro Ile Gly
305 310 315 320
Val Thr Phe Arg Arg Glu Asp Trp Glu Thr Gly Val Glu Cys Arg Pro
325 330 335
Trp Val Asn Thr Pro Tyr Met Ser Phe Ser Asp Leu Glu Asn Ala Ile
340 345 350
Ile Arg Pro Pro His Leu Phe Glu Thr Leu Arg Asn Leu Thr Ile His
355 360 365
Thr Gly Arg Tyr Asn Leu Val Gly Gly Ala Arg Phe Ile Glu Gly Trp
370 375 380
Val Gly His Ser Val Thr Asn Thr Arg Leu Gly Asn Ser Thr Val Phe
385 390 395 400
Thr Ser Asn Tyr Gly Ser Leu Pro Pro Arg Phe Gln Val Phe Asn Phe
405 410 415
Thr Asn Phe Asp Val Tyr Gln Ile Asn Thr Arg Ala Asp Ser Thr Gly
420 425 430
Thr Phe Arg Ile Pro Gly Phe Ala Val Thr Arg Ala Gln Phe Ile Pro
435 440 445
Gly Gly Thr Tyr Ser Val Ala His Arg Asp Pro Gly Ala Cys Gln Gln
450 455 460
Asp Tyr Asp Ser Ile Glu Glu Leu Pro Ser Leu Asp Pro Asp Glu Pro
465 470 475 480
Ile Asn Arg Ser Tyr Ser His Arg Leu Ser His Val Thr Leu Tyr Lys
485 490 495
Tyr Thr Leu Ser Asp Thr Asp Tyr Gly Val Ile Asn Tyr Thr Asp Tyr
500 505 510
Gly Ser Met Pro Ala Tyr Val Trp Thr His Arg Asp Val Asp Leu Thr
515 520 525
Asn Thr Ile Thr Ala Asp Arg Ile Thr Gln Leu Pro Leu Val Lys Ala
530 535 540
Ser Thr Leu Pro Ala Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr
545 550 555 560
Gly Gly Asp Ile Leu Arg Arg Thr Thr Asn Gly Thr Phe Gly Thr Leu
565 570 575
His Val Arg Val Asn Ser Pro Leu Thr Gln Gln Tyr Arg Leu Arg Val
580 585 590
Arg Phe Ala Ser Thr Gly Asn Phe Ser Ile Arg Val Leu Arg Gly Gly
595 600 605
Thr Ser Ile Gly Asp Ala Arg Phe Gly Ser Thr Met Asn Arg Gly Gln
610 615 620
Glu Leu Thr Tyr Glu Ser Phe Val Thr Arg Glu Phe Thr Thr Thr Gly
625 630 635 640
Pro Phe Asn Pro Pro Phe Thr Phe Thr Gln Thr Gln Glu Ile Leu Thr
645 650 655
Val Asn Ala Glu Gly Val Ser Thr Gly Gly Glu Tyr Tyr Ile Asp Ser
660 665 670
Ile Glu Ile Val Pro Val Asn Pro Thr Arg Glu Ala Glu Glu Asp Leu
675 680 685
Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe Thr Arg Thr Arg Asp
690 695 700
Gly Leu Gln Val Asn Val Thr Asp Tyr Gln Val Asp Gln Ala Ala Asn
705 710 715 720
Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Gly Tyr Asp Lys Lys Met
725 730 735
Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu Ser Arg Glu Arg Asn
740 745 750
Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn Ser Thr Glu Glu Asn
755 760 765
Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser Glu Gly Gly Pro Phe
770 775 780
Tyr Lys Gly Arg Ala Leu Gln Leu Ala Ser Ala Arg Glu Asn Tyr Pro
785 790 795 800
Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu Leu Lys Pro Tyr Thr
805 810 815
Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser Gln Asp Leu Glu Ile
820 825 830
Asp Leu Ile His His His Lys Val His Leu Val Lys Asn Val Pro Asp
835 840 845
Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser Cys Ser Gly Ile Asn
850 855 860
Arg Cys Gln Glu Gln Gln Met Val Asn Ala Gln Leu Glu Thr Glu His
865 870 875 880
His His Pro Met Asp Cys Cys Glu Ala Ala Gln Thr His Glu Phe Ser
885 890 895
Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Ser Val Asp Gln Gly Ile
900 905 910
Trp Ala Ile Phe Lys Val Arg Thr Thr Asp Gly Tyr Ala Thr Leu Gly
915 920 925
Asn Leu Glu Leu Val Glu Val Gly Pro Leu Ser Gly Glu Ser Leu Glu
930 935 940
Arg Glu Gln Arg Asp Asn Thr Lys Trp Ser Ala Glu Leu Gly Arg Lys
945 950 955 960
Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala Lys Gln Ser Ile Asn
965 970 975
His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu Asn Pro Glu Ile Gly
980 985 990
Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val Ala Ser Ile Ser Asp
995 1000 1005
Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly Ile Asn Tyr Glu
1010 1015 1020
Ile Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln Ala Ser Tyr Leu
1025 1030 1035
Tyr Thr Ser Arg Asn Ala Val Gln Asn Gly Asp Phe Asn Asn Gly
1040 1045 1050
Leu Asp Ser Trp Asn Ala Thr Ala Gly Ala Ser Val Gln Gln Asp
1055 1060 1065
Gly Asn Thr His Phe Leu Val Leu Ser His Trp Asp Ala Gln Val
1070 1075 1080
Ser Gln Gln Phe Arg Val Gln Pro Asn Cys Lys Tyr Val Leu Arg
1085 1090 1095
Val Thr Ala Glu Lys Val Gly Gly Gly Asp Gly Tyr Val Thr Ile
1100 1105 1110
Arg Asp Gly Ala His His Thr Glu Thr Leu Thr Phe Asn Ala Cys
1115 1120 1125
Asp Tyr Asp Ile Asn Gly Thr Tyr Val Thr Asp Asn Thr Tyr Leu
1130 1135 1140
Thr Lys Glu Val Ile Phe Tyr Ser His Thr Glu His Met Trp Val
1145 1150 1155
Glu Val Asn Glu Thr Glu Gly Ala Phe His Ile Asp Ser Ile Glu
1160 1165 1170
Phe Val Glu Thr Glu Lys
1175
<210> 17
<211> 1147
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мутант BT-0044
<400> 17
Met Asp Leu Asp Gly Asn Lys Thr Glu Thr Glu Thr Glu Ile Val Asn
1 5 10 15
Gly Ser Glu Ser Ser Ile Asp Pro Ser Ser Val Ser Tyr Ala Gly Asn
20 25 30
Asn Ser Tyr Ser Ser Ala Leu Asn Leu Asn Ser Cys Gln Asn Arg Gly
35 40 45
Ile Ala Gln Trp Val Asn Thr Leu Gly Gly Ala Ile Gly Gln Ala Val
50 55 60
Ser Ile Gly Thr Ser Ile Ile Ser Leu Leu Ala Ala Pro Thr Leu Thr
65 70 75 80
Gly Ser Ile Ser Leu Ala Phe Asn Leu Ile Arg Arg Met Gly Thr Gly
85 90 95
Ser Asn Gly Ser Ser Ile Ser Asp Leu Ser Ile Cys Asp Leu Leu Ser
100 105 110
Ile Ile Asn Leu Arg Val Ser Gln Ala Val Leu Asn Asp Gly Ile Ala
115 120 125
Asp Phe Asn Gly Ser Val Ala Val Tyr Asp Leu Tyr Leu His Ala Leu
130 135 140
Arg Ser Trp Asn Asn Asn Pro Asn Ala Ala Thr Ala Glu Glu Leu Arg
145 150 155 160
Thr Arg Phe Arg Ile Ala Asp Ser Glu Phe Glu Arg Ile Leu Thr Arg
165 170 175
Gly Ser Leu Thr His Gly Gly Ser Leu Ala Arg Gln Asp Ala Gln Val
180 185 190
Leu Leu Leu Pro Ser Phe Val Asn Ala Ala Tyr Leu His Leu Leu Ile
195 200 205
Leu Arg Asp Ala Ser Arg Tyr Gly Ala Ser Trp Gly Leu Phe Asn Thr
210 215 220
Thr Pro His Ile Asn Tyr Pro Val Arg Leu Gln Gln Leu Ile Gly Ser
225 230 235 240
Tyr Thr His Tyr Cys Thr His Trp Tyr Asn Gln Gly Leu Asn Glu Ile
245 250 255
Arg Gln Arg Gly Asn Thr Ala Val Asn Trp Leu Glu Phe His Arg Tyr
260 265 270
Arg Arg Asp Met Thr Leu Met Val Leu Asp Val Val Ser Leu Phe Ser
275 280 285
Ala Leu Asp Thr Ile Arg Tyr Pro Asn Ala Thr Val Val Gln Leu Ser
290 295 300
Arg Thr Val Tyr Thr Asp Pro Ile Gly Phe Val Asn Arg Gly Ser Gly
305 310 315 320
Asn Arg Leu Ser Trp Phe Asp Trp Arg Asn Gln Ala Asn Phe Ser Thr
325 330 335
Leu Glu Ser Glu Met Pro Thr Pro Ser Ser Pro Leu Ser Leu Asn His
340 345 350
Met Ser Ile Phe Thr Gly Pro Leu Thr Leu Pro Val Ser Pro Asn Thr
355 360 365
His Arg Ala Arg Val Trp Tyr Gly Asn Gln Asn Met Phe Thr Thr Gly
370 375 380
Ser Gln Asn Ser Gly Gln Thr Thr Asn Ser Ile Gln Asn Ile Ser Gly
385 390 395 400
Leu Glu Ile Phe Arg Ile Asp Ser Gln Ala Cys Asn Leu Asn Asn Asn
405 410 415
Ser Tyr Gly Val Asn Arg Ala Glu Phe Phe His Gly Ala Ser Gln Gly
420 425 430
Ser Gln Arg Ser Val Tyr Gln Gly Tyr Ile Arg Gln Ser Gly Leu Asp
435 440 445
Asn Pro Val Val Met Asn Leu Gln Ser Phe Leu Pro Gly Glu Asn Ser
450 455 460
Ala Thr Pro Thr Ala Gln Asp Tyr Thr His Ile Leu Ser Asn Pro Val
465 470 475 480
Asn Ile Arg Gly Gly Leu Arg Gln Ile Val Ala Asp Arg Arg Ser Ser
485 490 495
Val Val Val Tyr Gly Trp Thr His Lys Ser Leu Ser Arg Arg Ser Leu
500 505 510
Val Ala Pro Asp Gln Ile Thr Gln Val Pro Ala Val Lys Ala Ser Pro
515 520 525
Ser Ser His Cys Thr Ile Ile Ala Gly Pro Gly Phe Thr Gly Gly Asp
530 535 540
Leu Val Ser Leu Gln Pro Asn Gly Gln Leu Val Ile Pro Phe Gln Val
545 550 555 560
Ser Ala Pro Glu Thr Asn Tyr His Ile Arg Ile Cys Tyr Val Ser Thr
565 570 575
Ser Asp Cys Ser Ile Asn Thr Ile Cys Asn Asp Glu Thr His Leu Ser
580 585 590
Thr Leu Pro Ser Thr Thr Ser Ser Leu Glu Asn Leu Gln Cys Asn His
595 600 605
Leu His Tyr Phe Asn Val Gly Thr Phe Lys Pro Thr Ile Asp Ser Lys
610 615 620
Leu Thr Leu Val Asn Thr Ser Pro Asn Ala Asn Ile Ile Ile Asp Lys
625 630 635 640
Ile Glu Phe Ile Pro Val Asp Thr Ala Gln Gln Gln Asn Glu Asp Leu
645 650 655
Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe Thr Arg Thr Arg Asp
660 665 670
Gly Leu Gln Val Asn Val Lys Asp Tyr Gln Val Asp Gln Ala Ala Asn
675 680 685
Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Gly Tyr Asp Lys Lys Met
690 695 700
Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu Ser Arg Glu Arg Asn
705 710 715 720
Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn Ser Thr Glu Glu Asn
725 730 735
Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser Glu Gly Gly Pro Phe
740 745 750
Tyr Lys Gly Arg Ala Ile Gln Leu Ala Ser Ala Arg Glu Asn Tyr Pro
755 760 765
Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu Leu Lys Pro Tyr Thr
770 775 780
Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser Gln Asp Leu Glu Ile
785 790 795 800
Asp Leu Ile His His His Lys Val His Leu Val Lys Asn Val Pro Asp
805 810 815
Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser Cys Ser Gly Ile Asn
820 825 830
Arg Cys Gln Glu Gln Gln Met Val Asn Ala Gln Leu Glu Thr Glu His
835 840 845
His His Pro Met Asp Cys Cys Glu Ala Ala Gln Thr His Glu Phe Ser
850 855 860
Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Ser Val Asp Gln Gly Ile
865 870 875 880
Trp Ala Ile Phe Lys Val Arg Thr Thr Asp Gly Tyr Ala Thr Leu Gly
885 890 895
Asn Leu Glu Leu Val Glu Val Gly Pro Leu Ser Gly Glu Ser Leu Glu
900 905 910
Arg Glu Gln Arg Asp Asn Thr Lys Trp Ser Ala Glu Leu Gly Arg Lys
915 920 925
Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala Lys Gln Ser Ile Asn
930 935 940
His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu Asn Pro Glu Ile Gly
945 950 955 960
Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val Ala Ser Ile Ser Asp
965 970 975
Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly Ile Asn Tyr Glu Ile
980 985 990
Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln Ala Ser Tyr Leu Tyr Thr
995 1000 1005
Ser Arg Asn Ala Val Gln Asn Gly Asp Phe Asn Asn Gly Leu Asp
1010 1015 1020
Ser Trp Asn Ala Thr Ala Gly Ala Ser Val Gln Gln Asp Gly Asn
1025 1030 1035
Thr His Phe Leu Val Leu Ser His Trp Asp Ala Gln Val Ser Gln
1040 1045 1050
Gln Phe Arg Val Gln Pro Asn Cys Lys Tyr Val Leu Arg Val Thr
1055 1060 1065
Ala Glu Lys Val Gly Gly Gly Asp Gly Tyr Val Thr Ile Arg Asp
1070 1075 1080
Asp Ala His His Thr Glu Thr Leu Thr Phe Asn Ala Cys Asp Tyr
1085 1090 1095
Asp Ile Asn Gly Thr Tyr Val Thr Asp Asn Thr Tyr Ile Thr Lys
1100 1105 1110
Glu Val Val Phe His Pro Glu Thr Gln His Met Trp Val Glu Val
1115 1120 1125
Asn Glu Thr Glu Gly Ala Phe His Leu Asp Ser Ile Glu Phe Val
1130 1135 1140
Glu Thr Glu Lys
1145
<210> 18
<211> 1157
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мутант BT-0051
<400> 18
Met Asn Arg Asn Asn Gln Asn Glu Tyr Glu Ile Ile Asp Ala Pro His
1 5 10 15
Cys Gly Cys Pro Ser Asp Asp Asp Val Lys Tyr Pro Leu Ala Ser Asp
20 25 30
Pro Asn Ala Ala Leu Gln Asn Met Asn Tyr Lys Asp Tyr Leu Gln Met
35 40 45
Thr Asp Glu Asp Tyr Thr Asp Ser Tyr Ile Asn Pro Ser Leu Ser Ile
50 55 60
Ser Gly Arg Asp Ala Val Gln Thr Ala Leu Thr Val Val Gly Arg Ile
65 70 75 80
Leu Gly Ala Leu Gly Val Pro Phe Ser Gly Gln Ile Val Ser Phe Tyr
85 90 95
Gln Phe Leu Leu Asn Thr Leu Trp Pro Val Asn Asp Thr Ala Ile Trp
100 105 110
Glu Ala Phe Met Arg Gln Val Glu Glu Leu Val Asn Gln Gln Ile Thr
115 120 125
Glu Phe Ala Arg Asn Gln Ala Leu Ala Arg Leu Gln Gly Leu Gly Asp
130 135 140
Ser Phe Asn Val Tyr Gln Arg Ser Leu Gln Asn Trp Leu Ala Asp Arg
145 150 155 160
Asn Asp Thr Arg Asn Leu Ser Val Val Arg Ala Gln Phe Ile Ala Leu
165 170 175
Asp Leu Asp Phe Val Asn Ala Ile Pro Leu Phe Ala Val Asn Gly Gln
180 185 190
Gln Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Val Asn Leu His Leu
195 200 205
Leu Leu Leu Lys Asp Ala Ser Leu Phe Gly Glu Gly Trp Gly Phe Thr
210 215 220
Gln Gly Glu Ile Ser Thr His Tyr Asp Arg Gln Leu Glu Leu Thr Ala
225 230 235 240
Arg Tyr Thr Asn Tyr Cys Glu Thr Trp Tyr Asn Thr Gly Leu Asp Arg
245 250 255
Leu Arg Gly Thr Asn Thr Glu Ser Trp Leu Arg Tyr His Gln Phe Arg
260 265 270
Arg Glu Met Thr Leu Val Val Leu Asp Val Val Ala Leu Phe Pro Tyr
275 280 285
Tyr Asp Val Arg Leu Tyr Pro Thr Gly Ser Asn Pro Gln Leu Thr Arg
290 295 300
Glu Val Tyr Thr Asp Pro Ile Val Phe Asn Pro Pro Ala Asn Val Gly
305 310 315 320
Leu Cys Arg Arg Trp Gly Thr Asn Pro Tyr Asn Thr Phe Ser Glu Leu
325 330 335
Glu Asn Ala Phe Ile Arg Pro Pro His Leu Phe Asp Arg Ile Gln Ser
340 345 350
Leu Ser Ile Ser Ser Asn Arg Phe Pro Val Ser Ser Asn Phe Met Asp
355 360 365
Tyr Trp Ser Gly His Thr Leu Arg Arg Ser Tyr Leu Asn Asp Ser Ala
370 375 380
Val Gln Glu Asp Ser Tyr Gly Leu Ile Thr Thr Thr Arg Ala Thr Ile
385 390 395 400
Asn Pro Gly Val Asp Gly Thr Asn Arg Ile Glu Ser Thr Ala Val Asp
405 410 415
Phe Arg Ser Ala Leu Ile Gly Ile Tyr Gly Val Asn Arg Ala Ser Phe
420 425 430
Val Pro Gly Gly Leu Phe Asn Gly Thr Thr Ser Pro Ala Asn Gly Gly
435 440 445
Cys Arg Asp Leu Tyr Asp Thr Asn Asp Glu Leu Pro Pro Asp Glu Ser
450 455 460
Thr Gly Ser Ser Thr His Arg Leu Ser His Val Thr Phe Phe Ser Phe
465 470 475 480
Gln Thr Asn Gln Ala Gly Ser Ile Ala Asn Ala Gly Ser Val Pro Thr
485 490 495
Tyr Val Trp Thr Arg Arg Asp Val Asp Leu Asn Asn Thr Ile Thr Pro
500 505 510
Asn Arg Ile Thr Gln Leu Pro Leu Val Lys Ala Ser Ala Pro Val Ser
515 520 525
Gly Thr Thr Val Leu Lys Gly Pro Gly Phe Thr Gly Gly Gly Ile Leu
530 535 540
Arg Arg Thr Thr Asn Gly Thr Phe Gly Thr Leu Arg Val Thr Val Asn
545 550 555 560
Ser Pro Leu Thr Gln Gln Tyr Arg Leu Arg Val Arg Phe Ala Ser Thr
565 570 575
Gly Asn Phe Ser Ile Arg Leu Leu Arg Gly Gly Val Ser Ile Gly Asp
580 585 590
Val Arg Leu Gly Ser Thr Met Asn Arg Gly Gln Glu Leu Thr Tyr Glu
595 600 605
Ser Phe Phe Thr Arg Glu Phe Thr Thr Thr Gly Pro Phe Asn Pro Pro
610 615 620
Phe Thr Phe Thr Gln Ala Gln Glu Ile Leu Thr Val Asn Ala Glu Gly
625 630 635 640
Val Ser Thr Gly Gly Glu Tyr Tyr Ile Asp Arg Ile Glu Ile Val Pro
645 650 655
Val Asn Pro Ala Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys
660 665 670
Ala Val Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn
675 680 685
Val Thr Asp Tyr Gln Val Asp Arg Ala Ala Asn Leu Val Ser Cys Leu
690 695 700
Ser Asp Glu Gln Tyr Ser His Asp Lys Lys Met Leu Leu Glu Ala Val
705 710 715 720
Arg Ala Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro
725 730 735
Asp Phe Asn Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser
740 745 750
Asn Gly Val Thr Ile Ser Glu Gly Gly Pro Phe Phe Lys Gly Arg Ala
755 760 765
Leu Gln Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln
770 775 780
Lys Val Asp Ala Ser Val Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp
785 790 795 800
Gly Phe Val Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His
805 810 815
His Lys Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Ser Asp
820 825 830
Thr Tyr Ser Asp Gly Ser Cys Ser Gly Ile Asn Arg Cys Asp Glu Gln
835 840 845
Gln Gln Val Asp Met Gln Leu Asp Ala Glu His His Pro Met Asp Cys
850 855 860
Cys Glu Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly
865 870 875 880
Asp Leu Asn Ala Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val
885 890 895
Arg Thr Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu
900 905 910
Val Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn
915 920 925
Ala Lys Trp Asn Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg
930 935 940
Val Tyr Leu Ala Ala Lys Gln Ala Ile Asn His Leu Phe Val Asp Tyr
945 950 955 960
Gln Asp Gln Gln Leu Asn Pro Glu Ile Gly Leu Ala Glu Ile Asn Glu
965 970 975
Ala Ser Asn Leu Val Lys Ser Ile Ser Gly Val Tyr Ser Asp Thr Leu
980 985 990
Leu Gln Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asp
995 1000 1005
Arg Leu Gln Gln Ala Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val
1010 1015 1020
Gln Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr
1025 1030 1035
Thr Asp Ala Ser Val Gln Gln Asp Gly Ser Thr His Phe Leu Val
1040 1045 1050
Leu Ser His Trp Asp Ala Gln Val Ser Gln Gln Met Arg Val Asn
1055 1060 1065
Leu Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Lys Lys Val Gly
1070 1075 1080
Gly Gly Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Gln
1085 1090 1095
Glu Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp Val Asn Gly Thr
1100 1105 1110
Tyr Val Asn Asp Asn Ser Tyr Ile Thr Lys Glu Val Val Phe Tyr
1115 1120 1125
Pro Glu Thr Lys His Met Trp Val Glu Val Ser Glu Ser Glu Gly
1130 1135 1140
Ser Phe Tyr Ile Asp Ser Ile Glu Phe Ile Glu Thr Gln Glu
1145 1150 1155
<210> 19
<211> 1173
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мутант BT-0068
<400> 19
Met Asn Arg Asn Asn Gln Gly Glu Tyr Glu Ile Ile Asp Ala Ser Thr
1 5 10 15
Cys Gly Cys Ser Ser Asp Asp Val Val Gln Tyr Pro Leu Ala Arg Asp
20 25 30
Pro Asn Ala Ala Phe Gln Asn Met Asn Tyr Lys Asp Tyr Leu Lys Met
35 40 45
Ser Asp Gly Asp Tyr Val Asp Ser Tyr Ile Asn Pro Gly Leu Ser Ile
50 55 60
Gly Arg Arg Asp Val Thr Leu Thr Gly Val Gly Ile Val Ala Leu Ile
65 70 75 80
Val Gly Thr Leu Gly Gly Pro Val Gly Gly Ile Val Thr Gly Leu Ile
85 90 95
Ser Ser Leu Leu Gly Leu Leu Trp Pro Ser Asn Asp Asn Asp Val Trp
100 105 110
Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile Glu Gln Arg Ile Ala
115 120 125
Asp Gln Val Val Arg Asn Ala Leu Asp Asn Leu Thr Gly Leu Arg Asp
130 135 140
Tyr Tyr Asn Gln Tyr Leu Leu Ala Leu Glu Glu Trp Gln Glu Arg Pro
145 150 155 160
Asn Ala Val Arg Ser Thr Leu Val Phe Asn Arg Phe Glu Thr Leu His
165 170 175
Ser His Phe Val Thr Ser Met Pro Ser Phe Gly Ser Gly Pro Gly Ser
180 185 190
Glu Arg Tyr Ala Val Gln Leu Leu Thr Val Tyr Ala Gln Ala Ala Asn
195 200 205
Leu His Leu Leu Leu Leu Arg Asp Ala Asp Ile Tyr Gly Ala Arg Trp
210 215 220
Gly Leu Arg Glu Ser Gln Ile Asp Leu Tyr Phe Asn Glu Leu Gln Asn
225 230 235 240
Arg Thr Arg Asp Tyr Thr Asn His Cys Val Thr Ala Tyr Asn Asn Gly
245 250 255
Leu Glu Glu Ile Arg Gly Thr Ser Pro Ala Ser Trp Leu Arg Tyr His
260 265 270
Gln Phe Arg Arg Glu Thr Thr Leu Ile Ala Leu Asp Leu Val Ala Ile
275 280 285
Phe Pro Tyr Tyr Asn Val Arg Glu Tyr Pro Ile Gly Val Asn Pro Gln
290 295 300
Leu Thr Arg Asp Val Tyr Thr Asp Pro Ile Gly Val Thr Phe Arg Arg
305 310 315 320
Glu Asp Trp Glu Thr Gly Val Glu Cys Arg Pro Trp Val Asn Thr Pro
325 330 335
Tyr Met Ser Phe Ser Asp Leu Glu Asn Ala Ile Ile Arg Pro Pro His
340 345 350
Leu Phe Glu Thr Leu Arg Asn Leu Thr Ile His Thr Gly Arg Tyr Asn
355 360 365
Leu Val Gly Gly Ala Arg Phe Ile Glu Gly Trp Val Gly His Ser Val
370 375 380
Thr Asn Thr Arg Leu Gly Asn Ser Thr Val Phe Thr Ser Asn Tyr Gly
385 390 395 400
Ser Leu Pro Pro Arg Phe Gln Val Phe Asn Phe Thr Asn Phe Asp Val
405 410 415
Tyr Gln Ile Asn Thr Arg Ala Asp Ser Thr Gly Thr Phe Arg Ile Pro
420 425 430
Gly Phe Ala Val Thr Arg Ala Gln Phe Ile Pro Gly Gly Thr Tyr Ser
435 440 445
Val Ala His Arg Asp Pro Gly Ala Cys Gln Gln Asp Tyr Asp Ser Ile
450 455 460
Glu Glu Leu Pro Ser Leu Asp Pro Asp Glu Pro Ile Asn Arg Ser Tyr
465 470 475 480
Ser His Arg Leu Ser His Val Thr Leu Tyr Lys Tyr Thr Leu Ser Asp
485 490 495
Thr Asp Tyr Gly Val Ile Asn Tyr Thr Asp Tyr Gly Ser Met Pro Ala
500 505 510
Tyr Val Trp Thr His Arg Asp Val Asp Leu Thr Asn Thr Ile Thr Ala
515 520 525
Asp Arg Ile Thr Gln Leu Pro Leu Val Lys Ala Ser Thr Leu Pro Ala
530 535 540
Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu
545 550 555 560
Arg Arg Thr Thr Asn Gly Thr Phe Gly Thr Leu His Val Arg Val Asn
565 570 575
Ser Pro Leu Thr Gln Gln Tyr Arg Leu Arg Val Arg Phe Ala Ser Thr
580 585 590
Gly Asn Phe Ser Ile Arg Val Leu Arg Gly Gly Thr Ser Ile Gly Asp
595 600 605
Ala Arg Phe Gly Ser Thr Met Asn Arg Gly Gln Glu Leu Thr Tyr Glu
610 615 620
Ser Phe Val Thr Arg Glu Phe Thr Thr Thr Gly Pro Phe Asn Pro Pro
625 630 635 640
Phe Thr Phe Thr Gln Thr Gln Glu Ile Leu Thr Val Asn Ala Glu Gly
645 650 655
Val Ser Thr Gly Gly Glu Tyr Tyr Ile Asp Ser Ile Glu Ile Val Pro
660 665 670
Val Asn Pro Thr Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys
675 680 685
Ala Val Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn
690 695 700
Val Thr Asp Tyr Gln Val Asp Arg Ala Ala Asn Leu Val Leu Cys Leu
705 710 715 720
Ser Asp Glu Gln Tyr Ala His Asp Lys Lys Met Leu Leu Glu Ala Val
725 730 735
Arg Ala Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro
740 745 750
Asp Phe Asn Glu Ile Asn Ser Thr Glu Asp Ser Gly Trp Lys Thr Ser
755 760 765
Asn Gly Ile Ile Ile Ser Glu Gly Gly Pro Phe Phe Lys Gly Arg Ala
770 775 780
Leu Gln Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln
785 790 795 800
Lys Val Asp Ser Ser Met Leu Lys Pro Tyr Thr Arg Tyr Lys Leu Asp
805 810 815
Gly Phe Val Gln Ser Ser Gln Asp Leu Glu Ile Glu Leu Ile His His
820 825 830
His Lys Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Leu Asp
835 840 845
Thr Tyr Pro Asp Gly Ser Cys Asn Gly Ile Asn Arg Cys Glu Glu Gln
850 855 860
Gln Met Val Asn Ser Gln Leu Glu Thr Glu His His Pro Met Asp Cys
865 870 875 880
Cys Glu Ala Ser Gln Thr His Glu Phe Ser Ser Tyr Ile His Thr Gly
885 890 895
Asp Leu Asn Ala Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Ile
900 905 910
Arg Thr Thr Asp Gly Ser Ala Thr Leu Gly Asn Leu Glu Leu Val Glu
915 920 925
Val Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn
930 935 940
Ala Lys Trp Asn Ala Glu Leu Gly Arg Lys Arg Ala Glu Ala Asp Arg
945 950 955 960
Val Tyr Gln Gly Ala Lys Gln Ala Ile Asn His Leu Phe Val Asp Tyr
965 970 975
Gln Asp Gln Gln Leu Asn Pro Glu Val Gly Leu Ala Glu Ile Ser Glu
980 985 990
Ala Arg Asn Leu Ile Glu Ser Ile Ser Asp Val Tyr Cys Asp Ala Val
995 1000 1005
Leu Arg Ile Pro Gly Ile Asn Tyr Glu Met Tyr Thr Glu Leu Ser
1010 1015 1020
Asn Arg Leu Gln Gln Ala Ala Tyr Leu Tyr Thr Ser Arg Asn Ala
1025 1030 1035
Val Gln Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala
1040 1045 1050
Thr Thr Asp Ala Thr Val Gln Gln Asp Gly Asn Met Tyr Phe Leu
1055 1060 1065
Val Leu Ser His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val
1070 1075 1080
Gln Pro Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Lys Lys Val
1085 1090 1095
Gly Asn Gly Asp Gly Tyr Val Thr Ile Gln Asp Gly Ala His His
1100 1105 1110
Arg Glu Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp Val Asn Gly
1115 1120 1125
Thr His Val Asn Asp Asn Ser Tyr Ile Thr Lys Glu Leu Glu Phe
1130 1135 1140
Tyr Pro Lys Thr Glu His Met Trp Val Glu Val Ser Glu Thr Glu
1145 1150 1155
Gly Thr Phe Tyr Ile Asp Ser Ile Glu Leu Ile Glu Thr Gln Glu
1160 1165 1170
<210> 20
<211> 1179
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Мутант BT-0128
<400> 20
Met Gly Gly Lys Ser Met Asn Arg Asn Asn Gln Gly Glu Tyr Glu Ile
1 5 10 15
Ile Asp Ala Ser Thr Cys Gly Cys Ser Ser Asp Asp Val Val Gln Tyr
20 25 30
Pro Leu Ala Arg Asp Pro Asn Ala Ala Phe Gln Asn Met Asn Tyr Lys
35 40 45
Asp Tyr Leu Lys Met Ser Asp Gly Asp Tyr Val Asp Ser Tyr Ile Asn
50 55 60
Pro Gly Leu Ser Ile Gly Arg Arg Asp Val Thr Leu Thr Gly Val Gly
65 70 75 80
Ile Val Ala Leu Ile Val Gly Thr Leu Gly Gly Pro Val Gly Gly Ile
85 90 95
Val Thr Gly Leu Ile Ser Ser Leu Leu Gly Leu Leu Trp Pro Ser Asn
100 105 110
Asp Asn Asp Val Trp Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile
115 120 125
Glu Gln Arg Ile Ala Asp Gln Val Val Arg Asn Ala Leu Asp Asn Leu
130 135 140
Thr Gly Leu Arg Asp Tyr Tyr Asn Gln Tyr Leu Leu Ala Leu Glu Glu
145 150 155 160
Trp Gln Glu Arg Pro Asn Ala Val Arg Ser Thr Leu Val Phe Asn Arg
165 170 175
Phe Glu Thr Leu His Ser His Phe Val Thr Ser Met Pro Ser Phe Gly
180 185 190
Ser Gly Pro Gly Ser Glu Arg Tyr Ala Val Gln Leu Leu Thr Val Tyr
195 200 205
Ala Gln Ala Ala Asn Leu His Leu Leu Leu Leu Arg Asp Ala Asp Ile
210 215 220
Tyr Gly Ala Arg Trp Gly Leu Arg Glu Ser Gln Ile Asp Leu Tyr Phe
225 230 235 240
Asn Glu Leu Gln Asn Arg Thr Arg Asp Tyr Thr Asn His Cys Val Thr
245 250 255
Ala Tyr Asn Asn Gly Leu Glu Glu Ile Arg Gly Thr Ser Pro Ala Ser
260 265 270
Trp Leu Arg Tyr His Gln Phe Arg Arg Glu Thr Thr Leu Ile Ala Leu
275 280 285
Asp Leu Val Ala Ile Phe Pro Tyr Tyr Asn Val Arg Glu Tyr Pro Ile
290 295 300
Gly Val Asn Pro Gln Leu Thr Arg Asp Val Tyr Thr Asp Pro Ile Gly
305 310 315 320
Val Thr Phe Arg Arg Glu Asp Trp Glu Thr Gly Val Glu Cys Arg Pro
325 330 335
Trp Val Asn Thr Pro Tyr Met Ser Phe Ser Asp Leu Glu Asn Ala Ile
340 345 350
Ile Arg Pro Pro His Leu Phe Glu Thr Leu Arg Asn Leu Thr Ile His
355 360 365
Thr Gly Arg Tyr Asn Leu Val Gly Gly Ala Arg Phe Ile Glu Gly Trp
370 375 380
Val Gly His Ser Val Thr Asn Thr Arg Leu Gly Asn Ser Thr Val Phe
385 390 395 400
Thr Ser Asn Tyr Gly Ser Leu Pro Pro Arg Phe Gln Val Phe Asn Phe
405 410 415
Thr Asn Phe Asp Val Tyr Gln Ile Asn Thr Arg Ala Asp Ser Thr Gly
420 425 430
Thr Phe Arg Ile Pro Gly Phe Ala Val Thr Arg Ala Gln Phe Ile Pro
435 440 445
Gly Gly Thr Tyr Ser Val Ala His Arg Asp Pro Gly Ala Cys Gln Gln
450 455 460
Asp Tyr Asp Ser Ile Glu Glu Leu Pro Ser Leu Asp Pro Asp Glu Pro
465 470 475 480
Ile Asn Arg Ser Tyr Ser His Arg Leu Ser His Val Thr Leu Tyr Lys
485 490 495
Tyr Thr Leu Ser Asp Thr Asp Tyr Gly Val Ile Asn Tyr Thr Asp Tyr
500 505 510
Gly Ser Met Pro Ala Tyr Val Trp Thr His Arg Asp Val Asp Leu Thr
515 520 525
Asn Thr Ile Thr Ala Asp Arg Ile Thr Gln Leu Pro Leu Val Lys Ala
530 535 540
Ser Thr Leu Pro Ala Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr
545 550 555 560
Gly Gly Asp Ile Leu Arg Arg Thr Thr Asn Gly Thr Phe Gly Thr Leu
565 570 575
His Val Arg Val Asn Ser Pro Leu Thr Gln Gln Tyr Arg Leu Arg Val
580 585 590
Arg Phe Ala Ser Thr Gly Asn Phe Ser Ile Arg Val Leu Arg Gly Gly
595 600 605
Thr Ser Ile Gly Asp Ala Arg Phe Gly Ser Thr Met Asn Arg Gly Gln
610 615 620
Glu Leu Thr Tyr Glu Ser Phe Val Thr Arg Glu Phe Thr Thr Thr Gly
625 630 635 640
Pro Phe Asn Pro Pro Phe Thr Phe Thr Gln Thr Gln Glu Ile Leu Thr
645 650 655
Val Asn Ala Glu Gly Val Ser Thr Gly Gly Glu Tyr Tyr Ile Asp Ser
660 665 670
Ile Glu Ile Val Pro Val Asn Pro Thr Arg Glu Ala Glu Glu Asp Leu
675 680 685
Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe Thr Arg Thr Arg Asp
690 695 700
Gly Leu Gln Val Asn Val Thr Asp Tyr Gln Val Asp Gln Ala Ala Asn
705 710 715 720
Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Gly Tyr Asp Lys Lys Met
725 730 735
Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu Ser Arg Glu Arg Asn
740 745 750
Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn Ser Thr Glu Glu Asn
755 760 765
Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser Glu Gly Gly Pro Phe
770 775 780
Tyr Lys Gly Arg Ala Leu Gln Leu Ala Ser Ala Arg Glu Asn Tyr Pro
785 790 795 800
Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu Leu Lys Pro Tyr Thr
805 810 815
Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser Gln Asp Leu Glu Ile
820 825 830
Asp Leu Ile His His His Lys Val His Leu Val Lys Asn Val Pro Asp
835 840 845
Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser Cys Ser Gly Ile Asn
850 855 860
Arg Cys Gln Glu Gln Gln Met Val Asn Ala Gln Leu Glu Thr Glu His
865 870 875 880
His His Pro Met Asp Cys Cys Glu Ala Ala Gln Thr His Glu Phe Ser
885 890 895
Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Ser Val Asp Gln Gly Ile
900 905 910
Trp Ala Ile Phe Lys Val Arg Thr Thr Asp Gly Tyr Ala Thr Leu Gly
915 920 925
Asn Leu Glu Leu Val Glu Val Gly Pro Leu Ser Gly Glu Ser Leu Glu
930 935 940
Arg Glu Gln Arg Asp Asn Thr Lys Trp Ser Ala Glu Leu Gly Arg Lys
945 950 955 960
Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala Lys Gln Ser Ile Asn
965 970 975
His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu Asn Pro Glu Ile Gly
980 985 990
Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val Ala Ser Ile Ser Asp
995 1000 1005
Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly Ile Asn Tyr Glu
1010 1015 1020
Ile Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln Ala Ser Tyr Leu
1025 1030 1035
Tyr Thr Ser Arg Asn Ala Val Gln Asn Gly Asp Phe Asn Asn Gly
1040 1045 1050
Leu Asp Ser Trp Asn Ala Thr Ala Gly Ala Ser Val Gln Gln Asp
1055 1060 1065
Gly Asn Thr His Phe Leu Val Leu Ser His Trp Asp Ala Gln Val
1070 1075 1080
Ser Gln Gln Phe Arg Val Gln Pro Asn Cys Lys Tyr Val Leu Arg
1085 1090 1095
Val Thr Ala Glu Lys Val Gly Gly Gly Asp Gly Tyr Val Thr Ile
1100 1105 1110
Arg Asp Gly Ala His His Thr Glu Thr Leu Thr Phe Asn Ala Cys
1115 1120 1125
Asp Tyr Asp Ile Asn Gly Thr Tyr Val Thr Asp Asn Thr Tyr Leu
1130 1135 1140
Thr Lys Glu Val Ile Phe Tyr Ser His Thr Glu His Met Trp Val
1145 1150 1155
Glu Val Asn Glu Thr Glu Gly Ala Phe His Leu Asp Ser Leu Glu
1160 1165 1170
Phe Val Glu Thr Glu Lys
1175
<210> 21
<211> 26
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Прямой праймер OAR2613a
<400> 21
aaacatgaac cgaaataatc aaaatg 26
<210> 22
<211> 22
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Обратный праймер OAR2615a
<400> 22
atccgtccct tgtgcgtgta aa 22
<210> 23
<211> 30
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Прямой праймер OAR2611a-F
<400> 23
gtttaaacat gaatcgaaat aatcaaaatg 30
<210> 24
<211> 29
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Обратный праймер OAR2612a-R
<400> 24
ggcgcgccct actcttgtgt ttcaataaa 29
<210> 25
<211> 29
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Прямой праймер OAR2768-F
<400> 25
gtttaaacat gaatcaaaat aaacacgga 29
<210> 26
<211> 31
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Обратный праймер OAR2769-R
<400> 26
ggcgcgcctt actgttgggt ttccatgaac t 31
<---
Claims (27)
1. Химерная генетическая конструкция для экспрессии белка, токсичного для совки-ипсилон (Agrotis ipsilon), где конструкция содержит гетерологичный промотор, функционально связанный с молекулой нуклеиновой кислоты, содержащей нуклеотидную последовательность (a) SEQ ID NO: 10; или (b) кодирующую SEQ ID NO: 18; или (с) которая представляет собой синтетическую последовательность на основе (а) или (b), которая имеет кодоны, оптимизированные для экспрессии в трансгенной бактерии или растении.
2. Химерная генетическая конструкция по п. 1, где гетерологичный промотор представляет собой промотор, обеспечивающий экспрессию в растении.
3. Химерная генетическая конструкция по п. 2, где промотор, обеспечивающий экспрессию в растении, выбран из группы, состоящей из промотора убиквитина, cmp, TrpA кукурузы, 5'-UTR гена 9 бактериофага Т3, сахарозосинтетазы 1 кукурузы, алкогольдегидрогеназы 1 кукурузы, светособирающего комплекса кукурузы, белка теплового шока кукурузы, малой субъединицы RuBP карбоксилазы гороха, маннопинсинтазы Ti-плазмиды, нопалинсинтазы Ti-плазмиды, халкон-изомеразы петунии, богатого глицином белка 1 бобов, пататина картофеля, лектина, 35S CaMV и малой субъединицы S-E9 RuBP карбоксилазы.
4. Химерная генетическая конструкция по п. 1, где синтетическая последовательность содержит SEQ ID NO: 10.
5. Синтетическая молекула нуклеиновой кислоты для обеспечения экспрессии белка, токсичного для совки-ипсилон (Agrotis ipsilon), с кодонами, оптимизированными для экспрессии в трансгенной бактерии или растении, где молекула нуклеиновой кислоты (а) содержит последовательность SEQ ID NO: 10; или (b) кодирует аминокислотную последовательность, содержащую SEQ ID NO: 18.
6. Рекомбинантный инсектицидный Cry9C белок, токсичный для совки-ипсилон (Agrotis ipsilon), где рекомбинантный белок содержит аминокислотную последовательность SEQ ID NO: 18.
7. Инсектицидная композиция, токсичная для совки-ипсилон (Agrotis ipsilon), содержащая эффективное количество белка по п. 6.
8. Рекомбинантный вектор для экспрессии белка, содержащий химерную генетическую конструкцию по п. 1.
9. Трансгенная клетка-хозяин для экспрессии инсектицидного белка, который токсичен для совки-ипсилон (Agrotis ipsilon), содержащая химерную генетическую конструкцию по п. 1 или рекомбинантный вектор по п. 8.
10. Трансгенная клетка-хозяин по п. 9, которая представляет собой бактериальную клетку или растительную клетку.
11. Трансгенная клетка-хозяин по п. 10, где бактериальная клетка является представителем рода Bacillus, Clostridium, Xenorhabdus, Photorhabdus, Pasteuria, Escherichia, Pseudomonas, Erwinia, Serratia, Klebsiella, Salmonella, Pasteurella, Xanthomonas, Streptomyces, Rhizobium, Rhodopseudomonas, Methylophilius, Agrobacterium, Acetobacter, Lactobacillus, Arthrobacter, Azotobacter, Leuconostoc или Alcaligenes.
12. Трансгенная клетка Bacillus по п. 11, где клетка Bacillus представляет собой клетку Bacillus thuringiensis.
13. Трансгенная клетка-хозяин по п. 10, где клетка-хозяин представляет собой клетку двудольного растения или клетку однодольного растения.
14. Трансгенная клетка-хозяина по п. 13, где клетка двудольного растения выбрана из группы, состоящей из клетки сои, клетки подсолнечника, клетки томата, клетки культурной разновидности капусты, клетки хлопчатника, клетки сахарной свеклы и клетки табака.
15. Трансгенная клетка-хозяин по п. 13, где клетка однодольного растения выбрана из группы, состоящей из клетки ячменя, клетки маиса, клетки овса, клетки риса, клетки сорго, клетки сахарного тростника и клетки пшеницы.
16. Трансгенное растение для борьбы с совкой-ипсилон (Agrotis ipsilon), содержащее трансгенную клетку-хозяина по любому из пп. 13-15.
17. Трансгенное растение по п. 16, которое представляет собой растение маиса.
18. Трансгенное семя для борьбы с совкой-ипсилон (Agrotis ipsilon), с помощью которого размножают трансгенное растение по любому из пп. 16 или 17, где семя содержит конструкцию по п. 1.
19. Способ получения белка с инсектицидной активностью в отношении совки-ипсилон (Agrotis ipsilon), включающий культивирование клетки-хозяина по п. 9 в условиях, при которых клетка-хозяин продуцирует белок.
20. Способ по п. 19, где клетка-хозяин представляет собой растительную клетку.
21. Способ по п. 20, где растительная клетка представляет собой клетку маиса.
22. Способ по п. 19, где нуклеотидная последовательность кодон-оптимизирована для экспрессии в растении.
23. Способ по п. 22, где белок содержит аминокислотную последовательность SEQ ID NO: 18.
24. Способ получения устойчивого к совке-ипсилон трансгенного растения, включающий введение в растение химерной генетической конструкции по п. 1, где инсектицидный белок экспрессируется в растении, за счет чего растению придается устойчивость к совке-ипсилон (Agrotis ipsilon).
25. Способ по п. 24, где стадию введения осуществляют путем трансформации растения.
26. Способ по п. 24, где стадию введения осуществляют путем скрещивания первого трансгенного растения, содержащего химерную генетическую конструкцию, с отличающимся вторым растением и отбора трансгенного потомства растения, где отобранное потомство растения содержит химерный ген.
27. Способ борьбы с совкой-ипсилон (Agrotis ipsilon), включающий доставку в насекомых эффективного количества белка по п. 6.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462090899P | 2014-12-12 | 2014-12-12 | |
US62/090,899 | 2014-12-12 | ||
PCT/US2015/063610 WO2016094159A1 (en) | 2014-12-12 | 2015-12-03 | Compositions and methods for controlling plant pests |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2017124614A RU2017124614A (ru) | 2019-01-15 |
RU2017124614A3 RU2017124614A3 (ru) | 2019-06-25 |
RU2745322C2 true RU2745322C2 (ru) | 2021-03-23 |
Family
ID=56107966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2017124614A RU2745322C2 (ru) | 2014-12-12 | 2015-12-03 | Композиции и способы контроля вредителей растений |
Country Status (11)
Country | Link |
---|---|
US (4) | US10407693B2 (ru) |
EP (1) | EP3230456B1 (ru) |
CN (2) | CN107109418B (ru) |
AR (1) | AR102882A1 (ru) |
BR (2) | BR112017012495A2 (ru) |
CA (1) | CA2969667A1 (ru) |
MX (2) | MX2017007602A (ru) |
PH (1) | PH12017501018A1 (ru) |
RU (1) | RU2745322C2 (ru) |
UA (1) | UA124758C2 (ru) |
WO (1) | WO2016094159A1 (ru) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016094165A1 (en) | 2014-12-12 | 2016-06-16 | Syngenta Participations Ag | Compositions and methods for controlling plant pests |
CA3043493A1 (en) * | 2016-11-23 | 2018-05-31 | BASF Agricultural Solutions Seed US LLC | Axmi669 and axmi991 toxin genes and methods for their use |
RU2663347C1 (ru) * | 2017-07-12 | 2018-08-03 | Общество с ограниченной ответственностью "Дока-Генные Технологии" | Способ доставки биологически активных макромолекул в клетки растений |
EP3927168A4 (en) * | 2019-02-20 | 2023-02-08 | Syngenta Crop Protection AG | ENGINEERED PESTICIDE PROTEINS AND METHODS TO CONTROL PLANT PESTS |
CN109776659B (zh) * | 2019-03-14 | 2021-01-29 | 中国农业科学院生物技术研究所 | cry2Ah-vp基因在抗黏虫中的应用 |
AU2021224224A1 (en) * | 2020-02-21 | 2022-09-08 | BASF Agricultural Solutions Seed US LLC | Toxin gene and methods for its use |
CN116848249A (zh) * | 2021-01-22 | 2023-10-03 | 先正达生物科技(中国)有限公司 | 夜蛾科、草螟科和螟蛾科有害生物的控制 |
CN116768990B (zh) * | 2023-08-16 | 2023-11-07 | 莱肯生物科技(海南)有限公司 | 一种人工智能辅助生成的杀虫蛋白 |
CN117304266B (zh) * | 2023-11-29 | 2024-01-30 | 深圳市维琪科技股份有限公司 | 一种皮肤处理多肽、组合物及其应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1994024264A1 (en) * | 1993-04-09 | 1994-10-27 | Plant Genetic Systems N.V. | New bacillus thuringiensis strains and their insecticidal proteins |
RU2106409C1 (ru) * | 1990-03-20 | 1998-03-10 | Экоджен Инк. | Выделенный и очищенный фрагмент днк cry iiic, токсичный для жесткокрылых белок cry iiic, инсектицидная композиция для борьбы с жесткокрылыми насекомыми (варианты), штамм бактерий bacillus thuringiensis - продуцент токсичного для жесткокрылых белка cry iiic (варианты), токсичный для жесткокрылых белок, способ борьбы с жесткокрылыми насекомыми |
WO2001021821A2 (en) * | 1999-09-17 | 2001-03-29 | Aventis Cropscience N.V. | Insect-resistant rice plants |
WO2013134734A2 (en) * | 2012-03-09 | 2013-09-12 | Vestaron Corporation | Toxic peptide production, peptide expression in plants and combinations of cysteine rich peptides |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US788471A (en) | 1904-07-06 | 1905-04-25 | W H Flowers | Bale-tie buckle. |
DE69333893T2 (de) * | 1992-08-27 | 2006-07-13 | Bayer Bioscience N.V. | Bacillus thuringiensis und dessen insektizide proteine |
US6369213B1 (en) * | 1996-07-01 | 2002-04-09 | Mycogen Corporation | Toxins active against pests |
CA2259142A1 (en) * | 1996-07-01 | 1998-01-08 | Mycogen Corporation | Bacillus thuringiensis toxins active against noctuidae pests |
BR0014516A (pt) * | 1999-09-15 | 2002-07-02 | Monsanto Technology Llc | Composições e métodos de uso de delta-endotoxina do bacilo thuringiensis ativo de lepidopteran |
AU2001259260A1 (en) | 2000-05-15 | 2001-11-26 | Monsanto Technology Llc | Polypeptide composionns toxic to anthonomus insects, and use thereof |
WO2005066202A2 (en) * | 2003-12-22 | 2005-07-21 | E.I. Du Pont De Nemours And Company | Bacillus cry9 family members |
KR101156893B1 (ko) * | 2005-08-31 | 2012-06-21 | 몬산토 테크놀로지 엘엘씨 | 살충 단백질을 암호화하는 뉴클레오티드 서열들 |
CA3008307C (en) | 2008-06-25 | 2020-12-15 | Athenix Corp. | Toxin genes and methods for their use |
WO2012038480A2 (en) * | 2010-09-22 | 2012-03-29 | Bayer Cropscience Ag | Use of biological or chemical control agents for controlling insects and nematodes in resistant crops |
CN111560385B (zh) * | 2013-12-09 | 2023-11-28 | 巴斯夫农业解决方案种子美国有限责任公司 | Axmi477、axmi482、axmi486和axmi525毒素基因及使用方法 |
-
2015
- 2015-12-03 CN CN201580067474.0A patent/CN107109418B/zh active Active
- 2015-12-03 RU RU2017124614A patent/RU2745322C2/ru active
- 2015-12-03 BR BR112017012495-5A patent/BR112017012495A2/pt not_active Application Discontinuation
- 2015-12-03 WO PCT/US2015/063610 patent/WO2016094159A1/en active Application Filing
- 2015-12-03 BR BR122018075074-0A patent/BR122018075074B1/pt not_active IP Right Cessation
- 2015-12-03 UA UAA201707199A patent/UA124758C2/uk unknown
- 2015-12-03 EP EP15867122.2A patent/EP3230456B1/en active Active
- 2015-12-03 CN CN202110747274.7A patent/CN113736809A/zh active Pending
- 2015-12-03 MX MX2017007602A patent/MX2017007602A/es unknown
- 2015-12-03 AR ARP150103944A patent/AR102882A1/es unknown
- 2015-12-03 CA CA2969667A patent/CA2969667A1/en active Pending
- 2015-12-03 US US15/534,074 patent/US10407693B2/en active Active
-
2017
- 2017-06-01 PH PH12017501018A patent/PH12017501018A1/en unknown
- 2017-06-09 MX MX2023000046A patent/MX2023000046A/es unknown
-
2019
- 2019-07-29 US US16/524,873 patent/US10612039B2/en active Active
-
2020
- 2020-02-25 US US16/799,912 patent/US11261459B2/en active Active
-
2022
- 2022-01-19 US US17/578,620 patent/US11680272B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2106409C1 (ru) * | 1990-03-20 | 1998-03-10 | Экоджен Инк. | Выделенный и очищенный фрагмент днк cry iiic, токсичный для жесткокрылых белок cry iiic, инсектицидная композиция для борьбы с жесткокрылыми насекомыми (варианты), штамм бактерий bacillus thuringiensis - продуцент токсичного для жесткокрылых белка cry iiic (варианты), токсичный для жесткокрылых белок, способ борьбы с жесткокрылыми насекомыми |
WO1994024264A1 (en) * | 1993-04-09 | 1994-10-27 | Plant Genetic Systems N.V. | New bacillus thuringiensis strains and their insecticidal proteins |
WO2001021821A2 (en) * | 1999-09-17 | 2001-03-29 | Aventis Cropscience N.V. | Insect-resistant rice plants |
WO2013134734A2 (en) * | 2012-03-09 | 2013-09-12 | Vestaron Corporation | Toxic peptide production, peptide expression in plants and combinations of cysteine rich peptides |
Non-Patent Citations (1)
Title |
---|
База данных: UniProtKB/Swiss-Prot: Q45733.1, 01.10.2014. * |
Also Published As
Publication number | Publication date |
---|---|
US10612039B2 (en) | 2020-04-07 |
PH12017501018A1 (en) | 2017-12-11 |
EP3230456A4 (en) | 2018-10-17 |
EP3230456B1 (en) | 2024-05-22 |
CN107109418A (zh) | 2017-08-29 |
MX2023000046A (es) | 2023-02-01 |
CA2969667A1 (en) | 2016-06-09 |
CN107109418B (zh) | 2021-07-16 |
US11261459B2 (en) | 2022-03-01 |
WO2016094159A1 (en) | 2016-06-16 |
AR102882A1 (es) | 2017-03-29 |
US20190345514A1 (en) | 2019-11-14 |
US11680272B2 (en) | 2023-06-20 |
US20170335340A1 (en) | 2017-11-23 |
CN113736809A (zh) | 2021-12-03 |
EP3230456A1 (en) | 2017-10-18 |
BR112017012495A2 (pt) | 2018-04-10 |
BR122018075074B1 (pt) | 2022-08-09 |
RU2017124614A3 (ru) | 2019-06-25 |
US20200181641A1 (en) | 2020-06-11 |
UA124758C2 (uk) | 2021-11-17 |
US10407693B2 (en) | 2019-09-10 |
US20220135999A1 (en) | 2022-05-05 |
RU2017124614A (ru) | 2019-01-15 |
MX2017007602A (es) | 2017-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11578105B2 (en) | Compositions and methods for controlling plant pests | |
RU2745322C2 (ru) | Композиции и способы контроля вредителей растений | |
RU2759224C2 (ru) | Композиции и способы контроля вредителей растений | |
US11060105B2 (en) | Compositions and methods for controlling plant pests | |
WO2017146899A1 (en) | Compositions and methods for controlling plant pests | |
US20220251599A1 (en) | Compositions and Methods for Control of Insect Pests | |
WO2020050905A1 (en) | Compositions and methods for controlling plant pests | |
US20220322680A1 (en) | Compositions and methods for controlling plant pests |