KR101854478B1 - 변형 CRY1Ca 살곤충 CRY 단백질 - Google Patents
변형 CRY1Ca 살곤충 CRY 단백질 Download PDFInfo
- Publication number
- KR101854478B1 KR101854478B1 KR1020127018297A KR20127018297A KR101854478B1 KR 101854478 B1 KR101854478 B1 KR 101854478B1 KR 1020127018297 A KR1020127018297 A KR 1020127018297A KR 20127018297 A KR20127018297 A KR 20127018297A KR 101854478 B1 KR101854478 B1 KR 101854478B1
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- glu
- asn
- gly
- arg
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 337
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 277
- 230000000749 insecticidal effect Effects 0.000 title claims abstract description 20
- 241000238631 Hexapoda Species 0.000 claims abstract description 115
- 238000000034 method Methods 0.000 claims abstract description 74
- 150000001413 amino acids Chemical class 0.000 claims description 77
- 238000012217 deletion Methods 0.000 claims description 46
- 230000037430 deletion Effects 0.000 claims description 46
- 108020004705 Codon Proteins 0.000 claims description 26
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 19
- 108010021466 Mutant Proteins Proteins 0.000 claims description 17
- 102000008300 Mutant Proteins Human genes 0.000 claims description 17
- 230000000694 effects Effects 0.000 claims description 17
- 229930182817 methionine Natural products 0.000 claims description 17
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 16
- 108010060231 Insect Proteins Proteins 0.000 claims description 13
- 239000004471 Glycine Substances 0.000 claims description 10
- 210000004899 c-terminal region Anatomy 0.000 claims description 7
- 230000000368 destabilizing effect Effects 0.000 claims description 7
- -1 glycine amino acid Chemical class 0.000 claims description 5
- 230000014621 translational initiation Effects 0.000 claims description 5
- 244000045195 Cicer arietinum Species 0.000 claims description 2
- 235000010523 Cicer arietinum Nutrition 0.000 claims description 2
- 240000000111 Saccharum officinarum Species 0.000 claims 1
- 235000007201 Saccharum officinarum Nutrition 0.000 claims 1
- 230000000977 initiatory effect Effects 0.000 claims 1
- 239000003053 toxin Substances 0.000 abstract description 172
- 231100000765 toxin Toxicity 0.000 abstract description 172
- 239000012634 fragment Substances 0.000 abstract description 83
- 230000009261 transgenic effect Effects 0.000 abstract description 40
- 241000607479 Yersinia pestis Species 0.000 abstract description 33
- 150000007523 nucleic acids Chemical class 0.000 abstract description 16
- 102000039446 nucleic acids Human genes 0.000 abstract description 15
- 108020004707 nucleic acids Proteins 0.000 abstract description 15
- YZZUQHDYJXWFNG-VVEMGJRMSA-N (1S,2R,3S,3'S,5R,6S,7R,8S,9R,12R)-2,8-dihydroxy-3'-[(1S)-1-hydroxyethyl]-7-methyl-12-prop-1-en-2-ylspiro[4,10-dioxatetracyclo[7.2.1.02,7.03,5]dodecane-6,5'-oxolane]-2',11-dione Chemical compound C[C@@H]([C@@H]1C[C@]2([C@H]3[C@H](O3)[C@@]4([C@]2([C@@H]([C@H]5[C@H]([C@@H]4C(=O)O5)C(=C)C)O)C)O)OC1=O)O YZZUQHDYJXWFNG-VVEMGJRMSA-N 0.000 abstract description 8
- YZZUQHDYJXWFNG-UHFFFAOYSA-N Pretoxin Natural products CC(O)C1CC2(OC1=O)C1OC1C1(O)C3C(C(OC3=O)C(O)C21C)C(C)=C YZZUQHDYJXWFNG-UHFFFAOYSA-N 0.000 abstract description 2
- 108091006116 chimeric peptides Proteins 0.000 abstract description 2
- 235000018102 proteins Nutrition 0.000 description 253
- 108700012359 toxins Proteins 0.000 description 184
- 241000196324 Embryophyta Species 0.000 description 122
- 235000001014 amino acid Nutrition 0.000 description 77
- 240000008042 Zea mays Species 0.000 description 75
- 229940024606 amino acid Drugs 0.000 description 75
- 108090000765 processed proteins & peptides Proteins 0.000 description 74
- 108020004414 DNA Proteins 0.000 description 63
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 59
- 210000004027 cell Anatomy 0.000 description 57
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 55
- 235000009973 maize Nutrition 0.000 description 55
- 239000000523 sample Substances 0.000 description 41
- 108091034117 Oligonucleotide Proteins 0.000 description 40
- 102000004196 processed proteins & peptides Human genes 0.000 description 39
- 238000003776 cleavage reaction Methods 0.000 description 37
- 230000007017 scission Effects 0.000 description 36
- 241000880493 Leptailurus serval Species 0.000 description 35
- 125000003275 alpha amino acid group Chemical group 0.000 description 35
- 108091026890 Coding region Proteins 0.000 description 33
- 108090000631 Trypsin Proteins 0.000 description 28
- 102000004142 Trypsin Human genes 0.000 description 28
- 235000005911 diet Nutrition 0.000 description 28
- 239000012588 trypsin Substances 0.000 description 28
- 108091028043 Nucleic acid sequence Proteins 0.000 description 27
- 230000037213 diet Effects 0.000 description 27
- 238000009396 hybridization Methods 0.000 description 26
- 239000013612 plasmid Substances 0.000 description 26
- 239000000047 product Substances 0.000 description 26
- 241000894007 species Species 0.000 description 25
- 102000035195 Peptidases Human genes 0.000 description 24
- 108091005804 Peptidases Proteins 0.000 description 24
- 239000004365 Protease Substances 0.000 description 24
- 210000003000 inclusion body Anatomy 0.000 description 24
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 23
- 230000014509 gene expression Effects 0.000 description 23
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 22
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 22
- 230000009466 transformation Effects 0.000 description 19
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 18
- 108020001507 fusion proteins Proteins 0.000 description 18
- 102000037865 fusion proteins Human genes 0.000 description 18
- 239000002609 medium Substances 0.000 description 18
- 108020003175 receptors Proteins 0.000 description 18
- 102000005962 receptors Human genes 0.000 description 18
- 241000589158 Agrobacterium Species 0.000 description 17
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 17
- 108010077245 asparaginyl-proline Proteins 0.000 description 17
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 17
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 16
- 239000008188 pellet Substances 0.000 description 16
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 15
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 15
- 238000004166 bioassay Methods 0.000 description 15
- 239000000872 buffer Substances 0.000 description 15
- 239000013598 vector Substances 0.000 description 15
- 241000589516 Pseudomonas Species 0.000 description 14
- 108010013835 arginine glutamate Proteins 0.000 description 14
- 108010038633 aspartylglutamate Proteins 0.000 description 14
- 108010050848 glycylleucine Proteins 0.000 description 14
- 230000009036 growth inhibition Effects 0.000 description 14
- 239000002773 nucleotide Substances 0.000 description 14
- 125000003729 nucleotide group Chemical group 0.000 description 14
- 229920001184 polypeptide Polymers 0.000 description 14
- 239000000243 solution Substances 0.000 description 14
- 238000006467 substitution reaction Methods 0.000 description 14
- 238000012360 testing method Methods 0.000 description 14
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 14
- 108090000317 Chymotrypsin Proteins 0.000 description 13
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 13
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 13
- 229960002376 chymotrypsin Drugs 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 108010061238 threonyl-glycine Proteins 0.000 description 13
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 12
- 230000027455 binding Effects 0.000 description 12
- 108010051242 phenylalanylserine Proteins 0.000 description 12
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 11
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 11
- 238000013461 design Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 11
- 239000000499 gel Substances 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 11
- 244000005700 microbiome Species 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- 239000011780 sodium chloride Substances 0.000 description 11
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 10
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 10
- 108700026244 Open Reading Frames Proteins 0.000 description 10
- 241001147398 Ostrinia nubilalis Species 0.000 description 10
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 10
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 10
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 10
- 230000006378 damage Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 10
- 241000699666 Mus <mouse, genus> Species 0.000 description 9
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 9
- 108010093581 aspartyl-proline Proteins 0.000 description 9
- 230000004927 fusion Effects 0.000 description 9
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 9
- 230000002363 herbicidal effect Effects 0.000 description 9
- 239000004009 herbicide Substances 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 239000011148 porous material Substances 0.000 description 9
- 210000002966 serum Anatomy 0.000 description 9
- 239000006228 supernatant Substances 0.000 description 9
- 238000005406 washing Methods 0.000 description 9
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 8
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 8
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 8
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 8
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 8
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 8
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 8
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 8
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 8
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 8
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 8
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 8
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 8
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 8
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 8
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 8
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 8
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 8
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 8
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 8
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 8
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 8
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 8
- 238000010367 cloning Methods 0.000 description 8
- 238000011161 development Methods 0.000 description 8
- 230000018109 developmental process Effects 0.000 description 8
- 108010054813 diprotin B Proteins 0.000 description 8
- 239000002158 endotoxin Substances 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 8
- 108010089804 glycyl-threonine Proteins 0.000 description 8
- 108010087823 glycyltyrosine Proteins 0.000 description 8
- 238000011534 incubation Methods 0.000 description 8
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 108010056582 methionylglutamic acid Proteins 0.000 description 8
- 108010029020 prolylglycine Proteins 0.000 description 8
- 108091008146 restriction endonucleases Proteins 0.000 description 8
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 8
- 108020005345 3' Untranslated Regions Proteins 0.000 description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 7
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 7
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 7
- 241000122106 Diatraea saccharalis Species 0.000 description 7
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 7
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 7
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 7
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 7
- 230000004913 activation Effects 0.000 description 7
- 108010005233 alanylglutamic acid Proteins 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 229940098773 bovine serum albumin Drugs 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 108010040030 histidinoalanine Proteins 0.000 description 7
- 239000002596 immunotoxin Substances 0.000 description 7
- 239000002919 insect venom Substances 0.000 description 7
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000002797 proteolythic effect Effects 0.000 description 7
- 108010048818 seryl-histidine Proteins 0.000 description 7
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 6
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 6
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 6
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 6
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 6
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 6
- 102000005600 Cathepsins Human genes 0.000 description 6
- 108010084457 Cathepsins Proteins 0.000 description 6
- 238000002965 ELISA Methods 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 6
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 6
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 6
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 6
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 6
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 6
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 6
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 6
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 6
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 6
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 6
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 6
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 6
- 206010035226 Plasma cell myeloma Diseases 0.000 description 6
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 6
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 6
- 101710096655 Probable acetoacetate decarboxylase 1 Proteins 0.000 description 6
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 6
- 241000256251 Spodoptera frugiperda Species 0.000 description 6
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 6
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 6
- CKKFTIQYURNSEI-IHRRRGAJSA-N Tyr-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CKKFTIQYURNSEI-IHRRRGAJSA-N 0.000 description 6
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 6
- 108700041896 Zea mays Ubi-1 Proteins 0.000 description 6
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 6
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 6
- 230000004071 biological effect Effects 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 229940088598 enzyme Drugs 0.000 description 6
- 108010084760 glycyl-tyrosyl-glycyl-aspartate Proteins 0.000 description 6
- 108010081551 glycylphenylalanine Proteins 0.000 description 6
- 230000012010 growth Effects 0.000 description 6
- 108010025306 histidylleucine Proteins 0.000 description 6
- 230000003053 immunization Effects 0.000 description 6
- 238000002649 immunization Methods 0.000 description 6
- 230000002163 immunogen Effects 0.000 description 6
- 230000006698 induction Effects 0.000 description 6
- 108010078274 isoleucylvaline Proteins 0.000 description 6
- 230000001418 larval effect Effects 0.000 description 6
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 201000000050 myeloid neoplasm Diseases 0.000 description 6
- 108010018625 phenylalanylarginine Proteins 0.000 description 6
- 150000003839 salts Chemical class 0.000 description 6
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- 238000010561 standard procedure Methods 0.000 description 6
- 239000000725 suspension Substances 0.000 description 6
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 108010084932 tryptophyl-proline Proteins 0.000 description 6
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 6
- 108010076441 Ala-His-His Proteins 0.000 description 5
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 5
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 5
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 5
- 101150102464 Cry1 gene Proteins 0.000 description 5
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 5
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 229920002148 Gellan gum Polymers 0.000 description 5
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 5
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 5
- 241000589989 Helicobacter Species 0.000 description 5
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 5
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 5
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 5
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 5
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 5
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 5
- 108010066427 N-valyltryptophan Proteins 0.000 description 5
- 241000283973 Oryctolagus cuniculus Species 0.000 description 5
- 240000007594 Oryza sativa Species 0.000 description 5
- 235000007164 Oryza sativa Nutrition 0.000 description 5
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 5
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 5
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 5
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 5
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 5
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 5
- 102000012479 Serine Proteases Human genes 0.000 description 5
- 108010022999 Serine Proteases Proteins 0.000 description 5
- 238000002105 Southern blotting Methods 0.000 description 5
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 5
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 5
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 5
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 5
- WFTKOJGOOUJLJV-VKOGCVSHSA-N Val-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C)=CNC2=C1 WFTKOJGOOUJLJV-VKOGCVSHSA-N 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 238000012512 characterization method Methods 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 231100000433 cytotoxic Toxicity 0.000 description 5
- 230000001472 cytotoxic effect Effects 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 239000012153 distilled water Substances 0.000 description 5
- 235000013601 eggs Nutrition 0.000 description 5
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 5
- 230000037406 food intake Effects 0.000 description 5
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 5
- 238000003119 immunoblot Methods 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 239000003112 inhibitor Substances 0.000 description 5
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 235000009566 rice Nutrition 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 239000011782 vitamin Substances 0.000 description 5
- 229940088594 vitamin Drugs 0.000 description 5
- 235000013343 vitamin Nutrition 0.000 description 5
- 229930003231 vitamin Natural products 0.000 description 5
- 229920001817 Agar Polymers 0.000 description 4
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 4
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 4
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 4
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 4
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 4
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 4
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 4
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 4
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 4
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 4
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 4
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 4
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 4
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 4
- BIOCIVSVEDFKDJ-GUBZILKMSA-N Arg-Arg-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O BIOCIVSVEDFKDJ-GUBZILKMSA-N 0.000 description 4
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 4
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 4
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 4
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 4
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 4
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 4
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 4
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 4
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 4
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 4
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 4
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 4
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 4
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 4
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 4
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 4
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 4
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 4
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 4
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 4
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 4
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 4
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 4
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 4
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 4
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 4
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 4
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 4
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 4
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 4
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 4
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 4
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 4
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 4
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 4
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 4
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 4
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 4
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 4
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 4
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 4
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 4
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 4
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 4
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 4
- GFGUPLIETCNQGF-DCAQKATOSA-N Asn-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O GFGUPLIETCNQGF-DCAQKATOSA-N 0.000 description 4
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 4
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 4
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 4
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 4
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 4
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 4
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 4
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 4
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 4
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 4
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 4
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 4
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 4
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 4
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 4
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 4
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 4
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 4
- CMCIMCAQIULNDJ-CIUDSAMLSA-N Asp-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N CMCIMCAQIULNDJ-CIUDSAMLSA-N 0.000 description 4
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 4
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 4
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 4
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 4
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 4
- KACWACLNYLSVCA-VHWLVUOQSA-N Asp-Trp-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KACWACLNYLSVCA-VHWLVUOQSA-N 0.000 description 4
- CXEFNHOVIIDHFU-IHPCNDPISA-N Asp-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC(=O)O)N CXEFNHOVIIDHFU-IHPCNDPISA-N 0.000 description 4
- 108700010070 Codon Usage Proteins 0.000 description 4
- 229920000742 Cotton Polymers 0.000 description 4
- 101710151559 Crystal protein Proteins 0.000 description 4
- PLBJMUUEGBBHRH-ZLUOBGJFSA-N Cys-Ala-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLBJMUUEGBBHRH-ZLUOBGJFSA-N 0.000 description 4
- DEVDFMRWZASYOF-ZLUOBGJFSA-N Cys-Asn-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DEVDFMRWZASYOF-ZLUOBGJFSA-N 0.000 description 4
- XVLMKWWVBNESPX-XVYDVKMFSA-N Cys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N XVLMKWWVBNESPX-XVYDVKMFSA-N 0.000 description 4
- ODDOYXKAHLKKQY-MMWGEVLESA-N Cys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N ODDOYXKAHLKKQY-MMWGEVLESA-N 0.000 description 4
- DXSBGVKEPHDOTD-UBHSHLNASA-N Cys-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N DXSBGVKEPHDOTD-UBHSHLNASA-N 0.000 description 4
- CLEFUAZULXANBU-MELADBBJSA-N Cys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CS)N)C(=O)O CLEFUAZULXANBU-MELADBBJSA-N 0.000 description 4
- 102000005927 Cysteine Proteases Human genes 0.000 description 4
- 108010005843 Cysteine Proteases Proteins 0.000 description 4
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 4
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 4
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 4
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 4
- FGWRYRAVBVOHIB-XIRDDKMYSA-N Gln-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O FGWRYRAVBVOHIB-XIRDDKMYSA-N 0.000 description 4
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 4
- OACQOWPRWGNKTP-AVGNSLFASA-N Gln-Tyr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O OACQOWPRWGNKTP-AVGNSLFASA-N 0.000 description 4
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 4
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 4
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 4
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 4
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 4
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 4
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 4
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 4
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 4
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 4
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 4
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 4
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 4
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 4
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 4
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 4
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 4
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 4
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 4
- VNBNZUAPOYGRDB-ZDLURKLDSA-N Gly-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)O VNBNZUAPOYGRDB-ZDLURKLDSA-N 0.000 description 4
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 4
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 4
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 4
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 4
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 4
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 4
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 4
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 4
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 4
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 4
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 4
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 4
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 4
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 4
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 4
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 4
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 4
- 241000219146 Gossypium Species 0.000 description 4
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 4
- OZBDSFBWIDPVDA-BZSNNMDCSA-N His-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N OZBDSFBWIDPVDA-BZSNNMDCSA-N 0.000 description 4
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 4
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 4
- KDDKJKKQODQQBR-NHCYSSNCSA-N His-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KDDKJKKQODQQBR-NHCYSSNCSA-N 0.000 description 4
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 4
- PJLLMGWWINYQPB-PEFMBERDSA-N Ile-Asn-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PJLLMGWWINYQPB-PEFMBERDSA-N 0.000 description 4
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 4
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 4
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 4
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 4
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 4
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 4
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 4
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 4
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 4
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 4
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 4
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 4
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 4
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 4
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 4
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 4
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 4
- WRDTXMBPHMBGIB-STECZYCISA-N Ile-Tyr-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 WRDTXMBPHMBGIB-STECZYCISA-N 0.000 description 4
- QSXSHZIRKTUXNG-STECZYCISA-N Ile-Val-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QSXSHZIRKTUXNG-STECZYCISA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 4
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 4
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 4
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 4
- FEHQLKKBVJHSEC-SZMVWBNQSA-N Leu-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FEHQLKKBVJHSEC-SZMVWBNQSA-N 0.000 description 4
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 4
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 4
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 4
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 4
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 4
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 4
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 4
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 4
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 4
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 4
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 4
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 4
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 4
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 4
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 4
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 4
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 4
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 4
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 4
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 4
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 4
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 4
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 4
- KKFVKBWCXXLKIK-AVGNSLFASA-N Lys-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCCN)N KKFVKBWCXXLKIK-AVGNSLFASA-N 0.000 description 4
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 4
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 4
- WAAZECNCPVGPIV-RHYQMDGZSA-N Lys-Thr-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O WAAZECNCPVGPIV-RHYQMDGZSA-N 0.000 description 4
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 4
- CHQWUYSNAOABIP-ZPFDUUQYSA-N Met-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N CHQWUYSNAOABIP-ZPFDUUQYSA-N 0.000 description 4
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 4
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 4
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 4
- 244000061176 Nicotiana tabacum Species 0.000 description 4
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 4
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 4
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 4
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 4
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 4
- LXUJDHOKVUYHRC-KKUMJFAQSA-N Phe-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N LXUJDHOKVUYHRC-KKUMJFAQSA-N 0.000 description 4
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 4
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 4
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 4
- MRWOVVNKSXXLRP-IHPCNDPISA-N Phe-Ser-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MRWOVVNKSXXLRP-IHPCNDPISA-N 0.000 description 4
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 4
- VGTJSEYTVMAASM-RPTUDFQQSA-N Phe-Thr-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VGTJSEYTVMAASM-RPTUDFQQSA-N 0.000 description 4
- IPVPGAADZXRZSH-RNXOBYDBSA-N Phe-Tyr-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IPVPGAADZXRZSH-RNXOBYDBSA-N 0.000 description 4
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 4
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 4
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 4
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 4
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 4
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 4
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 4
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 4
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 4
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 4
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 4
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 4
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 4
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 4
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 4
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 4
- 241000235070 Saccharomyces Species 0.000 description 4
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 4
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 4
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 4
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 4
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 4
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 4
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 4
- DGPGKMKUNGKHPK-QEJZJMRPSA-N Ser-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGPGKMKUNGKHPK-QEJZJMRPSA-N 0.000 description 4
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 4
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 4
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 4
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 4
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 4
- JAWGSPUJAXYXJA-IHRRRGAJSA-N Ser-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=CC=C1 JAWGSPUJAXYXJA-IHRRRGAJSA-N 0.000 description 4
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 4
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 4
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 4
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 4
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 4
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 4
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 4
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- 108700005078 Synthetic Genes Proteins 0.000 description 4
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 4
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 4
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 4
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 4
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 4
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 4
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 4
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 4
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 4
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 4
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 4
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 4
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 4
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 4
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 4
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 4
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 4
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 4
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 4
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 4
- 108091036066 Three prime untranslated region Proteins 0.000 description 4
- DNUJCLUFRGGSDJ-YLVFBTJISA-N Trp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DNUJCLUFRGGSDJ-YLVFBTJISA-N 0.000 description 4
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 4
- YDTKYBHPRULROG-LTHWPDAASA-N Trp-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YDTKYBHPRULROG-LTHWPDAASA-N 0.000 description 4
- GIAMKIPJSRZVJB-IHPCNDPISA-N Trp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GIAMKIPJSRZVJB-IHPCNDPISA-N 0.000 description 4
- XGFOXYJQBRTJPO-PJODQICGSA-N Trp-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XGFOXYJQBRTJPO-PJODQICGSA-N 0.000 description 4
- MPYZGXUYLNPSNF-NAZCDGGXSA-N Trp-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O MPYZGXUYLNPSNF-NAZCDGGXSA-N 0.000 description 4
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 4
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 4
- DWJQKEZKLQCHKO-SRVKXCTJSA-N Tyr-Asn-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O DWJQKEZKLQCHKO-SRVKXCTJSA-N 0.000 description 4
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 4
- NGALWFGCOMHUSN-AVGNSLFASA-N Tyr-Gln-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NGALWFGCOMHUSN-AVGNSLFASA-N 0.000 description 4
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 4
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 4
- WPXKRJVHBXYLDT-JUKXBJQTSA-N Tyr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPXKRJVHBXYLDT-JUKXBJQTSA-N 0.000 description 4
- SOEGLGLDSUHWTI-STECZYCISA-N Tyr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 SOEGLGLDSUHWTI-STECZYCISA-N 0.000 description 4
- BCOBSVIZMQXKFY-KKUMJFAQSA-N Tyr-Ser-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O BCOBSVIZMQXKFY-KKUMJFAQSA-N 0.000 description 4
- NUQZCPSZHGIYTA-HKUYNNGSSA-N Tyr-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NUQZCPSZHGIYTA-HKUYNNGSSA-N 0.000 description 4
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 4
- JOQSQZFKFYJKKJ-GUBZILKMSA-N Val-Arg-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JOQSQZFKFYJKKJ-GUBZILKMSA-N 0.000 description 4
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 4
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 4
- NWDOPHYLSORNEX-QXEWZRGKSA-N Val-Asn-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N NWDOPHYLSORNEX-QXEWZRGKSA-N 0.000 description 4
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 4
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 4
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 4
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 4
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 4
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 4
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 4
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 4
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 4
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 4
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 4
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 4
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 4
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 4
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 4
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 4
- QHSSPPHOHJSTML-HOCLYGCPSA-N Val-Trp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N QHSSPPHOHJSTML-HOCLYGCPSA-N 0.000 description 4
- KJFBXCFOPAKPTM-BZSNNMDCSA-N Val-Trp-Val Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 KJFBXCFOPAKPTM-BZSNNMDCSA-N 0.000 description 4
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 4
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 239000008272 agar Substances 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 4
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 108010068265 aspartyltyrosine Proteins 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- 108010060199 cysteinylproline Proteins 0.000 description 4
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 4
- 210000002257 embryonic structure Anatomy 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- 108010020688 glycylhistidine Proteins 0.000 description 4
- 108010084389 glycyltryptophan Proteins 0.000 description 4
- 210000004408 hybridoma Anatomy 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 239000012139 lysis buffer Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000002953 phosphate buffered saline Substances 0.000 description 4
- 231100000572 poisoning Toxicity 0.000 description 4
- 230000000607 poisoning effect Effects 0.000 description 4
- 108010077112 prolyl-proline Proteins 0.000 description 4
- 108010079317 prolyl-tyrosine Proteins 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 230000006337 proteolytic cleavage Effects 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 239000011734 sodium Substances 0.000 description 4
- 239000002689 soil Substances 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 4
- 231100000331 toxic Toxicity 0.000 description 4
- 230000002588 toxic effect Effects 0.000 description 4
- 231100000419 toxicity Toxicity 0.000 description 4
- 230000001988 toxicity Effects 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 108010038745 tryptophylglycine Proteins 0.000 description 4
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 4
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 3
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 3
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 3
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 3
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 3
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 3
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 3
- CTAPSNCVKPOOSM-KKUMJFAQSA-N Arg-Tyr-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CTAPSNCVKPOOSM-KKUMJFAQSA-N 0.000 description 3
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 3
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 3
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 3
- 108700003918 Bacillus Thuringiensis insecticidal crystal Proteins 0.000 description 3
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 3
- 235000006008 Brassica napus var napus Nutrition 0.000 description 3
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 3
- 241001301148 Brassica rapa subsp. oleifera Species 0.000 description 3
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 3
- FNXOZWPPOJRBRE-XGEHTFHBSA-N Cys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)N)O FNXOZWPPOJRBRE-XGEHTFHBSA-N 0.000 description 3
- 241000489947 Diabrotica virgifera virgifera Species 0.000 description 3
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 3
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 3
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 3
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 3
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 3
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 3
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 3
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 3
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 3
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 3
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 3
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 3
- YKLOMBNBQUTJDT-HVTMNAMFSA-N Ile-His-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YKLOMBNBQUTJDT-HVTMNAMFSA-N 0.000 description 3
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 3
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 3
- 241000258916 Leptinotarsa decemlineata Species 0.000 description 3
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 3
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 3
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 3
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 3
- 241000209510 Liliopsida Species 0.000 description 3
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 3
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 3
- 241000244206 Nematoda Species 0.000 description 3
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 3
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 3
- 241000254101 Popillia japonica Species 0.000 description 3
- LCWXSALTPTZKNM-CIUDSAMLSA-N Pro-Cys-Glu Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O LCWXSALTPTZKNM-CIUDSAMLSA-N 0.000 description 3
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 3
- 241000589540 Pseudomonas fluorescens Species 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 3
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 3
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 3
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 3
- 241000256248 Spodoptera Species 0.000 description 3
- 241000256247 Spodoptera exigua Species 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 3
- JRAUIKJSEAKTGD-TUBUOCAGSA-N Thr-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N JRAUIKJSEAKTGD-TUBUOCAGSA-N 0.000 description 3
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 3
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- SCQBNMKLZVCXNX-ZFWWWQNUSA-N Trp-Arg-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N SCQBNMKLZVCXNX-ZFWWWQNUSA-N 0.000 description 3
- DKKHULUSOSWGHS-UWJYBYFXSA-N Tyr-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DKKHULUSOSWGHS-UWJYBYFXSA-N 0.000 description 3
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 3
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 3
- 108090000848 Ubiquitin Proteins 0.000 description 3
- 102000044159 Ubiquitin Human genes 0.000 description 3
- AHHJARQXFFGOKF-NRPADANISA-N Val-Glu-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N AHHJARQXFFGOKF-NRPADANISA-N 0.000 description 3
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 3
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- 239000002671 adjuvant Substances 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- GINJFDRNADDBIN-FXQIFTODSA-N bilanafos Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCP(C)(O)=O GINJFDRNADDBIN-FXQIFTODSA-N 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 235000020940 control diet Nutrition 0.000 description 3
- 244000038559 crop plants Species 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- JEIPFZHSYJVQDO-UHFFFAOYSA-N ferric oxide Chemical compound O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- 239000000216 gellan gum Substances 0.000 description 3
- 235000010492 gellan gum Nutrition 0.000 description 3
- 238000012224 gene deletion Methods 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000007062 hydrolysis Effects 0.000 description 3
- 238000006460 hydrolysis reaction Methods 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 239000002917 insecticide Substances 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 231100000636 lethal dose Toxicity 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000006166 lysate Substances 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 239000002751 oligonucleotide probe Substances 0.000 description 3
- 230000020978 protein processing Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 239000012723 sample buffer Substances 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000001542 size-exclusion chromatography Methods 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 229910052721 tungsten Inorganic materials 0.000 description 3
- 230000004584 weight gain Effects 0.000 description 3
- 235000019786 weight gain Nutrition 0.000 description 3
- IYLGZMTXKJYONK-ACLXAEORSA-N (12s,15r)-15-hydroxy-11,16-dioxo-15,20-dihydrosenecionan-12-yl acetate Chemical compound O1C(=O)[C@](CC)(O)C[C@@H](C)[C@](C)(OC(C)=O)C(=O)OCC2=CCN3[C@H]2[C@H]1CC3 IYLGZMTXKJYONK-ACLXAEORSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 2
- 108010068327 4-hydroxyphenylpyruvate dioxygenase Proteins 0.000 description 2
- 102100028626 4-hydroxyphenylpyruvate dioxygenase Human genes 0.000 description 2
- 101710191936 70 kDa protein Proteins 0.000 description 2
- 108010000700 Acetolactate synthase Proteins 0.000 description 2
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 2
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 101710134784 Agnoprotein Proteins 0.000 description 2
- 241000993143 Agromyza Species 0.000 description 2
- 241000218473 Agrotis Species 0.000 description 2
- PJNSIUPOXFBHDM-GUBZILKMSA-N Ala-Arg-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O PJNSIUPOXFBHDM-GUBZILKMSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 2
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 2
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 2
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 2
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 2
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 241000153204 Anisota senatoria Species 0.000 description 2
- 241000625764 Anticarsia gemmatalis Species 0.000 description 2
- 101100478623 Arabidopsis thaliana S-ACP-DES1 gene Proteins 0.000 description 2
- 241001002469 Archips Species 0.000 description 2
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 2
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 2
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 2
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 2
- YWENWUYXQUWRHQ-LPEHRKFASA-N Arg-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O YWENWUYXQUWRHQ-LPEHRKFASA-N 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 2
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 2
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 2
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 2
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 2
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 2
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 2
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 2
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 2
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 2
- JQBCANGGAVVERB-CFMVVWHZSA-N Asn-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N JQBCANGGAVVERB-CFMVVWHZSA-N 0.000 description 2
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 2
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 2
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 2
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 2
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 2
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 2
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 2
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 2
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 2
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 2
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 2
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 2
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 2
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 2
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 2
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 2
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 2
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 2
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 2
- 108010017640 Aspartic Acid Proteases Proteins 0.000 description 2
- 102000004580 Aspartic Acid Proteases Human genes 0.000 description 2
- 241000223651 Aureobasidium Species 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 108010077805 Bacterial Proteins Proteins 0.000 description 2
- 229940123779 Bacterial protease inhibitor Drugs 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000724266 Broad bean mottle virus Species 0.000 description 2
- 241001517925 Bucculatrix Species 0.000 description 2
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 2
- 241000282836 Camelus dromedarius Species 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- 241000254173 Coleoptera Species 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 2
- 241001587738 Cyclocephala borealis Species 0.000 description 2
- XEEIQMGZRFFSRD-XVYDVKMFSA-N Cys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N XEEIQMGZRFFSRD-XVYDVKMFSA-N 0.000 description 2
- ZEXHDOQQYZKOIB-ACZMJKKPSA-N Cys-Glu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZEXHDOQQYZKOIB-ACZMJKKPSA-N 0.000 description 2
- BLGNLNRBABWDST-CIUDSAMLSA-N Cys-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BLGNLNRBABWDST-CIUDSAMLSA-N 0.000 description 2
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- 241001641958 Desmia Species 0.000 description 2
- 241000489972 Diabrotica barberi Species 0.000 description 2
- 241000489976 Diabrotica undecimpunctata howardi Species 0.000 description 2
- ZGTMUACCHSMWAC-UHFFFAOYSA-L EDTA disodium salt (anhydrous) Chemical compound [Na+].[Na+].OC(=O)CN(CC([O-])=O)CCN(CC(O)=O)CC([O-])=O ZGTMUACCHSMWAC-UHFFFAOYSA-L 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 241000726221 Gemma Species 0.000 description 2
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 2
- MQANCSUBSBJNLU-KKUMJFAQSA-N Gln-Arg-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQANCSUBSBJNLU-KKUMJFAQSA-N 0.000 description 2
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 2
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 2
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 2
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 2
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 2
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 2
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 2
- KIMXNQXJJWWVIN-AVGNSLFASA-N Glu-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O KIMXNQXJJWWVIN-AVGNSLFASA-N 0.000 description 2
- ALCAUWPAMLVUDB-FXQIFTODSA-N Glu-Gln-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ALCAUWPAMLVUDB-FXQIFTODSA-N 0.000 description 2
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 2
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 2
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 2
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 2
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 2
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 2
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 2
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 2
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 2
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 2
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 2
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 2
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 2
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 2
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 2
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 2
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 2
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 2
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 2
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 2
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 2
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- 244000020551 Helianthus annuus Species 0.000 description 2
- 235000003222 Helianthus annuus Nutrition 0.000 description 2
- 241000255990 Helicoverpa Species 0.000 description 2
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 2
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 2
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 2
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 2
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 2
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 2
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 2
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 2
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 2
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 2
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 2
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 2
- CYHJCEKUMCNDFG-LAEOZQHASA-N Ile-Gln-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N CYHJCEKUMCNDFG-LAEOZQHASA-N 0.000 description 2
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 2
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 2
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 2
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 2
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 2
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 102100027612 Kallikrein-11 Human genes 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 241001658021 Lambdina Species 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 2
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 2
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- ONHCDMBHPQIPAI-YTQUADARSA-N Leu-Trp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N ONHCDMBHPQIPAI-YTQUADARSA-N 0.000 description 2
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 2
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 2
- 101710084376 Lipase 3 Proteins 0.000 description 2
- 239000006142 Luria-Bertani Agar Substances 0.000 description 2
- 241000721703 Lymantria dispar Species 0.000 description 2
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 2
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 2
- ZAWOJFFMBANLGE-CIUDSAMLSA-N Lys-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N ZAWOJFFMBANLGE-CIUDSAMLSA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- KZJQUYFDSCFSCO-DLOVCJGASA-N Lys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N KZJQUYFDSCFSCO-DLOVCJGASA-N 0.000 description 2
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 2
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 2
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 2
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 2
- BEGQVWUZFXLNHZ-IHPCNDPISA-N Lys-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 BEGQVWUZFXLNHZ-IHPCNDPISA-N 0.000 description 2
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 2
- RYOLKFYZBHMYFW-WDSOQIARSA-N Lys-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 RYOLKFYZBHMYFW-WDSOQIARSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- 241000555300 Mamestra Species 0.000 description 2
- 241000555303 Mamestra brassicae Species 0.000 description 2
- 241001232130 Maruca testulalis Species 0.000 description 2
- WWWGMQHQSAUXBU-BQBZGAKWSA-N Met-Gly-Asn Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O WWWGMQHQSAUXBU-BQBZGAKWSA-N 0.000 description 2
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 2
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 2
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 2
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 2
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 2
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 2
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 2
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 2
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 2
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 2
- 241001483078 Phyto Species 0.000 description 2
- 241000758706 Piperaceae Species 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- 241000143945 Pontia protodice Species 0.000 description 2
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 2
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- RYJRPPUATSKNAY-STECZYCISA-N Pro-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@@H]2CCCN2 RYJRPPUATSKNAY-STECZYCISA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- SXMSEHDMNIUTSP-DCAQKATOSA-N Pro-Lys-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SXMSEHDMNIUTSP-DCAQKATOSA-N 0.000 description 2
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 2
- 108091030071 RNAI Proteins 0.000 description 2
- 241000711981 Sais Species 0.000 description 2
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 2
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 2
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 2
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 2
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 2
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 2
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 2
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 2
- 241000607720 Serratia Species 0.000 description 2
- 241000589196 Sinorhizobium meliloti Species 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 2
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 2
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 2
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 2
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 2
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 2
- ODSAPYVQSLDRSR-LKXGYXEUSA-N Thr-Cys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O ODSAPYVQSLDRSR-LKXGYXEUSA-N 0.000 description 2
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 2
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 2
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 2
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 2
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 2
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 2
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 2
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 2
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 2
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- XZSJDSBPEJBEFZ-QRTARXTBSA-N Trp-Asn-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O XZSJDSBPEJBEFZ-QRTARXTBSA-N 0.000 description 2
- NXJZCPKZIKTYLX-XEGUGMAKSA-N Trp-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NXJZCPKZIKTYLX-XEGUGMAKSA-N 0.000 description 2
- XOLLWQIBBLBAHQ-WDSOQIARSA-N Trp-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O XOLLWQIBBLBAHQ-WDSOQIARSA-N 0.000 description 2
- SWSUXOKZKQRADK-FDARSICLSA-N Trp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SWSUXOKZKQRADK-FDARSICLSA-N 0.000 description 2
- 101710152431 Trypsin-like protease Proteins 0.000 description 2
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 2
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 2
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 2
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 2
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 2
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 2
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 2
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 244000077923 Vaccinium vitis idaea Species 0.000 description 2
- 235000017606 Vaccinium vitis idaea Nutrition 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 2
- OXGVAUFVTOPFFA-XPUUQOCRSA-N Val-Gly-Cys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N OXGVAUFVTOPFFA-XPUUQOCRSA-N 0.000 description 2
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 2
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 2
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 2
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 2
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 2
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 2
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 2
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 2
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 238000005571 anion exchange chromatography Methods 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010036533 arginylvaline Proteins 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 229940097012 bacillus thuringiensis Drugs 0.000 description 2
- 239000007640 basal medium Substances 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 229910002056 binary alloy Inorganic materials 0.000 description 2
- 238000013357 binding ELISA Methods 0.000 description 2
- 238000011953 bioanalysis Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 235000019504 cigarettes Nutrition 0.000 description 2
- ZYGHJZDHTFUPRJ-UHFFFAOYSA-N coumarin Chemical compound C1=CC=C2OC(=O)C=CC2=C1 ZYGHJZDHTFUPRJ-UHFFFAOYSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 238000007865 diluting Methods 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 231100000673 dose–response relationship Toxicity 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 2
- 239000002198 insoluble material Substances 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 108010045069 keyhole-limpet hemocyanin Proteins 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 230000009571 larval growth Effects 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- 238000000386 microscopy Methods 0.000 description 2
- 238000007479 molecular analysis Methods 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 238000011587 new zealand white rabbit Methods 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 238000001543 one-way ANOVA Methods 0.000 description 2
- 125000000951 phenoxy group Chemical group [H]C1=C([H])C([H])=C(O*)C([H])=C1[H] 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 229960002429 proline Drugs 0.000 description 2
- 238000000751 protein extraction Methods 0.000 description 2
- 231100000654 protein toxin Toxicity 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 238000003127 radioimmunoassay Methods 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 239000004627 regenerated cellulose Substances 0.000 description 2
- IYLGZMTXKJYONK-UHFFFAOYSA-N ruwenine Natural products O1C(=O)C(CC)(O)CC(C)C(C)(OC(C)=O)C(=O)OCC2=CCN3C2C1CC3 IYLGZMTXKJYONK-UHFFFAOYSA-N 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 238000005063 solubilization Methods 0.000 description 2
- 230000007928 solubilization Effects 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 239000012536 storage buffer Substances 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-N succinic acid Chemical compound OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- 108010064245 urinary gonadotropin fragment Proteins 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 150000003722 vitamin derivatives Chemical class 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- UEJJHQNACJXSKW-UHFFFAOYSA-N 2-(2,6-dioxopiperidin-3-yl)-1H-isoindole-1,3(2H)-dione Chemical compound O=C1C2=CC=CC=C2C(=O)N1C1CCC(=O)NC1=O UEJJHQNACJXSKW-UHFFFAOYSA-N 0.000 description 1
- QZDDFQLIQRYMBV-UHFFFAOYSA-N 2-[3-nitro-2-(2-nitrophenyl)-4-oxochromen-8-yl]acetic acid Chemical group OC(=O)CC1=CC=CC(C(C=2[N+]([O-])=O)=O)=C1OC=2C1=CC=CC=C1[N+]([O-])=O QZDDFQLIQRYMBV-UHFFFAOYSA-N 0.000 description 1
- OOLBCHYXZDXLDS-UHFFFAOYSA-N 2-[4-(2,4-dichlorophenoxy)phenoxy]propanoic acid Chemical compound C1=CC(OC(C)C(O)=O)=CC=C1OC1=CC=C(Cl)C=C1Cl OOLBCHYXZDXLDS-UHFFFAOYSA-N 0.000 description 1
- AXAVXPMQTGXXJZ-UHFFFAOYSA-N 2-aminoacetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound NCC(O)=O.OCC(N)(CO)CO AXAVXPMQTGXXJZ-UHFFFAOYSA-N 0.000 description 1
- ABOOPXYCKNFDNJ-UHFFFAOYSA-N 2-{4-[(6-chloroquinoxalin-2-yl)oxy]phenoxy}propanoic acid Chemical compound C1=CC(OC(C)C(O)=O)=CC=C1OC1=CN=C(C=C(Cl)C=C2)C2=N1 ABOOPXYCKNFDNJ-UHFFFAOYSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 1
- LKDMKWNDBAVNQZ-UHFFFAOYSA-N 4-[[1-[[1-[2-[[1-(4-nitroanilino)-1-oxo-3-phenylpropan-2-yl]carbamoyl]pyrrolidin-1-yl]-1-oxopropan-2-yl]amino]-1-oxopropan-2-yl]amino]-4-oxobutanoic acid Chemical compound OC(=O)CCC(=O)NC(C)C(=O)NC(C)C(=O)N1CCCC1C(=O)NC(C(=O)NC=1C=CC(=CC=1)[N+]([O-])=O)CC1=CC=CC=C1 LKDMKWNDBAVNQZ-UHFFFAOYSA-N 0.000 description 1
- TVZGACDUOSZQKY-LBPRGKRZSA-N 4-aminofolic acid Chemical compound C1=NC2=NC(N)=NC(N)=C2N=C1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 TVZGACDUOSZQKY-LBPRGKRZSA-N 0.000 description 1
- 241000589220 Acetobacter Species 0.000 description 1
- 244000235858 Acetobacter xylinum Species 0.000 description 1
- 235000002837 Acetobacter xylinum Nutrition 0.000 description 1
- 241000495828 Acleris gloverana Species 0.000 description 1
- 241000834107 Acleris variana Species 0.000 description 1
- 101710197633 Actin-1 Proteins 0.000 description 1
- 108700037654 Acyl carrier protein (ACP) Proteins 0.000 description 1
- 102000048456 Acyl carrier protein (ACP) Human genes 0.000 description 1
- 241000175828 Adoxophyes orana Species 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000566547 Agrotis ipsilon Species 0.000 description 1
- ATAKEVCGTRZKLI-UWJYBYFXSA-N Ala-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 ATAKEVCGTRZKLI-UWJYBYFXSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- 241000449794 Alabama argillacea Species 0.000 description 1
- 241000588986 Alcaligenes Species 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 201000004384 Alopecia Diseases 0.000 description 1
- 241001367806 Alsophila pometaria Species 0.000 description 1
- 102100022749 Aminopeptidase N Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 241001259789 Amyelois transitella Species 0.000 description 1
- 241000522128 Anarchias Species 0.000 description 1
- 241001198505 Anarsia lineatella Species 0.000 description 1
- 241000255978 Antheraea pernyi Species 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000384127 Argyrotaenia Species 0.000 description 1
- 241000186063 Arthrobacter Species 0.000 description 1
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 1
- ZTRJUKDEALVRMW-SRVKXCTJSA-N Asn-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZTRJUKDEALVRMW-SRVKXCTJSA-N 0.000 description 1
- MQLZLIYPFDIDMZ-HAFWLYHUSA-N Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O MQLZLIYPFDIDMZ-HAFWLYHUSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- OSZBYGVKAFZWKC-FXQIFTODSA-N Asn-Pro-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(O)=O OSZBYGVKAFZWKC-FXQIFTODSA-N 0.000 description 1
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 241000589151 Azotobacter Species 0.000 description 1
- 241000589149 Azotobacter vinelandii Species 0.000 description 1
- 108010023063 Bacto-peptone Proteins 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000255789 Bombyx mori Species 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 description 1
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 1
- 241000499436 Brassica rapa subsp. pekinensis Species 0.000 description 1
- 108010049990 CD13 Antigens Proteins 0.000 description 1
- 241000726760 Cadra cautella Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000131329 Carabidae Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241001070941 Castanea Species 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- 108090000617 Cathepsin G Proteins 0.000 description 1
- 102000004173 Cathepsin G Human genes 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- LZZYPRNAOMGNLH-UHFFFAOYSA-M Cetrimonium bromide Chemical compound [Br-].CCCCCCCCCCCCCCCC[N+](C)(C)C LZZYPRNAOMGNLH-UHFFFAOYSA-M 0.000 description 1
- 241000255945 Choristoneura Species 0.000 description 1
- 241000206751 Chrysophyceae Species 0.000 description 1
- 108090000746 Chymosin Proteins 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 241000143939 Colias eurytheme Species 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 241000252100 Conger Species 0.000 description 1
- 208000006069 Corneal Opacity Diseases 0.000 description 1
- 241000870659 Crassula perfoliata var. minor Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241001641310 Cunea Species 0.000 description 1
- 241000252867 Cupriavidus metallidurans Species 0.000 description 1
- 244000007835 Cyamopsis tetragonoloba Species 0.000 description 1
- 241001156075 Cyclocephala Species 0.000 description 1
- 241001634817 Cydia Species 0.000 description 1
- 241001635274 Cydia pomonella Species 0.000 description 1
- 101710112752 Cytotoxin Proteins 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 241001351082 Datana integerrima Species 0.000 description 1
- 241001631715 Dendrolimus Species 0.000 description 1
- 241000489977 Diabrotica virgifera Species 0.000 description 1
- 241000832201 Diaphania Species 0.000 description 1
- 241001000394 Diaphania hyalinata Species 0.000 description 1
- 241000879145 Diatraea grandiosella Species 0.000 description 1
- 239000005506 Diclofop Substances 0.000 description 1
- 108010010256 Dietary Proteins Proteins 0.000 description 1
- 102000015781 Dietary Proteins Human genes 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 241001517923 Douglasiidae Species 0.000 description 1
- 206010058314 Dysplasia Diseases 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 241000400698 Elasmopalpus lignosellus Species 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 241001585082 Ennomos Species 0.000 description 1
- 241000661448 Eoreuma loftini Species 0.000 description 1
- 241000122098 Ephestia kuehniella Species 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241001491718 Erannis Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000567412 Estigmene acrea Species 0.000 description 1
- 241001201696 Eulia Species 0.000 description 1
- 241000060469 Eupoecilia ambiguella Species 0.000 description 1
- 241000483001 Euproctis chrysorrhoea Species 0.000 description 1
- 241001368778 Euxoa messoria Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 102100025101 GATA-type zinc finger protein 1 Human genes 0.000 description 1
- 108010015133 Galactose oxidase Proteins 0.000 description 1
- 241000255896 Galleria mellonella Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 101710129229 Germin-like protein 1 Proteins 0.000 description 1
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 1
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- 108700037728 Glycine max beta-conglycinin Proteins 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 240000002024 Gossypium herbaceum Species 0.000 description 1
- 235000004341 Gossypium herbaceum Nutrition 0.000 description 1
- 241001441330 Grapholita molesta Species 0.000 description 1
- 241000190714 Gymnosporangium clavipes Species 0.000 description 1
- 241001352371 Harrisina americana Species 0.000 description 1
- 241001147381 Helicoverpa armigera Species 0.000 description 1
- 241000255967 Helicoverpa zea Species 0.000 description 1
- 241000256257 Heliothis Species 0.000 description 1
- 241000413128 Hemileuca oliviae Species 0.000 description 1
- 108010006464 Hemolysin Proteins Proteins 0.000 description 1
- 108091016366 Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 description 1
- 241000526466 Homoeosoma Species 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 108090001042 Hydro-Lyases Proteins 0.000 description 1
- 102000004867 Hydro-Lyases Human genes 0.000 description 1
- 241000370523 Hypena scabra Species 0.000 description 1
- 206010021033 Hypomenorrhoea Diseases 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 241000400431 Keiferia lycopersicella Species 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 229930182821 L-proline Natural products 0.000 description 1
- 239000012741 Laemmli sample buffer Substances 0.000 description 1
- 241001658022 Lambdina fiscellaria fiscellaria Species 0.000 description 1
- 241001658020 Lambdina fiscellaria lugubrosa Species 0.000 description 1
- 101710138460 Leaf protein Proteins 0.000 description 1
- 241000258915 Leptinotarsa Species 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- 241000192132 Leuconostoc Species 0.000 description 1
- 241001123008 Leukoma Species 0.000 description 1
- 241001261104 Lobesia botrana Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000081125 Macalla Species 0.000 description 1
- 241000255676 Malacosoma Species 0.000 description 1
- 241000732113 Mamestra configurata Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000256010 Manduca Species 0.000 description 1
- 241000369513 Manduca quinquemaculata Species 0.000 description 1
- 241000255908 Manduca sexta Species 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 241001585527 Melanchra Species 0.000 description 1
- 241001367645 Melanchra picta Species 0.000 description 1
- 239000005578 Mesotrione Substances 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- 101710151833 Movement protein TGBp3 Proteins 0.000 description 1
- 241001477931 Mythimna unipuncta Species 0.000 description 1
- NWBJYWHLCVSVIJ-UHFFFAOYSA-N N-benzyladenine Chemical compound N=1C=NC=2NC=NC=2C=1NCC1=CC=CC=C1 NWBJYWHLCVSVIJ-UHFFFAOYSA-N 0.000 description 1
- 241001443590 Naganishia albida Species 0.000 description 1
- 241000033319 Naganishia diffluens Species 0.000 description 1
- 101000774651 Naja atra Zinc metalloproteinase-disintegrin-like kaouthiagin-like Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 101710202365 Napin Proteins 0.000 description 1
- 241000486026 Nebris Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000005348 Neuraminidase Human genes 0.000 description 1
- 108010006232 Neuraminidase Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 101710089395 Oleosin Proteins 0.000 description 1
- 241001491877 Operophtera brumata Species 0.000 description 1
- 241001465800 Orgyia Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 102000016387 Pancreatic elastase Human genes 0.000 description 1
- 241000816088 Papia Species 0.000 description 1
- 241000255952 Papilio Species 0.000 description 1
- 241001300993 Papilio cresphontes Species 0.000 description 1
- 241000222051 Papiliotrema laurentii Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000721451 Pectinophora gossypiella Species 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- 241001190492 Phryganidia californica Species 0.000 description 1
- 241001517955 Phyllonorycter blancardella Species 0.000 description 1
- 241001313099 Pieris napi Species 0.000 description 1
- 241000907661 Pieris rapae Species 0.000 description 1
- 108020005120 Plant DNA Proteins 0.000 description 1
- 241001608845 Platynota Species 0.000 description 1
- 241001456328 Platynota stultana Species 0.000 description 1
- 241000495716 Platyptilia carduidactyla Species 0.000 description 1
- 241000595629 Plodia interpunctella Species 0.000 description 1
- 241000500439 Plutella Species 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241001657916 Proxenus mindara Species 0.000 description 1
- 241000589615 Pseudomonas syringae Species 0.000 description 1
- 241000287531 Psittacidae Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 241000190932 Rhodopseudomonas Species 0.000 description 1
- 241000190946 Rhodopseudomonas sp. Species 0.000 description 1
- 241000223252 Rhodotorula Species 0.000 description 1
- 241000223253 Rhodotorula glutinis Species 0.000 description 1
- 241000223254 Rhodotorula mucilaginosa Species 0.000 description 1
- 241000080930 Robertkochia marina Species 0.000 description 1
- 239000011542 SDS running buffer Substances 0.000 description 1
- 241000004261 Sabulodes Species 0.000 description 1
- 108010029987 Salivary Proteins and Peptides Proteins 0.000 description 1
- 102000001848 Salivary Proteins and Peptides Human genes 0.000 description 1
- 241000130993 Scarabaeus <genus> Species 0.000 description 1
- 241001351292 Schizura concinna Species 0.000 description 1
- 241001479507 Senecio odorus Species 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- 241000607715 Serratia marcescens Species 0.000 description 1
- 241000661452 Sesamia nonagrioides Species 0.000 description 1
- 241001135312 Sinorhizobium Species 0.000 description 1
- 241000753143 Sitotroga Species 0.000 description 1
- 241000753145 Sitotroga cerealella Species 0.000 description 1
- FKNQFGJONOIPTF-UHFFFAOYSA-N Sodium cation Chemical compound [Na+] FKNQFGJONOIPTF-UHFFFAOYSA-N 0.000 description 1
- 239000005708 Sodium hypochlorite Substances 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 229920002334 Spandex Polymers 0.000 description 1
- 241000222068 Sporobolomyces <Sporidiobolaceae> Species 0.000 description 1
- 241000123675 Sporobolomyces roseus Species 0.000 description 1
- 241000098292 Striacosta albicosta Species 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 229940100389 Sulfonylurea Drugs 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 241001441724 Tetraodontidae Species 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- CKHWEVXPLJBEOZ-VQVTYTSYSA-N Thr-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O CKHWEVXPLJBEOZ-VQVTYTSYSA-N 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 244000288561 Torulaspora delbrueckii Species 0.000 description 1
- 235000014681 Torulaspora delbrueckii Nutrition 0.000 description 1
- 241001495125 Torulaspora pretoriensis Species 0.000 description 1
- 241000255993 Trichoplusia ni Species 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- TZNNEYFZZAHLBL-BPUTZDHNSA-N Trp-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O TZNNEYFZZAHLBL-BPUTZDHNSA-N 0.000 description 1
- YTCNLMSUXPCFBW-SXNHZJKMSA-N Trp-Ile-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O YTCNLMSUXPCFBW-SXNHZJKMSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- 241001351286 Udea rubigalis Species 0.000 description 1
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 241000589636 Xanthomonas campestris Species 0.000 description 1
- 241000064240 Yponomeuta padellus Species 0.000 description 1
- 241000209149 Zea Species 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- QPMSXSBEVQLBIL-CZRHPSIPSA-N ac1mix0p Chemical compound C1=CC=C2N(C[C@H](C)CN(C)C)C3=CC(OC)=CC=C3SC2=C1.O([C@H]1[C@]2(OC)C=CC34C[C@@H]2[C@](C)(O)CCC)C2=C5[C@]41CCN(C)[C@@H]3CC5=CC=C2O QPMSXSBEVQLBIL-CZRHPSIPSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 125000002947 alkylene group Chemical group 0.000 description 1
- 231100000360 alopecia Toxicity 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 238000003277 amino acid sequence analysis Methods 0.000 description 1
- 229960003896 aminopterin Drugs 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 230000001147 anti-toxic effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 238000012742 biochemical analysis Methods 0.000 description 1
- 238000010256 biochemical assay Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- 239000007844 bleaching agent Substances 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- UDSAIICHUKSCKT-UHFFFAOYSA-N bromophenol blue Chemical compound C1=C(Br)C(O)=C(Br)C=C1C1(C=2C=C(Br)C(O)=C(Br)C=2)C2=CC=CC=C2S(=O)(=O)O1 UDSAIICHUKSCKT-UHFFFAOYSA-N 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 102000023852 carbohydrate binding proteins Human genes 0.000 description 1
- 108091008400 carbohydrate binding proteins Proteins 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 229960004261 cefotaxime Drugs 0.000 description 1
- AZZMGZXNTDTSME-JUZDKLSSSA-M cefotaxime sodium Chemical compound [Na+].N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C([O-])=O)=O)C(=O)\C(=N/OC)C1=CSC(N)=N1 AZZMGZXNTDTSME-JUZDKLSSSA-M 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 238000011965 cell line development Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 229940080701 chymosin Drugs 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 239000012881 co-culture medium Substances 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 229960000956 coumarin Drugs 0.000 description 1
- 235000001671 coumarin Nutrition 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 101150065438 cry1Ab gene Proteins 0.000 description 1
- 101150049404 cry1Ca gene Proteins 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 239000002619 cytotoxin Substances 0.000 description 1
- 230000032459 dedifferentiation Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 235000021245 dietary protein Nutrition 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- 239000012470 diluted sample Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000014103 egg white Nutrition 0.000 description 1
- 210000000969 egg white Anatomy 0.000 description 1
- 238000001378 electrochemiluminescence detection Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 229940096118 ella Drugs 0.000 description 1
- 230000000408 embryogenic effect Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 239000012520 frozen sample Substances 0.000 description 1
- 235000012055 fruits and vegetables Nutrition 0.000 description 1
- 239000003517 fume Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 238000002873 global sequence alignment Methods 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 102000005396 glutamine synthetase Human genes 0.000 description 1
- 108020002326 glutamine synthetase Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 239000003228 hemolysin Substances 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 239000013029 homogenous suspension Substances 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 238000003898 horticulture Methods 0.000 description 1
- 229940099552 hyaluronan Drugs 0.000 description 1
- KIUKXJAPPMFGSW-MNSSHETKSA-N hyaluronan Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)C1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H](C(O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-MNSSHETKSA-N 0.000 description 1
- 229920002674 hyaluronan Polymers 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 108010084553 jacalin Proteins 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 101150109249 lacI gene Proteins 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 239000008176 lyophilized powder Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 108010083942 mannopine synthase Proteins 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- KPUREKXXPHOJQT-UHFFFAOYSA-N mesotrione Chemical compound [O-][N+](=O)C1=CC(S(=O)(=O)C)=CC=C1C(=O)C1C(=O)CCCC1=O KPUREKXXPHOJQT-UHFFFAOYSA-N 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- WABYCCJHARSRBH-UHFFFAOYSA-N metaclazepam Chemical compound C12=CC(Br)=CC=C2N(C)C(COC)CN=C1C1=CC=CC=C1Cl WABYCCJHARSRBH-UHFFFAOYSA-N 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910001507 metal halide Inorganic materials 0.000 description 1
- 150000005309 metal halides Chemical class 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 210000000110 microvilli Anatomy 0.000 description 1
- 230000001617 migratory effect Effects 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 1
- 210000002484 nematocyst Anatomy 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 150000004767 nitrides Chemical class 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000000361 pesticidal effect Effects 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 239000000419 plant extract Substances 0.000 description 1
- 239000005648 plant growth regulator Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 238000012809 post-inoculation Methods 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- KCXFHTAICRTXLI-UHFFFAOYSA-N propane-1-sulfonic acid Chemical compound CCCS(O)(=O)=O KCXFHTAICRTXLI-UHFFFAOYSA-N 0.000 description 1
- 230000013777 protein digestion Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 101150116440 pyrF gene Proteins 0.000 description 1
- 238000000163 radioactive labelling Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000013643 reference control Substances 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 108010038196 saccharide-binding proteins Proteins 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 1
- RWVGQQGBQSJDQV-UHFFFAOYSA-M sodium;3-[[4-[(e)-[4-(4-ethoxyanilino)phenyl]-[4-[ethyl-[(3-sulfonatophenyl)methyl]azaniumylidene]-2-methylcyclohexa-2,5-dien-1-ylidene]methyl]-n-ethyl-3-methylanilino]methyl]benzenesulfonate Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C(=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C)C=2C(=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C)C=C1 RWVGQQGBQSJDQV-UHFFFAOYSA-M 0.000 description 1
- ALZJERAWTOKHNO-UHFFFAOYSA-M sodium;dodecyl sulfate;3-morpholin-4-ylpropane-1-sulfonic acid Chemical compound [Na+].OS(=O)(=O)CCCN1CCOCC1.CCCCCCCCCCCCOS([O-])(=O)=O ALZJERAWTOKHNO-UHFFFAOYSA-M 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 239000004759 spandex Substances 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 210000004988 splenocyte Anatomy 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000011146 sterile filtration Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000001384 succinic acid Substances 0.000 description 1
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 1
- 229940037128 systemic glucocorticoids Drugs 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 239000003104 tissue culture media Substances 0.000 description 1
- NLVFBUXFDBBNBW-PBSUHMDJSA-N tobramycin Chemical compound N[C@@H]1C[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N NLVFBUXFDBBNBW-PBSUHMDJSA-N 0.000 description 1
- 230000007888 toxin activity Effects 0.000 description 1
- 230000024033 toxin binding Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- YWBFPKPWMSWWEA-UHFFFAOYSA-O triazolopyrimidine Chemical compound BrC1=CC=CC(C=2N=C3N=CN[N+]3=C(NCC=3C=CN=CC=3)C=2)=C1 YWBFPKPWMSWWEA-UHFFFAOYSA-O 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 230000001810 trypsinlike Effects 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 210000005239 tubule Anatomy 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- 238000007492 two-way ANOVA Methods 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- OOLLAFOLCSJHRE-ZHAKMVSLSA-N ulipristal acetate Chemical compound C1=CC(N(C)C)=CC=C1[C@@H]1C2=C3CCC(=O)C=C3CC[C@H]2[C@H](CC[C@]2(OC(C)=O)C(C)=O)[C@]2(C)C1 OOLLAFOLCSJHRE-ZHAKMVSLSA-N 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N25/00—Biocides, pest repellants or attractants, or plant growth regulators, characterised by their forms, or by their non-active ingredients or by their methods of application, e.g. seed treatment or sequential application; Substances for reducing the noxious effect of the active ingredients to organisms other than pests
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
- C07K14/325—Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8286—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Plant Pathology (AREA)
- Pest Control & Pesticides (AREA)
- Insects & Arthropods (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Agronomy & Crop Science (AREA)
- Toxicology (AREA)
- Dentistry (AREA)
- Environmental Sciences (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
본 발명은 DIG-109 및 DIG-152의 변이체뿐만 아니라 DIG-109 및 DIG-152로서 본원에서 표기되는 단백질을 포함하는 변형된 살곤충 B.t. Cry1Ca 단백질, 이들 단백질을 코딩하는 핵산, 이 단백질을 이용하여 해충을 방제하는 방법, 트랜스제닉 숙주 세포에서 이 단백질을 생성하는 방법, 및 이 단백질을 생성하는 트랜스제닉 식물을 포함한다. DIG-109 및 DIG-152 단백질은 Cry1Ab 전독소 절편 및 B.t. Cry1Ca의 코어 독소 절편으로 구성된 키메라 펩티드를 포함한다. DIG-109 및 DIG-152 단백질의 살곤충 활성 변이체가 또한 개시된다.
Description
본 발명은 새로운 살곤충 Cry 단백질 및 곤충 해충 방제를 위한 그의 용도에 관한 것이다.
밤나방 (Fall armyworm) (FAW; 스포도프테라 프루기페르다 (Spodoptera frugiperda))은 옥수수 및 기타 작물, 예컨대 대두 및 목화에 상당한 손상을 야기한다.
바실루스 투린기엔시스 (Bacillus thuringiensis, B.t.)는 델타 내독소 또는 Cry 단백질로 공지된 살충성 결정 단백질을 생성하는 토양성 박테리아이다. Cry 단백질은 민감한 곤충의 중장 세포에 작용함으로써 그 기능을 하는 경구 중독제 (intoxicant)이다. 델타 내독소의 광범위한 목록은 하기 웹사이트에서 유지되며 정기적으로 갱신된다: lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/intro.html.
Cry 단백질, 가장 현저하게는 Cry1F를 코딩하는 유전자를 발현하는 트랜스제닉 (transgenic) 옥수수는 FAW에 대하여 상업적 수준의 효능을 제공한다.
FAW-내성 트랜스제닉 옥수수의 성공에도 불구하고, 내성 곤충 집단의 발생의 가능성은 FAW 제어에 있어서 Cry 단백질의 장기간 지속성을 위협하며, FAW 및 기타 해충의 방제를 위한 새로운 Cry 단백질의 발견 및 개발 필요성을 야기한다. B.t. Cry 단백질에 대한 곤충 내성이 몇몇 기작을 통하여 발생할 수 있다 (문헌[Heckel et al., 2007], [Pigott and Ellar, 2007]). Cry 단백질에 대한 다수의 수용체 단백질 부류가 곤충들 내에서 확인되었으며, 다수의 예가 각각의 수용체 부류 내에 존재한다. 특정 Cry 단백질에 대한 내성은 예를 들어 수용체 단백질의 카드헤린 도메인의 독소 결합 부분 내에서의 돌연변이에 의해 발생할 수 있다. 추가의 내성 수단은 전독소 (protoxin) 프로세싱 프로테아제를 통하여 매개될 수 있다. 따라서, 인시목의 종에서의 Cry 독소에 대한 내성은 적어도 4가지의 특유한 주요 내성 유전자에 의한 복잡한 유전적 기반을 갖는다. Cry 단백질에 대하여 내성을 갖는 인시목 곤충이, 플루텔라 자일로스텔라 (Plutella xylostella) (문헌[Tabashnik, et al., 1994]), 트리코플루시아 니 (Trichoplusia ni) (문헌[Janmaat and Myers 2003, 2005]), 및 헬리코베르파 제아에 (Helicoverpa zeae) (문헌[Tabashnik et al., 2008])에 대하여 경작지에서 발생하였다. 새로운 고 효력 Cry 단백질이 개발되면 FAW 및 기타 곤충 해충의 관리를 위한 추가의 도구를 제공할 것이다. 트랜스제닉 옥수수에서 조합되어 생성되는 상이한 작용 양식을 갖는 Cry 단백질들은 FAW 곤충 내성의 발생을 방지하고 곤충 해충 방제에 있어서의 B.t. 기술의 장기간 유용성을 보장한다.
발명의 간단한 요약
본 발명은 DIG-109 및 DIG-152의 변이체뿐만 아니라 DIG-109 및 DIG-152로서 본원에서 표기되는 단백질을 포함하는 살곤충 B.t. Cry 단백질, 이들 단백질을 코딩하는 핵산, 이 단백질을 이용하여 해충을 방제하는 방법, 트랜스제닉 숙주 세포에서 이 단백질을 생성하는 방법, 및 이 단백질을 생성하는 트랜스제닉 식물을 제공한다.
실시예 1에 기술된 바와 같이, DIG-109 및 DIG-152 단백질은 B.t. Cry1Ca의 코어 독소 절편 및 Cry1Ab 전독소 절편으로 구성된 키메라 펩티드를 포함한다. DIG-109 및 DIG-152 단백질의 살곤충 활성 변이체가 또한 기술된다.
본원에 보고된 놀라운 발견은 DIG-109 및 DIG-152 단백질이 Cry1F에 대하여 내성을 갖는 사탕수수 명나방 유충 및 밤나방 유충의 집단에 대하여 활성을 갖는다는 것이다. 따라서, DIG-109 및 DIG-152 단백질은 인시목 해충의 방제에 사용하기에 이상적인 후보이다. 상기 단백질들은 내성 곤충 집단의 발생을 방제하기 위하여 Cry1F, Cry1Ab, 및 Cry1Ac와 같은 다른 Cry 단백질과 조합하여 또는 단독으로 사용될 수 있다. 그러한 해충의 논의에 대해서는 예를 들어 문헌[Tabashnik, PNAS (2008), vol. 105 no. 49, 19029-19030]을 참조한다.
DIG-109 및 DIG-152의 살곤충 활성 단편, 및 그러한 단편을 코딩하는 뉴클로오티드가 본 발명의 또 다른 측면이다.
일 실시양태에서, 본 발명은 하기로 이루어진 군으로부터 선택된 코어 독소 절편을 포함하는 단리된 DIG-109 단백질 폴리펩티드를 제공한다:
(a) 서열 1의 잔기 28 내지 619의 아미노산 서열을 포함하는 폴리펩티드;
(b) 서열 1의 잔기 28 내지 619의 아미노산 서열에 대한 서열 동일성이 90% 이상인 아미노산 서열을 포함하는 폴리펩티드;
(c) 서열 1에 의해 코딩되는 단백질의 발현 또는 활성에 악영향을 주지 않는 20개 이하의 아미노산 치환, 결실 또는 변형을 갖는 서열 1의 잔기 28 내지 619의 아미노산 서열을 포함하는 폴리펩티드.
또 다른 실시양태에서, 본 발명은 하기로 이루어진 군으로부터 선택된 DIG-109 코어 독소 절편을 포함하는 단리된 DIG-109 독소 폴리펩티드를 제공한다:
(a) 서열 1의 잔기 1 내지 619의 아미노산 서열을 포함하는 폴리펩티드;
(b) 서열 1의 잔기 1 내지 619의 아미노산 서열에 대한 서열 동일성이 90% 이상인 아미노산 서열을 포함하는 폴리펩티드;
(c) 서열 1에 의해 코딩되는 단백질의 발현 또는 활성에 악영향을 주지 않는 20개 이하의 아미노산 치환, 결실 또는 변형을 갖는 서열 1의 잔기 1 내지 619의 아미노산 서열을 포함하는 폴리펩티드.
또 다른 실시양태에서, 본 발명은 DIG-109 단백질을 포함하는 식물을 제공한다.
또 다른 실시양태에서, 본 발명은 해충 집단을 살충적 유효량의 DIG-109 단백질과 접촉시키는 단계를 포함하는 해충 집단의 방제 방법을 제공한다.
또 다른 실시양태에서, 본 발명은 DIG-109 단백질을 코딩하는 단리된 핵산을 제공한다.
또 다른 실시양태에서, 본 발명은 바실루스 투린기엔시스로부터 유래되지 않은 그리고 식물에서 발현을 추진할 수 있는 프로모터에 작동가능하게 연결된, DIG-109 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 DNA 작제물을 제공한다. 또한 본 발명은 게놈 내로 안정하게 혼입된 DNA 작제물을 포함하는 트랜스제닉 식물 및 상기 식물 내로 작제물을 도입하는 단계를 포함하는, 해충으로부터 식물을 보호하는 방법을 제공한다.
서열의 간단한 설명
서열 1 Cry1Ca 코어 독소 절편; 619 aa
서열 2 제1 Cry1Ab 전독소 절편; 545 aa
서열 3 DIG-152 키메라 단백질; 1164 aa (Pf 버전)
서열 4 제2 Cry1Ab 전독소 절편; 545 aa
서열 5 DIG-109 키메라 단백질; 1164 aa (마이즈(maize) 버전)
서열 6 Cry1Ca436 펩티드; 10 aa
서열 7 Cry1Ca591 펩티드; 10 aa
서열 8 DIG-109를 코딩하는 마이즈 최적화 CDS; 3492 bp
서열 9 ZGP3S 올리고뉴클레오티드; 21 nt
서열 10 ZGP3A 올리고뉴클레오티드; 21 nt
서열 11 TQZGP3 올리고뉴클레오티드; 23 nt
서열 12 DSM2S 올리고뉴클레오티드; 17 nt
서열 13 DSM2A 올리고뉴클레오티드; 19 nt
서열 14 DSM2FQ 올리고뉴클레오티드; 20 nt
서열 15 Cry1CaS 올리고뉴클레오티드; 18 nt
서열 16 Cry1CaA 올리고뉴클레오티드; 18 nt
서열 17 Cry1Ca 올리고뉴클레오티드; 23 nt
서열 18 AAD1S 올리고뉴클레오티드; 20 nt
서열 19 AAD1A 올리고뉴클레오티드; 22 nt
서열 20 AAD1 올리고뉴클레오티드; 24 nt
서열 21 Y1CAS 올리고뉴클레오티드; 18 nt
서열 22 Y1CAR 올리고뉴클레오티드; 18 nt
서열 23 F6Y1CA 올리고뉴클레오티드; 23 nt
서열 24 IVF-Taq 올리고뉴클레오티드; 18 nt
서열 25 IVR-TAQ 올리고뉴클레오티드; 19 nt
서열 26 IV-프로브 올리고뉴클레오티드; 26 nt
서열 27 DIG-110; 1079 aa
서열 28 DIG-110의 마이즈 최적화 코딩 영역; 3237 bp
서열 29 DIG-111; 543 aa
서열 30 DIG-111의 마이즈 최적화 코딩 영역; 1629 bp
서열 31 DIG-112; 1044 aa
서열 32 DIG-112의 마이즈 최적화 코딩 영역; 3132 bp
서열 33 DIG-113; 508 aa
서열 34 DIG-113의 마이즈 최적화 코딩 영역; 1524 bp
서열 35 DIG-114; 582 aa
서열 36 DIG-114의 마이즈 최적화 코딩 영역; 1746 bp
DIG -109 및 DIG -152 단백질, 및 살곤충 활성 변이체 . 전장의 서열 5의 DIG-109 단백질 및 서열 3의 DIG-152 단백질에 더하여, 본 발명은 살곤충 활성 변이체를 포함한다. 본 출원인은 "변이체"라는 용어에 단편, 특정 결실 및 삽입 돌연변이체 및 특정 융합 단백질을 포함시키고자 한다. DIG-109 및 DIG-152의 Cry1Ca 코어 독소 절편은 고전적인 3도메인형 (3-domain) Cry 단백질이다. 본 발명에 포함되는 DIG-109 및 DIG-152 단백질의 변이체의 기술의 서두로서, 3도메인형 Cry 단백질의 구성을 일반적으로, 그리고 DIG-109 및 DIG-152 단백질 독소의 구성을 구체적으로 간략하게 재검토하는 것이 유용할 것이다.
대다수의 바실루스 투린기엔시스 델타-내독소 결정 단백질 분자는 2개의 기능성 절편으로 구성된다. 프로테아제-내성 코어 독소는 상기 단백질 분자의 대략적으로 제1 절반에 상응하며, 제1 절편이다. 대략 130 kDa의 전체 전독소 분자는 곤충 장 내의 프로테아제에 의해 내성 코어 절편으로 급속하게 프로세싱된다. 이러한 프로세싱에 의해 결실되는 절편은 본원에서 "전독소 절편"으로 칭해진다. 상기 전독소 절편은 독소 결정 형성에 참여하는 것으로 여겨진다 (문헌[Arvidson et al., (1989)]). 따라서 전독소 절편은 독소 분자의 프로테아제 프로세싱을 감소시킴으로써 (문헌[Haider et al., (1986)]) 또는 독소 용해성을 감소시킴으로써 (문헌[Aronson et al., (1991)]) 곤충에 대한 상기 코어의 접근성을 제한함으로써 독소에 대한 부분적 곤충 특이성을 전할 수 있다. 심지어 특정 부류 내인 B.t. 독소는 길이 면에서 그리고 코어 독소 절편으로부터 전독소 절편으로의 전위 (transition)의 정확한 위치 면에서 어느 정도 가변적이다. 코어 독소 절편으로부터 전독소 절편으로의 전위는 전형적으로 전장 독소의 약 50% 내지 약 60% 사이에서 일어난다. 서열 3은 전장 DIG-152 폴리펩티드의 1164개 아미노산 서열을 개시하며, 이 중 N-말단의 619개 아미노산은 서열 1에 개시된 Cry1Ca 코어 독소를 포함한다. 서열 5는 전장 DIG-109 폴리펩티드의 1164개 아미노산 서열을 개시하며, 이 중 N-말단의 619개 아미노산은 Cry1Ca 코어 독소를 포함한다.
3차원 결정 구조가 Cry1Aa1, Cry2Aa1, Cry3Aa1, Cry3Bb1, Cry4Aa, Cry4Ba 및 Cry8Ea1에 대하여 결정되었다. 이들 코어 독소 구조는 현저하게 유사하며, 하기에 기술된 특징을 갖는 3개의 특유한 도메인으로 이루어진다 (문헌[de Maagd et al., 2003]에서 재검토됨).
도메인 I은 나선 5가 6개의 양쪽친매성 나선으로 둘러싸인 7개의 알파 나선의 번들(bundle)이다. 이 도메인은 기공 형성에 연루되어 있으며, 용혈소 및 콜리신을 포함하는 다른 기공 형성 단백질과 상동성을 공유한다. Cry1Ca 코어 독소 단백질의 도메인 I은 서열 1의 아미노산 잔기 36 내지 254를 포함한다. [DIG-109 및 DIG-152 키메라 단백질은 Cry1Ca 코어 독소 절편을 포함하며, 따라서 서열 1에 개시된 Cry1Ca 코어 독소 절편의 아미노산 서열에 할당된 좌표는 서열 5에 개시된 DIG-109 키메라 단백질의 아미노산 서열 및 서열 3에 개시된 DIG-152 키메라 단백질의 아미노산 서열에도 적용됨을 이해하여야 한다.]
도메인 II는 베타 프리즘으로 함께 패킹된 (packed) 3개의 역평행 베타 시트로 형성된다. 이 도메인의 루프는 곤충 중장 수용체 결합에 있어서 중요한 역할을 한다. Cry1A 단백질에 있어서, 도메인 II 베타 시트의 정점의 표면 노출 루프는 인시목 카드헤린 수용체에의 결합에 관련된다. Cry3Aa 도메인 II 루프는 유사한 방식으로 렙티노타르사 데셈리네아타 (Leptinotarsa decemlineata) (Say) (콜로라도 (Colorado) 감자 딱정벌레)의 막 결부된 메탈로프로테아제에 결합한다 (문헌[Ochoa-Campuzano et al., 2007]). 도메인 II는 비텔린 및 자칼린을 비롯한 특정 탄수화물 결합 단백질과 상동성을 공유한다. Cry1Ca 코어 독소 단백질의 도메인 II는 서열 1의 아미노산 잔기 262 내지 458을 포함한다.
도메인 III은 2개의 역평행 베타 시트의 베타 샌드위치 (sandwich)이다. 구조적으로 이러한 도메인은 단백질, 예컨대 글루카나아제, 갈락토스 옥시다아제, 시알리다아제 및 기타의 것의 탄수화물 결합 도메인에 관련된다. 도메인 III은 특정한 부류의 수용체 단백질에 결합하며, 아마도 제2 부류의 수용체와 상호작용하는 올리고머형 독소 프리포어(pre-pore)의 삽입에 참여하는데, 상기 제2 부류의 수용체의 예로는 Cry1A 단백질의 경우 아미노펩티다아제 및 알칼리 포스파타아제가 있다 (문헌[Pigott and Ellar, 2007]). 유사한 Cry 도메인 III 수용체는 초시목에서는 동정되지 않았다. 보존된 B.t. 서열 블록 2 및 3은 각각 도메인 2의 N-말단 및 C-말단 근처에서 지도화된다. 따라서, 이들 보존된 서열 블록 2 및 3은 3개의 기능성 도메인 사이의 대략적인 경계 영역이다. 보존된 DNA 및 단백질 상동성의 이들 영역은 재조합 B.t. 독소의 조작을 위하여 활용되었다 (미국 특허 제6090931호, 국제 특허 공개 제WO 1991/01087호, 동 제WO 1995/06730호, 동 제WO 1998/022595호). Cry1Ca 단백질의 도메인 III은 서열 1의 아미노산 잔기 468 내지 617을 포함한다.
도메인 I의 α-나선 1은 수용체 결합 후에 제거됨이 보고되었다. 문헌[Aronson et al. (1999)]에서는 BBMV에 결합된 Cry1Ac가 α-나선 1의 바로 뒤의 잔기 59에서 시작하는 프로테이나아제 K 절단으로부터 보호되었음이 입증되었으며; 유사한 결과가 Cry1Ab에 대하여 인용되었다. 문헌[Gomez et al., (2002)]에서는 BBMV 수용체 결합시에 형성된 Cry1Ab 올리고머에서 도메인 I의 α-나선 1 부분이 결여되었음이 발견되었다. 또한, 문헌[Soberon et al., (2007)]에서는 3차원 Cry 구조 상에서 α-나선 1을 포함하는 대략 60개 아미노산이 결여된 Cry1Ab 및 Cry1Ac의 N-말단 결실 돌연변이체가 카드헤린 결합의 부재 하에 분자량 약 60 kDa의 단량체를 프리포어로 조립할 수 있음이 밝혀졌다. 이들 N-말단 결실 돌연변이체는 Cry 내성 곤충 유충에서 활성을 갖는 것으로 보고되었다. 더욱이, 문헌[Diaz-Mendoza et al., (2007)]에는 지중해 옥수수 명나방 (세사미아 노나그리오이데스 (Sesamia nonagrioides))에 대한 활성을 유지하는 43 kDa 및 46 kDa의 Cry1Ab 단편이 기술되어 있다. 이들 단편은 아미노산 잔기 116 내지 423을 포함하는 것으로 입증되었지만, 정확한 아미노산 서열은 해명되지 않았으며, 이들 단백질 분해 단편의 활성 기작은 공지되어 있지 않다. 문헌[Gomez et al., (2002)], [Soberon et al., 2007] 및 [Diaz-Mendoza et al., (2007)]의 결과는 Cry1Ab의 N-말단으로부터의 36개 아미노산의 결실이 살곤충 활성을 상실시킴을 보고한 문헌[Hofte et al., (1986)]의 것과 대조를 이룬다.
본 출원인은 나선 1, 2A, 2B, 3, 및 4의 시작과 끝, 및 Cry1Ca 코어 독소의 도메인 I에서의 그들 사이의 스페이서 영역의 위치를 추정하였으며, 이는 Cry1Ca 아미노산 서열을 구조가 공지된 Cry8Ea1의 아미노산 서열과 비교함에 의한 것이었다. 이들 위치가 표 1에 기술되어 있다.
DIG -109 및 DIG -152의 아미노 말단 결실 변이체 . 본 발명은 그의 측면들 중 하나에서 살곤충 활성을 향상시키고 곤충에 의한 내성의 발생을 회피하기 위하여 알파 나선 1, 2A, 및 2B의 전부 또는 일부가 결실된 DIG-109 및 DIG-152 변이체를 제공한다. 이들 변형은 개선된 속성, 예컨대 개선된 표적 해충 스펙트럼, 효력, 및 곤충 내성 관리성을 갖는 DIG-109 및 DIG-152 변이체를 제공하도록 행해진다. 본 발명의 일부 실시양태에서, 본 발명의 변형은 전독소 활성화 및 기공 형성의 효율에 영향을 주어 곤충 중독에 이르게 할 수 있다. 더 구체적으로, 개선된 속성을 갖는 DIG-109 및 DIG-152 변이체를 제공하기 위하여, 단계적 결실이 기술되어 있으며, 이는 N-말단을 코딩하는 유전자의 일부를 제거한다. 결실은 α-나선 3 내지 7의 구조적 완전성을 유지하면서 도메인 I에서 α-나선 1의 전부 및 α-나선 2의 전부 또는 일부를 제거한다. 따라서 본 발명은 부분적으로는 더욱 효율적인 기공 형성을 위하여 도메인 1의 α-나선 구성요소를 조작함으로써 만들어진 Cry 단백질 효능에 대한 개선에 관한 것이다. 더 구체적으로, 본 발명은 부분적으로는 Cry1 단백질의 도메인 I의 α-나선 1 및 2에 대하여 추정 2차 구조 상동성을 갖는 영역에서 N-말단 결실을 갖도록 설계된 개선된 DIG-109 및 DIG-152 단백질에 관한 것이다.
DIG-109 및 DIG-152 독소의 살곤충 특성을 개선시키는 결실은 예측 α-나선 2A가 시작되기 전에 개시될 수 있으며, α-나선 2B가 끝난 후 종결될 수 있지만, 바람직하게는 α-나선 3 내로 연장되지 않는다.
N-말단 결실 변이체의 코딩 서열을 설계함에 있어서, 메티오닌을 코딩하는 ATG 시작 코돈은 상기 결실 변이체를 발현하도록 설계된 뉴클레오티드 서열의 5' 말단에 삽입된다. 트랜스제닉 식물에서의 사용용으로 설계된 서열에 있어서, 문헌[Varshavsky (1997)]의 "N-말단 규칙"에 충실한 것이 유익할 수 있다. 일부 아미노산은 단백질의 N-말단 잔기로서 디스플레이될 때 진핵 세포에서 단백질 불안정성 및 분해에 기여할 수 있음이 교시되어 있다. 예를 들어, 효모 및 포유류 세포에서의 관찰로부터 수집된 데이터는 N-말단 불안정화 아미노산이 F, L, W, Y, R, K, H, I, N, Q, D, E 및 가능하게는 P임을 나타낸다. 단백질 분해 기작의 특질은 유기체들 사이에서 다소 상이할 수 있는 반면, 상기에 보이는 N-말단 불안정화 아미노산의 동일성 (identity)의 보존은 유사한 기작이 식물 세포에서 기능할 수 있음을 시사한다. 예를 들어, 문헌[Worley et al., (1998)]에서는 식물에 있어서 N-말단 규칙이 염기성 및 방향족 잔기를 포함함이 발견되었다. 대상 B.t. 살곤충 단백질의 α-나선 3의 시작 근처에서의 식물 프로테아제에 의한 단백질 분해적 절단은 불안정화 N-말단 아미노산을 노출시킬 수 있다는 가능성이 있다. 그러한 프로세싱은 신속한 붕괴를 위하여 절단 단백질을 표적으로 하고 효과적인 곤충 방제에 불충분한 수준으로 B.t. 살곤충 단백질의 축적을 한정할 수 있다. 따라서, 불안정화 아미노산들 중 하나에서 시작되는 N-말단 결실 변이체에 있어서, 본 출원인은 번역 개시 메티오닌과 불안정화 아미노산 사이에 G (글리신) 아미노산을 특정하는 코돈을 부가하는 것을 선호한다.
실시예 13 및 14는 본 발명에 따른 DIG-109 및 DIG-152의 아미노-말단 결실 변이체의 구체예를 제공한다. 추가의 유용한 단편은 어느 단편이 독성을 유지하는지를 결정하기 위하여 전장 가용화 결정 단백질의 트립신 또는 키모트립신 소화에 의해 생성된 단편들의 곤충 생물분석법에 의해 확인될 수 있거나, 또는 Cry 단백질 코딩 영역의 DNA 단편에 의해 코딩되는 독성 단백질 단편의 서열의 결정에 의해 확인될 수 있다. 이 단백질은 대부분은 전독소와 비교하여 짧은 N-말단 및 긴 C-말단 절단(truncation)을 갖는다. 가장 작은 독성 단편의 N-말단은 당업계에서 일상적으로 이용가능한 기술에 의해 트립신- 또는 키모트립신-처리 용해성 결정 단백질의 N-말단 아미노산 서열 결정에 의해 편리하게 결정된다.
키메라 독소. 하나의 Cry 독소의 코어 독소 도메인이 또 다른 Cry 독소의 전독소 절편에 융합된 것을 이용하는 키메라 단백질이 이전에 보고되었다. DIG-109 및 DIG-152 변이체는 Cry1Ca 독소 (이는 전장일 수 있거나 상기에 기술된 N-말단 결실을 가질 수 있음)의 N-말단 독소 코어 절편이 상기 코어 독소 절편의 말단을 지난 어떤 지점에서 이종 전독소 절편에 융합된 것을 포함하는 독소를 포함한다. 이종 전독소 절편으로의 전위는 대략적으로 코어 독소/전독소 접합부에서 나타날 수 있거나, 또는 대안에 있어서 천연 전독소의 일부분 (코어 독소 절편을 지나 연장함)은 유지되고 이종 전독소로의 전위는 하류에서 일어날 수 있다. 일례로서, 대상 발명의 키메라 독소는 Cry1Ca (아미노산 1-619)의 전체 코어 독소 절편 및 이종 전독소 (아미노산 620 내지 C-말단)를 갖는다. 바람직한 실시양태에서, 전독소의 이종 절편은 서열 2 및 서열 4에 예시된 바와 같이 Cry1Ab 델타-내독소로부터 유래된다.
프로테아제 민감성 변이체 . 전형적으로 곤충 장 프로테아제는 곤충이 식이 단백질로부터 필요한 아미노산을 수득하는 것을 돕는 기능을 한다. 가장 잘 이해된 곤충 소화 프로테아제가 세린 프로테아제라는 것인데, 이는 특히 인시목 종에서 가장 일반적인 유형인 것으로 보인다 (문헌[Englemann and Geraerts, 1980]). 초시목 곤충은 인시목 장보다 더욱 중성 내지 산성인 장을 갖는다. 대다수의 초시목 유충 및 성충, 예를 들어 콜로라도 (Colorado) 감자 딱정벌레는 약간 산성인 중장을 가지며, 시스테인 프로테아제가 주요 단백질 분해 활성을 제공한다 (문헌[Wolfson and Murdock, 1990]). 더욱 정확하게는, 문헌[Thie and Houseman (1990)]에서는 콜로라도 감자 딱정 벌레에서 카텝신 B-유사 및 카텝신 H-유사 시스테인 프로테아제들과, 카텝신 D-유사 아스파르틸 프로테아제가 확인 및 특성화되었다. 문헌[Gillikin et al., (1992)]에서는 서양 옥수수 뿌리벌레 (western corn rootworm) 유충의 장에서의 단백질 분해 활성이 특성화되었으며 이는 주로 시스테인 프로테아제임이 발견되었다. 미국 특허 제7230167호에는 세린 프로테아제, 카텝신 G가 서양 옥수수 뿌리벌레에 존재함이 개시되어 있다. 곤충 장 프로테아제의 다양성 및 상이한 활성 수준은 특정 B.t. 독소에 대한 곤충의 민감성에 영향을 줄 수 있다.
본 발명의 또 다른 실시양태에서, 프로테아제 절단 부위는 특정한 곤충 해충의 민감한 유충의 중장 내에서의 단백질 프로세싱에 영향을 주기 위하여 요망되는 위치에서 조작될 수 있다 (문헌[Walters et al., 2008]). 이들 프로테아제 절단 부위는 화학적 유전자 합성법 또는 스플라이스 중첩 PCR법과 같은 방법에 의해 도입될 수 있다 (문헌[Horton et al., 1989]). 예를 들어 세린 프로테아제 인식 서열이, 요망되는 결실 지점에서의 단백질 프로세싱을 민감한 유충의 중장 내에서 초래하도록 Cry 단백질 구조 내의 특정 부위에 임의로 삽입될 수 있다. 그러한 방식으로 활용될 수 있는 세린 프로테아제는 인시목 중장 세린 프로테아제, 예컨대 트립신 또는 트립신-유사 효소, 키모트립신, 엘라스타아제 등을 포함한다 (문헌[Christeller et al., 1992]). 또한, 비분획화 유충 중장 프로테아제 제제를 이용하여 생성한 Cry 단백질 소화 생성물의 서열 결정에 의해 또는 쇄자 연막소포 (brush-border membrane vesicle)에의 결합에 의해 실험적으로 확인된 결실 부위는 단백질 활성화를 초래하도록 조작될 수 있다. 유전자 결실에 의해 또는 프로테아제 절단 부위의 도입에 의해 생성된 변형 Cry 단백질은 오스트리니아 누빌랄리스 (Ostrinia nubilalis), 디아트라에아 그란디오셀라 (Diatraea grandiosella), 헬리코베르파 제아 (Helicoverpa zea), 아그로티스 입실론 (Agrotis ipsilon), 스포도프테라 프루기페르다, 스포도프테라 엑시구아 (Spodoptera exigua), 디아트라에아 사카랄리스 (Diatraea saccharalis), 록사그로티스 알비코스타 (Loxagrotis albicosta) 및 기타 표적 해충을 포함하는 인시목 해충에 대하여 개선된 활성을 갖는다.
초시목 세린 프로테아제, 예컨대 트립신, 키모트립신 및 카텝신 G-유사 프로테아제, 초시목 시스테인 프로테아제, 예컨대 카텝신 (B-유사, L-유사, O-유사, 및 K-유사 프로테아제) (문헌[Koiwa et al., (2000)] 및 [Bown et al., (2004)], 초시목 메탈로프로테아제, 예컨대 ADAM 10 (문헌[Ochoa-Campuzano et al., (2007)]), 및 초시목 아스파르트산 프로테아제, 예컨대 카텝신 D-유사 및 E-유사, 펩신, 플라스멥신, 및 키모신은 특정한 곤충 해충의 민감한 유충의 중장 내에서의 Cry 단백질 프로세싱에 영향을 주기 위하여 요망되는 프로세싱 부위에서의 적절한 인식 서열의 조작에 의해 추가로 활용될 수 있다.
그러한 프로테아제 절단 부위의 도입에 바람직한 위치는 α-나선 2B와 α-나선 3 사이의 "스페이서" 영역 내, 예를 들어 Cry1Ca 코어 독소 단백질의 아미노산 85 내지 90 (서열 1 및 표 1) 내일 수 있다. 유전자 결실에 의해 또는 프로테아제 절단 부위의 도입에 의해 생성되는 변형 Cry 단백질은, 밤나방, 사탕수수 명나방 등을 포함하지만 이에 한정되는 것은 아닌 곤충 해충에 대하여 개선된 활성을 갖는다.
폴리펩티드의 N-말단 또는 C-말단 잔기를 포함하는 아미노산의 서열의 결정을 가능하게 하기 위하여 다양한 기술이 존재한다. 예를 들어, 자동 에드만(Edman) 분해법을 순차적인 방식으로 이용하여 잔기 당 98%의 정확도로 30개 이하의 아미노산 잔기의 N-말단 아미노산 서열을 결정할 수 있다. 또한, 폴리펩티드의 카르복시 말단을 포함하는 아미노산 서열의 결정이 또한 가능하다 (문헌[Bailey et al., (1992)]; 미국 특허 제6046053호). 따라서, 일부 실시양태에서, 단백질 분해적 프로세싱에 의해, 예를 들어 곤충의 장으로부터 제조된 프로테아제에 의해 활성화된 B.t. Cry 단백질이 특성화될 수 있으며, 활성화된 독소 단편의 N-말단 또는 C-말단 아미노산이 확인될 수 있다. 곤충, 식물 또는 미생물 프로테아제에 의한 더욱 큰 변이체 단백질의 단백질 분해적 절단을 허용하거나 또는 그를 제거하기 위하여 코딩 서열 내의 적절한 위치에서의 프로테아제 프로세싱 부위의 도입 또는 제거에 의해 생성된 DIG-109 및 DIG-152 변이체는 본 발명의 범주 내이다. 그러한 조작의 최종 결과는 온전한 (전장) 독소 단백질과 동일하거나 그보다 더 우수한 활성을 갖는 독소 단편 분자의 생성인 것으로 이해된다.
DIG -109 및 DIG -152 독소의 도메인. DIG-109 및 DIG-152 독소에서 예시되는 Cry1Ca 코어 독소 절편의 별도의 도메인들 (및 그러한 도메인들에 대하여 90%, 95%, 또는 97% 동일한 변이체)은 증가된 스펙트럼의 해충 독성, 개선된 효력 또는 증가된 단백질 안정성을 갖는 새로운 독소를 제공하기 위하여 다른 Cry 독소 유래의 도메인과 조합을 형성하는 데 유용할 것으로 예상된다. Cry1Ca 코어 독소 단백질의 도메인 I은 서열 1의 아미노산 잔기 36 내지 254로 이루어진다. Cry1Ca 코어 독소 단백질의 도메인 II는 서열 1의 아미노산 잔기 262 내지 458로 이루어진다. Cry1Ca 코어 독소 단백질의 도메인 III은 서열 1의 아미노산 잔기 468 내지 617로 이루어진다. 도메인 스와핑 (swapping) 또는 셔플링 (shuffling)은 변경된 델타-내독소 단백질을 생성하는 기작이다. 도메인 II 및 III은 델타-내독소 단백질들 사이에서 스와핑되어 개선된 살충 활성 또는 표적 스펙트럼을 갖는 하이브리드 또는 키메라 독소를 생성할 수 있다. 도메인 II는 수용체 결합에 연루된다. 도메인 III은 특정한 부류의 수용체 단백질에 결합하며, 아마도 올리고머형 독소 프리포어의 삽입에 참여할 것이다. 다른 독소에서의 일부의 도메인 III의 치환은 스포도프테라 엑시구아에 대하여 탁월한 독성을 생성하는 것으로 밝혀졌으며 (문헌[de Maagd et al., (1996)], Cry 독소 도메인 스와프의 설계에 대하여 지침이 존재한다 (문헌[Knight et al., (2004)].
재조합 단백질을 제조하는 방법 및 상기 단백질을 살충 활성에 대하여 시험하는 방법이 당업계에 공지되어 있다 (예를 들어, 문헌[Naimov et al., (2001)], [de Maagd et al., (1996)], [Ge et al., (1991)], [Schnepf et al., (1990)], [Rang et al., (1999)] 참조). Cry1A 및 Cry3A 단백질 유래의 도메인 I이 막 내에 기공을 삽입 및 형성하는 능력에 대하여 연구되었다. 도메인 I의 α-나선 4 및 5는 막 삽입 및 기공 형성에서 중요한 역할을 하는 반면 (문헌[Walters et al., 1993], [Gazit et al., 1998]; [Nunez-Valdez et al., 2001]), 다른 나선들은 우산살과 같이 막 표면과 접촉하는 것으로 제안되어 있다 (문헌[Bravo et al., (2007)]; [Gazit et al., (1998)]).
제한된 수의 아미노산 결실, 치환 또는 부가를 만들어서 생성한 DIG -109 및 DIG-152 변이체 . 서열 1의 Cry1Ca 코어 독소 절편의 아미노산 서열에 대한 아미노산 결실, 치환 및 부가는 순차적인 방식으로 쉽게 만들어질 수 있으며, 살곤충 활성에 대한 그러한 변이의 영향은 생물분석법에 의해 시험될 수 있다. 변화의 수가 수적인 면에서 제한된다면, 그러한 시험은 불합리한 실험을 수반하지 않는다. 본 발명은 10개 이하, 15개 이하 또는 20개 이하의 독립적인 아미노산 부가, 결실 또는 치환이 초래된 코어 독소 (서열 1의 아미노산 1-619)의 살곤충 활성 변이체를 포함한다.
본 발명은 서열 1의 아미노산 1-619에 대하여 90%, 95% 또는 97% 동일한 코어 독소 절편을 갖는 DIG-109 및 DIG-152 변이체를 포함한다. 변이체는 랜덤 돌연변이를 만듦으로써 만들어질 수 있거나 또는 변이체는 설계될 수 있다. 설계된 돌연변이체의 경우, 궁극적으로는 생물 활성에 책임이 있는 3차원 구성의 결정에 연루되거나 또는 생물 활성의 이유를 밝히는 독소의 중요한 영역에서 아미노산 동일성이 유지될 때 천연 독소와 유사한 활성을 갖는 변이체를 생성할 확률이 높다. 높은 확률의 활성 유지는 또한 치환이 보존적일 경우 나타난다. 아미노산은 하기 부류에 배치될 수 있다: 비극성, 비하전 극성, 염기성 및 산성. 하나의 부류의 아미노산이 동일한 유형의 또 다른 아미노산으로 대체되는 보존적 치환은 변이체의 생물 활성을 실질적으로 변경시킬 가능성이 가장 적다. 표 2는 각각의 부류에 속하는 아미노산의 예의 목록을 제공한다.
일부 예에서, 비보존적 치환이 또한 초래될 수 있다. 중요한 인자는 이들 치환이 독소의 생물 활성을 유의하게 손상시키지 않아야 한다는 것이다. 변이체는 돌연변이 유발로 인하여 아미노산 서열이 상이한 폴리펩티드를 포함한다. 본 발명에 포함되는 변이체 단백질은 생물 활성을 가지며, 즉, 상기 단백질은 천연 단백질의 요망되는 생물 활성을 계속하여 보유하는데, 즉, 살충 활성을 유지한다.
서열 수준에서는 상이하지만 동일하거나 유사한 전체적인 본질적 3차원 구조, 표면 전하 분포 등을 유지하는 변이체 단백질이 또한 설계될 수 있다. 예를 들어, 미국 특허 제7058515호; 문헌[Larson et al., (2002)]; [Stemmer (1994a, 1994b, 1995)]; 및 [Crameri et al., (1996a, 1996b, 1997)]을 참조한다.
핵산. DIG-109 독소를 코딩하거나 또는 DIG-152 독소를 코딩하는 단리된 핵산이 본 발명의 일 측면이다. 이는 서열 1, 서열 3 및 서열 5를 코딩하는 핵산 및 그의 상보체를 포함하며, 그 외에 서열 1, 서열 3 및 서열 5의 살곤충성 변이체를 코딩하는 다른 핵산도 포함한다. 본 출원인에 의하면, "단리된"이라는 것은 핵산 분자가 그의 천연 환경으로부터 옮겨져서 인간의 손에 의해 다른 환경에 두어졌음을 의미한다. 유전자 코드의 중복성 때문에 다양한 상이한 DNA 서열들이 본원에 개시된 아미노산 서열을 코딩할 수 있다. 동일하거나, 또는 본질적으로 동일한 독소를 코딩하는 이들 대안적인 DNA 서열을 생성하는 것은 당업계의 숙련자의 기술 이내이다.
유전자 합성. 본원에 개시된 개선된 Cry 단백질을 코딩하는 유전자는 당업계에 공지된 다양한 방법에 의해 만들어질 수 있다. 예를 들어, 합성 유전자 절편 및 합성 유전자는 포스파이트 트리-에스테르 및 포스포르아미다이트 화학에 의해 만들어질 수 있으며 (문헌[Caruthers et al., 1987]), 판매사는 요구에 따라 유전자 합성을 수행할 수 있다. 전장 유전자는 예를 들어 제한효소 단편의 라이게이션에 의한 것 또는 또는 중첩 올리고뉴클레오티드의 폴리머라아제 연쇄 반응 조립에 의한 것을 포함하는 다양한 방식으로 조립될 수 있다 (문헌[Stewart and Burgin, 2005]). 또한, 말단 유전자 결실은 부위 특이적 말단 올리고뉴클레오티드를 이용하여 PCR 증폭에 의해 만들어질 수 있다.
DIG-109 독소 또는 DIG-152 독소를 코딩하는 핵산은 예를 들어 임의의 몇몇 상업적 공급처에 의해 현재 실행되는 방법에 의한 합성적 작제에 의해 만들어질 수 있다 (예를 들어, 미국 특허 제7482119B2호 참조). 이들 유전자, 또는 그의 부분 또는 변이체가 예를 들어 유전자 합성기의 사용 및 예를 들어 미국 특허 제5380831호의 설계 방법에 의해 또한 합성 작제될 수 있다. 대안적으로, 합성 또는 천연 유전자의 변이는 점 돌연변이를 만드는 표준 분자 생물학 기술을 이용하여 쉽게 작제될 수 있다. 이들 유전자의 단편은 또한 표준 절차에 따라 구매가능한 엑소뉴클레아제 또는 엔도뉴클레아제를 이용하여 만들어질 수 있다. 예를 들어 효소, 예컨대 Bal31 또는 부위 특이적 돌연변이 유발법을 이용하여 이들 유전자의 말단으로부터 뉴클레오티드를 조직적으로 절단할 수 있다. 또한, 활성 독소 단편을 코딩하는 유전자 단편은 다양한 제한 효소를 이용하여 수득될 수 있다.
DIG-109 독소 또는 DIG-152 독소의 아미노산 서열이 주어질 경우, 코딩 서열은 의도된 숙주가 선호하는 코돈을 이용하여 당해 단백질 서열을 역번역하고, 그 후 문제를 야기할 수 있는 서열을 제거하기 위하여 대안적인 (중복성) 코돈을 이용하여 상기 서열을 개량함으로써 설계될 수 있다. 또한, 주기적 종결 코돈을 비코딩 판독 프레임 (reading frame) 내로 조작하여 넣어서, 긴 의도하지 않은 개방 판독 프레임을 제거할 수 있다.
서열 동일성의 정량화. 두 아미노산 서열의 또는 두 핵산 서열의 동일성 %를 결정하기 위하여, 서열들을 최적의 비교 목적용으로 정렬한다. 두 서열 사이의 동일성 %는 상기 서열이 공유하는 동일한 위치의 수의 함수이다 (즉, 동일성 % = 동일한 위치의 수/위치의 총수 (예를 들어, 중첩 위치) x 100). 일 실시양태에서, 두 서열은 동일한 길이의 것이다. 두 서열 사이의 동일성 %는 갭을 허용하거나 허용하지 않고서 하기에 기술된 것과 유사한 기술을 이용하여 결정될 수 있다. 동일성 %를 계산하는 데 있어서, 전형적으로 정확한 매치 (match)가 카운팅된다.
두 서열 사이의 동일성 %의 결정은 수학적 알고리즘을 이용하여 성취될 수 있다. 그러한 알고리즘의 비제한적 예로는 BLAST (문헌[Altschul et al., 1990], 및 [Karlin and Altschul, 1990])가 있으며, 이는 문헌[Karlin and Altschul (1993)]에서와 같이 수정되고 BLASTN 및 BLASTX 프로그램 내에 포함된다. BLAST 검색은 핵산 또는 단백질 데이터베이스에서 질의 서열에 대하여 상동성인 (유사한) 서열을 확인하기 위하여 편리하게 사용될 수 있다. BLASTN 검색은 본 발명의 청구된 핵산 분자에 대하여 상동성을 갖는 뉴클레오티드 서열을 확인하기 위하여 수행될 수 있다 (스코어 = 100, 단어 길이 = 12). BLASTX 검색은 본 발명의 청구된 살곤충 단백질 분자에 대하여 상동성을 갖는 아미노산 서열을 확인하기 위하여 수행될 수 있다 (스코어 = 50, 단어 길이 = 3).
갭 형성식 (Gapped) BLAST (문헌[Altschul et al., (1997)])를 이용하여 비교 목적용의 갭 형성 정렬을 수득할 수 있다. 대안적으로, 분자들 사이의 거리 관계를 탐지하는 반복된 검색을 수행하기 위하여 PSI-Blast를 이용할 수 있다 (문헌[Altschul et al., 상기 문헌]). BLAST, 갭 형성식 BLAST, 및 PSI-Blast 프로그램을 이용할 때, 각각의 프로그램의 디폴트 (default) 파라미터가 이용될 수 있다. www.ncbi.nlm.nih.gov.를 참조한다.
서열 비교에 이용되는 수학적 알고리즘의 비제한적 예로는 ClustalW 알고리즘이 있다 (문헌[Thompson et al., 1994]). ClustalW는 서열들을 비교하며 아미노산 또는 DNA 서열의 전체를 정렬시키고, 따라서 전체 아미노산 서열 또는 뉴클레오티드 서열의 서열 보존에 관한 데이터를 제공할 수 있다. ClustalW 알고리즘은 몇몇 구매가능한 DNA/아미노산 분석 소프트웨어 패키지, 예컨대 벡터 NTI 프로그램 스위트 (Vector NTI Program Suite) (인비트로겐, 인크. (Invitrogen, Inc.), 미국 캘리포니아주 칼스바드)의 ALIGNX 모듈에서 사용된다. ALIGNX를 이용하여 아미노산 서열들을 정렬시킬 때, 두 서열 사이의 아미노산 유사성 (콘센서스 (consensus)) 또는 동일성 %를 평가하기 위하여 10의 갭 오픈 페널티 (Gap open penalty), 0.1의 갭 연장 페널티 및 blosum63mt2 비교 매트릭스를 포함하는 디폴트 설정치를 편리하게 이용할 수 있다. ALIGNX를 이용하여 DNA 서열들을 정렬시킬 때, 두 서열 사이의 동일성 %를 평가하기 위하여 15의 갭 오픈 페널티, 6.6의 갭 연장 페널티 및 swgapdnamt 비교 매트릭스를 포함하는 디폴트 설정치를 편리하게 이용할 수 있다.
서열들의 비교에 이용되는 수학적 알고리즘의 또 다른 비제한적 예로는 문헌[Myers and Miller (1988)]의 것이 있다. 그러한 알고리즘은 wEMBOSS 서열 정렬 소프트웨어 패키지 (http://emboss.sourceforge.net/에서 입수가능함)의 일부인 wSTRETCHER 프로그램 내에 포함된다. wSTRETCHER은 선형 공간을 이용하는 고전적인 동적 프로그래밍 알고리즘의 변형을 이용하여 두 서열의 최적의 전역 정렬을 계산한다. 정렬의 계산에 사용되는 치환 매트릭스, 갭 삽입 페널티 및 갭 연장 페널티는 특정될 수 있다. 뉴클레오티드 서열들의 비교를 위하여 wSTRETCHER 프로그램을 이용할 때, 스코어링 매트릭스 파일 EDNAFULL에서 16의 갭 오픈 페널티 및 4의 갭 연장 페널티가 이용될 수 있다. 아미노산 서열들의 비교에 사용될 때, EBLOSUM62 스코어링 매트릭스 파일에서 12의 갭 오픈 페널티 및 2의 갭 연장 페널티가 이용될 수 있다.
서열들의 비교에 이용되는 수학적 알고리즘의 추가의 비제한적 예로는 문헌[Needleman and Wunsch (1970)]의 것이 있으며, 이는 서열 정렬 소프트웨어 패키지 GAP 버전 10 및 wNEEDLE (http://emboss.sourceforge.net/) 내에 포함된다. GAP 버전 10은 하기 파라미터를 이용하여 서열 동일성 또는 유사성을 결정하기 위하여 사용될 수 있다: 뉴클레오티드 서열의 경우, 동일성 % 및 유사성 %는 50의 갭 가중치 및 3의 길이 가중치와, nwsgapdna.cmp 스코어링 매트릭스를 이용하여 찾아낸다. 아미노산 서열 비교의 경우, 동일성 % 및 유사성 %는 8의 갭 가중치 및 2의 길이 가중치와, BLOSUM62 스코어링 프로그램을 이용하여 결정한다.
wNEEDLE는 2개의 입력 서열을 판독하고, 그의 전체 길이를 따라 최적 정렬 (갭을 포함함)을 찾아내고, 그의 최적의 전역 서열 정렬을 파일에 기록한다. 알고리즘은 모든 가능한 정렬을 탐구하고, 모든 가능한 잔기 또는 뉴클레오티드 매치에 대한 값을 포함하는 스코어링 매트릭스를 이용하여 최상의 것을 찾아낸다. wNEEDLE는 최대의 가능한 스코어를 갖는 정렬을 찾아내며, 여기서, 정렬의 스코어는 스코어링 매트릭스로부터 취해진 매치의 합에서 정렬된 서열들 내의 갭의 개방 및 연장에서 생기는 페널티를 차감한 것과 동일하다. 치환 매트릭스 및 갭 개방 및 연장 페널티는 사용자에 의해 특정된다. 아미노산 서열들이 비교될 때, 10의 디폴트 갭 개방 페널티, 0.5의 갭 연장 페널티 및 EBLOSUM62 비교 매트릭스가 이용된다. DNA 서열을 wNEEDLE를 사용하여 비교할 때, 10의 갭 개방 페널티, 0.5의 갭 연장 페널티 및 EDNAFULL 비교 매트릭스가 이용된다.
등가의 프로그램이 또한 사용될 수 있다. "등가의 프로그램"은 당해의 임의의 두 서열에 있어서, ALIGNX, wNEEDLE, 또는 wSTRETCHER에 의해 생성된 상응하는 정렬과 비교할 때 동일한 뉴클레오티드 또는 아미노산 잔기 매치 및 동일한 서열 동일성 %를 갖는 정렬을 생성하는 임의의 서열 비교 프로그램을 의도한다. 동일성 %는 보고된 정렬 영역 (길이 면에서 임의의 갭을 포함함)에 걸쳐 두 서열 사이의 동일한 매치의 백분율이며, 유사성 %는 보고된 정렬 영역 (길이 면에서 임의의 갭을 포함함)에 걸쳐 두 서열 사이의 매치의 백분율이다.
또한 정렬은 조사에 의해 수동으로 수행될 수 있다.
재조합 숙주. 대상 발명의 독소 코딩 유전자는 광범위하게 다양한 미생물 또는 식물 숙주 내로 도입될 수 있다. 독소 유전자의 발현은 직접적으로 또는 간접적으로 살충 단백질을 세포내에서 생성 및 유지한다. 적합한 미생물 숙주, 예를 들어 슈도모나스 (Pseudomonas)를 이용하여, 미생물을 그가 증식하고 섭취되는 해충 환경에 적용될 수 있다. 그 결과는 해충의 방제이다. 대안적으로, 독소 유전자의 숙주가 되는 미생물은 독소의 활성을 연장시키고 세포를 안정화시키는 조건 하에 처리될 수 있다. 그 후, 독소 활성을 유지하는 처리된 세포는 표적 해충의 환경에 적용될 수 있다.
B.t. 독소 유전자를 적합한 벡터를 통하여 미생물 숙주 내로 도입하고 상기 숙주를 살아있는 상태로 상기 환경에 적용할 경우, 특정한 숙주 미생물을 사용하는 것이 필수적이다. 관심있는 하나 이상의 작물의 "식물권" (엽면, 엽권, 근권, 및/또는 근면)을 점유하는 것으로 공지된 미생물 숙주가 선택된다. 이들 미생물은 특정 환경 (작물 및 기타 곤충 서식지)에서 야생형 상재 미생물과 성공적으로 경쟁할 수 있도록 선택되며, 이는 폴리펩티드 살충제를 코딩하는 유전자의 안정한 유지 및 발현을 제공하고, 바람직하게는 환경적 분해 및 불활성화로부터의 살충제의 개선된 보호를 제공한다.
다수의 미생물이 광범위하게 다양한 주요 작물의 엽면 (식물 잎의 표면) 및/또는 근권 (식물 뿌리를 둘러싸고 있는 토양)에 서식하는 것으로 공지되어 있다. 이들 미생물은 박테리아, 조류 및 진균류를 포함한다. 특히 관심있는 것은 박테리아, 예를 들어 슈도모나스 속, 에르위니아 (Erwinia) 속, 세라티아 (Serratia) 속, 클렙시엘라 (Klebsiella) 속, 잔토모나스 (Xanthomonas) 속, 스트렙토마이세스 (Streptomyces) 속, 리조븀 (Rhizobium) 속, 시노리조븀 (Sinorhizobium) 속, 로도슈도모나스 (Rhodopseudomonas) 속, 메틸로필리우스 (Methylophilius) 속, 아그로박테륨 (Agrobacterium) 속, 아세토박터 (Acetobacter) 속, 락토바실루스 (Lactobacillus) 속, 아트로박터 (Arthrobacter) 속, 아조토박터 (Azotobacter) 속, 류코노스톡 (Leuconostoc) 속, 및 알칼리게네스 (Alcaligenes) 속과 같은 식물권 박테리아 종; 진균류, 특히 효모, 예를 들어 사카로마이세스 (Saccharomyces) 속, 크립토코커스 (Cryptococcus) 속, 클루이베로마이세스 (Kluyveromyces) 속, 스포로볼로마이세스 (Sporobolomyces) 속, 로도토룰라 (Rhodotorula) 속, 및 아우레오바시듐 (Aureobasidium) 속과 같은 미생물이다. 특히 관심있는 것은 식물권 세균종, 예컨대 슈도모나스 시린개 (Pseudomonas syringae), 슈도모나스 플루오레센스 (Pseudomonas fluorescens), 세라티아 마르세센스 (Serratia marcescens), 아세토박터 자일리눔 (Acetobacter xylinum), 아그로박테륨 투메파시엔스 (Agrobacterium tumefaciens), 아그로박테륨 라디오박터 (Agrobacterium radiobacter), 로도슈도모나스 스페로이데스 (Rhodopseudomonas spheroides), 잔토모나스 캄페스트리스 (Xanthomonas campestris), 시노리조븀 멜리로티 (Sinorhizobium meliloti) (이전에는 리조븀 멜리로티 (Rhizobium meliloti)), 알칼리게네스 유트로푸스 (Alcaligenes eutrophus), 및 아조토박터 비넬란디이 (Azotobacter vinelandii); 및 식물권 효모 종, 예컨대 로도토룰라 루브라 (Rhodotorula rubra), 알. 글루티니스 (R. glutinis), 알. 마리나 (R. marina), 알. 아우란티아카 (R. aurantiaca), 크립토코커스 알비두스 (Cryptococcus albidus), 씨. 디플루엔스 (C. diffluens), 씨. 라우렌티이 (C. laurentii), 사카로마이세스 로세이 (Saccharomyces rosei), 에스. 프레토리엔시스 (S. pretoriensis), 에스. 세레비지애 (S. cerevisiae), 스포로볼로마이세스 로세우스 (Sporobolomyces roseus), 에스. 오도루스 (S. odorus), 클루이베로마이세스 베로내 (Kluyveromyces veronae), 및 아우레오바시듐 폴룰란스 (Aureobasidium pollulans)이다. 특히 관심있는 것은 착색 미생물이다.
곤충 해충의 방제 방법
곤충이 트랜스제닉 식물 발현, 제형화된 단백질 조성물(들), 스프레이가능 단백질 조성물(들), 미끼 매트릭스 또는 기타 전달 시스템을 통하여 전달되는 유효량의 독소와 접촉하게 될 때, 그 결과는 전형적으로 곤충의 죽음이거나, 또는 독소가 곤충에게 이용가능해지게 하는 공급원을 곤충이 먹지 않게 되는 것이다.
대상 단백질 독소는 다양한 방식으로 표적 곤충과 접촉하도록 "적용되거나" 또는 제공될 수 있다. 예를 들어, 트랜스제닉 식물 (여기서, 당해 단백질은 식물에 의해 생성되며 식물 내에 존재함)이 사용될 수 있으며, 이는 당업계에 공지되어 있다. 독소 유전자의 발현은 또한 뿌리, 잎 등과 같은 식물의 특정 조직에서 선택적으로 달성될 수 있다. 이는 예를 들어 조직 특이적 프로모터의 이용을 통하여 성취될 수 있다. 스프레이-온 (Spray-on) 적용이 또 다른 예이며 이는 또한 당업계에 공지되어 있다. 대상 단백질은 요망되는 최종 용도용으로 적절하게 제형화되고, 그 후 만연함이 발견되기 전에, 표적 곤충이 발견된 후에, 전후에 및 기타 등등에 보호할 식물 상에 및/또는 상기 식물 주위에 / 상기 식물 근처에 스프레이될 수 있다 (또는 다르게는 적용될 수 있다). 예를 들어 미끼 과립이 또한 사용될 수 있으며, 이는 당업계에 공지되어 있다.
트랜스제닉
식물
대상 단백질을 이용하여 실질적으로 임의의 유형의 식물을 인시목 곤충에 의한 손상으로부터 보호할 수 있다. 그러한 식물의 예는 몇 가지만을 들자면 마이즈, 해바라기, 대두, 목화, 카놀라, 벼, 수수류, 담배, 밀, 보리, 야채류, 장식용 식물, 후추 (매운 후추를 포함함), 사탕무, 과실 및 잔디를 포함한다. 식물의 형질전환 방법은 당업계에 공지되어 있으며, 예시적인 형질전환법이 실시예에 기술되어 있다.
대상 발명의 바람직한 실시양태는 대상 살곤충 단백질 또는 그의 변이체를 코딩하는 유전자를 이용하여 식물을 형질전환시키는 것이다. 형질전환된 식물은 형질전환된 식물의 세포 내의 대상 살곤충 단백질 또는 그의 변이체의 방제량의 존재에 의해 곤충 표적 해충에 의한 공격에 대하여 내성을 갖는다. 살곤충 특성의 B.t. 살곤충 독소를 코딩하는 유전 물질을 특정 곤충 해충이 먹는 식물의 게놈 내로 혼입함으로써 성체 또는 유충은 먹이 식물을 소비한 후 죽게 된다. 단자엽 식물 및 쌍자엽 식물 분류의 다수의 구성원이 형질전환되었다. 트랜스제닉 농경작물과, 과실 및 야채류가 상업적으로 관심이 있다. 그러한 작물은 마이즈, 벼, 대두, 카놀라, 해바라기, 알팔파, 수수류, 밀, 목화, 땅콩, 토마토, 감자 등을 포함하지만, 이에 한정되는 것은 아니다. 외래 유전 물질을 식물 세포 내로 도입하기 위한, 그리고 도입된 유전자를 안정하게 유지 및 발현하는 식물을 수득하기 위한 몇몇 기술이 존재한다. 그러한 기술은 미세 입자 상에 코팅된 유전 물질의 세포 내로의 직접적인 가속화를 포함한다 (미국 특허 제4945050호 및 미국 특허 제5141131). 식물은 아그로박테륨 기술을 이용하여 형질전환될 수 있으며, 미국 특허 제5177010호, 미국 특허 제5104310호, 유럽 특허 출원 제0131624B1호, 유럽 특허 출원 제120516호, 유럽 특허 출원 제159418B1호, 유럽 특허 출원 제176112호, 미국 특허 제5149645호, 미국 특허 제5469976호, 미국 특허 제5464763호, 미국 특허 제4940838호, 미국 특허 제4693976호, 유럽 특허 출원 제116718호, 유럽 특허 출원 제290799호, 유럽 특허 출원 제320500호, 유럽 특허 출원 제604662호, 유럽 특허 출원 제627752호, 유럽 특허 출원 제0267159호, 유럽 특허 출원 제0292435호, 미국 특허 제5231019호, 미국 특허 제5463174호, 미국 특허 제4762785호, 미국 특허 제5004863호, 및 미국 특허 제5159135호를 참조한다. 다른 형질전환 기술은 휘스커스 (WHISKERS)TM 기술을 포함하며, 미국 특허 제5302523호 및 미국 특허 제5464765호를 참조한다. 또한 전기천공 기술이 식물의 형질전환에 사용되었으며, 국제 특허 공개 제WO 1987/06614호, 미국 특허 제5472869, 미국 특허 제5384253, 국제 특허 공개 제WO 1992/09696호, 및 국제 특허 공개 제WO 1993/21335호를 참조한다. 모든 이들 형질전환 특허 및 간행물은 본원에 참고로 포함된다. 식물을 형질전환시키는 다수의 기술에 더하여, 외래 유전자와 접촉시키는 조직의 유형도 다양할 수 있다. 그러한 조직은 배발생 조직, 제I형 및 제II형 유합 조직, 배축, 분열 조직 등을 포함하지만, 이에 한정되는 것은 아니다. 거의 모든 식물 조직은 당업자의 기술 이내의 적절한 기술을 이용하여 탈분화 동안 형질전환될 수 있다.
DIG-109 또는 DIG-152 독소를 코딩하는 유전자 또는 그의 변이체는 상기에 개시된 바와 같이 당업계에 공지된 다양한 기술을 이용하여 식물 세포 내로 삽입될 수 있다. 예를 들어, 에스케리키아 콜라이 (Escherichia coli)에서 기능적인 복제 시스템 및 형질전환된 미생물 세포의 선발을 가능케 하는 마커를 포함하는 다수의 클로닝 벡터가 고등 식물 내로의 삽입을 위한 외래 유전자의 제조 및 변형에 이용가능하다. 그러한 조작은 예를 들어 의도된 용도에 요망될 경우 돌연변이의 삽입, 절단, 부가 또는 치환을 포함할 수 있다. 벡터는 예를 들어 pBR322, pUC 시리즈, M13mp 시리즈, pACYC184 등을 포함한다. 따라서, Cry 단백질 또는 변이체를 코딩하는 서열은 적합한 제한효소 부위에서 벡터 내로 삽입될 수 있다. 생성된 플라스미드는 세포가 적합한 영양 배지에서 배양되는 이. 콜라이의 형질전환에 사용되며, 그 후 수확되고 용해되어서 작업가능한 양의 플라스미드가 회수되도록 한다. 서열 분석, 제한효소 단편 분석, 전기영동 및 기타 생화학적-분자 생물학적 방법이 분석 방법으로서 일반적으로 실시된다. 각각의 조작 후, 사용된 DNA 서열은 절단되고 다음 DNA 서열에 연결될 수 있다. 각각의 조작된 DNA 서열은 동일하거나 다른 플라스미드 내에 클로닝될 수 있다.
식물 세포의 형질전환에 있어서의 T-DNA 함유 벡터의 사용은 집중적으로 연구되었으며, 유럽 특허 출원 제120516호; 문헌[Lee and Gelvin (2008)], [Fraley et al., (1986)], 및 [An et al., (1985)]에 충분히 기술되어 있고, 당해 분야에 잘 확립되어 있다.
일단 삽입 DNA가 식물 게놈 내로 통합되었으면, 이것은 후속 세대 전체에 걸쳐 비교적 안정하다. 식물 세포의 형질전환에 사용되는 벡터는 보통형질전환 식물 세포에 특히 비알라포스, 카나마이신, G418, 블레오마이신 또는 하이그로마이신과 같은 항생제 또는 제초제에 대한 내성을 부여하는 단백질을 코딩하는 선발가능 마커 유전자를 함유한다. 따라서, 개별적으로 이용되는 선발가능 마커 유전자는 형질전환된 세포의 선발은 가능케 하여야 하는 반면 삽입 DNA를 함유하지 않는 세포의 성장은 선발 화합물에 의해 억제된다.
다수의 기술이 숙주 식물 세포 내로 DNA를 삽입하는 데 이용가능하다. 그러한 기술은 형질전환 에이전트 (agent)로서 아그로박테륨 투메파시엔스 또는 아그로박테륨 리조게네스 (Agrobacterium rhizogenes)에 의해 전달되는 T-DNA를 이용한 형질전환을 포함한다. 부가적으로, 식물 원형질체와, 전달할 DNA를 함유하는 리포좀의 융합, DNA의 직접적인 주입, 바이오리스틱스 (biolistics) 형질전환 (미세입자총 (microparticle bombardment), 또는 전기천공법과, 다른 가능한 방법이 이용될 수 있다.
대상 발명의 바람직한 실시양태에서, 식물은 단백질 코딩 영역의 코돈 사용이 식물에 대하여 최적화된 유전자로 형질전환된다. 예를 들어, 본원에 참고로 포함된 미국 특허 제5380831호를 참조한다. 또한, 유리하게는 절단 독소를 코딩하는 식물이 사용된다. 절단 독소는 전형적으로 전장 독소의 약 55% 내지 약 80%를 코딩한다. 식물에서 사용하기 위한 합성 B.t. 유전자를 생성하는 방법은 당업계에 공지되어 있다 (문헌[Stewart 2007]).
형질전환 기술에 관계없이, 유전자는 바람직하게는 벡터 내에 식물 프로모터를 포함시킴으로써 식물 세포에서 B.t. 살곤충 독소 유전자 및 변이체를 발현하도록 된 유전자 전달 벡터 내로 혼입된다. 식물 프로모터에 더하여, 다양한 공급원 유래의 프로모터가 외래 유전자의 발현을 위하여 식물 세포에서 효율적으로 사용될 수 있다. 예를 들어, 박테리아 기원의 프로모터, 예컨대 옥토파인 신타아제 프로모터, 노팔린 신타아제 프로모터, 만노파인 신타아제 프로모터; 식물 바이러스 기원의 프로모터, 예컨대 꽃양배추 모자이크 바이러스의 35S 및 19S 프로모터 등이 이용될 수 있다. 식물 프로모터는 리불로스-1,6-비스포스페이트 (RUBP) 카르복실라아제 소형 서브유닛 (carboxylase small subunit; ssu), 베타-콘글리시닌 프로모터, 파세올린 프로모터, ADH (알코올 데히드로게나아제) 프로모터, 열충격 (heat-shock) 프로모터, ADF (액틴 탈중합 인자 (actin depolymerization factor)) 프로모터 및 조직 특이적 프로모터를 포함하지만, 이에 한정되는 것은 아니다. 프로모터는 또한 전사 효율을 향상시킬 수 있는 특정한 인핸서 서열 요소를 함유할 수 있다. 전형적인 인핸서는 ADH1-인트론 1 및 ADH1-인트론 6을 포함하지만, 이에 한정되는 것은 아니다. 구성적 (Constitutive) 프로모터가 사용될 수 있다. 구성적 프로모터는 거의 모든 세포 유형에서 그리고 거의 모든 시점에서 계속적인 유전자 발현을 지시한다 (예를 들어, 액틴, 유비퀴틴, CaMV 35S). 조직 특이적 프로모터는 특정 세포 또는 조직 유형, 예컨대 잎 또는 종자에서의 유전자 발현에 책임이 있으며 (예를 들어, 제인, 올레오신, 나핀, 아실 운반 단백질 (Acyl Carrier Protein; ACP)), 이들 프로모터가 또한 이용될 수 있다. 또한, 특정 식물 조직 및 기관에서 활성을 가질 뿐만 아니라 특정한 단계의 식물의 발달 동안 활성을 갖기도 하는 프로모터가 이용될 수 있다. 그러한 프로모터의 예는 뿌리 특이적, 화분 특이적, 배아 특이적, 옥수수 수염 특이적, 면화 특이적, 종자 내배유 특이적, 체관부 특이적인 프로모터 등을 포함하지만, 이에 한정되는 것은 아니다.
특정한 상황 하에서, 유도성 프로모터를 사용하는 것이 바람직할 수 있다. 유도성 프로모터는 특정 신호, 예컨대 물리적 자극 (예를 들어, 열충격 유전자); 광 (예를 들어, RUBP 카르복실라아제); 호르몬 (예를 들어, 글루코코르티코이드); 항생제 (예를 들어, 테트라사이클린); 대사산물; 및 스트레스 (예를 들어, 가뭄)에 응답하는 유전자의 발현에 책임이 있다. 식물에서 기능하는 다른 바람직한 전사 및 번역 요소, 예컨대 5' 비번역 리더 서열, RNA 전사 종결 서열 및 폴리아데닐레이트 부가 신호 서열이 이용될 수 있다. 다수의 식물 특이적 유전자 전달 벡터가 당업계에 공지되어 있다.
곤충 내성 (IR) 형질을 포함하는 트랜스제닉 작물은 북미 전체에 걸쳐 옥수수 및 목화 식물에서 만연하며, 이들 형질의 사용은 전세계적으로 확대되고 있다. IR 형질과 제초제 내성 (herbicide tolerance; HT) 형질이 조합된 상업적 트랜스제닉 작물이 다수의 종자 회사에 의해 개발되었다. 이들은 B.t. 살곤충 단백질에 의해 부여되는 IR 형질과 아세토락테이트 신타아제 (Acetolactate Synthase; ALS) 저해제, 예컨대 술포닐우레아, 이미다졸리논, 트리아졸로피리미딘, 술폰아닐리드 등, 글루타민 신테타아제 (Glutamine Synthetase; GS) 저해제, 예컨대 비알라포스, 글루포시네이트 등, 4-히드록시페닐피루베이트 디옥시게나아제 (HydroxyPhenylPyruvate Dioxygenase; HPPD) 저해제, 예컨대 메소트리온, 이속사플루톨 등, 5-엔올피루빌쉬키메이트-3-포스페이트 신타아제 (5-EnolPyruvylShikimate-3-Phosphate Synthase; EPSPS) 저해제, 예컨대 글리포세이트 등, 및 아세틸-조효소 A 카르복실라아제 (Acetyl-Coenzyme A Carboxylase; ACCase) 저해제, 예컨대 할록시포프, 퀴잘로포프, 디클로포프 등에 대한 내성과 같은 HT 형질의 조합을 포함한다. 트랜스제닉 제공 단백질은 제초제 화학물질류, 예컨대 페녹시 산 제초제 및 피리딜옥시아세테이트 옥신 제초제 (국제 특허 공개 제WO 2007/053482 A2호 참조), 또는 페녹시 산 제초제 및 아릴옥시페녹시프로피오네이트 제초제 (국제 특허 공개 제WO 2005107437 A2, A3호 참조)에 대한 내성을 식물에 제공하는 다른 예가 공지되어 있다. IR 형질을 통하여 다수의 해충 문제를 방제하는 능력은 가치있는 상품 컨셉트 (concept)이며, 이러한 제품 컨셉트의 편리함은 곤충 방제 형질 및 잡초 방제 형질이 동일 식물에서 조합될 경우 향상된다. 또한, 대상 발명의 것과 같은 B.t. 살곤충 단백질에 의해 부여되는 IR 형질과, 하나 이상의 추가의 HT 형질, 예컨대 상기에 언급된 것의 단일 식물 조합에 하나 이상의 추가의 제1세대 형질 (input trait) (예를 들어, B.t.-유래된 단백질 또는 다른 살곤충 단백질에 의해 부여되는 다른 곤충 내성, RNAi 등과 같은 기작에 의해 부여되는 곤충 내성, B.t.-유래된 단백질 또는 다른 살선충 단백질에 의해 부여되는 선충류 내성, RNAi 등과 같은 기작에 의해 부여되는 선충류 내성, 질병 내성, 스트레스 내성, 개선된 질소 이용성 등), 또는 제2세대 형질 (output trait) (예를 들어, 고 오일 함량, 건강한 오일 조성, 영양 개선 등)과 더해진 것을 통하여 개선된 가치가 수득될 수 있다. 그러한 조합은 다수의 유전자의 동시 도입을 수반하는 신규한 형질전환 이벤트 (event) (분자적 스택)로서 공동으로 또는 통상적인 교배 (교배 스택 (stack))를 통하여 수득될 수 있다. 이득은 곤충 해충을 관리하는 능력 및 작물 식물에서의 개선된 잡초 방제성을 포함하는데, 이는 생산자 및/또는 소비자에게 이차적인 이득을 제공한다. 따라서, 대상 발명은 다수의 농경적 쟁점을 유연하게 그리고 비용 효과적으로 제어하는 능력을 갖는, 개선된 작물 품질의 완전한 농경 패키지를 제공하기 위하여 다른 형질과 조합되어 이용될 수 있다.
표적 해충
본 발명의 DIG-109 독소 및 DIG-152 독소는 인시목 곤충의 방제에 사용하기에 특히 적합하다. 인시목은 매해 매우 많은 양의 손상을 야기하는 농업적, 원예적 및 가정 해충의 중요한 군이다. 이 해충 목은 엽면을 먹는 그리고 뿌리를 먹는 유충 및 성충을 포함한다. 인시목 곤충 해충은 아초로이아 그리셀라 (Achoroia grisella), 아클레리스 글로베라나 (Acleris gloverana), 아클레리스 바리아나 (Acleris variana), 아독소파이에스 오라나 (Adoxophyes orana), 아그로티스 입실론 (검거세미나방), 알라바마 아르길라세아 (Alabama argillacea), 알소필라 포메타리아 (Alsophila pometaria), 아마이엘로이스 트란시텔라 (Amyelois transitella), 아나가스타 쿠에니엘라 (Anagasta kuehniella), 아나르시아 리네아텔라 (Anarsia lineatella), 아니소타 세나토리아 (Anisota senatoria), 안테라에아 페르나이이 (Antheraea pernyi), 안티카르시아 겜마탈리스 (Anticarsia gemmatalis), 아르칩스 (Archips) sp., 아르가이로타에니아 (Argyrotaenia) sp., 아테티스 민다라 (Athetis mindara), 봄바익스 모리 (Bombyx mori), 부쿨라트릭스 투르베리엘라 (Bucculatrix thurberiella), 카드라 카우텔라 (Cadra cautella), 코리스토네우라 (Choristoneura) sp., 코카일스 호스페스 (Cochylls hospes), 콜리아스 에우라이테메 (Colias eurytheme), 코르사이라 세팔로니카 (Corcyra cephalonica), 사이디아 라티페레아누스 (Cydia latiferreanus), 사이디아 포모넬라 (Cydia pomonella), 다타나 인테게리마 (Datana integerrima), 덴드로리무스 시베리쿠스 (Dendrolimus sibericus), 데스미아 페네랄리스 (Desmia feneralis), 디아파니아 하이알리나타 (Diaphania hyalinata), 디아파니아 니티달리스 (Diaphania nitidalis), 디아트라에아 그란디오셀라 (남서부 옥수수 명나방), 디아트라에아 사카랄리스 (사탕수수 명나방), 엔노모스 서브시그나리아 (Ennomos subsignaria), 에오레우마 로프티니 (Eoreuma loftini), 에스페스티아 엘루텔라 (Esphestia elutella), 에라니스 틸라리아 (Erannis tilaria), 에스티그메네네 아크레아 (Estigmene acrea), 율리아 살루브리콜라 (Eulia salubricola), 유포코엘리아 암비구엘라 (Eupocoellia ambiguella), 유포엑실리아 암비구엘라 (Eupoecilia ambiguella), 유프록티스 크라이소로에아 (Euproctis chrysorrhoea), 육소아 메소리아 (Euxoa messoria), 갈레리아 멜로넬라 (Galleria mellonella), 그라포리타 몰레스타 (Grapholita molesta), 하리시나 아메리카나 (Harrisina americana), 헬리코베르파 서브플렉사 (Helicoverpa subflexa), 헬리코베르파 제아 (왕담배나방), 헬리오티스 비레센스 (Heliothis virescens), 헤미류카 올리비애 (Hemileuca oliviae), 호메오소마 엘렉텔룸 (Homoeosoma electellum), 하이판티아 쿠네아 (Hyphantia cunea), 케이페리아 라이코페르시셀라 (Keiferia lycopersicella), 람디나 피셀라리아 피셀라리아 (Lambdina fiscellaria fiscellaria), 람디나 피셀라리아 루구브로사 (Lambdina fiscellaria lugubrosa), 류코마 살리시스 (Leucoma salicis), 로베시아 보트라나 (Lobesia botrana), 록사그로티스 알비코스타 (서부 콩 거세미나방), 록소스테게 스틱티칼리스 (Loxostege sticticalis), 라이만트리아 디스파르 (Lymantria dispar), 마칼라 타이리살리스 (Macalla thyrisalis), 말라코소마 (Malacosoma) sp., 마메스트라 브라시캐 (Mamestra brassicae), 마메스트라 콘피구라타 (Mamestra configurata), 만두카 퀸퀘마쿨라타 (Manduca quinquemaculata), 만두카 섹스타 (Manduca sexta), 마루카 테스툴랄리스 (Maruca testulalis), 멜란크라 픽타 (Melanchra picta), 오페로프테라 브루마타 (Operophtera brumata), 오르가이이아 (Orgyia) sp., 오스트리니아 누빌랄리스 (유럽 옥수수 명나방), 팔레아크리타 베르나타 (Paleacrita vernata), 파피아페마 네브리스 (Papiapema nebris) (일반 줄기 명나방), 파필리오 크레스폰테스 (Papilio cresphontes), 펙티노포라 고시피엘라 (Pectinophora gossypiella), 프라이가니디아 칼리포르니카 (Phryganidia californica), 필로노라익테르 블란카르델라 (Phyllonorycter blancardella), 피에리스 나피 (Pieris napi), 피에리스 라패 (Pieris rapae), 플라타이페나 스카브라 (Plathypena scabra), 플라타이노타 플로우엔다나 (Platynota flouendana), 플라타이노타 스툴타나 (Platynota stultana), 플라타입틸리아 카르두이닥타일라 (Platyptilia carduidactyla), 플로디아 인테르푼크텔라 (Plodia interpunctella), 플루텔라 자일로스텔라 (배추좀나방), 폰티아 프로토디세 (Pontia protodice), 슈달레티아 우니푼크타 (Pseudaletia unipuncta) (거염벌레), 슈도플라시아 인클루덴스 (Pseudoplasia includens), 사불로데스 아에그로타타 (Sabulodes aegrotata), 쉬주라 콘신나 (Schizura concinna), 시토트로가 세레알렐라 (Sitotroga cerealella), 스피론타 오셀라나 (Spilonta ocellana), 스포도프테라 프루기페르다 (밤나방), 스포도프테라 엑시구아 (파밤나방), 타우른스토포에아 피타이오캄파 (Thaurnstopoea pityocampa), 엔솔라 비셀리엘라 (Ensola bisselliella), 트리코플루시아 니, 우데아 루비갈리스 (Udea rubigalis), 자일로마이게스 쿠리아일스 (Xylomyges curiails), 및 이포노메우타 파델라 (Yponomeuta padella).
DIG-109 독소 및 DIG-152 독소, 및 그의 변이체를 사용하여 작물 식물의 초시목 해충을 방제하는 것이 또한 고려된다. 일부 실시양태에서, Cry 단백질은 예를 들어 뿌리벌레, 예컨대 디아브로티카 운데심푼크타타 호와르디 (Diabrotica undecimpunctata howardi) (남부 옥수수 뿌리벌레), 디아브로티카 롱기코르니스 바르베리 (Diabrotica longicornis barberi) (북부 옥수수 뿌리벌레), 및 디아브로티카 비르기페라 (Diabrotica virgifera) (서양 옥수수 뿌리벌레) 및 땅벌레, 예컨대 사이클로세팔라 보레알리스 (Cyclocephala borealis) (북부 마스크 풍뎅이 (northern masked chafer)), 사이클로세팔라 임마쿨라테 (Cyclocephala immaculate) (남부 마스크 풍뎅이), 및 포필리아 자포니카 (Popillia japonica) (일본 딱정벌레)를 포함하지만 이에 한정되는 것은 아닌 곤충 해충의 방제에 경제적으로 효율적으로 활용될 수 있다.
DIG
-109 및
DIG
-152 독소의 항체 검출
항-독소 항체. 본원에 개시된 B.t. 독소에 대한 또는 등가의 독소에 대한, 또는 이들 독소의 단편에 대한 항체는 예를 들어 문헌[Coligan et al., 2007] 및 그의 최신판에 교시된 바와 같이 당업계의 표준 절차를 이용하여 쉽게 제조될 수 있다. 그러한 항체는 DIG-109 독소, DIG-152 독소 및 그의 변이체의 존재의 검출에 유용하다.
일단 B.t. 살곤충 독소가 단리되었으면, 그 독소에 특이적인 항체가 당업계에 공지된 통상적인 방법에 의해 발생될 수 있다. 수주 또는 수개월의 기간에 걸친 선택된 숙주 내로의 반복 주입은 면역 반응을 야기하여 유의한 항-B.t. 독소의 혈청 역가를 생성한다. 바람직한 숙주는 포유류 종이며, 더 고도로 바람직한 종은 토끼, 염소, 양 및 마우스이다. 그러한 면역화 동물로부터 채혈된 혈액은 B.t. 살곤충 독소와 반응성인 항혈청 (폴리클로날 항체)을 수득하기 위하여 확립된 방법에 의해 프로세싱될 수 있다. 그 후 항혈청은 당업계에 공지된 기술에 따라 독소에의 흡착에 의해 친화성 정제될 수 있다. 친화성 정제된 항혈청은 당업계에 공지된 절차를 이용하여 항혈청 내의 면역글로불린 분획물을 단리함으로써 추가로 정제될 수 있다. 생성된 물질은 B.t. 살곤충 독소와 반응성인 면역글로불린의 불균질한 집단이다.
항-B.t. 독소 항체는 또한 면역원성 담체에 콘쥬게이션된 (conjugated) B.t. 살곤충 독소의 합성 펩티드 단편으로 이루어진 반합성 면역원을 제조함으로써 생성될 수 있다. 펩티드 단편의 제조에 유용한 다수의 방법 및 기기가 당업계에 공지되어 있다. 다수의 적합한 면역원성 담체, 예컨대 소 혈청 알부민 또는 키홀 림펫 헤모시아닌 (Keyhole Limpet Hemocyanin)이 또한 당업계에 공지되어 있으며, 이는 면역원 및 담체 단백질을 커플링시키는 기술이 그러한 바와 같다. 일단 반합성 면역원이 작제되었으면, B.t. 살곤충 독소 단편에 특이적인 항체의 제조 절차는 천연 B.t. 독소와 반응성인 항체의 제조에 사용되는 것과 동일하다.
항-B.t. 독소 모노클로날 항체 (MAb)는 정제된 B.t. 살곤충 독소를 사용하여 쉽게 제조된다. MAb를 제조하는 방법은 15년에 걸쳐 실행되었으며, 당업계의 숙련자에게 공지되어 있다. 아쥬반트 (adjuvant) 중 정제된 B.t. 살곤충 독소의 반복된 복강내 또는 피하 주사는 대부분의 동물에서 면역 반응을 야기한다. 과다면역화 B-림프구는 동물로부터 제거되며, 무기한으로 배양될 수 있는 적합한 융합 파트너 세포주와 융합된다. B-림프구가 과다면역화되고 MAb의 생성에 사용될 수 있는 바람직한 동물은 포유류이다. 더 바람직한 동물은 래트 및 마우스이며, 가장 바람직한 것은 BALB/c 마우스 주이다.
다수의 포유류 세포주가 하이브리도마의 생성에 적합한 융합 파트너이다. 다수의 그러한 주는 아메리칸 타입 컬쳐 콜렉션 (American Type Culture Collection; ATCC, 미국 버지니아주 매너서스) 및 상업적 공급처로부터 입수가능하다. 바람직한 융합 파트너 세포주는 마우스 골수종 및 HL-1® 프렌들리 (Friendly) 골수종-653 세포주 (벤트렉스 (Ventrex), 미국 메인주 포틀랜드)가 가장 바람직하다. 일단 융합되면, 생성된 하이브리도마는 1 내지 2주 동안 선발 성장 배지에서 배양된다. 2가지 공지된 선발 시스템이 비융합 골수종 세포의 제거, 또는 혼합 하이브리도마 배양물로부터의 골수종 세포들 사이의 융합에 이용가능하다. 선발 시스템의 선택은 면역화된 마우스 주 및 사용되는 골수종 융합 파트너에 따라 달라진다. 문헌[Taggart and Samloff, (1983)]에 기술된 aaT 선발 시스템이 사용될 수 있지만, 문헌[Littlefield (1964)]에 기술된 HAT (하이포잔틴, 아미노프테린, 티미딘) 선발 시스템이 바람직하며, 이는 상기에 언급된 바람직한 마우스 주 및 융합 파트너와의 그의 양립가능성 때문이다. 그 후, 이미 이용한 성장 배지는 면역특이적 MAb 분비에 대하여 스크리닝된다. 효소 결합 면역흡착 분석법 (enzyme linked immunosorbent assay; ELISA) 절차가 이 목적에 최상으로 적합하지만, 큰 부피의 스크리닝용으로 수정된 방사면역분석법이 또한 허용된다. 상당한 수의 관계없는 또는 덜 요망되는 배양을 연속적으로 줄이도록 설계된 다수의 스크린이 수행될 수 있다. B.t. 살곤충 독소와 반응성인 MAb를 분비하는 배양물은 공지된 B.t. 살곤충 독소와의 교차 반응성에 대하여 스크리닝될 수 있다. 바람직한 B.t. 살곤충 독소에 우선적으로 결합하는 MAb는 구매가능한 분석물을 이용하여 이소타이핑될 수 있다. 바람직한 MAb는 IgG 부류의 것이며, 더 고도로 바람직한 MAb는 IgG1 및 IgG2a 하위이소타입의 것이다.
바람직한 MAb를 분비하는 하이브리도마 배양물은 단클론성 및 안정성을 확립하기 위하여 수회 서브클로닝될 수 있다. 진핵, 비부착성 세포 배양물을 서브클로닝하는 공지된 방법은 제한 희석, 연성 아가로스 및 형광 활성화 세포 분류 기술을 포함한다. 각각의 서브클로닝 후, 생성된 배양물은 바람직하게는 항체 분비 및 이소타입에 대하여 재분석하여 안정한 바람직한 MAb 분비 배양물이 확립되었음을 보장한다.
항-B.t. 독소 항체는 본 발명의 청구된 B.t. 살곤충 독소 및 그의 변이체 또는 단편을 검출하는 다양한 방법에서 유용하다. 리포팅 (reporting) 기로 표지된 항체를 사용하여 다양한 환경에서의 항원의 존재를 확인할 수 있음이 공지되어 있다. 방사성 동위원소로 표지된 항체가 큰 정확성 및 민감성으로 다양한 생물 유체 중 항원의 존재의 확인을 위하여 방사면역분석법에서 수십년 동안 사용되었다. 더욱 최근에는, 효소 표지된 항체가 ELISA 분석법에서 방사성 표지 항체의 대용물로서 사용되었다. 또한, 본 발명의 B.t. 살곤충 독소에 대하여 면역반응성인 항체는 고정화 물질, 예컨대 폴리스티렌 웰 또는 입자에 결합시켜 면역분석법에서 사용하여 B.t. 독소가 시험 샘플에 존재하는지를 결정할 수 있다.
프로브를
이용한 검출
대상 발명의 독소 및 유전자를 확인하는 추가의 방법은 올리고뉴클레오티드 프로브의 사용을 통한 것이다. 이들 프로브는 검출가능한 뉴클레오티드 서열이다. 이들 서열은 적절한 방사능 표지체에 의해 검출가능해지게 될 수 있거나, 또는 미국 특허 제6268132호에 기술된 바와 같이 내재적으로 형광성이 되게 할 수 있다. 당업계에 공지된 바와 같이, 프로브 분자와 핵산 샘플이 두 분자 사이에 강한 염기쌍 형성 결합을 형성함으로써 혼성화될 경우, 프로브 및 샘플은 상당한 서열 상동성을 갖는 것으로 합리적으로 가정될 수 있다. 바람직하게는, 혼성화는 당업계에 공지된 기술에 의해 엄격한 조건 하에 행해지며, 이는 예를 들어 문헌[Keller and Manak (1993)]에 기술된 바와 같다. 프로브의 검출은 혼성화가 일어났는지를 공지된 방식으로 결정하는 수단을 제공한다. 그러한 프로브 분석은 대상 발명의 독소-코딩 유전자를 확인하는 빠른 방법을 제공한다. 본 발명에 따라 프로브로 사용되는 뉴클레오티드 절편은 DNA 합성기 및 표준 절차를 이용하여 합성될 수 있다. 이들 뉴클레오티드 서열은 또한 대상 발명의 유전자의 증폭을 위하여 PCR 프라이머로서 사용될 수 있다.
혼성화
분자 생물학의 숙련자에게 공지된 바와 같이, 두 핵산의 유사성은 혼성화하는 그의 경향에 의해 특성화될 수 있다. 본원에서 사용될 때, "엄격한 조건" 또는 "엄격한 혼성화 조건"이라는 용어는 프로브가 다른 서열에 혼성화하는 것보다 검출가능하게 더 큰 정도로 그의 표적 서열에 혼성화하는 (어닐링하는) (예를 들어, 배경에 비하여 2배 이상) 조건을 나타내고자 한다. 엄격한 조건은 서열의존적이며, 상이한 상황에서 상이하다. 세척 조건 및/또는 혼성화의 엄격도를 제어함으로써 프로브에 대하여 100% 상보성인 표적 서열이 확인될 수 있다 (상동적 프로빙). 대안적으로, 엄격도 조건은 더욱 낮은 정도의 유사성이 검출되도록 서열이 약간 미스매칭되도록 조정될 수 있다 (비상동적 프로빙). 일반적으로, 프로브는 길이가 약 1000개 미만의 뉴클레오티드이며, 바람직하게는 길이가 500개 미만의 뉴클레오티드이다.
전형적으로, 엄격한 조건은 염 농도가 pH 7.0 내지 pH 8.3에서 약 1.5 M 미만의 Na 이온, 전형적으로는 약 0.01 내지 1.0 M의 Na 이온 농도 (또는 다른 염)이며, 온도가 짧은 프로브 (예를 들어, 10 내지 50개 뉴클레오티드)일 경우 약 30℃ 이상, 그리고 긴 프로브 (예를 들어, 50개 초과의 뉴클레오티드)일 경우 약 60℃ 이상인 것이다. 엄격한 조건은 또한 포름아미드와 같은 불안정화제의 첨가에 의해 달성될 수 있다. 예시적인 낮은 엄격도 조건은 37℃에서 30% 내지 35%의 포름아미드, 1 M NaCl, 1% SDS (소듐 도데실 술페이트)의 완충액을 이용한 혼성화 및 50℃ 내지 55℃에서 1X 내지 2X SSC (20X SSC = 3.0 M NaCl/0.3 M 시트르산3나트륨)에서의 세척을 포함한다. 예시적인 중간 정도의 엄격도 조건은 37℃에서 40% 내지 45%의 포름아미드, 1.0 M NaCl, 1% SDS에서의 혼성화 및 55℃ 내지 60℃에서 0.5X 내지 1X SSC에서의 세척을 포함한다. 예시적인 높은 엄격도 조건은 37℃에서 50% 포름아미드, 1 M NaCl, 1% SDS에서의 혼성화 및 60℃ 내지 65℃에서 0.1X SSC에서의 세척을 포함한다. 임의로, 세척 완충액은 약 0.1% 내지 약 1%의 SDS를 포함할 수 있다. 혼성화 지속 기간은 일반적으로 약 24시간 미만, 일반적으로 약 4 내지 약 12시간이다.
특이성은 전형적으로 혼성화 후 세척의 함수이며, 가장 중요한 인자는 최종 세척 용액의 이온 강도 및 온도이다. DNA/DNA 하이브리드에 있어서, 열융점 (Tm)은 상보성 표적 서열의 50%가 완벽 매칭 프로브에 혼성화하는 온도 (정의된 이온 강도 및 pH 하에서)이다. Tm은 각각의 1%의 미스매칭에 있어서 약 1℃만큼 감소하며, 따라서, Tm, 혼성화 조건 및/또는 세척 조건은 요망되는 동일성의 서열들의 어닐링을 돕도록 조정될 수 있다. 예를 들어, 90% 초과의 동일성을 갖는 서열을 찾을 경우, Tm은 10℃ 감소될 수 있다. 일반적으로, 엄격한 조건은 정의된 이온 강도 및 pH에서 특정 서열 및 그의 상보체의 Tm보다 약 5℃ 더 낮도록 선택된다. 그러나, 고도로 엄격한 조건은 Tm보다 1℃, 2℃, 3℃, 또는 4℃ 더 낮은 온도에서의 혼성화 및/또는 세척을 이용할 수 있으며, 중간 정도로 엄격한 조건은 Tm보다 6℃, 7℃, 8℃, 9℃, 또는 10℃ 더 낮은 온도에서의 혼성화 및/또는 세척을 이용할 수 있으며, 낮은 엄격도 조건은 Tm보다 11℃, 12℃, 13℃, 14℃, 15℃, 또는 20℃ 더 낮은 온도에서의 혼성화 및/또는 세척을 이용할 수 있다.
Tm (℃)은 실험적으로 결정될 수 있거나 또는 계산에 의해 근사치로 계산될 수 있다. DNA-DNA 하이브리드에 있어서, Tm은 문헌[Meinkoth and Wahl (1984)]의 등식으로부터 근사치로 계산될 수 있다:
Tm(℃) = 81.5℃ + 16.6(log M) + 0.41(%GC) - 0.61(% 포름아미드) - 500/L
여기서, M은 1가 양이온의 몰 농도이며, %GC는 DNA 중 구아노신 및 시토신 뉴클레오티드의 백분율이고, % 포름아미드는 혼성화 용액 중 포름아미드의 백분율이며, L은 염기쌍 중 하이브리드의 길이이다.
대안적으로, Tm은 하기 식 (문헌[Beltz et al., 1983])으로 기술된다.
Tm(℃) = 81.5℃ + 16.6(log[Na+]) + 0.41(%GC) - 0.61(% 포름아미드) - 600/L
여기서, [Na+]는 나트륨 이온의 몰 농도이며, %GC는 DNA 중 구아노신 및 시토신 뉴클레오티드의 백분율이고, % 포름아미드는 혼성화 용액 중 포름아미드의 백분율이며, L은 염기쌍 중 하이브리드의 길이이다.
상기 등식, 혼성화 및 세척 조성물, 및 요망되는 Tm을 이용하면 당업자는 혼성화 및/또는 세척 용액의 엄격도의 변동이 내재적으로 기술됨을 이해할 것이다. 요망되는 정도의 미스매칭이 45℃ 미만 (수성 용액) 또는 32℃ 미만 (포름아미드 용액)의 Tm이 되게 할 경우, 더욱 높은 온도가 사용될 수 있도록 SSC 농도를 증가시키는 것이 바람직하다. 핵산의 혼성화에 대한 광범위한 가이드는 문헌[Tijssen (1993)] 및 문헌[Ausubel et al., 1995]과 그의 최신판에서 발견된다. 또한, 문헌[Sambrook et al., (1989)] 및 그의 최신판을 참조한다.
방사능 표지된 유전자-특이적 프로브를 이용한 서던 (Southern) 블롯 상에서의 고정 DNA의 혼성화는 표준 방법에 의해 수행될 수 있다 (문헌[Sambrook et al., 상기 문헌]). 폴리뉴클레오티드 프로브의 표지에 사용되는 방사능 동위원소는 32P, 33P, 14C, 또는 3H를 포함할 수 있다. 폴리뉴클레오티드 프로브 분자 내로의 방사능 동위원소의 혼입은 분자 생물학 분야의 숙련자에게 공지된 임의의 몇몇 방법에 의해 행해질 수 있다 (예를 들어, 문헌[Sambrook et al., 상기 문헌] 참조). 일반적으로, 혼성화 및 후속 세척은 청구된 독소 코딩 유전자에 대하여 상동성을 갖는 표적 서열의 검출을 허용하는 엄격한 조건 하에 실시될 수 있다. 이중 가닥 DNA 유전자 프로브에 있어서, 혼성화는 DNA 하이브리드의 Tm보다 20-25℃ 더 낮은 온도에서 6X SSPE, 5X 덴하르트 용액 (Denhardt's Solution), 0.1% SDS, 0.1 mg/mL의 변성 DNA에서 하룻밤 실시될 수 있다 [20X SSPE는 3M NaCl, 0.2 M NaHP04, 및 0.02M EDTA (에틸렌디아민 테트라아세트산 나트륨염)이며; 100X 덴하르트 용액은 20 gm/L의 폴리비닐피롤리돈, 20 gm/L의 피콜 (Ficoll) 타입 400 및 20 gm/L의 소 혈청 알부민 (분획물 V)임].
세척은 전형적으로 하기와 같이 실시될 수 있다:
실온에서 15분 동안 1X SSPE, 0.1% SDS (더욱 낮은 엄격도의 세척)에서 2회.
Tm - 20℃에서 15분 동안 0.2X SSPE, 0.1% SDS (더욱 높은 엄격도의 세척)에서 1회.
올리고뉴클레오티드 프로브에 있어서, 혼성화는 하이브리드의 Tm보다 10-20℃ 더 낮은 온도에서 6X SSPE, 5X 덴하르트 용액, 0.1% SDS, 0.1 mg/mL의 변성 DNA에서 하룻밤 실시될 수 있다. 올리고뉴클레오티드 프로브의 Tm은 하기 식에 의해 결정될 수 있다 (문헌[Suggs et al., 1981]).
Tm(℃ ) = 2(T/A 염기쌍의 수) + 4(G/C 염기쌍의 수)
세척은 전형적으로 하기와 같이 실시될 수 있다:
실온에서 15분 동안 1X SSPE, 0.1 % SDS (더욱 낮은 엄격도의 세척)에서 2회.
혼성화 온도에서 15분 동안 1X SSPE, 0.1% SDS (더욱 높은 엄격도의 세척)에서 1회.
염 농도 및 온도의 조합의 일부 예는 (엄격도 증가 순서대로) 하기와 같다: 2X SSPE 또는 SSC, 실온; 1X SSPE 또는 SSC, 42℃; 0.1X SSPE 또는 SSC, 42℃; 0.1X SSPE 또는 SSC, 65℃.
혼성화용 프로브 분자 및 프로브와 표적 분자 사이에 형성된 하이브리드 분자는 방사능 표지 이외의 수단에 의해 검출가능해지게 될 수 있다. 그런 다른 방법은 본 발명의 범주 이내인 것으로 의도된다.
본원에 기술된 실시예 및 실시양태는 단지 예시 목적을 위한 것이며, 그를 고려한 다양한 변형 또는 변화가 당업계의 숙련자에게 제안될 것이고 이는 본 출원의 사상 및 범위와 첨부된 특허청구범위의 범주 내에 포함됨을 이해하여야 한다.
구체적으로 지시되거나 뜻하는 것이 아니라면, 본원에서 사용될 때 단수형 ("a", "an" 및 "the") 용어는 "적어도 하나"를 나타낸다.
하기는 본 발명을 실행하는 절차를 예시하는 실시예이다. 이들 실시예는 한정하는 것으로 파악되어서는 안된다. 달리 나타내지 않으면 모든 백분율은 중량 기준이며, 모든 용매 혼합 비율은 부피 기준이다. 모든 온도는 ℃ 단위이다.
실시예
1
키메라
Cry1Ca
코어 독소 및
Cry1Ab
전독소의
설계
키메라 독소. 하나의 Cry 독소의 코어 독소 도메인이 또 다른 Cry 독소의 전독소 절편에 융합된 것을 이용하는 키메라 단백질이 예를 들어 미국 특허 제5593881호 및 미국 특허 제5932209호에서 이전에 보고되었다. Cry1Ca3 델타 내독소 단백질 서열은 CryIC(b)의 폐기된 용어 하에 젠뱅크 (GenBank) 등록 번호 AAA22343으로 기탁되어 있다.
본 발명의 Cry1Ca 키메라 단백질 변이체는 Cry1Ca3 살곤충 독소로부터 유래된 N-말단 코어 독소 절편이 상기 코어 독소 절편의 말단을 지난 어떠한 지점에서 이종 델타 내독소 전독소 절편에 융합된 것을 포함하는 독소를 포함한다. 코어 독소로부터의 이종 전독소 절편으로의 전위는 대략적으로 천연 코어 독소/전독소 접합부에서 일어날 수 있거나, 또는 대안에서는 천연 전독소의 일부분 (코어 독소 절편을 지나서 연장함)이 유지될 수 있고 이때 이종 전독소로의 전위가 하류에서 일어난다. 변이 양식에서, 코어 독소 및 전독소 절편은 정확하게 그가 유래된 천연 독소의 아미노산 서열을 포함할 수 있거나, 또는 서로에게 융합될 때 절편들의 생물학적 기능을 감소시키지 않으며 상기 기능을 향상시킬 수 있는 아미노산 부가, 결실 또는 치환을 포함할 수 있다.
예를 들어, 대상 발명의 키메라 독소는 Cry1Ca3로부터 유래된 코어 독소 절편 및 이종 전독소를 포함한다. 본 발명의 바람직한 실시양태에서, Cry1Ca3으로부터 유래되고 서열 1 (619개 아미노산)에 Cry1Ca 코어 독소 절편으로 개시된 코어 독소 절편은 Cry1Ab 델타-내독소로부터 유래된 전독소 절편을 포함하는 이종 절편에 융합시킨다. 서열 2는 본 발명의 Cry1Ca 변이체에서 유용한 그리고 Cry1Ab로부터 유래된 하나의 전독소 절편의 545개 아미노산의 서열을 개시한다. 서열 2의 이 전독소 절편의 마지막의 약 100 내지 150개 아미노산이 주의를 끌며, 이를 본 발명의 키메라 독소 내에 포함시키는 것이 중요하다. 따라서, 본 발명의 바람직한 실시양태는 서열 1에 개시된 Cry1Ca 코어 독소 절편을 서열 2에 개시된 Cry1Ab로부터 유래된 전독소 절편에 연결시킨 키메라 단백질을 포함한다. 본원에서 DIG-152로 칭하는 키메라 단백질의 1164개 아미노산의 서열은 서열 3 (pMYC2547 버전)으로 개시되어 있다. 본 발명의 두 번째의 바람직한 실시양태는 서열 1로 개시된 Cry1Ca 코어 독소 절편을 서열 4로 제시된 Cry1Ab로부터 유래된 제2의 545개 아미노산의 전독소 절편에 연결시킨 키메라 단백질을 포함한다. 이 전독소 절편의 마지막의 약 100 내지 150개 아미노산이 주의를 끌며, 이를 본 발명의 키메라 독소 내에 포함시키는 것이 중요하다. DIG-109로 칭하는 제2 키메라 단백질의 1164개 아미노산의 서열은 서열 5 (마이즈 최적화 버전)로 개시되어 있다. Cry1Ca 코어 독소 변이체 및 Cry1Ab로부터 유래된 전독소를 포함하는 다른 키메라 융합물이 본 발명의 범주 내임을 이해하여야 한다.
서열 2 및 서열 4로 제시된, Cry1Ab로부터 유래된 전독소 절편들은 단지 단일한 (첫 번째) 위치에서 서열이 상이한, 서로의 본질적 기능적 등가물임을 주목한다.
실시예
2
키메라
Cry1Ca
코어/
Cry1Ab
전독소
단백질을 코딩하는 발현 플라스미드의
작
제 및
슈도모나스에서의
발현
Cry1Ab 전독소에 융합된 Cry1Ca 코어로 이루어진 전장 키메라 단백질 (DIG-152; 서열 3)을 생성하도록 조작한 슈도모나스 플루오레센스 (Pf) 발현 작제물 pMYC2547의 작제에서 표준 클로닝법 [예를 들어, 문헌[Sambrook et al., (1989)] 및 문헌[Ausubel et al., (1995)]과 그의 최신판에 기술된 바와 같음]을 이용하였다. 단백질 생성은 미국 특허 제5169760호에 개시된 바와 같이 변형 lac 오페론을 삽입한 슈도모나스 플루오레센스 주 MB214 (주 MB101의 유도체; 피. 플루오레센스 biovar I)에서 수행하였다. 기본적인 클로닝 방법은 DIG-152를 코딩하는 DNA 단편을 플라스미드 벡터 내로 서브클로닝하는 것을 수반하였으며, 그에 의해 이것은 플라스미드 pKK223-3 (피엘 파마시아 (PL Pharmacia; 미국 위스콘신주 밀워키)) 유래의 rrnBTlT2 종결 서열 및 Ptac 프로모터의 발현 제어 하에 두어진다. 한 가지 그러한 플라스미드는 pMYC2547로 명명하였으며, 이 플라스미드를 지닌 MB214 단리체를 Dpf108로 명명하였다.
진탕 플라스크에서의 성장 및 발현 분석 곤충 생물분석 및 특성화를 위한 DIG-152 단백질의 생성은 진탕 플라스크에서 성장시킨 피. 플루오레센스 주 Dpf108에 의해 성취하였다. Ptac 프로모터에 의해 지시되는 DIG-152 단백질 생성은 미국 특허 제5527883호에 이전에 기술된 바와 같이 행하엿다. 진탕하면서 30℃에서 24시간 처음 인큐베이션한 후 이소프로필-β-D-1-티오갈락토피라노사이드 (IPTG)를 첨가함으로써 발현을 유도하였다. 유도 시점 및 유도 후 다양한 시점에서 배양물을 샘플링하였다. 세포 밀도를 600 nm에서의 광학 밀도 (OD600)에 의해 측정하였다.
진탕 플라스크 샘플의 세포 분획화 및 SDS - PAGE 분석 각각의 샘플링 시점에서, 샘플의 세포 밀도를 OD600 = 20으로 조정하고, 1 mL의 분취물을 14000 x g에서 5분 동안 원심분리하였다. 세포 펠렛을 -80도에서 냉동시켰다. 냉동시킨 진탕 플라스크 세포 펠렛 샘플로부터의 용해성 및 불용성 분획물을 이지라이즈 (EasyLyse)TM 박테리아 단백질 추출 용액 (에피센터 (EPICENTRE)® 바이오테크놀로지즈 (Biotechnologies), 미국 위스콘신주 매디슨)을 이용하여 생성하였다. 각각의 세포 펠렛을 1 mL의 이지라이즈TM 용액에 재현탁시키고, 용해 완충액에서 1:4로 추가로 희석시키고, 실온에서 30분 동안 진탕하면서 인큐베이션하였다. 용해물을 14,000 rpm에서 20분 동안 4도에서 원심분리하고, 상청액을 용해성 분획물로서 회수하였다. 그 후 펠렛 (불용성 분획물)을 동일한 부피의 인산염 완충 염수 (PBS; 11.9 mM Na2HPO4, 137 mM NaCl, 2.7 mM KC1, pH7.4)에 재현탁시켰다.
샘플은 β-메르캅토에탄올을 함유하는 2X 램믈리 (Laemmli) 샘플 완충액과 1:1로 혼합하고 (문헌[Sambrook et al., 상기 문헌]), 5분 동안 비등시킨 후 크리테리온 (Criterion) XT 비스-트리스 12% 겔 (바이오-라드 인크. (Bio-Rad Inc.; 미국 캘리포니아주 허큘리스)) 상에 로딩하였다. 전기영동을 권고된 XT MOPS 완충액에서 수행하였다. 겔을 제조업자 (바이오-라드)의 프로토콜에 따라 바이오-세이프 쿠마시 스테인 (Bio-Safe Coomassie Stain)으로 염색시키고, 알파 이노테크 이미징 시스템 (Alpha Innotech Imaging system; 미국 캘리포니아주 샌리앤드로)을 이용하여 이미징하였다.
봉입체 ( inclusion body ; IB ) 제조. DIG-152 단백질 봉입체 (IB) 제조는 SDS-PAGE 및 MALDI-MS (매트릭스 보조 레이저 탈착/이온화 질량 분광법 (Matrix Assisted Laser Desorption/Ionization Mass Spectrometry))에 의해 입증되는 바와 같이 불용성 B.t. 살곤충 단백질을 생성하는 피. 플루오레센스 발효로부터의 세포에서 수행하였다. 피. 플루오레센스 발효 펠렛을 37도 수조에서 해동시켰다. 세포를 용해 완충액 [50 mM 트리스, pH 7.5, 200 mM NaCl, 20 mM EDTA 2나트륨 염 (에틸렌디아민테트라아세트산), 1% 트리톤 X-100, 및 5 mM 디티오트레이톨 (DTT); 5 mL/L의 박테리아 프로테아제 저해제 칵테일 (카탈로그 번호 P8465; 시그마-알드리치 (Sigma- Aldrich; 미국 미주리주 세인트 루이스))을 사용 직전에 첨가함]에 25% (w/v)로 재현탁하였다. 세포를 최저 설정치의 핸드헬드 (hand-held) 균질화기 (티슈 테어러 (Tissue Tearor), 바이오스펙 프로덕츠, 인크. (BioSpec Products, Inc.; 미국 오클라호마주 바틀레스 빌))를 이용하여 현탁시켰다. 라이소자임 (계란 흰자 유래의 시그마 L7651 25 mg)은 금속 스패튤라를 이용하여 혼합함으로써 세포 현탁물에 첨가하고, 상기 현탁물을 실온에서 1시간 동안 인큐베이션하였다. 현탁물을 얼음 상에서 15분 동안 냉각시키고, 그 후 브랜슨 (Branson) 초음파 장치 250 (2회의 1분의 기간, 50%의 듀티 사이클, 30%의 출력)를 이용하여 초음파 처리하였다. 세포 용해물을 현미경법으로 체크하였다. 필요할 경우 추가의 25 mg의 라이소자임을 첨가하고, 인큐베이션 및 초음파 처리를 반복하였다. 현미경법을 통한 세포 용해의 확증 후, 상기 용해물을 11,500 x g에서 25분 동안 (4도) 원심분리하여 IB 펠렛을 형성하고, 상청액을 버렸다. IB 펠렛을 100 mL 용해 완충액으로 재현탁시키고, 핸드헬드 혼합기로 균질화하고, 상기와 같이 원심분리하였다. 상청액이 무색으로 되고 IB 펠렛이 안정된 회백색으로 될 때까지 IB 펠렛을 재현탁 (50 mL의 용해 완충액 중에), 균질화, 초음파 처리 및 원심분리에 의해 반복적으로 세척하였다. 마지막 세척에 있어서, IB 펠렛을 2 mM EDTA를 함유하는 살균 여과 (0.22 ㎛) 증류수에 재현탁시키고, 원심분리하였다. 최종 펠렛을 2 mM EDTA를 함유하는 살균 여과 증류수에 재현탁시키고, 1 mL의 분취물로 -80도에서 보관하였다.
IB 제제 중 단백질의 SDS-PAGE 분석 및 정량화는 1 mL의 IB 펠렛 분취물을 해동시키고 살균 여과 증류수로 1:20으로 희석시킴으로써 행하였다. 그 후 희석 샘플을 4X 환원 샘플 완충액 [250 mM 트리스, pH 6.8, 40% 글리세롤 (v/v), 0.4%의 브로모페놀 블루 (Bromophenol Blue) (w/v), 8% SDS (w/v) 및 8% β-메르캅토에탄올 (v/v)]을 이용하여 끓이고, 노벡스 (Novex)® 4-20% 트리스-글리신 상에 로딩하고, 12+2 웰 겔 (인비트로겐)을 1X 트리스/글리신/SDS 완충액 (바이오라드 (BioRad))으로 러닝시켰다. 겔을 60분 동안 200 V에서 러닝시키고, 그 후 쿠마시 블루 (Coomassie Blue) (10% 아세트산, 45% 메탄올 중 50% R-250/50% G-250)로 염색시키고, 증류수 중 7% 아세트산, 5% 메탄올로 탈염시켰다. 표적 밴드의 정량화는 동일 겔 상에서 러닝시킨 소 혈청 알부민 (BSA) 표준 샘플에 대하여 상기 밴드의 농도계 값들을 비교하여 표준 곡선을 생성함으로써 행하였다.
봉입체의 가용화 . Pf 클론 DPf108로부터의 DIG-152 봉입체 현탁물 6 mL을 에펜도르프 (Eppendorf) 모델 5415C 마이크로퓨지 (microfuge)의 최고 설정치에서 (대략 14,000 x g) 원심분리하여 봉입체를 펠렛화하였다. 보관 완충액 상청액을 제거하고, 50 mL 코니칼 (conical) 튜브에서 25 mL의 100 mM 탄산나트륨 완충액 (pH 11)으로 대체하였다. 봉입체를 피펫을 이용하여 재현탁시키고, 와동시켜 철저히 혼합하였다. 튜브를 4도에서 하룻밤 온화하게 흔들리는 플랫폼 상에 두어서 표적 단백질을 추출하였다. 추출물을 30,000 x g에서 4도에서 30분 동안 원심분리하고, 생성된 상청액을 아미콘 (Amicon) 울트라-15 재생 셀룰로오스 원심분리 필터 장치 (30,000의 분자량의 컷오프 (Cutoff); 밀리포어 (Millipore))를 이용하여 5배 농축시켰다. 그 후 샘플 완충액을 일회용 PD-10 컬럼 (지이 헬스케어 (GE Healthcare; 미국 뉴저지주 피스카타웨이)을 이용하여 10 mM CAPS [3-(사이클로헥사미노)1-프로판술폰산] (pH 10)로 교환하였다.
봉입체 단백질의 가용화 및 트립신 활성화. 일부 예에서, Pf 클론 DPf108로부터의 DIG-152 봉입체 현탁물을 에펜도르프 모델 5415C 마이크로퓨지의 최고 설정치에서 (대략 14,000 x g) 원심분리하여 봉입체를 펠렛화하였다. 보관 완충액 상청액을 제거하고, pH 11의 100 mM CAPS로 대체하여 대략 50 mg/mL의 단백질 농도를 제공하였다. 튜브를 실온에서 3시간 동안 흔들어서 상기 단백질을 완전히 가용화하였다. 트립신을 5% 내지 10% (w:w, IB 분말의 초기 중량 기준)인 양으로 첨가하고, 4도에서 하룻밤 흔들면서 인큐베이션함에 의해 또는 실온에서 90-120분 동안 흔들어서 소화를 성취하였다. 불용성 물질을 10,000 x g에서의 15분 동안의 원심분리에 의해 제거하고, 상청액을 모노큐 (MonoQ) 음이온 교환 컬럼 (10 mm x 10 cm)에 적용하였다. 활성화 DIG-152 단백질은 25배 컬럼 부피에 걸쳐 0% 내지 100%의 1 M NaCl 구배에 의해 용출시켰다 (이는 SDS-PAGE에 의해 결정되는 바와 같음, 하기 참조). 활성화 단백질을 함유하는 분획물을 풀링하고 (pooled), 필요할 경우 상기와 같이 아미콘 울트라-15 재생 셀룰로오스 원심분리 필터 장치를 이용하여 10 mL 미만으로 농축시켰다. 그 후 상기 물질을 100 mM NaCl. 10% 글리세롤, 0.5% 트윈 (Tween)-20 및 1 mM EDTA를 함유하는 완충액에서 수퍼덱스 (Superdex) 200 컬럼 (16 mm x 60 cm)에 통과시켰다. 활성화된 (효소에 의해 절단된) 단백질이 65 내지 70 mL에서 용출됨을 SDS-PAGE 분석에 의해 결정하였다. 활성화 단백질을 함유하는 분획물을 풀링하고, 상기와 같이 원심분리 농축기를 이용하여 농축시켰다.
겔 전기영동. 환원제로서 5 mM DTT를 함유하는 NuPAGE® LDS 샘플 완충액 (인비트로겐) 중에 1:50으로 희석시킴으로써 농축 단백질 제제를 전기영동용으로 준비하고, 95도에서 4분 동안 가열하였다. 샘플은 0.2 ㎍ 내지 2 ㎍/레인의 범위의 5가지의 BSA 표준물 (표준 곡선 생성용)과 함께 4-12% NuPAGE® 겔의 두 레인에 로딩하였다. 추적 염료가 겔의 하부에 도달할 때까지 MOPS SDS 러닝 완충액 (인비트로겐)을 이용하여 전압을 200 V로 인가하였다. 겔을 10% 아세트산, 45% 메탄올 중 0.2% 쿠마시 블루 G-250으로 염색시키고, 처음에 잠시 45% 메탄올, 10% 아세트산으로, 그리고 그 후 7% 아세트산, 5% 메탄올로 충분히 탈염시켰는데, 이는 배경이 제거될 때까지 그렇게 하였다. 탈염 후, 겔을 바이오라드 플루오르-S 멀티이미저 (Fluor-S Multilmager)로 스캐닝하였다. 상기 기기의 퀀티티 원 소프트웨어 (Quantity One Software) v.4.5.2를 사용하여 염색된 단백질 밴드의 배경-차감 부피를 수득하고 BSA 표준 곡선을 생성하였으며, 상기 곡선을 이용하여 원액 중 키메라 DIG-152 단백질의 농도를 계산하였다.
실시예
3
슈도모나스
플루오레센스에서
생성된
DIG
-152 단백질의
살곤충
활성
유럽 옥수수 명나방 (ECB; 오스트리니아 누빌랄리스 (휘브네르 (Huebner))), Cry1F-내성 ECB (rECB), 왕담배나방 (CEW; 헬리코베르파 제아 (보디에 (Boddie))), 검거세미나방 (BCW; 아그로티스 입실론 (후프나겔 (Hufnagel))), 밤나방 (FAW, 스포도프테라 프루기페르다 (제이.이. 스미스 (J.E. Smith))), Cry1F-내성 FAW (rFAW), 및 남서부 옥수수 명나방 (SWCB, 디아트라에아 그란디오셀라)을 포함하는 인시목 종에서 DIG-152 단백질의 살곤충 활성을 입증하였다.
샘플 제조 및 생물분석. 봉입체 제제 (천연 전장 단백질 또는 트립신 활성화 단백질)를 PD-10 컬럼 또는 투석과 같은 교환 방법에 의해 10 mM CAPS (pH 1O) 완충액으로 옮겼다. 그 후 샘플을 10 mM CAPS (pH 10) 중에 적절하게 희석시켰으며, 모든 생물분석은 사망률 또는 성장 저해율에 대한 배경 체크로서의 역할을 하는 이 완충액으로 이루어진 대조 처리제를 포함하였다.
생물분석 완충액 중 단백질 농도는 겔 농도측정을 위하여 표준 곡선을 생성하기 위하여 BSA를 사용하여 겔 전기영동에 의해 개산하였는데, 이는 상기와 같이 바이오라드 이미징 시스템을 이용하여 측정하였다. 겔 매트릭스 중 단백질을 쿠마시 블루계 염색제로 염색시키고, 탈염시킨 후 판독하였다.
정제한 단백질을 인공 곤충 규정식 상에서 신생 인시목 유충을 이용하여 행하는 생물분석에서의 살곤충 활성에 대하여 시험하였다. ECB, CEW, BCW, FAW, 및 SWCB의 유충을 상업적 곤충 연구소 (벤존 리서치 인크. (Benzon Research Inc.; 미국 펜실베이니아주 칼리즐)가 유지한 콜로니로부터 수득한 알로부터 부화시켰다. rECB 및 rFAW의 유충을 독점적 콜로니 (다우 아그로사이언시즈 (Dow AgroSciences; 미국 인디애나주 인디애나폴리스))로부터 수확한 알로부터 부화시켰다.
생물분석은 곤충 생물분석용으로 특별히 설계된 128웰 플라스틱 트레이 (씨-디 인터내셔널 (C-D International; 미국 뉴저지주 피트맨))에서 행하였다. 각각의 웰은 1.0 mL의 다중-종 인시목 규정식 (사우스랜드 프로덕츠 (Southland Products; 미국 아칸소주 레이크 빌리지)을 함유하였다. 40 μL의 단백질 샘플 분취물을 각각의 웰의 1.5 cm2 규정식 표면 상에 피펫에 의해 전달하였다 (즉, 26.7 μL/cm2). 규정식 농도를 웰 중 표면적 제곱 센티미터 당 DIG-152 단백질의 양 (ng)으로 계산하였다. 처리한 트레이는 규정식 표면 상의 액체가 증발되거나 또는 규정식 내로 흡수될 때까지 흄후드에서 유지하였다.
부화한지 수시간 내에, 개개의 유충은 적신 낙타털 브러시로 골라내어 웰 당 1마리의 유충을 처리 규정식 상에 두었다. 그 후, 만연된 웰을 가스가 교환되도록 통기되는 투명 플라스틱의 접착 시트로 밀봉하였다 (씨-디 인터내셔널). 생물분석 트레이를 제어된 환경 조건 [28도, 대략 40%의 상대 습도 (Relative Humidity; RH), 16 hr:8 hr (명암 (ligh dark))] 하에 5일 동안 유지하고, 그 히간 후 각각의 단백질 샘플에 노출된 곤충의 총수, 죽은 곤충의 수 및 생존 곤충의 중량을 기록하였다. 사망률 (%) 및 성장 저해율 (%)을 각각의 처리에 대하여 계산하였다. 성장 저해율 (GI) (%)을 하기와 같이 계산하였다:
%GI = [1 - (TWIT/TNIT)/(TWIBC/TNIBC)] x 100
여기서, TWIT는 처리에 있어서의 곤충의 총 중량 (Total Weight of Insects in the Treatment)이며,
TNIT는 처리에 있어서의 곤충의 총수 (Total Number of Insects in the Treatment)이고,
TWIBC는 배경 체크 (완충액 대조구)에 있어서의 곤충의 총 중량 (Total Weight of Insects in the Background Check)이며,
TNIBC는 배경 체크 (완충액 대조구)에 있어서의 곤충의 총수 (Total Number of Insects in the Background Check)이다.
GI50은 %GI 값이 50인 규정식 중 키메라 DIG-152 단백질의 농도인 것으로 결정하였다. LC50 (50% 치사 농도)Lethal Concentration)은 50%의 시험 곤충을 사멸시키는 규정식 중 DIG-152 단백질의 농도로 기록하였다. 통계적 분석 (일원 분산 분석 (One-way ANOVA))을 JMP 소프트웨어 (에스에이에스 (SAS; 미국 노스캐롤라이나주 캐리))를 이용하여 행하였다.
표 3에는 7가지 유형의 시험 곤충 유충에서의 DIG-152 단백질의 섭취에 대한 생물분석의 결과를 제시하였다.
밤나방 (스포도프테라 프루기페르다) 및 남서부 옥수수 명나방 (디아트라에아 그란디오셀라)의 신생 유충의 성장을 DIG-152 단백질의 섭취 후 저해시킨다는 것이 본 발명의 DIG-152 단백질의 특징이었다. 또한, Cry1F에 의한 중독에 대하여 내성을 갖는 밤나방 유충은 야생형 밤나방 유충이 그러한 만큼 DIG-152 활성에 대하여 민감하였다.
실시예
4
슈도모나스
플루오레센스에서
생성된
DIG
-152 단백질의 추가의
살곤충
활성
DIG-152 단백질 (트립신 활성화되지 않음)의 인시목 살곤충 활성을 규정식 포함 절차를 이용하여 용량-응답 실험에서 사탕수수 명나방 (SCB; 디아트라에아 사카랄리스) 및 Cry1Ab-내성 SCB (rSCB)의 신생 유충에서 추가로 입증하였다. DIG-152 봉입체는 7.5 mL의 100 mM CAPS (pH 11), 1 mM EDTA에서 4도에서 4시간 동안 온화하게 흔들어서 가용화하고, 이것에 200 μL의 박테리아 프로테아제 저해제 (시그마 P4865; 공급처의 지시에 따라 준비)를 첨가하였다. 원심분리하여 불용성 물질을 펠렛화한 후, 스톡 단백질 농도를 100 mM CAPS (pH 11) 중에서 4.0 mg/mL로 조정하였다. 곤충 생물분석에 있어서, 규정식 1 g 당 0.030 ㎍ 내지 102 ㎍의 범위의 DIG-152 단백질 농도는 적절한 부피를 메리딕 (meridic) 규정식 (바이오-서브 (Bio-Serv; 미국 뉴저지주 프렌치타운))과 혼합함으로써 준비하고, 그 직후 대략 0.7 mL의 규정식을 128셀 트레이 (바이오 (Bio)-Ba-128, 씨-디 인터내셔널)의 개개의 셀 내로 분배하였다.
트립신-활성화 Cry1Ab 단백질 (살곤충 활성에 대한 양성 대조구로서 사용)을 규정식 (동결건조 분말을 적당량의 증류수와 혼합한 후 규정식 제조를 함으로써 제조함) 1 g 당 0.03125 ㎍ 내지 32 ㎍의 범위에서 시험하였다.
단지 완충액 (100 mM CAPS (pH 11), DIG-152 시험용) 또는 증류수 (블랭크 대조구, Cry1Ab 시험용)로 제조한 규정식을 대조 처리제로서 사용하였다. 디. 사카랄리스의 하나의 신생 유충 (부화 후 24시간 미만)을 각각의 셀에서 규정식 표면 상에 방출하였다. 유충 접종 후, 셀을 통기 뚜껑 (씨-디 인터내셔널)으로 덮고, 생물분석 트레이를 28도, 50% RH, 및 16 hr:8 hr의 (명암) 광주기에서 유지한 환경실에 두었다. 유충 사망률, 유충 중량, 및 중량 증가를 보이지 않은 (유충 당 0.1 mg 미만) 생존 유충의 수를 접종 후 7일째에 기록하였다. 곤충 주/Cry 단백질 농도의 각각의 조합을 4회 반복하였으며, 각각의 반복에서 16 내지 32마리의 유충을 이용하였다.
유충 사망 기준은 "실제" 사망으로 측정하였는데, 이는 죽은 (병적) 유충 및 유의한 체중 증가를 보이지 않은 (즉, 유충 당 0.1 mg 미만) 생존 (성장을 멈추고 먹이를 먹지 않음) 유충 둘 모두를 고려하였다. 처리에 있어서의 유충의 실제 사망률을 하기 등식을 이용하여 계산하였다:
실제 사망률 (%) = [TDS/TNIT] x 100
여기서, TDS는 죽은 유충의 총수 + 성장을 멈춘 유충의 수 (Total number of Dead larvae plus the number of Stunted larvae)이며,
TNIT는 처리에 있어서의 곤충의 총수 (Total Number of Insects in the Treatment)이다.
각각의 디. 사카랄리스 주의 "실제" 사망률 (이하, 사망률로 간단히 함)은 DIG-152 처리용의 단지 완충제로 처리한 규정식 또는 Cry1Ab 처리 후 결과를 분석하기 위한 물 블랭크 대조 규정식에서 관찰한 유충 사망률에 대하여 보정하였다.
용량 응답 실험의 결과를 추가로 분석하여 GI50 값을 확립하였다 [즉, 유충 성장 저해율 (%GI) 값이 50인 규정식 중 B.t. 단백질의 농도]. Cry1Ab 단백질을 함유하는 규정식에서의 유충의 %GI 값을 하기 식을 이용하여 계산하였다:
%GI = [TWC -TWT]/TWC x 100
여기서, TWC는 물 대조 규정식을 먹인 유충의 총 체중 (Total body Weight of larvae feeding on water Control diet)이며,
TWT는 Cry1Ab 처리 규정식을 먹인 유충의 총 체중 (Total body Weight of larvae feeding on Cry1Ab Treated diet)이고,
반면에, DIG-152 단백질 섭취의 결과로서 유충 %GI를 분석함에 있어서 이것은 하기 식을 이용하여 계산하였다:
%GI = [TWB -TWT]/TWB x 100
여기서, TWB는 단지 완충제 대조구 처리 규정식을 먹인 유충의 총 체중 (Total body Weight of larvae feeding on Buffer-Only control treated diet)이며,
TWT는 DIG-152 처리 규정식을 먹인 유충의 총 체중 (Total body Weight of larvae feeding on DIG-152 Treated diet)이다.
100%의 유충 성장 저해율은, 유의한 체중 증가가 있는 유충이 전혀 없는 경우 (유충 당 0.1 mg 미만) 반복체에 할당하였다. 성장 저해 데이터는 곤충 주 및 Cry 단백질 농도를 두 주요 인자로 이용하여 이원 분산 분석 (two-way ANOVA)을 이용하여 분석하였다. LSMEANS 검정을 이용하여 α= 0.05의 수준에서의 처리 차이를 결정하였다.
디아트라에아 사카랄리스 유충에서의 규정식 포함 생물분석의 결과를 표 4에 제공하였다.
데이터 분석 그 후, 보정한 용량/사망률 데이터를 50% 사망 (LC50) 값을 야기한 처리 단백질 농도 및 상응하는 95% 신뢰 구간 (confidence intervals; CI)의 결정을 위한 프로빗 (probit) 분석을 하였다. 프로빗 분석에서 이용한 처리는 0의 사망률을 생성한 최고 농도, 100% 사망률을 생성한 최저 농도, 및 상기 극단들 사이의 모든 결과를 포함하였다. 내성 비는 rSCB 주의 LC50 값을 SCB 곤충의 LC50 값으로 나누어서 계산하였다. 치사 용량 비 검정을 이용하여 α= 0.05의 수준에서 내성 비가 유의한지를 결정하였다. 또한 이원 분산 분석을 이용하여 사망률 데이터를 분석하고, 이어서 α= 0.05의 수준에서의 LSMEANS 검정에 의해 처리 차이를 결정하였다. 상기 분석들의 결과를 표 5에 제시하였다.
동일한 생물 응답을 제공하는 활성화 Cry1Ab 단백질의 것과 유사한 수준의 DIG-152 단백질의 섭취 후 신생 사탕수수 명나방 (디아트라에아 사카랄리스) 유충의 성장을 저해하거나 또는 상기 유충을 사멸시키는 것이 대상 발명의 DIG-152 단백질의 특징이었다. 그럼에도 불구하고 Cry1Ab 단백질의 독성 효과에 대하여 내성을 갖는 디아트라에아 사카랄리스 유충이 DIG-152 단백질의 독성 작용에 민감하다는 것이 DIG-152 단백질의 추가의 특징이었다.
실시예
5
키메라
Cry1Ca
단백질에 대하여 면역반응성인 토끼
폴리클로날
항체 및 마우스
모노클로날
항체의 제조
예를 들어 대상 발명의 단백질을 생성하는 트랜스제닉 식물로부터 제조한 추출물 중 키메라 Cry1Ca 단백질 및 키메라 Cry1Ca 단백질의 변이체의 검출 및 정량화를 위하여 항체를 개발하였다. 표준 면역블롯 제제/분석 방법 및 ELISA법을 이용하여 항체를 특성화하였으며, 이를 B.t. 단백질 검출에 이용하였다 (예를 들어, 문헌[Coligan et al., 2007] 및 그의 최신판에 교시된 바와 같음).
폴리클로날 항체의 제조. 다클론 면역화에 이용한 단백질 항원은 실시예 2에 교시한 바와 같이 피. 플루오레센스 세포에서 생성한 DIG-152 단백질로부터 제조한 트립신 절단 코어 독소였다. 게다가, Cry1Ca 코어 독소 절편에 특이적인 두 펩티드를 키홀 림펫 헤모시아닌에 콘쥬게이션시키고, 이를 면역원으로 사용하였다. 대상 펩티드는 서열 1의 아미노산 436-445 (VQRSGTPFLT; Cry1Ca436; 서열 6) 및 아미노산 591-600 (SEQPLFGAGS; Cry1Ca591; 서열 7)에 상응하였다. 이들 펩티드 서열은 Cry1Ca의 단백질 서열을 몇몇 다른 부류의 Cry1 B.t. 단백질의 서열과 비교할 때 Cry1Ca에 독특한 것으로 확인되었다. 또한, 상기 펩티드들은 천연 Cry1Ca 단백질의 표면 상에 노출될 것으로 예상되었다.
면역화 및 혈청 수집은 계약된 판매 회사가 표준 절차에 의해 수행하였다. 폴리클로날 항체는 코반스 (Covance; 미국 뉴저지주 프린스턴)를 통하여 획득하였다. 뉴질랜드 백색 토끼를 이용하여 트립신 활성화 DIG-152 단백질에 대한 폴리클로날 항체를 생성하였다. 14일의 사이클 시간을 면역화와 혈청 수집 사이에 이용하였다. 투약은 0.5 mg의 단백질 또는 콘쥬게이션된 펩티드를 함유하는 프로인트 완전 아쥬반트 (Freund's complete adjuvant)로 시작하였다. 후속 주사제는 불완전 프로인트 아쥬반트를 이용하여 제조하였다.
2마리의 토끼로부터의 혈청을 합하여 Cry1Ca 코어 독소 단백질과 반응성인 단일 로트의 단백질 A-정제 항체 (DIG152RPC1로 칭함)를 생성하였다. 항체 특성화 분야의 숙련자에게 공지된 바와 같이, 온전한 단백질에 대하여 생성한 폴리클로날 항체는 일반적으로 극도로 특이적인 것은 아니며 흔히 면역화 단백질과 기타 관련 단백질 상의 다수의 에피토프를 탐지한다. 따라서, 면역블롯 분석에 의하면, DIG152RPC1은 다른 Cry1-부류 B.t. 독소, 구체적으로, 트립신 활성화 Cry1Ab, Cry1Da, 및 Cry1Fa와, 키모트립신 활성화 Cry1Be 및 Cry1Ea를 탐지함이 나타났다. 상업적 세팅에서, 작물 식물은 다른 Cry1-부류 단백질을 생성할 수 있으며, 따라서 DIG152RPC1은 절단체 및 기타 형태의 단백질을 포함하는 이들 단백질의 검출에 유용한 시약을 대표함을 주목한다.
토끼 폴리클로날 항체의 콘쥬게이션 펩티드 특이적인 두 로트를 Cry1Ca용으로 개발하였다. 2마리의 뉴질랜드 백색 토끼를 각각의 펩티드에 대하여 사용하였으며, 혈청을 각각의 펩티드에 대하여 풀링하여 두 펩티드 각각에 대한 펩티드 항체의 하나의 로트를 생성하였다. 면역화 및 혈청 수집은 면역화와 혈청 수집 사이의 14일의 사이클 시간을 이용하여 표준 절차에 의해 수행하였다. 최종 로트의 혈청을 상응하는 펩티드를 이용하여 친화성 정제하였다. 둘 모두의 펩티드 특이적 항체의 직접적 ELISA 평가에 의하면, 펩티드 Cry1Ca591에 대한 항체는 다른 Cry1 부류 단백질과의 반응과 비교할 때 Cry1Ca를 특이적으로 탐지하는 것으로 보이는 반면, 펩티드 Cry1Ca436에 대한 항체는 특이적이지 않은 것으로 나타났다 (표 6).
모노클로날 항체의 제조. 모노클로날 항체는 오픈 바이오시스템즈 (Open Bio Systems)/서모 피셔 사이언티픽 (Thermo Fisher Scientific) (미국 앨라배마주 헌츠빌)이 제조하였다. 마우스 항-Cry1Ca 모노클로날 항체 개발에서는 실시예 2에 기술한 바와 같이 피. 플루오레센스 세포에서 생성한 DIG-152 단백질로부터 제조한 트립신 절단 코어 독소를 이용하였다. 면역화 및 세포주 개발은 세포 배양에 있어서의 표준 항체 개발법에 의해 수행하였으며, 복수 생성 방법에 의한 것은 아니었다. 모노클로날 세포주는 면역화 마우스 비장 세포를 양립가능한 ND4 마우스 골수종 세포주와 융합함으로써 표준 절차에 따라 개발하였다.
직접적 결합 ELISA 스크리닝에 의해 마우스 M4 혈청이 Cry1Ca 단백질에 대하여 유의한 특이성을 갖는 것으로 확인하였다 (표 7).
모든 M4 유래 모노클로날 주는 Cry1Ca, Cry1Da, Cry1Ac, Cry1Fa, Cry1Be, 및 Cry1Ab에의 결합에 대하여 직접적 결합 ELISA에 의해 시험하였다. Cry1Ca를 탐지하는 능력을 보인 [즉, 높은 광학 밀도 (OD) 판독치를 제공함], 그리고 다른 Cry1 부류 단백질은 탐지하지 못하는 [즉, 0 또는 매우 낮은 OD 판독치를 제공함] 주 M4-34 및 M4-23이 특히 흥미로웠다 (표 8). 바람직한 주 M4-34 유래의 모노클로날 항체는 항체 DIG152MabM4-34로 지칭하였다.
따라서, 절단 Cry1Ca B.t. 단백질을 특이적으로 인식하는 모노클로날 항체를 제공하는 것이 본 발명의 주제이다.
실시예
6
DIG
-109 단백질을 코딩하는
마이즈
-코돈 최적화 서열의 설계
식물 분자 생물학 분야의 숙련자라면 단일 아미노산 서열을 코딩하도록 다수의 DNA 서열을 설계할 수 있음을 이해할 것이다. 관심있는 단백질에 있어서 코딩 영역의 발현을 증가시키는 일반적인 수단은 그의 코돈 조성이 당해 유전자를 발현할 운명인 숙주의 전체 코돈 조성과 닮도록 하는 그러한 방식으로 상기 코딩 영역을 테일러링 (tailoring)하는 것이다. 합성 유전자의 설계 및 생성에 관한 지침은 예를 들어 국제 특허 공개 제WO 1997/13402호 및 미국 특허 제5380831호에서 발견할 수 있다.
마이즈 코돈 바이어스를 갖는 DNA 서열은 트랜스제닉 단자엽 식물에서 DIG-109 키메라 살곤충 단백질을 생성하도록 설계 및 합성하였다. 마이즈 (제아 마이스 엘. (Zea mays L.))에 대한 코돈 사용 표를 젠뱅크 (GenBank) (www.ncbi.nlm.nih.gov)에 기탁된 서열들로부터 수득한 706개의 단백질 코딩 서열들로부터 계산하였다. 그 아미노산에 대하여 총 코돈 사용의 약 10% 미만으로 사용되는 임의의 중복 코돈을 제외한 후 가중 평균 마이즈 코돈 세트를 계산하였다. 각각의 코돈에 있어서의 가중 평균을 나타낸 것은 하기 식을 이용하여 계산하였다:
C1의 가중 평균 % = 1/(%C1 + %C2 + %C3 + 기타) x %C1 x 100
여기서, C1은 당해 코돈이며, %C2, %C3 등은 남아있는 동의 코돈들의 평균 사용 % 값을 나타낸다.
서열 5의 1164개 아미노산 DIG-109 단백질을 코딩하는 마이즈-코돈 최적화 DNA 서열을 유도하기 위하여, Cry1Ca 코어 독소 절편을 코딩하는 천연 cry1Ca DNA 서열에 대한 코돈 치환을 행하여서, 생성된 DNA 서열이 마이즈-최적화 코돈 바이어스 표의 전체 코돈 조성을 갖도록 하였다. 이와 유사한 방식으로, 서열 4의 Cry1Ab 전독소 절편을 코딩하는 천연 cry1Ab DNA 서열에 대한 코돈 치환을 행하여서, 생성된 DNA 서열이 마이즈-최적화 코돈 바이어스 표의 전체 코돈 조성을 갖도록 하였다. 바람직하지 못한 제한 효소 인식 부위, 잠재적인 식물 인트론 스플라이스 부위, A/T 또는 C/G 잔기의 긴 런 (run), 및 식물 세포에서 코딩 영역의 RNA 안정성, 전사 또는 번역을 간섭할 수 있는 다른 모티프를 제거하기 위하여 서열을 추가로 개량하였다. 다른 변화를 초래하여 요망되는 제한 효소 인식 부위를 도입하고, 긴 내부 개방 판독 프레임 (+1 이외의 프레임)을 제거하였다. 이들 변화는 모두 대략적으로 마이즈-편향된 코돈 조성을 유지하는 제약 이내에서 초래하였다. DIG-109 단백질을 코딩하는 마이즈-코돈 최적화 전 서열이 서열 8로서 개시되어 있다. 서열 8에 상응하는 DNA 단편의 합성은 상업적 판매사 (DNA2.0, 미국 캘리포니아주 멘로 파크)가 수행하였다.
실시예
7
DIG
-109 단백질을 코딩하는 식물 발현가능 유전자를 함유하는 식물 형질전환 벡터의
작제
아그로박테륨 수퍼바이너리 (superbinary) 시스템 (저팬 토바코 (Japan Tobacco; 일본 도꾜)은 단자엽 식물 숙주의 형질전환에 편리하게 사용된다. 수퍼바이너리 시스템은 pSB11 셔틀 벡터 플라스미드를 이용하는데, 상기 플라스미드는 다수의 클로닝 부위로 분리된 우측 T-DNA 경계 반복체 (RB) 및 좌측 T-DNA 경계 반복체 (LB)의 서열을 포함한다. pSB11의 유도체 (pDAB7691로 불리움)를 표준 DNA 클로닝 방법에 의해 제조하였다. 플라스미드 pDAB7691은 마이즈 Per5 3' 비번역 영역 (3' UTR) (미국 특허 제7179902호) 및 인트론1과 결부된 마이즈 유비퀴틴1 프로모터 (미국 특허 제5510474호)의 전사 제어 하의 마이즈 최적화 DIG-109 코딩 서열 (CDS; 즉, 서열 8)을 포함한다. 또한, pDAB7691은 마이즈 리파아제 3' UTR (미국 특허 제7179902호) 및 인트론1과 결부된 벼 액틴1 프로모터 (미국 특허 제5641876호)의 전사 제어 하의, 다우 아그로사이언시즈 DSM2 CDS (국제 특허 공개 제WO 2008/070845 A2호)를 포함하는 식물 선발가능 마커 유전자를 포함한다. pDAB7691 T-영역의 구성요소의 물리적 배열은 하기와 같이 편리하게 예시된다:
RB>마이즈 Ubi1 프로모터:DIG-109 CDS:마이즈 Per5 3'UTR>벼 Act1 프로모터:DSM2 CDS:마이즈 Lip 3'UTR>LB
pSB11의 제2 유도체 (pDAB100276으로 불리움)를 표준 DNA 클로닝 방법으로 제조하였다. 플라스미드 pDAB100276은 마이즈 Per5 3' UTR 및 인트론1과 결부된 마이즈 유비퀴틴1 프로모터의 전사 제어 하의 마이즈 최적화 DIG-109 코딩 서열 (CDS; 즉, 서열 8)을 포함한다. 또한, pDAB100276은 마이즈 리파아제 3' UTR 및 인트론1과 결부된 마이즈 유비퀴틴1 프로모터의 전사 제어 하의, 다우 아그로사이언시즈 AAD1 CDS (미국 특허 공개 제20090093366호)를 포함하는 식물 선발가능 마커 유전자를 포함한다. pDAB100276 T-영역의 구성요소의 물리적 배열은 하기와 같이 편리하게 예시된다:
RB>마이즈 Ubi1 프로모터:DIG-109 CDS:마이즈 Per5 3' UTR>마이즈 Ubi1 프로모터:AAD-1 CDS:마이즈 Lip 3' UTR>LB
아그로박테륨 형질전환을 준비하기 위하여, 플라스미드 pDAB7691 또는 플라스미드 pDAB 100276을 지닌 에스케리키아 콜라이 클로닝 주 DH5α의 세포를 스펙티노마이신 (Spectinomycin, 100 ㎍/mL)을 함유하는 LB 한천 배지(g/L: 박토 트립톤 (Bacto Tryptone), 10; 박토 효모 추출물, 5; NaCl, 10; 한천, 15) 상에서 37도에서 하룻밤 성장시켰다. 접합 이동 플라스미드 pRK2013을 포함하는 주 DH5α 세포를 카나마이신 (Kanamycin; 50 ㎍/mL)을 함유하는 LB 한천 상에서 성장시켰다. 인큐베이션 후, 플레이트를 4도에 두어 플라스미드 pSB1을 함유하는 아그로박테륨 투메파시엔스 주 LBA4404의 이용가능성을 기다렸다.
실시예
8
수퍼바이너리
벡터의 생성을 위한
아그로박테륨의
형질전환
pSB1을 포함하는 아그로박테륨 투메파시엔스 주 LBA4404를 이용하는 아그로박테륨 수퍼바이너리 시스템을 단자엽 식물 숙주의 형질전환에 편리하게 사용하였다. 수퍼바이너리 벡터를 작제 및 인증하는 방법은 pSB1의 작동 매뉴얼 (Operating Manual for pSB1) (저팬 토바코)에 제공된 바와 같이 잘 확립되어 있다. 표준의 미생물학 및 분자 생물학적 방법을 이용하여 플라스미드 pSB1 및 pDAB7691을 포함하는 동시통합성 플라스미드인 수퍼바이너리 플라스미드 pDAS5162와, 플라스미드 pSB1 및 pDAB100276을 포함하는 동시통합성 플라스미드인 수퍼바이너리 플라스미드 pDAS5848을 생성 및 인증하였다.
실시예
9
마이즈
식물에서의
DIG
-109 단백질의 생성
마이즈의 아그로박테륨 - 매개된 형질전환 Hi-II F1 잡종 (cross) (문헌[Armstrong et al., 1991]) 유래의 종자를 95% 메트로-믹스 (Metro-Mix) 360 무토양 성장 매질 (선 그로 호티컬쳐 (Sun Gro Horticulture; 미국 워싱턴주 벨레뷰))과 5% 점토/양토 (loam soil)의 혼합물을 포함하는 5갤런 화분 내에 심었다. 16시간의 광:8시간의 암의 광주기를 이용하여 고압 나트륨 램프 및 금속 할로겐화물 램프의 조합을 이용하여 온실에서 상기 식물을 성장시켰다. 제어된 형매 수분을 수행하여 형질전환용의 미성숙 F2 배아를 수득하였다. 수염이 달린 마이즈 알 (maize ear)은 미성숙 배아의 크기가 1.0 mm 내지 2.0 mm일 때 수분 후 대략 8 내지 10일에 수확하였다.
감염 및 동시 배양. 수염이 달린 마이즈 알의 껍질을 벗기고, 표면을 액체 비누로 문지르고, 20%의 상업적 표백제 (5% 차아염소산나트륨을 함유함)에 약 20분 동안 침지시키고, 그 후 살균수로 3회 헹굼으로써 살균하였다. DSM2 식물 선발가능 마커 유전자를 포함하고 DIG-109 단백질을 코딩하는 유전자를 지닌 수퍼바이너리 벡터, pDAS5162를 포함하는 아그로박테륨 투메파시엔스 세포의 현탁물은 1 또는 2 루프 (loop)의 박테리아 [100 mg/L의 스펙티노마이신, 10 mg/L의 테트라사이클린, 및 250 mg/L의 스트렙토마이신을 함유하는 YEP 고형 배지 (g/L: 박토 효모 추출물, 10; 박토 펩톤, 10; NaCl, 5; 한천, 15) 상에서 28도에서 2 내지 3일 동안 성장시킴]를 100 μM의 아세토시링곤을 함유하는 5 mL의 액체 감염 배지 [LS 기본 배지 (문헌[Linsmaier and Skoog, 1965]), N6 비타민 (문헌[Chu et al., 1975]), 1.5 mg/L의 2,4-디클로로페녹시아세트산 (2,4-D), 68.5 g/L의 수크로스, 36.0 g/L의 글루코스, 6 mM의 L-프롤린, pH 5.2] 내로 옮김으로써 제조하였다.
대안적으로, AAD-1 식물 선발가능 마커 유전자를 포함하고 DIG-109 단백질을 코딩하는 유전자를 지닌 수퍼바이너리 벡터, pDAS5848을 포함하는 아그로박테륨 투메파시엔스 세포의 현탁물은 100 내지 200 μM의 아세토시링곤을 함유하는 5 mL의 액체 감염 배지 내로 상기와 같이 성장시킨 1 또는 2 루프의 박테리아를 옮김으로써 제조하였다.
둘 모두의 경우에서, 균일한 현탁물이 달성될 때까지 용액을 와동시키고, 자주색 필터를 갖춘 클렛-서머슨 (Klett-Summerson) 비색계를 이용하여 200 클렛 단위의 최종 밀도로 (pDAS5162 형질전환의 경우), 또는 550 nm에서 1.2의 광학 밀도로 (pDAS5848 형질전환의 경우) 농도를 조정하였다. 미성숙 배아를 2 mL의 감염 배지를 함유하는 미소원심분리관 내로 직접적으로 단리하여 넣었다. 배지를 제거하고, 1 mL의 아그로박테륨 용액으로 대체하고, 아그로박테륨/배아 용액을 실온에서 5 내지 10분 동안 인큐베이션하였다. 그 후 배아는 100 μM의 아세토시링곤을 함유하거나 (pDAS5162 형질전환체의 경우) 또는 100 내지 200 μM의 아세토시링곤을 함유하는 (pDAS5848 형질전환체의 경우) 동시 배양 배지 [LS 기본 배지, N6 비타민, 1.5 mg/L의 2,4-D, 30.0 g/L의 수크로스, 6 mM의 L-프롤린, 0.85 mg/L의 AgNO3, 2.8 g/L의 겔란 (Gellan) 검 (피토테크놀로지 래보러토리즈 (PhytoTechnology Laboratories; 미국 캔자스주 레넥사)), pH 5.8]로 옮기고, 암소에서 20도에서 3 내지 4일 동안 동시 배양하였다.
동시 배양 후, 배아를 MS 염 및 비타민, 6 mM의 L-프롤린, 100 mg/L의 미오이노시톨, 500 mg/L의 MES, 30 g/L 수크로스, 1.5 mg/L의 2,4-D, 0.85 mg/L의 AgNO3, 250 mg/L의 세포탁심 (Cefotaxime), 2.8 g/L의 겔란 검 (pH 5.8)을 함유하는 휴지 배지로 옮겼다. 대략 7일 후, 배아는 3 mg/L의 비아라포스 (Bialaphos)를 보충하거나 (pDAS5162 형질전환체의 경우) 또는 100 nM의 할록시포프를 보충한 (pDAS5848 형질전환체의 경우) 동일 배지 (선발 배지)로 옮겼다. 대략 8주 후 형질전환 단리체를 확인하고, 이를 재생 및 분석을 위하여 2주 간격으로 신선 선발 배지로 옮김으로써 부피가 커지게 하였다.
재생 및 종자 생성. 재생을 위하여, 배양물은 3 mg/L의 비아라포스를 보충하거나 (pDAS5162 형질전환체의 경우) 또는 100 nM의 할록시포프를 보충한 (pDAS5848 형질전환체의 경우) "28" 유도 배지 (MS 염 및 비타민, 30 g/L의 수크로스, 5 mg/L의 벤질아미노퓨린, 0.25 mg/L의 2,4-D, 250 mg/L의 세포탁심, 2.5 g/L의 겔란 검, pH 5.7)로 옮겼다. 인큐베이션은 낮은 광 조건 (14 μEm-2s-1) 하에 1주일 동안, 그 후 높은 광 조건 (대략 89 μEm-2s-1) 하에 1주일 동안 하였다. 조직을 후속적으로 "36" 재생 배지 (식물 성장 조절제가 결여된 것을 제외하고는 유도 배지와 동일함)로 옮겼다. 모종 길이가 3-5 cm일 때, 이를 SHGA 배지 [(문헌[Schenk and Hildebrandt (1972)]의 염 및 비타민; 피토테크놀로지즈 래보러토리즈), 1.0 g/L의 미오이노시톨, 10 g/L의 수크로스 및 2.0 g/L의 겔란 검, pH 5.8]를 함유하는 유리 배양관으로 옮겨 새싹 및 뿌리의 추가의 성장 및 발달을 허용하였다. 식물을 이전에 기술한 동일 토양 혼합물에 이식하고, 온실에서 성장시켜 개화시켰다. 종자 생성을 위한 제어된 수분을 행하였다.
마이즈 형질전환 분야의 숙련자라면 다른 방법이 마이즈 형질전환에 이용가능하고 다른 식물 발현성 선발가능 마커 유전자 (예를 들어 제초제 내성 유전자)가 사용될 때 다른 방법이 형질전환 식물의 선발에 이용가능함을 이해할 것이다.
실시예
10
DIG
-109 단백질을 생성하는
마이즈
식물의 생화학적 분석 및 곤충 생물분석
트랜스제닉 마이즈 식물에서의 DIG-109 단백질의 생성을 어린 식물 (T0 세대)의 잎으로부터 추출한 단백질에서 조사하였다. 2개의 6 mm 직경의 마이즈 잎 디스크를 깊은 웰 96 클러스터 (cluster) 튜브 박스 (코스타 (Costar) 카탈로그 번호 3957)로부터의 샘플 튜브 내에 넣고, 분석일까지 -80도에서 냉동시켰다. 이 시점에서, 각각의 (냉동) 튜브에 2개의 4.5 mm 아연 코팅 데이지 (Daisy)TM BB를 PBS (인산염 완충 염수; 피셔 (Fisher) 카탈로그 번호 BP665-1) + 0.05% 트윈 (Tween) 20으로 이루어진 200 μL의 추출 완충액과 함께 첨가하였다. 각각의 튜브의 뚜껑을 닫고, 박스를 최대 설정치에서 비드밀 (bead mill) (켈코 (Kleco)TM 4-96 분쇄기; 가르시아 매뉴팩츄어링 (Garcia Manufacturing; 미국 캘리포니아주 비살리아)) 내에 3분 동안 두었다. 분쇄한 샘플을 2,500 x g에서 5분 동안 원심분리하고, 용해성 단백질을 함유하는 상청액을 면역분석에서 사용하였다.
추출한 마이즈 잎 단백질의 면역블롯 분석에 의하면, DIG152RPC1 폴리클로날 항체는 비트랜스제닉 식물의 잎으로부터 추출한 단백질과 교차 반응하지 않음이 나타났다. pDAS5162로 형질전환된 식물의 추출물에 있어서, 몇몇 단백질 종이 DIG152PRC1 항체에 의해 검출되었다. 4가지 이상의 주요 면역반응 밴드가 일반적으로 검출되었다. 많은 경우, 대략 70 kDa의 단백질에 상응하는 이동성으로 이동하는 풍부한 단백질 종이 보였다. 다른 주요 단백질 종은 실시예 2)에서 Dpf108로부터 제조한 DIG-152의 트립신 제한 펩티드의 것과 동일한 65 kDa, 60 kDa, 및 55 kDa으로 개산(estimate)된 분자 크기를 가졌다. pDAS5162 트랜스제닉 마이즈 잎 추출물을 DIG-152 폴리클로날 항체를 이용하여 면역블롯에 의해 조사할 때, 일부 식물에서 60 kDa 및 55 kDa의 종이 가장 풍부하였다. 어느 하나의 항체를 이용하면, 단지 다소의 식물이 전장 DIG-109 (130 kDa) 단백질을 갖는 것으로 발견되었으며, 이것은 발견될 때 소수 종으로 존재하였다.
비록 pDAS5162를 이용한 형질전환을 통하여 마이즈 내로 도입한 트랜스진 (transgene)이 전장 DIG-109 단백질을 포함할지라도, 마이즈 세포 내의 단백질 분해 활성은 신생 단백질을 풍부한 안정한 더욱 작은 분자량의 종으로 프로세싱함이 명백하다.
pDAS5162 작제물로 형질전환시킨 독립적으로 단리시킨 트랜스제닉 마이즈 식물로부터 수확한 잎의 곤충 독성을 밤나방 (FAW, 스포도프테라 프루기페르다 (제이.이. 스미스))의 신생 유충 및 Cry1F-내성 FAW (rFAW) 유충을 이용하여 시험관내에서 시험하였다. FAW 알을 상업적 곤충 실험실 (벤존 (Benzon))으로부터 획득하였으며, rFAW 알은 독점적 집단 (다우 아그로사이언시즈)으로부터 온 것이었다. 식물을 실험실로부터 온실 내로 이식한지 대략 2주 후 온실에서 성장시킨 T0 식물로부터 잎 절편 샘플을 곤충 생물분석용으로 취하였다. 각각의 식물로부터의 2개의 잎 조각 (각각은 대략 1 제곱 인치임)을 32웰 트레이 (씨디 인터내셔널)의 별도의 웰 내에 약 3 mL의 고형화 2% 한천의 상부 상에 두었다. 알을 다중-종 인시목 규정식 (사우스랜드 프로덕츠 (Southland Products)) 상으로 부화시키고, 24시간 미만의 연령일 때 신생 유충을 선발하였다. 잎 절편 당 대략 10마리의 유충을 낙타털 페인트브러시를 사용하여 각각의 웰 내에 조심스럽게 두었다. 만연된 트레이를 트레이와 함께 공급된 천공 뚜껑으로 밀봉하고, 그 후 28도, 40% RH, 16시간의 명:8시간의 암에서 3일 동안 유지하였다. 각각의 잎 조각의 손상 % (% DAM)를 시험의 종말에 기록하였다. 손상 평점을 평균하고, 이를 사용하여 어느 식물이 각각의 유형의 시험 곤충으로부터의 손상이 가장 적었는지를 결정하였다. 시험을 모든 곤충에 대하여 수회 반복하였다.
데이터를 JMP 통계 소프트웨어 (에스에이에스, 미국 노스캐롤라이나주 캐리)를 사용하여 분석하였으며, 각각의 곤충 유형에 있어서 각각의 식물에 대하여 % DAM 스코어를 평균하였다. "fit Y by X" 모델을 일원 분산 분석에 사용하였다. 필요할 경우 투키-크레이머 (Tukey-Kramer) 평균 분리를 이용하여 각각의 처리에 있어서의 평균 %DAM 스코어들 사이에서의 유의한 차이에 대하여 분석하였다. 유사한 연령의 대조 식물로부터 획득한 %DAM 스코어와 비교하였다. 양성 대조 식물을 상업적 헤르쿨렉스 (Herculex) ITM 하이브리드의 종자로부터 성장시켰으며, 이는 Cry1Fa B.t. 독소를 생성한다. 음성 대조구 (즉, 비형질전환 식물)는 Hi II 및 B104 주, 및 헤르쿨렉스 ITM 이소라인 (Isoline) (헤르쿨렉스 ITM 하이브리드의 비-Cry 함유 모 (parent))이 대표하였다.
도 1에는 그러한 곤충 생물분석 시험에서 획득한 결과가 요약되어 있다. 트랜스제닉 잎에서의 DIG-109의 생성과 %DAM 평점 사이에 양의 상관 관계가 존재한다는 것은 놀라운 발견이다. FAW의 경우, F = 35.3; d.f. = 1, 33; P < 0.0001; r2 = 0.52, 그리고 rFAW의 경우, F = 25.3; d.f. = 1, 33; P < 0.0001; r2 = 0.43. Cry1Fa B.t. 독소에 의한 중독에 대하여 내성을 갖는 밤나방 유충이 DIG-109 B.t. 독소를 먹임으로써 여전히 저해된다는 것은 추가의 놀라운 그리고 신규한 발견이다.
마이즈의 다른 곤충 해충을 유사한 방식으로 시험할 수 있음이 이해된다. 이들 해충은 하기를 포함하지만, 이에 한정되는 것은 아니다: 아그로마이자 파르비코르니스 (Agromyza parvicornis) (옥수수 얼룩 굴나방 (corn blot leafminer)), 아그로티스 입실론 (검거세미나방), 안티카르시아 겜마탈리스 (벨벳빈 애벌레 (velvetbean caterpillar)), 디아트라에아 그란디오셀라 (남서부 옥수수 명나방), 디아트라에아 사카랄리스 (사탕수수 명나방), 엘라스모팔푸스 리그노셀루스 (Elasmopalpus lignosellus) (낮은 옥수수 줄기 (lesser cornstalk) 명나방), 헬리코베르파 제아 (왕담배나방), 헬리오티스 비레센스 (담배 나방 (tobacco budworm)), 오스트리니아 누빌랄리스 (유럽 옥수수 명나방), Cry1F-내성 오. 누빌랄리스, 플루텔라 자일로스텔라 (배추좀나방), Cry1-내성 피. 자일로스텔라, 스포도프테라 엑시구아 (파밤나방), 및 트리코플루시아 니 (양배추 은무늬 밤나방 유충).
pDAS5848로 형질전환시킨 트랜스제닉 마이즈 식물 (T0 세대)을 곤충 생물분석에 의해 그리고 면역분석에 의해 또한 조사하였다. 잎 추출물 중 DIG-109 단백질의 양을 구매가능한 Cry1C ELISA 검출 키트 (엔바이롤로직스 (Envirologix)TM, 미국 매사추세츠주 포틀랜드; 카탈로그 번호 AP007)를 사용하여 정량화하고, 검출된 DIG-109 단백질의 수준을 백만분율 (parts per million, ppm; 1 ppm은 추출물 중 전체 용해성 단백질 1 mg 당 1 ng의 DIG-109 단백질을 나타냄). FAW 및 rFAW에 의한 식해 (feeding damage)를 하기와 같이 체계화하였다: 0 = 손상 없음 또는 약간의 핀홀형의 먹은 표시 (feeding mark), 1= 25% 내지 50%의 잎을 먹음, 및 2 = 대부분 전부의 잎을 소비하거나 또는 잎이 남아있지 않음. 보호된 식물은 손상 스코어가 0.67 이하인 것이다.
표 9의 데이터는 T0 식물에서 ELISA에 의해 검출되는 DIG-109 단백질 종의 존재와 시험관내 생물분석에서 밤나방 유충에 의해 행해지는 식해의 제어 사이에 양의 상관관계가 있음을 보여주었다. 최고 검출 수준의 DIG-109 단백질을 갖는 식물 (식물 5848-005.4)은 잎 식해 스코어가 최저였다. 또한 190 내지 230 ppm의 범위의 더욱 낮은 수준의 검출가능한 DIG-109 단백질을 갖는 식물 유래의 잎은 1.7 및 1.8의 평균 손상 스코어를 갖는 음성 대조 식물들 (즉, 비형질전환 대조구 B104 및 Hi II) 유래의 잎에서 보이는 것보다 더 적은 식해를 입었다. 조사한 모든 pDAS5848 잎에서, 검출된 우세한 DIG-109 단백질 종은 대략적인 크기가 60 kDa 및 55 kDa인 펩티드들의 이중체를 포함하였다.
따라서, 마이즈 식물에서 생성될 때 DIG-109 단백질은 밤나방 유충 및 Cry1F-내성 밤나방 유충에 의한 식해에 대하여 상기 식물이 내성이 되도록 한다는 것이 본 발명의 특징이다.
실시예
11
DIG
-109 단백질을 생성하는
마이즈
식물의
분자적
분석
조직 추출. 게놈 DNA를 pDAS5162- 및 pDAS5848-형질전환 T0 트랜스제닉 마이즈 식물의 잎으로부터 단리하였다. 조직 샘플을 96웰 수집 플레이트 (퀴아젠 (Qiagen), 카탈로그 번호 19560)에서 수집하고 2일 동안 동결건조시켰다. 조직 파괴는 본질적으로 실시예 10에 개시한 바와 같이 켈코TM 조직 분쇄기 및 텅스텐 비드를 이용하여 수행하였다. 가수분해 프로브 (Hydrolysis Probe; HP) 분석에 있어서, 제조업자의 제안된 프로토콜에 따라 디엔이지 (DNeasy)TM 96 식물용 키트 (퀴아젠)를 사용하여 높은 처리량 포맷으로 게놈 DNA를 단리하였다. 서던 블롯 분석에 있어서, 문헌[Murray and Thompson (1980)]의 CTAB DNA 추출 프로토콜의 변형을 사용하여 높은 처리량 포맷으로 게놈 DNA를 단리하였다. 문헌[Murray, M. G., Thompson, W. F. (1980) Rapid isolation of high molecular weight plant DNA. Nucl. Acids Res. 8:4321-4325].
어느 하나의 프로토콜로부터의 추출 DNA를 퀀트 (Quant)-IT 피코 그린 (Pico Green) DNA 분석 키트 (몰레큘러 프로브즈 (Molecular Probes), 인비트로겐 카탈로그 번호 P7589)를 이용하여 정량화하였다. 이 절차에서 비공지된 것의 88가지의 샘플을 96웰 포맷으로 분석하였으며, 이때 첫 번째 컬럼은 20 ng/μL 내지 1.25 ng/μL의 범위의 2배 희석 표준물, + 완충액 블랭크, 물 블랭크 및 빈 웰을 포함하였다. 그 후, 시험 DNA 샘플들, 5 μL의 1:5 내지 1:40의 희석물 (예상 초기 농도에 따라 달라짐)을 적절하게 희석시킨 완충 삽입 염료와 혼합하고, 암소에서 10분 동안 105 μL의 반응물 중에 인큐베이션하였다. 인큐베이션 후, 시너지2 (Synergy2) 플레이트 판독기 (바이오테크 (BioTek; 미국 버몬트주 위누스키))를 이용하여 기록하였다. 게놈 DNA 농도를 배경 형광 보정 후 계산한 표준 곡선으로부터 개산하였다.
서던 블롯 준비. 10가지의 pDAS5848-형질전환 마이즈 주 유래의 게놈 DNA 10 ㎍을 37도에서 하룻밤 제한 효소 Bsm I로 절단하였다. 절단된 DNA 샘플의 단편을 (에스에이에스, 미국 노스캐롤라이나주 캐리) 1% 아가로스 겔을 통한 겔 전기영동을 통하여 분리하고, 나일론 막 (INYC000I0 임모빌론 (IMMOBILON)-NY+, 밀리포어)으로 옮겼다. 서던 블롯은 서열 8의 염기 251 내지 630에 상응하는 디그옥시제닌-표지 (DIG PCR 프로브 합성 키트; 로슈 어플라이드 사이언스 (Roche Applied Science; 미국 인디애나주 인디애나폴리스)) PCR-증폭 프로브를 이용하여 혼성화하였다. 혼성화 및 검출을 공급처의 프로토콜에 따라 실시하였다. 단일 카피 (copy)의 DIG-109 코딩 유전자를 지니는 것으로 서던 블롯 분석에 의해 확인된 pDAS5848-형질전환 주 유래의 DNA를 정량적 PCR 카피수 분석에 있어서의 기준 대조구로 사용하였다.
가수분해 프로브 분석 가수분해 프로브 (HP) 분석에 의한 트랜스진 카피수 결정은 라이트사이클러 (LightCycler)®480 시스템 (로슈 어플라이드 사이언스)을 이용하여 실시간 PCR에 의해 수행하였다. 라이트사이클러® 프로브 설계 소프트웨어 v 2.0을 DSM2 및 AAD-1 선발가능 마커 유전자, GLP1 (마이즈 생식세포계-유사 단백질1 (germin-like protein1; 젠뱅크 등록 번호 AY394010)) 및 INV (마이즈 인버타아제; 젠뱅크 등록 번호 U16123) 기준 유전자, 및 DIG-109-코딩 유전자를 검출하는 분석의 설계를 위하여 사용하였다. 증폭에 있어서, 라이트사이클러®480 프로브 마스터 믹스는 0.4 μM의 각각의 프라이머 및 0.2 μM의 각각의 프로브 (형광 표지체 및 상기 올리고뉴클레오티드들의 서열이 표 10에 열거되어 있음)를 함유하는 10 μL 부피의 다중 반응물 중에 1 x 최종 농도로 제조하였다. 형광 획득을 이용하여 56도에서의 40초 동안의 연장에 의해 2단계 증폭 반응을 수행하였다. 모든 샘플을 삼중으로 러닝하고, 평균 Ct 값을 각각의 샘플의 분류에 사용하였다.
DSM2의 HP 분석을 36가지의 pDAS5162-형질전환 주에서 완료하였다. 1-2개 카피의 유전자로서 정의되는 단순 통합 사건을 샘플의 95% (34가지의 사건)에서 검출하였다.
AAD-1 및 DIG-109의 HP 분석을 13가지의 pDAS5848-형질전환 주에서 완료하였다. AAD-1의 경우 샘플의 93% (12가지의 주)에서 그리고 DIG-109의 경우 54% (7가지의 주)에서 단순 통합 사건을 검출하였다. 54%의 주 (7가지의 주)는 둘 모두의 유전자에 대한 단순 통합 사건을 포함하였다.
실시예
12
마이즈
DIG
-109 절단 종의 생화학적 특성화
더욱 상세한 분석을 pDAS5162로 형질전환시킨 T0 마이즈 식물의 잎으로부터 추출한 단백질에서 수행하였다. DIG152RPC1 폴리클로날 항체로 프로빙한 상기 단백질 추출물의 면역블롯은 5가지의 DIG-109 단백질 종의 존재를 나타냈다. 이들 펩티드의 상대적인 이동성을 기반으로 하여, 하기 동일성 (identity)을 할당하였다: 종 1은 서열 5로 표기되는 전장 DIG-109 (130 kDa) 단백질에 상응하며; 종 2는 70 kDa DIG-109 생성물에 상응하였다. 동일한 이동성의 펩티드가 전장 DIG-152 단백질을 코딩하는 유전자를 발현하는 박테리아 세포의 추출물에서 발견되었다. 대략 70 kDa의 이들 단편의 생성은 마이즈 및 박테리아 둘 모두에서 발견되는 프로테아제에 노출되는 전장 단백질 상의 우세한 절단 부위의 존재를 나타낸다. 종 3은 크기 면에서 실시예 2에서 제조한, 대략 65 kDa의 크기를 갖는 DIG-152의 트립신 제한 펩티드에 상응하며; 종 4는 대략 60 kDa의 절단 DIG-109 생성물에 상응하며; 종 5는 대략 55 kDa의 절단 DIG-109 생성물에 상응하였다. 대략 70 kDa, 60 kDa 및 55 kDa의 펩티드를 실시예 14에서 추가로 특성화하였다.
실시예
13
도메인 I α-나선의 결실 및
DIG
-109의
변이체를
코딩하는 유전자의 설계
DIG-109 단백질의 살곤충 특성을 개선하기 위하여, 연속적인 단계적 결실을 행하였으며, 이들 각각은 서열 5에 개시된 DIG-109 단백질의 N-말단의 일부를 제거하였다. 결실은, α-나선 3 내지 α-나선 7의 구조적 완전성 (integrity)은 유지하면서 도메인 I의 일부 또는 전부의 α-나선 1 및 일부 또는 전부의 α-나선 2를 제거하였다. 본 발명자는 α-나선 1, α-나선 2A, α-나선 2B, α-나선 3, 및 α-나선 4의 시작과 끝 및 Cry1Ca 코어 독소의 도메인 I에서의 그들 사이의 스페이서 영역의 위치를 추론하였으며, 이는 Cry1Ca 코어 독소 아미노 서열을 구조가 공지된 Cry1Aa 단백질 [RGBS 단백질 구조 데이터베이스 번호: CRY1A(A); 문헌[GrochuLski et al., ( 1995)]]의 아미노산 서열 (젠뱅크 등록 번호 AAA22353)과 비교함에 의한 것이었다. 이들 위치는 표 1에 기술되어 있다.
N-말단 결실 변이체의 코딩 서열의 설계에 있어서, 메티오닌을 코딩하는 ATG 시작 코돈을 결실 변이체를 발현하도록 설계된 뉴클레오티드의 5' 말단에 삽입하였다. 트랜스제닉 식물에서의 사용용으로 설계한 서열에 있어서, 문헌[Varshavsky (1997)]의 "N-말단 규칙"에 충실한 것이 유익할 수 있다. 일부 아미노산은 단백질의 N-말단 잔기로서 디스플레이될 때 진핵 세포에서 단백질 불안정성 및 분해에 기여할 수 있음이 교시되었다. 예를 들어, 효모 및 포유류 세포에서의 관찰로부터 수집된 데이터는 N-말단 불안정화 아미노산이 F, L, W, Y, R, K, H, I, N, Q, D, E 및 가능하게는 P임을 나타낸다. 단백질 분해 기작의 특수성은 유기체들 사이에서 다소 상이할 수 있지만, 상기에 보이는 N-말단 불안정화 아미노산의 동일성의 보존은 유사한 기작이 식물 세포에서 기능할 수 있음을 시사한다. 예를 들어, 문헌[Worley et al., (1998)]에서는 식물에 있어서 N-말단 규칙이 염기성 및 방향족 잔기를 포함함이 발견되었다. 대상 B.t. 살곤충 단백질의 α-나선 3의 시작 근처에서의 식물 프로테아제에 의한 단백질 분해적 절단은 불안정화 N-말단 아미노산을 노출시킬 수 있다는 가능성이 있다. 그러한 프로세싱은 신속한 붕괴를 위하여 절단 단백질을 표적으로 하고 효과적인 곤충 방제에 불충분한 수준으로 B.t. 살곤충 단백질의 축적을 한정할 수 있다. 따라서, 불안정화 아미노산들 중 하나에서 시작되는 N-말단 결실 변이체에 있어서, 본 출원인은 번역 개시 메티오닌과 불안정화 아미노산 사이에 G (글리신) 아미노산을 특정하는 코돈을 부가하는 것을 선호한다.
결실을 하기와 같이 설계하였다. 본 실시예는 65가지의 특정 변이체를 이용하여 설계 원리를 예시하기 위하여 전장의 1164개 아미노산의 키메라 DIG-109 단백질 (즉, 서열 5)을 코딩하는 마이즈 코돈-최적화 전장 3492 bp DNA 서열 (즉, 서열 8)을 이용하였다. 당업계의 숙련자라면 Cry1Ca 코어 독소 절편의 전부 또는 N-말단 부분을 코딩하는 다른 DNA 서열이 요망되는 결과를 달성하도록 유사하게 조작될 수 있음을 실감할 것이다. 첫 번째의 결실 변이체 코딩 서열을 고안하기 위하여, α-나선 2A의 시작부 근처의 발린 잔기 (즉, 서열 5의 전장 DIG-109 부분의 V51)에 대한 코돈을 포함하는 α-나선 1을 코딩하는 염기들 전부를 제거하였다. 따라서, 서열 8의 염기 1 내지 153의 제거는 서열 5의 아미노산 1 내지 51의 아미노산의 코딩 서열을 제거하였다. 시작부 (즉, 전장 단백질의 아미노산 52에 상응하는 코돈의 앞)에 번역 개시 ATG (메티오닌)를 재도입하면 1114개 아미노산 (즉, 메티오닌 + 전장 DIG-109 단백질의 아미노산 52 내지 1164)을 포함하는 결실 변이체 DIG-109 단백질을 코딩하는 3342개 염기의 개방 판독 프레임을 포함하는 결실 변이체 코딩 서열이 제공되었다. 서열 5의 전장 DIG-109 단백질의 잔기 52 내지 91에 상응하는 단일 아미노산의 추가의 코돈들을 제거하는 연속적인 단계적 결실은 일부의 또는 전부의 α-나선 2A 및 α-나선 2B가 없어진 변이체를 제공하였다. 따라서, 두 번째의 설계된 결실 변이체 코딩 서열은 서열 8의 염기 1 내지 156의 제거를 필요로 하며, 이것에 의해 아미노산 1 내지 52의 코딩 서열이 제거되었다. 기능성 개방 판독 프레임의 복구는 남아있는 코딩 서열의 시작부에 번역 개시 메티오닌 코돈을 재도입함으로써 또한 성취하였으며, 그에 의해 1113개 아미노산 (즉, 메티오닌 + 전장 DIG-109 단백질의 아미노산 53 내지 1164)을 포함하는 결실 변이체 DIG-109 단백질을 코딩하는 3339개 염기의 개방 판독 프레임을 갖는 두 번째의 결실 변이체 코딩 서열이 제공되었다. 마지막의 설계된 결실 변이체 코딩 서열은 서열 8의 염기 1 내지 273의 제거를 필요로 하며, 그에 의해 아미노산 1 내지 91의 코딩 서열이 제거되었고, 번역 개시 메티오닌 코돈의 재도입 후, 1074개 아미노산 (즉, 메티오닌 + 전장 DIG-109 단백질의 아미노산 92 내지 1164)의 결실 변이체 DIG-109 단백질을 코딩하는 3222개 염기의 개방 판독 프레임을 갖는 결실 변이체 코딩 서열이 제공되었다. 예시된 바와 같이, 결실 서열의 제거 후, 메티오닌 개시 코돈을 남아있는 코딩 서열의 시작부에 부가하여 기능성 개방 판독 프레임을 복구하였다. 또한 기술된 바와 같이, 결실 서열의 제거가 상기에 제공된 불안정성 결정 아미노산들 중 하나를 전장 단백질의 남아있는 부분의 N-말단에 노출시킨 채 남겨두는 것인 경우에 불안정성 결정 아미노산의 코돈과 메티오닌 코돈 사이에 추가의 글리신 코돈을 부가하여야 한다.
표 11에는 상기에 기술된 방법에 따라 설계한 특정 변이체가 기술되어 있다.
표 11에 기술된 DIG-109 단백질 변이체를 코딩하는 추가의 핵산을 실시예 6에 교시한 바와 같이 식물에서의 발현용으로 의도된 합성 유전자에 대한 일반적인 원리에 따라 설계하였다.
실시예
14
추가의
DIG
-109 단백질
변이체의
설계
실시예 12에 개시한 바와 같이, 전장 DIG-109 단백질을 포함하는 초기 번역 생성물은 식물에서 다양한 정도로 프로세싱되며, 생성물 중 하나는 크기 면에서 65 kDa의 트립신 절단 코어 독소 펩티드에 상응한다. 이 코어 독소는 곤충 중장에서 수용체에 결합하는 활성화 형태의 독소인 것으로 간주되며 이는 독성을 생성한다. 트립신은 아르기닌 (R) 또는 라이신 (K) 잔기의 C-말단 측에서 단백질을 절단하는 엔도펩티다아제이다. 따라서, 마이즈에서 보이는 65 kDa DIG-109 펩티드는 마이즈 트립신-유사 프로테아제에 의해 서열 5의 잔기 R28 및 R628 이후의 절단에 의해 생성되는 65 kDa 단편에 상응할 수 있다. 이러한 65 kDa 코어 독소 펩티드는 서열 1의 Cry1Ca 코어 독소 절편의 아미노산 28 내지 619 및 서열 4의 Cry1Ab 전독소 절편의 아미노산 1 내지 9를 포함할 수 있음을 주목한다. 그러나, 트랜스제닉 마이즈에서 관찰되는 그리고 하기에 논의되는 다른 절단 생성물의, 또는 65 kDa 절단 생성물의 정확한 C-말단은 실험적으로 결정되지 않았음을 이해하여야 한다. 따라서, 본원에 논의된 DIG-109 변이체 단백질의 설계는 예시적인 것으로 의도되며, 살곤충 활성을 유지하는 다른 DIG-109 절단 변이체 단백질은 본 발명의 범주 이내이다.
대부분의 트랜스제닉 마이즈 식물에 존재하는 DIG-109 펩티드 생성물의 농도는 대략 200 ppm인 것으로 결정되었다. 따라서, DIG-109 펩티드의 아미노산 서열을 결정하기 위하여 수중에 불충분한 재료가 식물 조직으로부터의 정제에 이용가능하다. 크기 면에서 마이즈에서 검출되는 절단 생성물과 유사한 대리 펩티드를, 상이한 프로테아제를 사용하여 전장 DIG-152 단백질을 절단함으로써 생성하였다.
70 kDa 펩티드의 동일성. 슈도모나스 플루오레센스 (Pf)에서 봉입체로서 생성된 전장 DIG-152의 SDS-PAGE 프로필에 의하면, 70 kDa의 겉보기 분자량을 갖는 그리고 트립신 처리에 대하여 비교적 안정한 유의한 양의 단백질이 나타났다. 음이온 교환 및 크기 배제 크로마토그래피의 조합에 의해 가용화 전장 DIG-152 봉입체로부터 정제한 후, 이 펩티드는 SDS-PAGE 상에서의 이동성이 트랜스제닉 마이즈 식물 유래의 추출물에서 검출되는 대략 70 kDa의 DIG-109 펩티드와 동일하였다. 둘 모두의 펩티드는 DIG-152에 대하여 유도된 폴리클로날 항체에 의해 인식되었으며, Pf-생성된 펩티드의 아미노산 서열 분석에 의해 MDNNP를 N-말단 서열로서 확인하였다 (DIG-109의 잔기 1 내지 5, 서열 5). 따라서, 70 kDa 펩티드는 전장 DIG-109 단백질의 천연 N-말단을 함유한다. 코어 독소를 생성하도록 R28에서의 트립신 절단에 의해 DIG-109 단백질로부터 특징적으로 제거되는 처음 28개의 잔기를 온전하게 남겨두면서 추정 코어 독소 C-말단 절단 부위 (R628)에서 트립신으로 절단하면 70.5 kDa의 크기 이론치를 갖는 펩티드 (DIG-109 잔기 1-628로 이루어짐)가 생성되며, 이는 트랜스제닉 마이즈 식물에서 검출되고 Pf 봉입체로부터 단리한 DIG-152 펩티드의 겉보기 분자량과 거의 동일하였다. 따라서, 70 kDa 단백질의 동일성은 아미노산 1-628로 이루어진 절단 DIG-109 펩티드에 상응하는 것으로 제안된다.
60 kDa 및 55 kDa 펩티드의 동일성. pDAS5162- 및 pDAS5848-형질전환 마이즈 식물이 60 kDa 및 55 kDa에 상응하는 이동성의 DIG-109-유래 단백질을 또한 생성하는 것으로 밝혀졌다. 이들 크기의 펩티드는 먼저 전장 DIG-152 단백질을 트립신으로 절단하고, 후속적으로 트립신-절단 생성물을 키모트립신으로 처리함으로써 실험적으로 생성하였다. [전장 DIG-152 단백질을 키모트립신 단독으로 처리하면 60 kDa보다 다소 더 큰 다수의 절단 생성물이 생성되었다.] 트립신/키모트립신 절단 생성물을 벌크로 제조하였으며, 그 후 음이온 교환 크로마토그래피, 이어서 수퍼로스 (Superose) 200 크기 배제 크로마토그래피로 정제하였다. 3개의 주요 피크가 크기 배제 크로마토그래피 단계에서 관찰되었으며, 이는 12.5 mL, 18.3 mL, 및 20 mL의 수집 부피에서 용출시켰다. 제1 주요 피크 (12.5 mL)는 DIG-152 단백질의 높은 분자량 (700 kDa 내지 1000 kDa)의 응집체를 포함하며, 제3 주요 피크 (20 mL)는 여분의 키모트립신을 포함하였다. 12.5 mL 분획물은 또한 DIG-152의 65 kDa 및 60 kDa 생성물에 상응하는 이동성을 갖는 밴드를 포함하였으며, 따라서 DIG-152-유래 펩티드의 올리고머화 또는 응집은 가역적인 것으로 보였다.
18.3 mL 피크 내의 단백질은, 단지 트립신으로 절단한 DIG-152 단백질과 함께, 환원 및 변성 조건 하에 SDS-PAGE로 분석하였다. 이들 단백질은 60 kDa 및 55 kDa에 상응하는 이동성을 갖는 주요한 두 종을 포함하였다. 14 kDa 및 9 kDa의 더욱 작은 단백질도 관찰되었으며, 이는 정제 동안 DIG-152 펩티드에 명백히 결합하는 키모트립신으로 확인되었다. 게다가, 240 kDa에 상응하는 이동성을 갖는 고분자량 밴드가 관찰되었다. 이 밴드 내의 단백질은 DIG152RPC1 항체에 의해 인식되었으며, 이는 이것이 DIG-152 절단 생성물의 올리고머 (사량체)일 가능성이 가장 큰 것임을 입증하는 것이었다.
DIG-109를 생성하는 식물 유래의 추출물 중 단백질은, 정제한, 트립신으로 절단한 DIG-152 및 트립신, 그 후 키모트립신으로 절단한 DIG-152 단백질의 샘플과 함께, SDS-PAGE로 분리하고 그 후 니트로셀룰로오스 상에 전기블로팅하였다. DIG-109 또는 DIG-152 펩티드에 상응하는 밴드를 일차 DIG152RPC1 토끼 항체 및 이차 항-토끼 서양고추냉이 퍼옥시다아제 표지 항체의 조합에 의해 야기되는 향상된 화학발광을 이용하여 가시화하였다. 트립신 처리 DIG-152 샘플은 대략 65 kDa의 이동에서 단일 밴드를 나타냈다. DIG-109 펩티드를 생성하는 식물 유래의 추출물은 하기 4개의 밴드를 나타냈다: 130 kDa (전장 DIG-109 단백질을 나타냄)에 상응하는 이동성을 갖는 하나의 밴드, 60 kDa 및 55 kDa에 상응하는 이동성의 밴드들, 및 대략 20 kDa에 상응하는 이동성의 하나의 밴드. DIG-109의 20 kDa 절단 생성물은 추가로 특성화하지 않았다. 트립신, 그 후 키모트립신으로 처리한 DIG-152 단백질은 대략 60 kDa 및 55 kDa에 상응하는 이동성을 가지며 식물 추출물에서 보이는 60 kDa 및 55 kDa 밴드와 함께 동시 이동하는 2개의 밴드를 나타냈다. 또한, 트립신, 그 후 키모트립신으로 처리한 DIG-152 단백질 샘플에서 약 240 kDa에 상응하는 이동성을 갖는 고분자량 밴드가 또한 있었다.
따라서, 마이즈에서 생성되는 DIG-109의 주요 절단 생성물은 크기 면에서 전장 DIG-152 단백질을 처음에 트립신으로 절단하고, 그 후 추가로 키모트립신으로 절단할 때 수득되는 두 생성물에 상응하였다. 효소에 의해 생성된 60 kDa 및 55 kDa 펩티드 유래의 처음 5개의 N-말단 잔기는 둘 모두 DAFLV (DIG-109 단백질의 잔기 74 내지 78에 상응함, 서열 5)인 것으로 결정되었다. 전장 DIG-109 단백질의 W73 이후의 그러한 절단은 α-나선1, α-나선2A, 및 일부의 α-나선2B를 제거함을 주목한다 (표 1).
또한, 60 kDa 및 55 kDa 펩티드 둘 모두는 동일한 N-말단 서열을 갖기 때문에, 더욱 작은 (55 kDa) 펩티드의 생성에서 제거되는 5 kDa 절편은 60 kDa 펩티드의 C-말단으로부터의 추가의 프로세싱을 나타냄이 분명함을 주목한다.
pDAS5162- 및 pDAS5848-형질전환 마이즈 식물에서 생성된 5가지의 주요 DIG-109 펩티드의 추정 아미노산 좌표가 표 12에 요약되어 있다. 이들 종의 정확한 C-말단은 결정되지 않았다. R568 이후의 60 kDa 종 4의 트립신 절단은 56 kDa (즉, 종 5의 것에 가까움)의 펩티드를 생성함을 주목한다.
DIG -109 절단 변이체의 설계. 표 1에 나타낸 바와 같이, DIG-109 코어 독소의 α-나선1 내지 α-나선4는 DIG-109 단백질의 처음 145개 아미노산 내에 있다. DIG-109 코어 독소의 N-말단 상의 첫 번째의 잠재적인 부위 (DIG-109의 R87; 코어 독소의 R59)에서의 절단은 DIG-109 코어로부터 59개의 아미노산을 제거하여, 분자량이 61.02 kDa인 단백질을 생성하며, 이때 α-나선1, α-나선2A, 및 α-나선2B는 제거되었다. Cry1Ab의 α-나선1의 제거는 상기 단백질이 카드헤린 수용체에의 처음 결합을 우회하게 하는 데 연루되어 있는데, 이는 곤충 중장 세포막 내로의 삽입 전에 올리고머 프리포어 구조가 형성되게 하고 궁극적으로는 기공이 형성되게 한다. 이러한 연구와 유사하게, α-나선1이 손실되게 하는 트립신 절단 DIG-109 코어의 N-말단 부분의 제거는 올리고머가 형성되게 하는 데 필요한 그리고 기능성 기공을 형성시키는 이차적인 아미노펩티다아제 N 수용체에의 결합에 필요한 단계인 것으로 예측된다. 따라서, 그러한 방식으로 식물에서 DIG-109 단백질을 절단하면 곤충에 의한 섭취시에 카드헤린 수용체에의 결합의 요건을 우회하는 DIG-109 독소 펩티드를 생성할 수 있다. 그러한 효과는 돌연변이 카드헤린 수용체 단백질을 갖는 곤충에 있어서 Bt 단백질 중독에 대한 내성의 극복으로 이어지는 것으로 밝혀졌다.
pDAS5162 및 pDAS5848 트랜스제닉 마이즈 식물에서 발견되는 더욱 작은 펩티드 (60 kDa 및 55 kDa)는 트립신-유사 프로테아제에 의한 추가의 절단의 생성물을 대표할 수 있다. 이들 펩티드는 65 kDa 코어 펩티드보다 단지 5 kDa 내지 10 kDa 더 작기 때문에, 그러한 추가의 절단은 상기 코어 독소의 어느 한 말단으로부터 대략적으로 총 80개 미만의 잔기를 제거한다. DIG-109 단백질의 N-말단으로부터의 처음 130개 잔기 내에서, 잠재적인 트립신 절단 부위는 R28 (코어 독소의 R-1), R87 (코어 독소의 R59), R93 (코어 독소의 R65), K115 (코어 독소의 K87), K122 (코어 독소의 K94), R127 (코어 독소의 R99), 및 R129 (코어 독소의 R101)에 위치한다. 코어 독소의 C-말단의 마지막 100개의 아미노산 내에서, 잠재적인 트립신 절단 부위는 R530 (코어 독소의 R502), R533 (코어 독소의 R505), K557 (코어 독소의 K529), R568 (코어 독소의 R540), R571 (코어 독소의 R543), R582 (코어 독소의 R554), 및 K610 (코어 독소의 K582)에 위치한다.
가이드로서 상기에 확인된 잠재적인 프로테아제 절단 부위를 이용하여, 서열 8에 개시된 마이즈 최적화 DIG-109 코딩 서열로부터 유래되는 DNA 서열을 유전자 절단형 DIG-109 단백질 변이체를 코딩하도록 설계하였다. 실시예 13에 개시한 바와 같이 절단 코딩 영역을 개시하기 위하여 5' 말단 메티오닌 및 글리신 코돈을 부가하는 것에 대한 지침을 이들 작제물에 대하여 또한 이용하였다. 첫 번째의 그러한 실시양태인 서열 27로 개시된 DIG-110은 DIG-109 단백질의 아미노산 88 내지 1164를 포함하며, 이는 메티오닌 및 글리신이 N-말단에 부가된 것이었다. DIG-110을 코딩하는 마이즈 최적화 DNA 서열이 서열 28에 개시되어 있다. 두 번째 실시양태인 서열 29로 개시된 DIG-111은 DIG-109 단백질의 아미노산 88 내지 628을 포함하며, 이는 메티오닌 및 글리신이 N-말단에 부가된 것이었다. DIG-111을 코딩하는 마이즈 최적화 DNA 서열은 서열 30에 개시되어 있다. 세 번째 실시양태인 서열 31로 개시된 DIG-112는 DIG-109 단백질의 아미노산 123 내지 1164를 포함하며, 이는 메티오닌 및 글리신이 N-말단에 부가된 것이었다. DIG-112를 코딩하는 마이즈 최적화 DNA 서열은 서열 32에 개시되어 있다. 네 번째 실시양태인 서열 33으로 개시된 DIG-113은 DIG-109 단백질의 아미노산 123 내지 628을 포함하며, 이는 메티오닌 및 글리신이 N-말단에 부가된 것이었다. DIG-113을 코딩하는 마이즈 최적화 DNA 서열은 서열 34에 개시되어 있다. 다섯 번째 실시양태인 서열 35로 개시된 DIG-114는 DIG-109 단백질의 아미노산 1 내지 582를 포함한다. DIG-114를 코딩하는 마이즈 최적화 DNA 서열은 서열 36에 개시되어 있다.
DIG-110 및 DIG-112 단백질은 서열 4에 개시된 Cry1Ab 전독소 절편을 포함함을 주목해야 한다. 이러한 C-말단 전독소 절편은 일부의 예에서 식물에서 단백질을 안정화시키거나 이것이 더 큰 용해성을 갖도록 하는 기능을 할 수 있다고 생각된다. DIG-110의 R543의 트립신 부위에서의 절단, 그에 따른 전독소 절편 대부분의 제거는 크기 이론치가 61.2 kDa인 펩티드를 생성하는데, 이 크기는 pDAS5162- 및 pDAS5848-형질전환 마이즈 식물에서 관찰되는 60 kDa DIG-109 절단 (truncated) 펩티드의 것에 매우 가까웠다. DIG-111 단백질 (이는 처음 9개 아미노산을 제외하고는 Cry1Ab 전독소 절편 전부가 결여됨)은 그러한 절단에서 생기는 DIG-110의 절편 (즉, DIG-110의 아미노산 1 내지 543; 크기의 이론치: 61.2 kDa)을 포함한다.
이와 유사하게, DIG-112의 유사 R508 부위에서의 절단은 크기 이론치가 57.2 kDa인 펩티드를 생성하는데, 이 크기는 pDAS5162- 및 pDAS5848-형질전환 마이즈 식물에서 관찰되는 55 kDa DIG-109 펩티드의 것에 매우 가까웠다. DIG-113 단백질 (이는 처음 9개 아미노산을 제외하고는 Cry1Ab 전독소 절편 전부가 결여됨)은 그러한 절단에서 생기는 DIG-112의 절편 (즉, DIG-112의 아미노산 1 내지 508; 크기의 이론치: 57.2 kDa)을 포함한다.
DIG-114 단백질은 DIG-109 단백질의 아미노산 1 내지 28 (이들 잔기는 식물 세포에서 또는 곤충 중장에서 효소에 의해 제거될 수 있음)을 유지하며, DIG-109 단백질의 R582의 잠재적인 트립신 절단 부위에서 종결된다. 따라서, 이 DIG-109 변이체는 N-말단의 28개 아미노산이 생체내에서 제거되었는지의 여부에 따라 65.7 kDa 단백질로서 또는 62.6 펩티드로서 존재할 수 있다.
본원에 개시한 원리에 의해 추가의 DIG-109 단백질 변이체를 코딩하도록 추가의 마이즈 최적화 코딩 서열을 설계할 수 있다.
실시예
15
DIG
-109 및
DIG
-109
변이체
단백질을 코딩하는 발현 플라스미드의
작제
및 슈도모나스에서의 발현
DIG-109 단백질 또는 DIG-110, DIG-111, DIG-112, DIG-113, 또는 DIG-114 단백질 (DIG-109 변이체 단백질로 총칭됨)을 생성하도록 조작되는 슈도모나스 플루오레센스 (Pf) 발현 작제물의 작제에서 표준 클로닝 방법 [예를 들어, 문헌[Sambrook et al., (1989)] 및 [Ausubel et al., (1995)]와, 그의 최신판에 기술된 바와 같음]을 사용하였다. 미국 특허 제5169760호에 개시된 바와 같이 변형 lac 오페론이 삽입된 슈도모나스 플루오레센스 주 MB214 (주 MB101의 유도체; 피. 플루오레센스 biovar I)에서 단백질 생성을 수행하였다. 기본 클로닝 방법은 DIG-109 또는 DIG-109 변이체 단백질을 코딩하는 DNA 단편을 플라스미드 pDOW1169 내로 서브클로닝하는 것을 수반하였으며, 그에 의해 이것은 플라스미드 pKK223-3 (피엘 파마시아 (PL Pharmacia; 미국 위스콘신주 밀워키)) 유래의 rrnBT1T2 종결서열 및 Ptac 프로모터의 발현 제어 하에 위치하게 된다. pDOW1169는 단백질 코딩 영역을 포함하는 DNA 단편이 내부에 도입될 수 있는 제한 효소 인식 부위 앞의 리보좀 결합 부위, pyrF 유전자 및 RSF1010 복제 기원을 갖는 중위 카피의 플라스미드이다 (미국 특허 공개 제20080193974호). 상기 발현 플라스미드로 전기천공에 의해 DC454 (돌연변이 ΔpyrF 및 lsc::lacIQI를 갖는 거의 야생형의 피. 플루오레센스 주) 또는 그의 유도체를 형질전환시키고, 이를 SOC-대두 가수분해물 배지에서 회수하고, 선발 배지 (우라실이 결여된 M9 글루코스 한천, 문헌[Sambrook et al., 상기 문헌]) 상에 도말하였다. 미생물학적 조작에 대한 상세 사항은 본원에 참고로 포함된 문헌[Squires et al., (2004)], 미국 특허 공개 제20060008877호, 미국 특허 공개 제20080193974호, 및 미국 특허 공개 제20080058262호에서 입수가능하다. 먼저 콜로니를 PCR에 의해 스크리닝하고, 그 후 양성 클론을 미니프렙 (miniprep) 플라스미드 DNA의 제한효소 절단에 의해 분석하였다. 삽입체를 포함하는 선발 클론의 플라스미드 DNA를 상업적 서열결정 판매 회사, 예컨대 엠더블유지 바이오테크 (MWG Biotech; 미국 앨라배마주 헌츠빌))와의 계약에 의해 서열결정하였다. 서열 데이터를 시켄처 (Sequencher)TM 소프트웨어 (진 코즈 코포레이션 (Gene Codes Corp.; 미국 미시건주 앤아버))를 사용하여 어셈블링 및 분석하였다.
진탕 플라스크에서의 성장 및 발현의 분석 특성화 및 곤충 생물분석을 위한 DIG-109 단백질 또는 DIG-109 변이체 단백질의 생성은 적절한 발현 플라스미드를 포함하는, 진탕 플라스크에서 성장시킨 피. 플루오레센스 주에 의해 성취하였다. DIG-109 단백질 또는 DIG-109 변이체 단백질의 생성은 Ptac 프로모터에 의해 추진되었으며, 이는 미국 특허 제5527883호에 이전에 기술된 바와 같이 행하였다. 진탕하면서 30도에서 24시간 초기 인큐베이션한 후 이소프로필-β-D-1-티오갈락토피라노시드 (IPTG)를 첨가함으로써 발현을 유도하였다. 유도시에 그리고 유도 후 다양한 시점에서 배양물을 샘플링하였다. 세포 밀도를 600 nm에서의 광학 밀도 (OD600)로 측정하였다. 각각의 샘플링 시점에서, 샘플의 세포 밀도를 OD600 = 20으로 조정하고, 1 mL의 분취물을 14000 x g에서 5분 동안 원심분리하였다. 세포 펠렛을 -80도에서 냉동시켰다.
실시예
16
세포
분획화
, 및
DIG
-109 및
DIG
-109
변이체
단백질의 슈도모나스에 의한 생성의 진탕 플라스크 샘플의
SDS
-
PAGE
분석
냉동 진탕 플라스크 세포 펠렛 샘플로부터의 용해성 및 불용성 분획물을 이지라이즈TM 박테리아 단백질 추출 용액 (에피센터® 바이오테크놀로지즈, 미국 위스콘신주 매디슨)을 이용하여 생성하였다. 실시예 2에 개시한 방법 및 지침을 이용하였다.
실시예
17
슈도모나스
플루오레센스에서
생성한
DIG
-109
변이체
단백질의
살곤충
활성
유럽 옥수수 명나방 (ECB; 오스트리니아 누빌랄리스 (휘브너)), Cry1F-내성 ECB (rECB), 왕담배나방 (CEW; 헬리코베르파 제아 (보디에)), 검거세미나방 (BCW; 아그로티스 입실론 (후프나겔)), 밤나방 (FAW, 스포도프테라 프루기페르다 (제이.이. 스미스)), Cry1F-내성 FAW (rFAW), 남서부 옥수수 명나방 (SWCB, 디아트라에아 그란디오셀라), 사탕수수 명나방 (SCB; 디아트라에아 사카랄리스) 및 Cry1Ab-내성 SCB (rSCB)를 포함하는 인시목 종에서 DIG-109 변이체 단백질의 살곤충 활성을 입증하였다.
실시예 3 및 실시예 4에 개시한 방법, 지침 및 데이터 분석을 따랐다.
실시예
18
DIG
-109
변이체
단백질을 코딩하는 식물
발현성
유전자를 포함하는 식물 형질전환 벡터의
작제
아그로박테륨 수퍼바이너리 시스템 (저팬 토바코, 일본 도꾜)을 단자엽 식물 숙주의 형질전환에 편리하게 이용하였다. 식물 발현 벡터의 작제, 및 수퍼바이너리 플라스미드의 생성 및 그의 인증을 실시예 7 및 실시예 8에 개시한 방법에 의해 수행하였다. pSB11 유도 플라스미드의 T-DNA 성분의 물리적 배열을 하기와 같이 편리하게 예시하였다:
RB>마이즈 Ubi1 프로모터:DIG-109 변이체 CDS:마이즈 Per5 3'UTR>벼 Act1 프로모터:DSM2 CDS:마이즈 Lip 3'UTR>LB, 또는
RB>마이즈 Ubi1 프로모터:DIG-109 변이체 CDS:마이즈 Per5 3'UTR>마이즈 Ubi1 프로모터:AAD-1 CDS:마이즈 Lip 3' UTR>LB
실시예
19
마이즈
식물에서의
DIG
-109 단백질
변이체의
생성
마이즈의 아그로박테륨 -매개 형질전환 DIG 109 변이체 단백질을 생성하는 트랜스제닉 마이즈 식물을 실시예 9에 개시한 방법에 의해 생성하였다.
마이즈 형질전환 분야의 숙련자라면 다른 방법이 마이즈 형질전환에 이용가능하고 다른 식물 발현성 선발가능 마커 유전자 (예를 들어 제초제 내성 유전자)가 사용될 때 다른 방법이 형질전환 식물의 선발에 이용가능함을 이해할 것이다.
실시예
20
DIG
-109
변이체
단백질을 코딩하는 유전자를 발현하는
트랜스제닉
마이즈
식물의 생화학적
분자적
분석 및 곤충 생물분석
DIG-109 변이체 단백질을 코딩하는 유전자를 지니고 발현하는 트랜스제닉 마이즈 식물에 의해 생성되는 DIG-109 변이체 단백질의 생화학적 특성화를 실시예 10 및 실시예 12의 방법 및 시약에 의해 행하였다. DIG-109 변이체 단백질을 코딩하는 유전자의 트랜스진 분석을 실시예 11에 개시한 방법 및 시약에 따라 수행하였다. DIG-109 변이체 단백질을 코딩하는 유전자를 지니고 발현하는 트랜스제닉 마이즈 식물로부터 유래된 잎 조각의 곤충 생물분석을 실시예 10에 개시한 방법에 의해 행하였다.
SEQUENCE LISTING
<110> Dow AgroSciences
Narva, Ken
Hey, Tim
Sheets, Joel
Larrinua, Iggy
Burton, Stephanie
<120> Truncated Cry1Ca
<130> IDM 68342
<160> 36
<170> PatentIn version 3.5
<210> 1
<211> 619
<212> PRT
<213> Artificial Sequence
<220>
<223> Derived from Cry1Ca3
<400> 1
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr
610 615
<210> 2
<211> 545
<212> PRT
<213> Artificial Sequence
<220>
<223> Derived from Cry1Ab
<400> 2
Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala
1 5 10 15
Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp
20 25 30
Tyr His Ile Asp Arg Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu
35 40 45
Phe Cys Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala
50 55 60
Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg
65 70 75 80
Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile
85 90 95
Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu
100 105 110
Leu Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile
115 120 125
Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr
130 135 140
Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala
145 150 155 160
Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu
165 170 175
Ser Ala Pro Ser Pro Ile Gly Lys Cys Ala His His Ser His His Phe
180 185 190
Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly
195 200 205
Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu
210 215 220
Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu
225 230 235 240
Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys
245 250 255
Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val
260 265 270
Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr
275 280 285
Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg
290 295 300
Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala
305 310 315 320
Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr
325 330 335
Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser
340 345 350
Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu Gln Asn Asn His
355 360 365
Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu
370 375 380
Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr
385 390 395 400
Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn
405 410 415
Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr
420 425 430
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu
435 440 445
Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr
450 455 460
Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu Glu
465 470 475 480
Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser Asn Arg
485 490 495
Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu
500 505 510
Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu
515 520 525
Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu
530 535 540
Glu
545
<210> 3
<211> 1164
<212> PRT
<213> Artificial Sequence
<220>
<223> DIG-152 Chimeric protein
<400> 3
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser
625 630 635 640
Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Arg
645 650 655
Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu
660 665 670
Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp
675 680 685
Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln
690 695 700
Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly
705 710 715 720
Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp
725 730 735
Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu
740 745 750
Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln
755 760 765
Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val
770 775 780
Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro
785 790 795 800
Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp
805 810 815
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
820 825 830
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
835 840 845
Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg
850 855 860
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr
865 870 875 880
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
885 890 895
Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile
900 905 910
His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro
915 920 925
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu
930 935 940
Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
945 950 955 960
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys
965 970 975
Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
980 985 990
Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro
995 1000 1005
Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr
1010 1015 1020
Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp
1025 1030 1035
Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asn
1040 1045 1050
Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu Tyr
1055 1060 1065
Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr
1070 1075 1080
Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu
1085 1090 1095
Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser
1100 1105 1110
Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val
1115 1120 1125
Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile
1130 1135 1140
Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu
1145 1150 1155
Leu Leu Leu Met Glu Glu
1160
<210> 4
<211> 545
<212> PRT
<213> Artificial Sequence
<220>
<223> Derived from Cry1Ab
<400> 4
Leu Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala
1 5 10 15
Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp
20 25 30
Tyr His Ile Asp Arg Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu
35 40 45
Phe Cys Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala
50 55 60
Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg
65 70 75 80
Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile
85 90 95
Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu
100 105 110
Leu Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile
115 120 125
Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr
130 135 140
Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala
145 150 155 160
Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu
165 170 175
Ser Ala Pro Ser Pro Ile Gly Lys Cys Ala His His Ser His His Phe
180 185 190
Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly
195 200 205
Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu
210 215 220
Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu
225 230 235 240
Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys
245 250 255
Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val
260 265 270
Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr
275 280 285
Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg
290 295 300
Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala
305 310 315 320
Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr
325 330 335
Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser
340 345 350
Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu Gln Asn Asn His
355 360 365
Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu
370 375 380
Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr
385 390 395 400
Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn
405 410 415
Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr
420 425 430
Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu
435 440 445
Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr
450 455 460
Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu Glu
465 470 475 480
Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser Asn Arg
485 490 495
Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu
500 505 510
Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu
515 520 525
Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu
530 535 540
Glu
545
<210> 5
<211> 1164
<212> PRT
<213> Artificial Sequence
<220>
<223> DIG-109 chimeric protein
<400> 5
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser
625 630 635 640
Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Arg
645 650 655
Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu
660 665 670
Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp
675 680 685
Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln
690 695 700
Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly
705 710 715 720
Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp
725 730 735
Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu
740 745 750
Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln
755 760 765
Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val
770 775 780
Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro
785 790 795 800
Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp
805 810 815
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
820 825 830
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
835 840 845
Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg
850 855 860
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr
865 870 875 880
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
885 890 895
Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile
900 905 910
His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro
915 920 925
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu
930 935 940
Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
945 950 955 960
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys
965 970 975
Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
980 985 990
Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro
995 1000 1005
Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr
1010 1015 1020
Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp
1025 1030 1035
Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asn
1040 1045 1050
Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu Tyr
1055 1060 1065
Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr
1070 1075 1080
Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu
1085 1090 1095
Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser
1100 1105 1110
Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val
1115 1120 1125
Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile
1130 1135 1140
Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu
1145 1150 1155
Leu Leu Leu Met Glu Glu
1160
<210> 6
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> immunogenic peptide
<400> 6
Val Gln Arg Ser Gly Thr Pro Phe Leu Thr
1 5 10
<210> 7
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> immunogenic peptide
<400> 7
Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser
1 5 10
<210> 8
<211> 3492
<212> DNA
<213> Artificial Sequence
<220>
<223> DIG-109 maize-optimized coding region
<400> 8
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180
atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240
gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctc 1860
gaggctgaat cggatcttga aagggcacag aaggcagtca acgctctctt caccagctca 1920
aatcagattg gccttaagac cgatgttact gactatcata tcgacagagt ttctaacctt 1980
gtcgagtgcc tctccgacga gttctgtctc gacgaaaaga aggaactctc cgagaaagtg 2040
aagcacgcga aacgcctctc ggatgaacgg aacttgctgc aagatccgaa cttcagaggc 2100
atcaatcgcc agttggatag aggctggagg ggatcaaccg acataaccat tcaaggtggg 2160
gatgatgtgt tcaaggaaaa ctacgtgaca ttgctgggca ccttcgacga gtgctatccc 2220
acgtatctct atcagaagat tgacgagtcc aagctcaaag cctacacacg ctatcagctc 2280
agaggctaca ttgaggactc tcaagacctc gaaatctact tgatcagata caacgccaag 2340
cacgagacgg tgaacgtccc tgggactggg tcactgtggc cactgtcggc accctcgcca 2400
atcggaaagt gcgctcacca cagccaccac ttctcccttg acatagatgt tgggtgtacg 2460
gacttgaatg aggatctggg tgtgtgggtg atctttaaga tcaagaccca agatggtcat 2520
gcgaggcttg gcaaccttga gttccttgaa gagaagcctt tggtcggaga ggcactggct 2580
cgcgtgaaga gggctgagaa gaaatggagg gacaagaggg agaaactgga gtgggagacc 2640
aacatagtgt acaaggaggc caaggagtca gtggacgcac tgtttgtcaa ttcccagtat 2700
gataggctcc aagcggacac gaacatcgcc atgatccatg cagcggacaa gagggttcac 2760
tccataaggg aggcctatct tccggagctg tcagtgattc ctggggtcaa cgcagccatc 2820
tttgaggaat tggaagggag gatcttcacc gctttctctc tgtacgacgc tcggaacgtc 2880
atcaagaatg gtgatttcaa caatggactc agctgctgga acgtgaaagg gcatgtcgat 2940
gttgaagaac agaacaatca ccgcagcgtg ctggtggttc cggagtggga agccgaggtc 3000
tcacaagaag tcagagtgtg ccctgggagg ggttacatct tgcgggtcac agcctacaag 3060
gaaggttatg gcgaaggctg tgtcacgatc catgagatcg aaaacaacac agacgagctg 3120
aagttttcca actgtgttga ggaggaggtc tatcctaaca atactgttac gtgcaacgac 3180
tacacagcca ctcaagagga gtacgagggc acttacacct ctcgcaacag aggctacgac 3240
ggtgcctacg agtcaaacag ctccgtgcca gcggactacg cctcggctta cgaagagaag 3300
gcgtacaccg acggtcggag ggataacccg tgcgagagca atagaggcta tggcgactac 3360
actcctctcc cagctggcta cgtgaccaag gagttggagt actttccgga gacagacaaa 3420
gtctggattg agattggaga gacagaaggc acgttcatcg tggactctgt tgaactcttg 3480
ctgatggagg ag 3492
<210> 9
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 9
cctgctccac taccagtaca a 21
<210> 10
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 10
gtccaagaag gtgaccttct c 21
<210> 11
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 11
agatcaccga ctttgcgctc ttt 23
<210> 12
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 12
cctccctctt tgacgcc 17
<210> 13
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 13
agccacatcc cagtaacga 19
<210> 14
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 14
cagcccaatg aggcatgagc 20
<210> 15
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 15
tgtgttgagg aggaggtc 18
<210> 16
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 16
ccttctcttc gtaagccg 18
<210> 17
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 17
tcaagaggag tacgagggca ctt 23
<210> 18
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 18
tgttcggttc cctctaccaa 20
<210> 19
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 19
caacatccat caccttgact ga 22
<210> 20
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 20
cacagaaccg tcgcttcagc aaca 24
<210> 21
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 21
tgtgttgagg aggaggtc 18
<210> 22
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 22
ccttctcttc gtaagccg 18
<210> 23
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 23
tcaagaggag tacgagggca ctt 23
<210> 24
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 24
tggcggacga cgacttgt 18
<210> 25
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 25
aaagtttgga ggctgccgt 19
<210> 26
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide
<400> 26
cgagcagacc gccgtgtact tctacc 26
<210> 27
<211> 1079
<212> PRT
<213> Artificial Sequence
<220>
<223> DIG-110 Chimeric protein
<400> 27
Met Gly Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn Leu Glu
1 5 10 15
Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys Glu Trp
20 25 30
Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile Asp Arg
35 40 45
Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg
50 55 60
Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala
65 70 75 80
Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg
85 90 95
Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile
100 105 110
Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg
115 120 125
Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr
130 135 140
Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala
145 150 155 160
Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly
165 170 175
Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro
180 185 190
Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Asn
195 200 205
Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn Leu Thr
210 215 220
Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly
225 230 235 240
His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro
245 250 255
Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe
260 265 270
Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu
275 280 285
Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly
290 295 300
Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly
305 310 315 320
Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro
325 330 335
Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln
340 345 350
Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr
355 360 365
His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn
370 375 380
Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val
385 390 395 400
Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr
405 410 415
Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr
420 425 430
Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg
435 440 445
Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val
450 455 460
Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu
465 470 475 480
Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe
485 490 495
Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly
500 505 510
Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile
515 520 525
Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu Arg Ala
530 535 540
Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu
545 550 555 560
Lys Thr Asp Val Thr Asp Tyr His Ile Asp Arg Val Ser Asn Leu Val
565 570 575
Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Lys Glu Leu Ser
580 585 590
Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu
595 600 605
Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp
610 615 620
Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys
625 630 635 640
Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp Glu Cys Tyr Pro Thr
645 650 655
Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg
660 665 670
Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr
675 680 685
Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr
690 695 700
Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro Ile Gly Lys Cys Ala
705 710 715 720
His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp
725 730 735
Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln
740 745 750
Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro
755 760 765
Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp
770 775 780
Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys
785 790 795 800
Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp
805 810 815
Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys
820 825 830
Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile
835 840 845
Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe
850 855 860
Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp
865 870 875 880
Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Asp Val
885 890 895
Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Val Pro Glu Trp Glu
900 905 910
Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile
915 920 925
Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr
930 935 940
Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys
945 950 955 960
Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr
965 970 975
Thr Ala Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg
980 985 990
Gly Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr
995 1000 1005
Ala Ser Ala Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp
1010 1015 1020
Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu
1025 1030 1035
Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr
1040 1045 1050
Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile
1055 1060 1065
Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1070 1075
<210> 28
<211> 3237
<212> DNA
<213> Artificial Sequence
<220>
<223> DIG-110 maize-optimized coding region
<400> 28
atgggcatcg ctgagttcgc gagaaatgct gcaatcgcca accttgaagg gcttggcaac 60
aacttcaaca tctacgtgga ggcgttcaag gagtgggaag aggaccctaa gaatccagcg 120
accagaacga gggttataga tcggttccgc atcctcgatg gccttttgga gagggacatc 180
ccgagcttcc gcatttcggg atttgaggtt cctctgctct cagtctacgc tcaagctgct 240
aatctgcatc tggccatctt gagggattca gtcatctttg gcgaacgctg gggtcttacg 300
actatcaacg tgaacgagaa ctacaatcgg ttgattcggc acatagacga gtatgccgac 360
cactgtgcta acacctacaa taggggtctg aacaatctgc caaagtcaac gtatcaagac 420
tggataacct acaataggct cagacgggac ctcactctca ccgtgctgga catagctgcc 480
ttctttccga actacgacaa ccggagatat cctattcaac ccgttggtca gctcactcgc 540
gaggtctaca ccgatcccct catcaacttc aatccccagc tgcaatcggt cgcacagctg 600
cccaccttca atgtgatgga aaactcagcg atccggaatc cccatctgtt tgacatactt 660
aacaacctca ctatcttcac cgattggttt tcagttggac gcaacttcta ctggggaggg 720
cacagagtga tttcaagcct cattggagga gggaacatta catcgcctat ctatggaagg 780
gaggccaacc aagagccacc aaggtctttc accttcaacg gtccggtgtt cagaacactt 840
agcaatccca cattgcgctt gctgcaacag ccgtggccag caccaccatt caatctgagg 900
ggagtggagg gtgtggagtt ctcgacgcct acaaactcct ttacgtacag aggcagaggg 960
acagtggact cactgacaga actcccacct gaggacaact ctgttcctcc gagggagggc 1020
tactcgcacc ggctttgcca tgccaccttc gtccagaggt ctggcacgcc ttttctgacc 1080
actggggttg tctttagctg gactcaccgc tcagcgacgc tgaccaacac aatcgaccca 1140
gagaggatca atcagatccc tctggtgaag ggctttcgcg tttggggtgg cacaagcgtg 1200
atcaccggac ctggtttcac tggtggggat atcctcagac gcaatacgtt tggcgatttc 1260
gtgagccttc aagtcaacat caattcccca atcacccaga gatatcggct ccgcttcaga 1320
tacgcctcat ccagagacgc aagggtcatc gtccttactg gagcagccag caccggagtc 1380
ggaggccaag ttagcgtcaa catgccgttg cagaaaacga tggaaatcgg tgaaaacctc 1440
accagcagaa cctttcgcta tacagatttc agcaaccctt tctccttcag agccaatccg 1500
gacataatcg gcatatccga gcagcccttg ttcggtgctg ggtccatctc ttctggcgag 1560
ctgtacatcg acaagattga gatcattctc gcagatgcga ctctcgaggc tgaatcggat 1620
cttgaaaggg cacagaaggc agtcaacgct ctcttcacca gctcaaatca gattggcctt 1680
aagaccgatg ttactgacta tcatatcgac agagtttcta accttgtcga gtgcctctcc 1740
gacgagttct gtctcgacga aaagaaggaa ctctccgaga aagtgaagca cgcgaaacgc 1800
ctctcggatg aacggaactt gctgcaagat ccgaacttca gaggcatcaa tcgccagttg 1860
gatagaggct ggaggggatc aaccgacata accattcaag gtggggatga tgtgttcaag 1920
gaaaactacg tgacattgct gggcaccttc gacgagtgct atcccacgta tctctatcag 1980
aagattgacg agtccaagct caaagcctac acacgctatc agctcagagg ctacattgag 2040
gactctcaag acctcgaaat ctacttgatc agatacaacg ccaagcacga gacggtgaac 2100
gtccctggga ctgggtcact gtggccactg tcggcaccct cgccaatcgg aaagtgcgct 2160
caccacagcc accacttctc ccttgacata gatgttgggt gtacggactt gaatgaggat 2220
ctgggtgtgt gggtgatctt taagatcaag acccaagatg gtcatgcgag gcttggcaac 2280
cttgagttcc ttgaagagaa gcctttggtc ggagaggcac tggctcgcgt gaagagggct 2340
gagaagaaat ggagggacaa gagggagaaa ctggagtggg agaccaacat agtgtacaag 2400
gaggccaagg agtcagtgga cgcactgttt gtcaattccc agtatgatag gctccaagcg 2460
gacacgaaca tcgccatgat ccatgcagcg gacaagaggg ttcactccat aagggaggcc 2520
tatcttccgg agctgtcagt gattcctggg gtcaacgcag ccatctttga ggaattggaa 2580
gggaggatct tcaccgcttt ctctctgtac gacgctcgga acgtcatcaa gaatggtgat 2640
ttcaacaatg gactcagctg ctggaacgtg aaagggcatg tcgatgttga agaacagaac 2700
aatcaccgca gcgtgctggt ggttccggag tgggaagccg aggtctcaca agaagtcaga 2760
gtgtgccctg ggaggggtta catcttgcgg gtcacagcct acaaggaagg ttatggcgaa 2820
ggctgtgtca cgatccatga gatcgaaaac aacacagacg agctgaagtt ttccaactgt 2880
gttgaggagg aggtctatcc taacaatact gttacgtgca acgactacac agccactcaa 2940
gaggagtacg agggcactta cacctctcgc aacagaggct acgacggtgc ctacgagtca 3000
aacagctccg tgccagcgga ctacgcctcg gcttacgaag agaaggcgta caccgacggt 3060
cggagggata acccgtgcga gagcaataga ggctatggcg actacactcc tctcccagct 3120
ggctacgtga ccaaggagtt ggagtacttt ccggagacag acaaagtctg gattgagatt 3180
ggagagacag aaggcacgtt catcgtggac tctgttgaac tcttgctgat ggaggag 3237
<210> 29
<211> 543
<212> PRT
<213> Artificial Sequence
<220>
<223> DIG-111 truncated protein
<400> 29
Met Gly Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn Leu Glu
1 5 10 15
Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys Glu Trp
20 25 30
Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile Asp Arg
35 40 45
Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg
50 55 60
Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala
65 70 75 80
Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg
85 90 95
Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile
100 105 110
Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg
115 120 125
Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr
130 135 140
Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala
145 150 155 160
Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly
165 170 175
Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro
180 185 190
Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Asn
195 200 205
Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn Leu Thr
210 215 220
Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly
225 230 235 240
His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro
245 250 255
Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe
260 265 270
Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu
275 280 285
Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly
290 295 300
Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly
305 310 315 320
Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro
325 330 335
Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln
340 345 350
Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr
355 360 365
His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn
370 375 380
Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val
385 390 395 400
Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr
405 410 415
Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr
420 425 430
Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg
435 440 445
Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val
450 455 460
Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu
465 470 475 480
Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe
485 490 495
Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly
500 505 510
Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile
515 520 525
Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu Arg
530 535 540
<210> 30
<211> 1629
<212> DNA
<213> Artificial Sequence
<220>
<223> DIG-111 maize-optimized coding region
<400> 30
atgggcatcg ctgagttcgc gagaaatgct gcaatcgcca accttgaagg gcttggcaac 60
aacttcaaca tctacgtgga ggcgttcaag gagtgggaag aggaccctaa gaatccagcg 120
accagaacga gggttataga tcggttccgc atcctcgatg gccttttgga gagggacatc 180
ccgagcttcc gcatttcggg atttgaggtt cctctgctct cagtctacgc tcaagctgct 240
aatctgcatc tggccatctt gagggattca gtcatctttg gcgaacgctg gggtcttacg 300
actatcaacg tgaacgagaa ctacaatcgg ttgattcggc acatagacga gtatgccgac 360
cactgtgcta acacctacaa taggggtctg aacaatctgc caaagtcaac gtatcaagac 420
tggataacct acaataggct cagacgggac ctcactctca ccgtgctgga catagctgcc 480
ttctttccga actacgacaa ccggagatat cctattcaac ccgttggtca gctcactcgc 540
gaggtctaca ccgatcccct catcaacttc aatccccagc tgcaatcggt cgcacagctg 600
cccaccttca atgtgatgga aaactcagcg atccggaatc cccatctgtt tgacatactt 660
aacaacctca ctatcttcac cgattggttt tcagttggac gcaacttcta ctggggaggg 720
cacagagtga tttcaagcct cattggagga gggaacatta catcgcctat ctatggaagg 780
gaggccaacc aagagccacc aaggtctttc accttcaacg gtccggtgtt cagaacactt 840
agcaatccca cattgcgctt gctgcaacag ccgtggccag caccaccatt caatctgagg 900
ggagtggagg gtgtggagtt ctcgacgcct acaaactcct ttacgtacag aggcagaggg 960
acagtggact cactgacaga actcccacct gaggacaact ctgttcctcc gagggagggc 1020
tactcgcacc ggctttgcca tgccaccttc gtccagaggt ctggcacgcc ttttctgacc 1080
actggggttg tctttagctg gactcaccgc tcagcgacgc tgaccaacac aatcgaccca 1140
gagaggatca atcagatccc tctggtgaag ggctttcgcg tttggggtgg cacaagcgtg 1200
atcaccggac ctggtttcac tggtggggat atcctcagac gcaatacgtt tggcgatttc 1260
gtgagccttc aagtcaacat caattcccca atcacccaga gatatcggct ccgcttcaga 1320
tacgcctcat ccagagacgc aagggtcatc gtccttactg gagcagccag caccggagtc 1380
ggaggccaag ttagcgtcaa catgccgttg cagaaaacga tggaaatcgg tgaaaacctc 1440
accagcagaa cctttcgcta tacagatttc agcaaccctt tctccttcag agccaatccg 1500
gacataatcg gcatatccga gcagcccttg ttcggtgctg ggtccatctc ttctggcgag 1560
ctgtacatcg acaagattga gatcattctc gcagatgcga ctctcgaggc tgaatcggat 1620
cttgaaagg 1629
<210> 31
<211> 1044
<212> PRT
<213> Artificial Sequence
<220>
<223> DIG-112 chimeric protein
<400> 31
Met Gly Asn Pro Ala Thr Arg Thr Arg Val Ile Asp Arg Phe Arg Ile
1 5 10 15
Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg Ile Ser Gly
20 25 30
Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn Leu His
35 40 45
Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg Trp Gly Leu
50 55 60
Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile Arg His Ile
65 70 75 80
Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg Gly Leu Asn
85 90 95
Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr Asn Arg Leu
100 105 110
Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala Phe Phe Pro
115 120 125
Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly Gln Leu Thr
130 135 140
Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro Gln Leu Gln
145 150 155 160
Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Asn Ser Ala Ile
165 170 175
Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn Leu Thr Ile Phe Thr
180 185 190
Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly His Arg Val
195 200 205
Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro Ile Tyr Gly
210 215 220
Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn Gly Pro
225 230 235 240
Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln Gln Pro
245 250 255
Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly Val Glu Phe
260 265 270
Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly Thr Val Asp
275 280 285
Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Pro Arg Glu
290 295 300
Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln Arg Ser Gly
305 310 315 320
Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr His Arg Ser
325 330 335
Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro
340 345 350
Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly
355 360 365
Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp
370 375 380
Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr
385 390 395 400
Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val
405 410 415
Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn
420 425 430
Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg
435 440 445
Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn
450 455 460
Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser
465 470 475 480
Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala
485 490 495
Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala
500 505 510
Val Asn Ala Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp
515 520 525
Val Thr Asp Tyr His Ile Asp Arg Val Ser Asn Leu Val Glu Cys Leu
530 535 540
Ser Asp Glu Phe Cys Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val
545 550 555 560
Lys His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro
565 570 575
Asn Phe Arg Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser
580 585 590
Thr Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr
595 600 605
Val Thr Leu Leu Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr
610 615 620
Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu
625 630 635 640
Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg
645 650 655
Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu
660 665 670
Trp Pro Leu Ser Ala Pro Ser Pro Ile Gly Lys Cys Ala His His Ser
675 680 685
His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu
690 695 700
Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His
705 710 715 720
Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val Gly
725 730 735
Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys
740 745 750
Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys
755 760 765
Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln
770 775 780
Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val His
785 790 795 800
Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val
805 810 815
Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Phe
820 825 830
Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn
835 840 845
Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu Gln
850 855 860
Asn Asn His Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val
865 870 875 880
Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val
885 890 895
Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu
900 905 910
Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu
915 920 925
Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr
930 935 940
Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp
945 950 955 960
Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala
965 970 975
Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu
980 985 990
Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val
995 1000 1005
Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile
1010 1015 1020
Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu
1025 1030 1035
Leu Leu Leu Met Glu Glu
1040
<210> 32
<211> 3132
<212> DNA
<213> Artificial Sequence
<220>
<223> DIG-112 maize-optimized coding region
<400> 32
atgggcaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 60
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 120
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 180
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 240
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 300
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 360
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 420
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 480
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 540
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 600
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 660
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 720
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 780
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 840
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 900
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 960
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1020
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1080
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1140
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1200
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1260
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1320
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1380
ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1440
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctc 1500
gaggctgaat cggatcttga aagggcacag aaggcagtca acgctctctt caccagctca 1560
aatcagattg gccttaagac cgatgttact gactatcata tcgacagagt ttctaacctt 1620
gtcgagtgcc tctccgacga gttctgtctc gacgaaaaga aggaactctc cgagaaagtg 1680
aagcacgcga aacgcctctc ggatgaacgg aacttgctgc aagatccgaa cttcagaggc 1740
atcaatcgcc agttggatag aggctggagg ggatcaaccg acataaccat tcaaggtggg 1800
gatgatgtgt tcaaggaaaa ctacgtgaca ttgctgggca ccttcgacga gtgctatccc 1860
acgtatctct atcagaagat tgacgagtcc aagctcaaag cctacacacg ctatcagctc 1920
agaggctaca ttgaggactc tcaagacctc gaaatctact tgatcagata caacgccaag 1980
cacgagacgg tgaacgtccc tgggactggg tcactgtggc cactgtcggc accctcgcca 2040
atcggaaagt gcgctcacca cagccaccac ttctcccttg acatagatgt tgggtgtacg 2100
gacttgaatg aggatctggg tgtgtgggtg atctttaaga tcaagaccca agatggtcat 2160
gcgaggcttg gcaaccttga gttccttgaa gagaagcctt tggtcggaga ggcactggct 2220
cgcgtgaaga gggctgagaa gaaatggagg gacaagaggg agaaactgga gtgggagacc 2280
aacatagtgt acaaggaggc caaggagtca gtggacgcac tgtttgtcaa ttcccagtat 2340
gataggctcc aagcggacac gaacatcgcc atgatccatg cagcggacaa gagggttcac 2400
tccataaggg aggcctatct tccggagctg tcagtgattc ctggggtcaa cgcagccatc 2460
tttgaggaat tggaagggag gatcttcacc gctttctctc tgtacgacgc tcggaacgtc 2520
atcaagaatg gtgatttcaa caatggactc agctgctgga acgtgaaagg gcatgtcgat 2580
gttgaagaac agaacaatca ccgcagcgtg ctggtggttc cggagtggga agccgaggtc 2640
tcacaagaag tcagagtgtg ccctgggagg ggttacatct tgcgggtcac agcctacaag 2700
gaaggttatg gcgaaggctg tgtcacgatc catgagatcg aaaacaacac agacgagctg 2760
aagttttcca actgtgttga ggaggaggtc tatcctaaca atactgttac gtgcaacgac 2820
tacacagcca ctcaagagga gtacgagggc acttacacct ctcgcaacag aggctacgac 2880
ggtgcctacg agtcaaacag ctccgtgcca gcggactacg cctcggctta cgaagagaag 2940
gcgtacaccg acggtcggag ggataacccg tgcgagagca atagaggcta tggcgactac 3000
actcctctcc cagctggcta cgtgaccaag gagttggagt actttccgga gacagacaaa 3060
gtctggattg agattggaga gacagaaggc acgttcatcg tggactctgt tgaactcttg 3120
ctgatggagg ag 3132
<210> 33
<211> 508
<212> PRT
<213> Artificial Sequence
<220>
<223> DIG-113 truncated protein
<400> 33
Met Gly Asn Pro Ala Thr Arg Thr Arg Val Ile Asp Arg Phe Arg Ile
1 5 10 15
Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg Ile Ser Gly
20 25 30
Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn Leu His
35 40 45
Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg Trp Gly Leu
50 55 60
Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile Arg His Ile
65 70 75 80
Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg Gly Leu Asn
85 90 95
Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr Asn Arg Leu
100 105 110
Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala Phe Phe Pro
115 120 125
Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly Gln Leu Thr
130 135 140
Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro Gln Leu Gln
145 150 155 160
Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Asn Ser Ala Ile
165 170 175
Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn Leu Thr Ile Phe Thr
180 185 190
Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly His Arg Val
195 200 205
Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro Ile Tyr Gly
210 215 220
Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn Gly Pro
225 230 235 240
Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln Gln Pro
245 250 255
Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly Val Glu Phe
260 265 270
Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly Thr Val Asp
275 280 285
Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Pro Arg Glu
290 295 300
Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln Arg Ser Gly
305 310 315 320
Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr His Arg Ser
325 330 335
Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro
340 345 350
Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly
355 360 365
Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp
370 375 380
Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr
385 390 395 400
Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val
405 410 415
Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn
420 425 430
Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg
435 440 445
Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn
450 455 460
Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser
465 470 475 480
Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala
485 490 495
Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu Arg
500 505
<210> 34
<211> 1524
<212> DNA
<213> Artificial Sequence
<220>
<223> DIG-113 maize-optimized coding region
<400> 34
atgggcaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 60
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 120
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 180
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 240
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 300
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 360
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 420
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 480
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 540
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 600
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 660
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 720
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 780
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 840
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 900
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 960
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1020
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1080
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1140
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1200
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1260
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1320
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1380
ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1440
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctc 1500
gaggctgaat cggatcttga aagg 1524
<210> 35
<211> 582
<212> PRT
<213> Artificial Sequence
<220>
<223> DIG-114 truncated protein
<400> 35
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg
580
<210> 36
<211> 1746
<212> DNA
<213> Artificial Sequence
<220>
<223> DIG-114 maize-optimized coding region
<400> 36
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180
atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240
gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcaga 1746
Claims (23)
- 상응하는 야생형 Cry1Ca의 N-말단 α-나선 1, 2A, 2B 또는 그의 조합의 전부 또는 일부가 결실된, 살곤충 활성을 갖는, 서열 3 및 서열 5로 이루어진 군으로부터 선택된 서열에 대하여 99% 이상 동일한 Cry1Ca 변이체 단백질.
- 제1항에 있어서, 결실에 의해 도메인 I에서 전부의 α-나선 1 및 전부 또는 일부의 α-나선 2가 제거되고, α-나선 3 내지 7을 포함하는 변이체 단백질.
- 제1항에 있어서, 상기 결실에 의해 살곤충 단백질 DIG-109의 살곤충 활성이 향상되며, 상기 결실은 α-나선 2A 시작 전에 착수되고 α-나선 2B 말단 이후에 종결되지만 α-나선 3 내로는 연장되지 않는 변이체 단백질.
- 제1항에 있어서, 상기 결실에 의해 살곤충 단백질 DIG-152의 살곤충 활성이 향상되며, 상기 결실은 α-나선 2A 시작 전에 착수되고 α-나선 2B 말단 이후에 종결되지만 α-나선 3 내로는 연장되지 않는 변이체 단백질.
- 제1항에 있어서, N-말단 결실이 적어도 하나의 불안정화 아미노산에서 시작되고, 변이체 단백질은 번역 개시 메티오닌과 불안정화 아미노산 사이의 글리신 아미노산을 특정하는 부가된 코돈을 포함하는 변이체 단백질.
- 제1항에 있어서, C-말단 전독소 (protoxin) 서열이 결여된 변이체 단백질.
- 제1항에 있어서, 야생형 Cry1Ca 단백질에 비해 곤충에 대하여 향상된 활성을 갖는 단백질.
- 제7항에 있어서, 상기 곤충이 밤나방 및 사탕수수 명나방으로 이루어진 군으로부터 선택된 단백질.
- 제1항에 있어서, 서열 3에 대하여 99% 이상 동일한 단백질.
- 제1항에 있어서, 서열 5에 대하여 99% 이상 동일한 단백질.
- 제9항에 있어서, 서열 3을 포함하는 단백질.
- 제9항에 있어서, 서열 5를 포함하는 단백질.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US28427509P | 2009-12-16 | 2009-12-16 | |
US61/284,275 | 2009-12-16 | ||
PCT/US2010/060826 WO2011084627A2 (en) | 2009-12-16 | 2010-12-16 | Modified cry1ca insecticidal cry proteins |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120101546A KR20120101546A (ko) | 2012-09-13 |
KR101854478B1 true KR101854478B1 (ko) | 2018-05-03 |
Family
ID=44306062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127018297A KR101854478B1 (ko) | 2009-12-16 | 2010-12-16 | 변형 CRY1Ca 살곤충 CRY 단백질 |
Country Status (18)
Country | Link |
---|---|
US (1) | US9284573B2 (ko) |
EP (1) | EP2512224A4 (ko) |
JP (1) | JP2013514772A (ko) |
KR (1) | KR101854478B1 (ko) |
CN (1) | CN102762096A (ko) |
AR (1) | AR079502A1 (ko) |
AU (1) | AU2010339916B2 (ko) |
BR (1) | BR112012015005A2 (ko) |
CA (1) | CA2782554A1 (ko) |
CL (1) | CL2012001631A1 (ko) |
CO (1) | CO6592053A2 (ko) |
IL (1) | IL220335A (ko) |
MX (1) | MX345224B (ko) |
NZ (1) | NZ601094A (ko) |
RU (1) | RU2012130019A (ko) |
UA (1) | UA112286C2 (ko) |
WO (1) | WO2011084627A2 (ko) |
ZA (1) | ZA201204918B (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2015116907A (ru) * | 2012-10-05 | 2016-11-27 | ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи | ПРИМЕНЕНИЕ Cry1Ea В КОМБИНАЦИЯХ ДЛЯ БОРЬБЫ С РЕЗИСТЕНТНОЙ СОВКОЙ ТРАВЯНОЙ |
CN103145814B (zh) * | 2013-02-25 | 2014-07-09 | 北京大北农科技集团股份有限公司 | 杀虫蛋白质、其编码基因及用途 |
EP3102592B1 (en) | 2014-02-07 | 2020-05-20 | Pioneer Hi-Bred International, Inc. | Insecticidal proteins and methods for their use |
TW201542093A (zh) | 2014-03-21 | 2015-11-16 | 艾格里遺傳學股份有限公司 | 用於控制玉米穗蟲之Cry1D |
EP3137489A4 (en) * | 2014-04-29 | 2017-09-20 | Dow AgroSciences LLC | Monoclonal antibodies specific for cry1ca and related detection methods |
UA123036C2 (uk) * | 2014-10-16 | 2021-02-03 | Монсанто Текнолоджі Ллс | Сконструйований інсектицидний білок, який має активність проти лускокрилих |
JP2018501798A (ja) * | 2014-12-30 | 2018-01-25 | ダウ アグロサイエンシィズ エルエルシー | 害虫の防除に有用な改変Cry1Ca毒素 |
CN108064233B (zh) * | 2015-05-19 | 2022-07-15 | 先锋国际良种公司 | 杀昆虫蛋白及其使用方法 |
US10412369B2 (en) | 2015-07-31 | 2019-09-10 | Dell Products, Lp | Method and apparatus for compensating for camera error in a multi-camera stereo camera system |
US11129906B1 (en) | 2016-12-07 | 2021-09-28 | David Gordon Bermudes | Chimeric protein toxins for expression by therapeutic bacteria |
CN109781993B (zh) * | 2018-12-27 | 2021-04-06 | 中国农业科学院生物技术研究所 | 一种定量检测抗虫蛋白Cry1C的酶联免疫试剂盒 |
AU2020226376A1 (en) * | 2019-02-20 | 2021-08-05 | Syngenta Crop Protection Ag | Engineered pesticidal proteins and methods of controlling plant pests |
CN111100208A (zh) * | 2020-01-16 | 2020-05-05 | 黑龙江大鹏农业有限公司 | 一种人工合成的抗虫蛋白mCry1Ia2及其制备方法和应用 |
CN111574599B (zh) * | 2020-05-18 | 2022-10-28 | 福建农林大学 | 一种解决杀虫毒素被昆虫肠道消化酶过度酶解的毒素改造方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030101482A1 (en) * | 1996-11-27 | 2003-05-29 | Monsanto Technology Llc | Compositions encoding lepidopteran-toxic polypeptides and methods of use |
EP1676922B1 (en) * | 1997-11-12 | 2008-09-17 | Mycogen Corporation | Plant-optimized genes encoding pesticidal toxins |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5380831A (en) * | 1986-04-04 | 1995-01-10 | Mycogen Plant Science, Inc. | Synthetic insecticidal crystal protein gene |
US6078854A (en) * | 1995-06-07 | 2000-06-20 | Automotive Technologies International, Inc. | Apparatus and method for adjusting a vehicle component |
GB9318207D0 (en) | 1993-09-02 | 1993-10-20 | Sandoz Ltd | Improvements in or relating to organic compounds |
US5593881A (en) | 1994-05-06 | 1997-01-14 | Mycogen Corporation | Bacillus thuringiensis delta-endotoxin |
US6110668A (en) | 1996-10-07 | 2000-08-29 | Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. | Gene synthesis method |
US6017534A (en) | 1996-11-20 | 2000-01-25 | Ecogen, Inc. | Hybrid Bacillus thuringiensis δ-endotoxins with novel broad-spectrum insecticidal activity |
US6218188B1 (en) * | 1997-11-12 | 2001-04-17 | Mycogen Corporation | Plant-optimized genes encoding pesticidal toxins |
FR2795739B1 (fr) * | 1999-07-01 | 2003-08-15 | Agronomique Inst Nat Rech | Gene synthetique cryic et plantes transgeniques exprimant ledit gene |
EP1311162B1 (en) * | 2000-08-25 | 2005-06-01 | Syngenta Participations AG | Bacillus thurigiensis crystal protein hybrids |
US7053266B2 (en) | 2002-03-27 | 2006-05-30 | Council Of Scientfic And Industrial Research | Chimeric cry1E δendotoxin and methods of controlling insects |
CA2611539C (en) * | 2005-06-08 | 2017-02-28 | Pioneer Hi-Bred International, Inc. | Insect-specific protease recognition sequences |
-
2010
- 2010-12-16 BR BRBR112012015005-7A patent/BR112012015005A2/pt not_active IP Right Cessation
- 2010-12-16 AR ARP100104675A patent/AR079502A1/es unknown
- 2010-12-16 CN CN2010800640116A patent/CN102762096A/zh active Pending
- 2010-12-16 WO PCT/US2010/060826 patent/WO2011084627A2/en active Application Filing
- 2010-12-16 RU RU2012130019/10A patent/RU2012130019A/ru not_active Application Discontinuation
- 2010-12-16 US US13/516,622 patent/US9284573B2/en active Active
- 2010-12-16 KR KR1020127018297A patent/KR101854478B1/ko active IP Right Grant
- 2010-12-16 EP EP10842617.2A patent/EP2512224A4/en not_active Withdrawn
- 2010-12-16 NZ NZ601094A patent/NZ601094A/en not_active IP Right Cessation
- 2010-12-16 JP JP2012544843A patent/JP2013514772A/ja active Pending
- 2010-12-16 MX MX2012007124A patent/MX345224B/es active IP Right Grant
- 2010-12-16 UA UAA201208626A patent/UA112286C2/uk unknown
- 2010-12-16 AU AU2010339916A patent/AU2010339916B2/en not_active Ceased
- 2010-12-16 CA CA2782554A patent/CA2782554A1/en not_active Abandoned
-
2012
- 2012-06-12 IL IL220335A patent/IL220335A/en not_active IP Right Cessation
- 2012-06-15 CL CL2012001631A patent/CL2012001631A1/es unknown
- 2012-07-02 ZA ZA2012/04918A patent/ZA201204918B/en unknown
- 2012-07-16 CO CO12119345A patent/CO6592053A2/es unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030101482A1 (en) * | 1996-11-27 | 2003-05-29 | Monsanto Technology Llc | Compositions encoding lepidopteran-toxic polypeptides and methods of use |
EP1676922B1 (en) * | 1997-11-12 | 2008-09-17 | Mycogen Corporation | Plant-optimized genes encoding pesticidal toxins |
Non-Patent Citations (1)
Title |
---|
Gatehouse J. et al, Plant Physiol. 146: pp.881-887. (2008.).* |
Also Published As
Publication number | Publication date |
---|---|
WO2011084627A2 (en) | 2011-07-14 |
EP2512224A4 (en) | 2013-04-10 |
JP2013514772A (ja) | 2013-05-02 |
CO6592053A2 (es) | 2013-01-02 |
NZ601094A (en) | 2014-10-31 |
CA2782554A1 (en) | 2011-07-14 |
AU2010339916B2 (en) | 2016-04-21 |
BR112012015005A2 (pt) | 2015-09-01 |
KR20120101546A (ko) | 2012-09-13 |
IL220335A (en) | 2017-01-31 |
ZA201204918B (en) | 2013-02-27 |
RU2012130019A (ru) | 2014-01-27 |
WO2011084627A3 (en) | 2011-12-22 |
US20130025006A1 (en) | 2013-01-24 |
AU2010339916A1 (en) | 2012-07-12 |
UA112286C2 (uk) | 2016-08-25 |
MX345224B (es) | 2017-01-20 |
MX2012007124A (es) | 2012-11-12 |
CN102762096A (zh) | 2012-10-31 |
EP2512224A2 (en) | 2012-10-24 |
US9284573B2 (en) | 2016-03-15 |
CL2012001631A1 (es) | 2013-01-25 |
AR079502A1 (es) | 2012-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101854478B1 (ko) | 변형 CRY1Ca 살곤충 CRY 단백질 | |
CA2758885C (en) | Dig-3 insecticidal cry toxins | |
KR20120039625A (ko) | 살충성 dig-11 cry 독소 | |
JP2012529910A (ja) | Dig−5殺虫性cry毒素 | |
US20230183300A1 (en) | MODIFIED Cry1Ca TOXINS USEFUL FOR CONTROL OF INSECT PESTS | |
US10028510B2 (en) | DIG-17 insecticidal cry toxins | |
WO2017030843A1 (en) | Engineered cry6a insecticidal proteins | |
US20160060306A1 (en) | Dig-14 insecticidal cry toxins |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |