KR20170099907A - 곤충 해충의 방제에 유용한 변형된 Cry1Ca 독소 - Google Patents
곤충 해충의 방제에 유용한 변형된 Cry1Ca 독소 Download PDFInfo
- Publication number
- KR20170099907A KR20170099907A KR1020177017297A KR20177017297A KR20170099907A KR 20170099907 A KR20170099907 A KR 20170099907A KR 1020177017297 A KR1020177017297 A KR 1020177017297A KR 20177017297 A KR20177017297 A KR 20177017297A KR 20170099907 A KR20170099907 A KR 20170099907A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- asn
- ile
- arg
- gly
- Prior art date
Links
- 108700012359 toxins Proteins 0.000 title claims abstract description 223
- 239000003053 toxin Substances 0.000 title claims abstract description 211
- 231100000765 toxin Toxicity 0.000 title claims abstract description 211
- 241000238631 Hexapoda Species 0.000 title abstract description 141
- 238000000034 method Methods 0.000 claims abstract description 59
- 230000009261 transgenic effect Effects 0.000 claims abstract description 48
- 241000607479 Yersinia pestis Species 0.000 claims abstract description 33
- 241000196324 Embryophyta Species 0.000 claims description 182
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 58
- 125000000539 amino acid group Chemical group 0.000 claims description 36
- 150000007523 nucleic acids Chemical group 0.000 claims description 28
- 240000008042 Zea mays Species 0.000 claims description 26
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 23
- 244000068988 Glycine max Species 0.000 claims description 21
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 19
- 235000009973 maize Nutrition 0.000 claims description 19
- 235000010469 Glycine max Nutrition 0.000 claims description 18
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 15
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 13
- 229920000742 Cotton Polymers 0.000 claims description 11
- 241000024188 Andala Species 0.000 claims description 6
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 5
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 claims description 4
- 235000006008 Brassica napus var napus Nutrition 0.000 claims description 4
- 240000000385 Brassica napus var. napus Species 0.000 claims description 4
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 claims description 4
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 4
- 244000299507 Gossypium hirsutum Species 0.000 claims description 4
- 244000020551 Helianthus annuus Species 0.000 claims description 4
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 4
- 235000002566 Capsicum Nutrition 0.000 claims description 3
- 240000007594 Oryza sativa Species 0.000 claims description 3
- 235000007164 Oryza sativa Nutrition 0.000 claims description 3
- 235000021307 Triticum Nutrition 0.000 claims description 3
- 244000098338 Triticum aestivum Species 0.000 claims description 3
- 235000009566 rice Nutrition 0.000 claims description 3
- 235000013311 vegetables Nutrition 0.000 claims description 3
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 claims description 2
- 241001057636 Dracaena deremensis Species 0.000 claims description 2
- 240000005979 Hordeum vulgare Species 0.000 claims description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 2
- 235000021536 Sugar beet Nutrition 0.000 claims description 2
- 239000006002 Pepper Substances 0.000 claims 1
- 235000016761 Piper aduncum Nutrition 0.000 claims 1
- 235000017804 Piper guineense Nutrition 0.000 claims 1
- 244000203593 Piper nigrum Species 0.000 claims 1
- 235000008184 Piper nigrum Nutrition 0.000 claims 1
- 244000062793 Sorghum vulgare Species 0.000 claims 1
- 235000019713 millet Nutrition 0.000 claims 1
- 230000006378 damage Effects 0.000 abstract description 25
- 239000002919 insect venom Substances 0.000 abstract description 13
- 108091033319 polynucleotide Proteins 0.000 abstract description 11
- 239000002157 polynucleotide Substances 0.000 abstract description 11
- 102000040430 polynucleotide Human genes 0.000 abstract description 11
- 241000193388 Bacillus thuringiensis Species 0.000 abstract description 10
- 229940097012 bacillus thuringiensis Drugs 0.000 abstract description 10
- 210000002845 virion Anatomy 0.000 abstract description 2
- 108090000623 proteins and genes Proteins 0.000 description 242
- 102000004169 proteins and genes Human genes 0.000 description 167
- 235000018102 proteins Nutrition 0.000 description 158
- 241000880493 Leptailurus serval Species 0.000 description 81
- 210000004027 cell Anatomy 0.000 description 81
- 108020004414 DNA Proteins 0.000 description 68
- 239000012634 fragment Substances 0.000 description 59
- 235000001014 amino acid Nutrition 0.000 description 57
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 51
- 229940024606 amino acid Drugs 0.000 description 50
- 150000001413 amino acids Chemical class 0.000 description 48
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 46
- 125000003729 nucleotide group Chemical group 0.000 description 44
- 239000002773 nucleotide Substances 0.000 description 41
- 108091026890 Coding region Proteins 0.000 description 39
- 230000014509 gene expression Effects 0.000 description 36
- 230000000749 insecticidal effect Effects 0.000 description 35
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 34
- 125000003275 alpha amino acid group Chemical group 0.000 description 33
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 32
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 32
- 108010013835 arginine glutamate Proteins 0.000 description 32
- 108010050848 glycylleucine Proteins 0.000 description 32
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 31
- 102000035195 Peptidases Human genes 0.000 description 30
- 108091005804 Peptidases Proteins 0.000 description 30
- 239000013612 plasmid Substances 0.000 description 30
- 108010061238 threonyl-glycine Proteins 0.000 description 30
- 241000589158 Agrobacterium Species 0.000 description 29
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 28
- 239000004365 Protease Substances 0.000 description 28
- 108010056582 methionylglutamic acid Proteins 0.000 description 28
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 27
- 238000009396 hybridization Methods 0.000 description 26
- 239000000523 sample Substances 0.000 description 26
- 230000009466 transformation Effects 0.000 description 26
- 230000000694 effects Effects 0.000 description 25
- 239000002609 medium Substances 0.000 description 25
- 239000013598 vector Substances 0.000 description 24
- 108010060231 Insect Proteins Proteins 0.000 description 23
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 21
- 238000003776 cleavage reaction Methods 0.000 description 21
- 238000004519 manufacturing process Methods 0.000 description 21
- 230000007017 scission Effects 0.000 description 21
- 210000001519 tissue Anatomy 0.000 description 21
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 20
- 241001147398 Ostrinia nubilalis Species 0.000 description 20
- 238000004166 bioassay Methods 0.000 description 20
- 239000002158 endotoxin Substances 0.000 description 18
- 239000000243 solution Substances 0.000 description 18
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 17
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 17
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 17
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 17
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 17
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 17
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 17
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 17
- ODDOYXKAHLKKQY-MMWGEVLESA-N Cys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N ODDOYXKAHLKKQY-MMWGEVLESA-N 0.000 description 17
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 17
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 17
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 17
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 17
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 17
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 17
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 17
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 17
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 17
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 17
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 17
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 17
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 17
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 17
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 17
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 17
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 17
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 17
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 17
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 17
- DNUJCLUFRGGSDJ-YLVFBTJISA-N Trp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DNUJCLUFRGGSDJ-YLVFBTJISA-N 0.000 description 17
- DWJQKEZKLQCHKO-SRVKXCTJSA-N Tyr-Asn-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O DWJQKEZKLQCHKO-SRVKXCTJSA-N 0.000 description 17
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 17
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 17
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 17
- 108010054813 diprotin B Proteins 0.000 description 17
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 17
- 102000039446 nucleic acids Human genes 0.000 description 17
- 108020004707 nucleic acids Proteins 0.000 description 17
- 108010018625 phenylalanylarginine Proteins 0.000 description 17
- 108010079317 prolyl-tyrosine Proteins 0.000 description 17
- 108010038745 tryptophylglycine Proteins 0.000 description 17
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 16
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 16
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 16
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 16
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 16
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 16
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 16
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 16
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 16
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 16
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 16
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 16
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 16
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 16
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 16
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 16
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 16
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 16
- GFGUPLIETCNQGF-DCAQKATOSA-N Asn-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O GFGUPLIETCNQGF-DCAQKATOSA-N 0.000 description 16
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 16
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 16
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 16
- CMCIMCAQIULNDJ-CIUDSAMLSA-N Asp-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N CMCIMCAQIULNDJ-CIUDSAMLSA-N 0.000 description 16
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 16
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 16
- FGWRYRAVBVOHIB-XIRDDKMYSA-N Gln-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O FGWRYRAVBVOHIB-XIRDDKMYSA-N 0.000 description 16
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 16
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 16
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 16
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 16
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 16
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 16
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 16
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 16
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 16
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 16
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 16
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 16
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 16
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 16
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 16
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 16
- PJLLMGWWINYQPB-PEFMBERDSA-N Ile-Asn-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PJLLMGWWINYQPB-PEFMBERDSA-N 0.000 description 16
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 16
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 16
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 16
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 16
- WRDTXMBPHMBGIB-STECZYCISA-N Ile-Tyr-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 WRDTXMBPHMBGIB-STECZYCISA-N 0.000 description 16
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 16
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 16
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 16
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 16
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 16
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 16
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 16
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 16
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 16
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 16
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 16
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 16
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 16
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 16
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 16
- WAAZECNCPVGPIV-RHYQMDGZSA-N Lys-Thr-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O WAAZECNCPVGPIV-RHYQMDGZSA-N 0.000 description 16
- 108010066427 N-valyltryptophan Proteins 0.000 description 16
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 16
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 16
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 16
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 16
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 16
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 16
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 16
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 16
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 16
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 16
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 16
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 16
- JAWGSPUJAXYXJA-IHRRRGAJSA-N Ser-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=CC=C1 JAWGSPUJAXYXJA-IHRRRGAJSA-N 0.000 description 16
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 16
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 16
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 16
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 16
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 16
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 16
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 16
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 16
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 16
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 16
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 16
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 16
- GIAMKIPJSRZVJB-IHPCNDPISA-N Trp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GIAMKIPJSRZVJB-IHPCNDPISA-N 0.000 description 16
- MPYZGXUYLNPSNF-NAZCDGGXSA-N Trp-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O MPYZGXUYLNPSNF-NAZCDGGXSA-N 0.000 description 16
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 16
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 16
- BCOBSVIZMQXKFY-KKUMJFAQSA-N Tyr-Ser-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O BCOBSVIZMQXKFY-KKUMJFAQSA-N 0.000 description 16
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 16
- NWDOPHYLSORNEX-QXEWZRGKSA-N Val-Asn-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N NWDOPHYLSORNEX-QXEWZRGKSA-N 0.000 description 16
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 16
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 16
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 16
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 16
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 16
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 16
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 16
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 16
- 108010077245 asparaginyl-proline Proteins 0.000 description 16
- 108010038633 aspartylglutamate Proteins 0.000 description 16
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 16
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 16
- 108010081551 glycylphenylalanine Proteins 0.000 description 16
- 108010087823 glycyltyrosine Proteins 0.000 description 16
- 108010025306 histidylleucine Proteins 0.000 description 16
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 16
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 16
- 239000000203 mixture Substances 0.000 description 16
- 108010077112 prolyl-proline Proteins 0.000 description 16
- 108010029020 prolylglycine Proteins 0.000 description 16
- 108010084932 tryptophyl-proline Proteins 0.000 description 16
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 16
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 15
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 15
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 15
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 15
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 15
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 15
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 15
- 239000011159 matrix material Substances 0.000 description 15
- 239000008188 pellet Substances 0.000 description 15
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 14
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 14
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 14
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 14
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 14
- 230000004071 biological effect Effects 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 14
- 238000010276 construction Methods 0.000 description 14
- 239000000499 gel Substances 0.000 description 14
- 108010078274 isoleucylvaline Proteins 0.000 description 14
- 239000011148 porous material Substances 0.000 description 14
- 108020003175 receptors Proteins 0.000 description 14
- 102000005962 receptors Human genes 0.000 description 14
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 14
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 13
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 13
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 13
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 13
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 13
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 13
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 13
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 13
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 13
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 13
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 13
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 13
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 13
- 108010005233 alanylglutamic acid Proteins 0.000 description 13
- 230000009036 growth inhibition Effects 0.000 description 13
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 13
- 229940027257 timentin Drugs 0.000 description 13
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 12
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 12
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 12
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 12
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 12
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 12
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 12
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 12
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 12
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 12
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 12
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 12
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 12
- KACWACLNYLSVCA-VHWLVUOQSA-N Asp-Trp-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KACWACLNYLSVCA-VHWLVUOQSA-N 0.000 description 12
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 12
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 12
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 12
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 12
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 12
- IPVPGAADZXRZSH-RNXOBYDBSA-N Phe-Tyr-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IPVPGAADZXRZSH-RNXOBYDBSA-N 0.000 description 12
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 12
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 12
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 12
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 12
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 12
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 12
- CKKFTIQYURNSEI-IHRRRGAJSA-N Tyr-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CKKFTIQYURNSEI-IHRRRGAJSA-N 0.000 description 12
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 12
- 230000027455 binding Effects 0.000 description 12
- 230000015572 biosynthetic process Effects 0.000 description 12
- 108010010147 glycylglutamine Proteins 0.000 description 12
- 230000012010 growth Effects 0.000 description 12
- 210000003000 inclusion body Anatomy 0.000 description 12
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 108010051242 phenylalanylserine Proteins 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 12
- 238000006467 substitution reaction Methods 0.000 description 12
- 238000012360 testing method Methods 0.000 description 12
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 12
- 238000005406 washing Methods 0.000 description 12
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 12
- DGPGKMKUNGKHPK-QEJZJMRPSA-N Ser-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGPGKMKUNGKHPK-QEJZJMRPSA-N 0.000 description 11
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 11
- 239000003550 marker Substances 0.000 description 11
- 229920001184 polypeptide Polymers 0.000 description 11
- 102000004196 processed proteins & peptides Human genes 0.000 description 11
- 108090000765 processed proteins & peptides Proteins 0.000 description 11
- 108010053725 prolylvaline Proteins 0.000 description 11
- 231100000654 protein toxin Toxicity 0.000 description 11
- 241000894007 species Species 0.000 description 11
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 10
- 239000000872 buffer Substances 0.000 description 10
- 244000005700 microbiome Species 0.000 description 10
- 231100000252 nontoxic Toxicity 0.000 description 10
- 230000003000 nontoxic effect Effects 0.000 description 10
- YZZUQHDYJXWFNG-VVEMGJRMSA-N (1S,2R,3S,3'S,5R,6S,7R,8S,9R,12R)-2,8-dihydroxy-3'-[(1S)-1-hydroxyethyl]-7-methyl-12-prop-1-en-2-ylspiro[4,10-dioxatetracyclo[7.2.1.02,7.03,5]dodecane-6,5'-oxolane]-2',11-dione Chemical group C[C@@H]([C@@H]1C[C@]2([C@H]3[C@H](O3)[C@@]4([C@]2([C@@H]([C@H]5[C@H]([C@@H]4C(=O)O5)C(=C)C)O)C)O)OC1=O)O YZZUQHDYJXWFNG-VVEMGJRMSA-N 0.000 description 9
- 229920001817 Agar Polymers 0.000 description 9
- 102000005600 Cathepsins Human genes 0.000 description 9
- 108010084457 Cathepsins Proteins 0.000 description 9
- 102100033156 Dopamine beta-hydroxylase Human genes 0.000 description 9
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 9
- 239000008272 agar Substances 0.000 description 9
- 238000010367 cloning Methods 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 238000004520 electroporation Methods 0.000 description 9
- 230000000670 limiting effect Effects 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- 150000003839 salts Chemical class 0.000 description 9
- 239000011782 vitamin Substances 0.000 description 9
- 229940088594 vitamin Drugs 0.000 description 9
- 235000013343 vitamin Nutrition 0.000 description 9
- 229930003231 vitamin Natural products 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 8
- 229930006000 Sucrose Natural products 0.000 description 8
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 8
- 208000027418 Wounds and injury Diseases 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 229940098773 bovine serum albumin Drugs 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 208000014674 injury Diseases 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 230000002797 proteolythic effect Effects 0.000 description 8
- 108091008146 restriction endonucleases Proteins 0.000 description 8
- 239000011780 sodium chloride Substances 0.000 description 8
- 239000005720 sucrose Substances 0.000 description 8
- 108090000317 Chymotrypsin Proteins 0.000 description 7
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 7
- 241000219146 Gossypium Species 0.000 description 7
- 241000589540 Pseudomonas fluorescens Species 0.000 description 7
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 7
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 7
- 238000007792 addition Methods 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 7
- 229960002376 chymotrypsin Drugs 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000005714 functional activity Effects 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 230000006698 induction Effects 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 239000011734 sodium Substances 0.000 description 7
- 239000000725 suspension Substances 0.000 description 7
- 238000011282 treatment Methods 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 6
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 6
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 6
- 108700008625 Reporter Genes Proteins 0.000 description 6
- 239000003242 anti bacterial agent Substances 0.000 description 6
- 229940088710 antibiotic agent Drugs 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 239000013078 crystal Substances 0.000 description 6
- 241001233957 eudicotyledons Species 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 230000000813 microbial effect Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 6
- SQGYOTSLMSWVJD-UHFFFAOYSA-N silver(1+) nitrate Chemical compound [Ag+].[O-]N(=O)=O SQGYOTSLMSWVJD-UHFFFAOYSA-N 0.000 description 6
- 239000002689 soil Substances 0.000 description 6
- 229960005322 streptomycin Drugs 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 241000254173 Coleoptera Species 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- 241000346285 Ostrinia furnacalis Species 0.000 description 5
- 206010035226 Plasma cell myeloma Diseases 0.000 description 5
- GINJFDRNADDBIN-FXQIFTODSA-N bilanafos Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCP(C)(O)=O GINJFDRNADDBIN-FXQIFTODSA-N 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 230000034994 death Effects 0.000 description 5
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 5
- 210000002257 embryonic structure Anatomy 0.000 description 5
- 239000013613 expression plasmid Substances 0.000 description 5
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- 239000004009 herbicide Substances 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 230000000968 intestinal effect Effects 0.000 description 5
- 201000000050 myeloid neoplasm Diseases 0.000 description 5
- 229960000268 spectinomycin Drugs 0.000 description 5
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 5
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 4
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 4
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 4
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 4
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 4
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 4
- RBOBTTLFPRSXKZ-BZSNNMDCSA-N Asn-Phe-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RBOBTTLFPRSXKZ-BZSNNMDCSA-N 0.000 description 4
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 4
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 4
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 4
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 4
- 241000193830 Bacillus <bacterium> Species 0.000 description 4
- 108700003918 Bacillus Thuringiensis insecticidal crystal Proteins 0.000 description 4
- 108700010070 Codon Usage Proteins 0.000 description 4
- 102000005927 Cysteine Proteases Human genes 0.000 description 4
- 108010005843 Cysteine Proteases Proteins 0.000 description 4
- 238000002965 ELISA Methods 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- CWYNVVGOOAEACU-UHFFFAOYSA-N Fe2+ Chemical compound [Fe+2] CWYNVVGOOAEACU-UHFFFAOYSA-N 0.000 description 4
- 229920002148 Gellan gum Polymers 0.000 description 4
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 4
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 4
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 4
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 4
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 4
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 4
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 4
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 4
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 4
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 4
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 4
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 4
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 4
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 4
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 4
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 4
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 4
- 241000589516 Pseudomonas Species 0.000 description 4
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 4
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 4
- 102000012479 Serine Proteases Human genes 0.000 description 4
- 108010022999 Serine Proteases Proteins 0.000 description 4
- 241000256247 Spodoptera exigua Species 0.000 description 4
- 241000256251 Spodoptera frugiperda Species 0.000 description 4
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 4
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 4
- JVTHMUDOKPQBOT-NSHDSACASA-N Trp-Gly-Gly Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O)=CNC2=C1 JVTHMUDOKPQBOT-NSHDSACASA-N 0.000 description 4
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 4
- OXVPMZVGCAPFIG-BQFCYCMXSA-N Val-Gln-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N OXVPMZVGCAPFIG-BQFCYCMXSA-N 0.000 description 4
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 4
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 4
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 4
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 108010009297 diglycyl-histidine Proteins 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- -1 glucanase Proteins 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 210000004408 hybridoma Anatomy 0.000 description 4
- 239000002596 immunotoxin Substances 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- JTEDVYBZBROSJT-UHFFFAOYSA-N indole-3-butyric acid Chemical compound C1=CC=C2C(CCCC(=O)O)=CNC2=C1 JTEDVYBZBROSJT-UHFFFAOYSA-N 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 239000002917 insecticide Substances 0.000 description 4
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 4
- 229920003023 plastic Polymers 0.000 description 4
- 239000004033 plastic Substances 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 108010026333 seryl-proline Proteins 0.000 description 4
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 4
- 238000010561 standard procedure Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000002588 toxic effect Effects 0.000 description 4
- 101150085703 vir gene Proteins 0.000 description 4
- AXAVXPMQTGXXJZ-UHFFFAOYSA-N 2-aminoacetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound NCC(O)=O.OCC(N)(CO)CO AXAVXPMQTGXXJZ-UHFFFAOYSA-N 0.000 description 3
- LKDMKWNDBAVNQZ-UHFFFAOYSA-N 4-[[1-[[1-[2-[[1-(4-nitroanilino)-1-oxo-3-phenylpropan-2-yl]carbamoyl]pyrrolidin-1-yl]-1-oxopropan-2-yl]amino]-1-oxopropan-2-yl]amino]-4-oxobutanoic acid Chemical compound OC(=O)CCC(=O)NC(C)C(=O)NC(C)C(=O)N1CCCC1C(=O)NC(C(=O)NC=1C=CC(=CC=1)[N+]([O-])=O)CC1=CC=CC=C1 LKDMKWNDBAVNQZ-UHFFFAOYSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 108090000617 Cathepsin G Proteins 0.000 description 3
- 102000004173 Cathepsin G Human genes 0.000 description 3
- 108090000624 Cathepsin L Proteins 0.000 description 3
- 102000004172 Cathepsin L Human genes 0.000 description 3
- KZBUYRJDOAKODT-UHFFFAOYSA-N Chlorine Chemical compound ClCl KZBUYRJDOAKODT-UHFFFAOYSA-N 0.000 description 3
- 241000879145 Diatraea grandiosella Species 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- 229930182821 L-proline Natural products 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- 108010021466 Mutant Proteins Proteins 0.000 description 3
- 102000008300 Mutant Proteins Human genes 0.000 description 3
- NWBJYWHLCVSVIJ-UHFFFAOYSA-N N-benzyladenine Chemical compound N=1C=NC=2NC=NC=2C=1NCC1=CC=CC=C1 NWBJYWHLCVSVIJ-UHFFFAOYSA-N 0.000 description 3
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 3
- YZZUQHDYJXWFNG-UHFFFAOYSA-N Pretoxin Natural products CC(O)C1CC2(OC1=O)C1OC1C1(O)C3C(C(OC3=O)C(O)C21C)C(C)=C YZZUQHDYJXWFNG-UHFFFAOYSA-N 0.000 description 3
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 3
- 108090000631 Trypsin Proteins 0.000 description 3
- 102000004142 Trypsin Human genes 0.000 description 3
- 108010059993 Vancomycin Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000006037 cell lysis Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000003501 co-culture Methods 0.000 description 3
- 239000007857 degradation product Substances 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 239000012153 distilled water Substances 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 239000000216 gellan gum Substances 0.000 description 3
- 235000010492 gellan gum Nutrition 0.000 description 3
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Natural products O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 230000002163 immunogen Effects 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 239000002751 oligonucleotide probe Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 229960002429 proline Drugs 0.000 description 3
- 230000017854 proteolysis Effects 0.000 description 3
- 230000006337 proteolytic cleavage Effects 0.000 description 3
- 239000012723 sample buffer Substances 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 229910001415 sodium ion Inorganic materials 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 231100000331 toxic Toxicity 0.000 description 3
- 231100000419 toxicity Toxicity 0.000 description 3
- 230000001988 toxicity Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 239000012588 trypsin Substances 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- 229960003165 vancomycin Drugs 0.000 description 3
- MYPYJXKWCTUITO-LYRMYLQWSA-N vancomycin Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1=C2C=C3C=C1OC1=CC=C(C=C1Cl)[C@@H](O)[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@H]3C(=O)N[C@H]1C(=O)N[C@H](C(N[C@@H](C3=CC(O)=CC(O)=C3C=3C(O)=CC=C1C=3)C(O)=O)=O)[C@H](O)C1=CC=C(C(=C1)Cl)O2)=O)NC(=O)[C@@H](CC(C)C)NC)[C@H]1C[C@](C)(N)[C@H](O)[C@H](C)O1 MYPYJXKWCTUITO-LYRMYLQWSA-N 0.000 description 3
- MYPYJXKWCTUITO-UHFFFAOYSA-N vancomycin Natural products O1C(C(=C2)Cl)=CC=C2C(O)C(C(NC(C2=CC(O)=CC(O)=C2C=2C(O)=CC=C3C=2)C(O)=O)=O)NC(=O)C3NC(=O)C2NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(CC(C)C)NC)C(O)C(C=C3Cl)=CC=C3OC3=CC2=CC1=C3OC1OC(CO)C(O)C(O)C1OC1CC(C)(N)C(O)C(C)O1 MYPYJXKWCTUITO-UHFFFAOYSA-N 0.000 description 3
- 150000003722 vitamin derivatives Chemical class 0.000 description 3
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 2
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 2
- 102220485318 ATP-dependent DNA/RNA helicase DHX36_L57A_mutation Human genes 0.000 description 2
- 101710146995 Acyl carrier protein Proteins 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 102000004400 Aminopeptidases Human genes 0.000 description 2
- 108090000915 Aminopeptidases Proteins 0.000 description 2
- 241000625764 Anticarsia gemmatalis Species 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 108010017640 Aspartic Acid Proteases Proteins 0.000 description 2
- 102000004580 Aspartic Acid Proteases Human genes 0.000 description 2
- 241000223651 Aureobasidium Species 0.000 description 2
- 101500028013 Bos taurus Spleen trypsin inhibitor II Proteins 0.000 description 2
- 241000724266 Broad bean mottle virus Species 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 108090000712 Cathepsin B Proteins 0.000 description 2
- 102000004225 Cathepsin B Human genes 0.000 description 2
- 108090000625 Cathepsin K Proteins 0.000 description 2
- 102000004171 Cathepsin K Human genes 0.000 description 2
- 108090000613 Cathepsin S Proteins 0.000 description 2
- 102100035654 Cathepsin S Human genes 0.000 description 2
- 241001367803 Chrysodeixis includens Species 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- 101710151559 Crystal protein Proteins 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 102000003668 Destrin Human genes 0.000 description 2
- 108090000082 Destrin Proteins 0.000 description 2
- 241000489947 Diabrotica virgifera virgifera Species 0.000 description 2
- 241001649081 Dina Species 0.000 description 2
- 241001555556 Ephestia elutella Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 108090001064 Gelsolin Proteins 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 2
- MXIULRKNFSCJHT-STQMWFEESA-N Gly-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 MXIULRKNFSCJHT-STQMWFEESA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 239000005562 Glyphosate Substances 0.000 description 2
- 241000413128 Hemileuca oliviae Species 0.000 description 2
- 241000785682 Hispania Species 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 108010025815 Kanamycin Kinase Proteins 0.000 description 2
- 241000588748 Klebsiella Species 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 241000258916 Leptinotarsa decemlineata Species 0.000 description 2
- 241000209510 Liliopsida Species 0.000 description 2
- 241000555303 Mamestra brassicae Species 0.000 description 2
- 241000256010 Manduca Species 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108010065395 Neuropep-1 Proteins 0.000 description 2
- 241000758706 Piperaceae Species 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 241000607715 Serratia marcescens Species 0.000 description 2
- 241000661452 Sesamia nonagrioides Species 0.000 description 2
- 241000589196 Sinorhizobium meliloti Species 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 240000006394 Sorghum bicolor Species 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 229940100389 Sulfonylurea Drugs 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 241000589634 Xanthomonas Species 0.000 description 2
- OJOBTAOGJIWAGB-UHFFFAOYSA-N acetosyringone Chemical compound COC1=CC(C(C)=O)=CC(OC)=C1O OJOBTAOGJIWAGB-UHFFFAOYSA-N 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000000853 adhesive Substances 0.000 description 2
- 230000001070 adhesive effect Effects 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- VJYIFXVZLXQVHO-UHFFFAOYSA-N chlorsulfuron Chemical compound COC1=NC(C)=NC(NC(=O)NS(=O)(=O)C=2C(=CC=CC=2)Cl)=N1 VJYIFXVZLXQVHO-UHFFFAOYSA-N 0.000 description 2
- 239000012881 co-culture medium Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 108091036078 conserved sequence Proteins 0.000 description 2
- 101150049404 cry1Ca gene Proteins 0.000 description 2
- 125000004093 cyano group Chemical group *C#N 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000001739 density measurement Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000004090 dissolution Methods 0.000 description 2
- 231100000673 dose–response relationship Toxicity 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 235000013601 eggs Nutrition 0.000 description 2
- 230000000408 embryogenic effect Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000003031 feeding effect Effects 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 2
- 229940097068 glyphosate Drugs 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000003898 horticulture Methods 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 238000003119 immunoblot Methods 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 210000001370 mediastinum Anatomy 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- 108091005573 modified proteins Proteins 0.000 description 2
- 102000035118 modified proteins Human genes 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000013492 plasmid preparation Methods 0.000 description 2
- 229910052700 potassium Inorganic materials 0.000 description 2
- 239000000186 progesterone Substances 0.000 description 2
- 229960003387 progesterone Drugs 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000003127 radioimmunoassay Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 239000006152 selective media Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000007921 spray Substances 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- YWBFPKPWMSWWEA-UHFFFAOYSA-O triazolopyrimidine Chemical compound BrC1=CC=CC(C=2N=C3N=CN[N+]3=C(NCC=3C=CN=CC=3)C=2)=C1 YWBFPKPWMSWWEA-UHFFFAOYSA-O 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 2
- 235000019354 vermiculite Nutrition 0.000 description 2
- 239000010455 vermiculite Substances 0.000 description 2
- 229910052902 vermiculite Inorganic materials 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- 101150066838 12 gene Proteins 0.000 description 1
- QWENRTYMTSOGBR-UHFFFAOYSA-N 1H-1,2,3-Triazole Chemical compound C=1C=NNN=1 QWENRTYMTSOGBR-UHFFFAOYSA-N 0.000 description 1
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- HXKWSTRRCHTUEC-UHFFFAOYSA-N 2,4-Dichlorophenoxyaceticacid Chemical compound OC(=O)C(Cl)OC1=CC=C(Cl)C=C1 HXKWSTRRCHTUEC-UHFFFAOYSA-N 0.000 description 1
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 1
- WTLKTXIHIHFSGU-UHFFFAOYSA-N 2-nitrosoguanidine Chemical compound NC(N)=NN=O WTLKTXIHIHFSGU-UHFFFAOYSA-N 0.000 description 1
- DGZSVBBLLGZHSF-UHFFFAOYSA-N 4,4-diethylpiperidine Chemical compound CCC1(CC)CCNCC1 DGZSVBBLLGZHSF-UHFFFAOYSA-N 0.000 description 1
- TVZGACDUOSZQKY-LBPRGKRZSA-N 4-aminofolic acid Chemical compound C1=NC2=NC(N)=NC(N)=C2N=C1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 TVZGACDUOSZQKY-LBPRGKRZSA-N 0.000 description 1
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 1
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 1
- GOSWTRUMMSCNCW-HNNGNKQASA-N 9-ribosyl-trans-zeatin Chemical compound C1=NC=2C(NC\C=C(CO)/C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GOSWTRUMMSCNCW-HNNGNKQASA-N 0.000 description 1
- 108091007504 ADAM10 Proteins 0.000 description 1
- 241000589220 Acetobacter Species 0.000 description 1
- 244000235858 Acetobacter xylinum Species 0.000 description 1
- 235000002837 Acetobacter xylinum Nutrition 0.000 description 1
- 241000495828 Acleris gloverana Species 0.000 description 1
- 241000834107 Acleris variana Species 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 241000175828 Adoxophyes orana Species 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- 241000566547 Agrotis ipsilon Species 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- 241000449794 Alabama argillacea Species 0.000 description 1
- 241000588986 Alcaligenes Species 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 241001367806 Alsophila pometaria Species 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 241001259789 Amyelois transitella Species 0.000 description 1
- 241001198505 Anarsia lineatella Species 0.000 description 1
- 241000153204 Anisota senatoria Species 0.000 description 1
- 241000255978 Antheraea pernyi Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 241001002469 Archips Species 0.000 description 1
- 241000384127 Argyrotaenia Species 0.000 description 1
- 241000186063 Arthrobacter Species 0.000 description 1
- 241000238421 Arthropoda Species 0.000 description 1
- 241000589151 Azotobacter Species 0.000 description 1
- 241000589149 Azotobacter vinelandii Species 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 229940123779 Bacterial protease inhibitor Drugs 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 208000021657 Birth injury Diseases 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000255789 Bombyx mori Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 description 1
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 1
- 241000499436 Brassica rapa subsp. pekinensis Species 0.000 description 1
- 241001517925 Bucculatrix Species 0.000 description 1
- 241000726760 Cadra cautella Species 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 241000255945 Choristoneura Species 0.000 description 1
- 108090000746 Chymosin Proteins 0.000 description 1
- 241000540393 Cochylis hospes Species 0.000 description 1
- 241000143939 Colias eurytheme Species 0.000 description 1
- 206010010071 Coma Diseases 0.000 description 1
- 241000993412 Corcyra cephalonica Species 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- 101150102464 Cry1 gene Proteins 0.000 description 1
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000252867 Cupriavidus metallidurans Species 0.000 description 1
- 241001634817 Cydia Species 0.000 description 1
- 241001635274 Cydia pomonella Species 0.000 description 1
- 101710112752 Cytotoxin Proteins 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 241001351082 Datana integerrima Species 0.000 description 1
- 241001309417 Dendrolimus sibiricus Species 0.000 description 1
- 208000006558 Dental Calculus Diseases 0.000 description 1
- 241001641958 Desmia Species 0.000 description 1
- 241001641949 Desmia funeralis Species 0.000 description 1
- 241001000394 Diaphania hyalinata Species 0.000 description 1
- 241001012951 Diaphania nitidalis Species 0.000 description 1
- 241000122106 Diatraea saccharalis Species 0.000 description 1
- 102100039673 Disintegrin and metalloproteinase domain-containing protein 10 Human genes 0.000 description 1
- ZGTMUACCHSMWAC-UHFFFAOYSA-L EDTA disodium salt (anhydrous) Chemical compound [Na+].[Na+].OC(=O)CN(CC([O-])=O)CCN(CC(O)=O)CC([O-])=O ZGTMUACCHSMWAC-UHFFFAOYSA-L 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 241000498377 Egira curialis Species 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241001608224 Ennomos subsignaria Species 0.000 description 1
- 241000661448 Eoreuma loftini Species 0.000 description 1
- 241000122098 Ephestia kuehniella Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000567412 Estigmene acrea Species 0.000 description 1
- 241001201696 Eulia Species 0.000 description 1
- 241000060469 Eupoecilia ambiguella Species 0.000 description 1
- 241000483001 Euproctis chrysorrhoea Species 0.000 description 1
- 241001368778 Euxoa messoria Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000510678 Falcaria vulgaris Species 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 241000956293 Fulda Species 0.000 description 1
- 108010015133 Galactose oxidase Proteins 0.000 description 1
- 241000255896 Galleria mellonella Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108700037728 Glycine max beta-conglycinin Proteins 0.000 description 1
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 1
- 241001441330 Grapholita molesta Species 0.000 description 1
- 241000190714 Gymnosporangium clavipes Species 0.000 description 1
- 241001352371 Harrisina americana Species 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 241000255990 Helicoverpa Species 0.000 description 1
- 241000255967 Helicoverpa zea Species 0.000 description 1
- 241000256244 Heliothis virescens Species 0.000 description 1
- 108010006464 Hemolysin Proteins Proteins 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 241000630740 Homoeosoma electellum Species 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 241001531327 Hyphantria cunea Species 0.000 description 1
- 206010021033 Hypomenorrhoea Diseases 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 241000400431 Keiferia lycopersicella Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- 241001658022 Lambdina fiscellaria fiscellaria Species 0.000 description 1
- 241001658020 Lambdina fiscellaria lugubrosa Species 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 1
- 241001352367 Leucoma salicis Species 0.000 description 1
- 241000192132 Leuconostoc Species 0.000 description 1
- 241001261104 Lobesia botrana Species 0.000 description 1
- 206010024774 Localised infection Diseases 0.000 description 1
- 241000193981 Loxostege sticticalis Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 241000721703 Lymantria dispar Species 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000081125 Macalla Species 0.000 description 1
- 241000255676 Malacosoma Species 0.000 description 1
- 241000732113 Mamestra configurata Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000369513 Manduca quinquemaculata Species 0.000 description 1
- 241000255908 Manduca sexta Species 0.000 description 1
- 241001232130 Maruca testulalis Species 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 241001367645 Melanchra picta Species 0.000 description 1
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241001477931 Mythimna unipuncta Species 0.000 description 1
- 241001443590 Naganishia albida Species 0.000 description 1
- 241000033319 Naganishia diffluens Species 0.000 description 1
- 101000774651 Naja atra Zinc metalloproteinase-disintegrin-like kaouthiagin-like Proteins 0.000 description 1
- 101710202365 Napin Proteins 0.000 description 1
- 102000005348 Neuraminidase Human genes 0.000 description 1
- 108010006232 Neuraminidase Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 101710089395 Oleosin Proteins 0.000 description 1
- 241001491877 Operophtera brumata Species 0.000 description 1
- 241001465800 Orgyia Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 241001585671 Paleacrita vernata Species 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 102000016387 Pancreatic elastase Human genes 0.000 description 1
- 241001657689 Papaipema nebris Species 0.000 description 1
- 241001300993 Papilio cresphontes Species 0.000 description 1
- 241000222051 Papiliotrema laurentii Species 0.000 description 1
- 241000237509 Patinopecten sp. Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000721451 Pectinophora gossypiella Species 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- 241001190492 Phryganidia californica Species 0.000 description 1
- 241001517955 Phyllonorycter blancardella Species 0.000 description 1
- 241001313099 Pieris napi Species 0.000 description 1
- 241000907661 Pieris rapae Species 0.000 description 1
- 108020005120 Plant DNA Proteins 0.000 description 1
- 241001608845 Platynota Species 0.000 description 1
- 241001456328 Platynota stultana Species 0.000 description 1
- 241000595629 Plodia interpunctella Species 0.000 description 1
- 241000500437 Plutella xylostella Species 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 241000143945 Pontia protodice Species 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241001657916 Proxenus mindara Species 0.000 description 1
- 241000589615 Pseudomonas syringae Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241000158450 Rhodobacter sp. KYW73 Species 0.000 description 1
- 241000191043 Rhodobacter sphaeroides Species 0.000 description 1
- 241000190932 Rhodopseudomonas Species 0.000 description 1
- 241000223252 Rhodotorula Species 0.000 description 1
- 241000223253 Rhodotorula glutinis Species 0.000 description 1
- 241000223254 Rhodotorula mucilaginosa Species 0.000 description 1
- 244000171263 Ribes grossularia Species 0.000 description 1
- 235000002357 Ribes grossularia Nutrition 0.000 description 1
- 239000012722 SDS sample buffer Substances 0.000 description 1
- 241000004261 Sabulodes Species 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 241000567479 Schizura Species 0.000 description 1
- 241001479507 Senecio odorus Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 241001135312 Sinorhizobium Species 0.000 description 1
- 241000753145 Sitotroga cerealella Species 0.000 description 1
- FKNQFGJONOIPTF-UHFFFAOYSA-N Sodium cation Chemical compound [Na+] FKNQFGJONOIPTF-UHFFFAOYSA-N 0.000 description 1
- 239000005708 Sodium hypochlorite Substances 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241001201846 Spilonota ocellana Species 0.000 description 1
- 241001521235 Spodoptera eridania Species 0.000 description 1
- 241000222068 Sporobolomyces <Sporidiobolaceae> Species 0.000 description 1
- 241000123675 Sporobolomyces roseus Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 241001349589 Tethys Species 0.000 description 1
- 241001231950 Thaumetopoea pityocampa Species 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- 244000288561 Torulaspora delbrueckii Species 0.000 description 1
- 235000014681 Torulaspora delbrueckii Nutrition 0.000 description 1
- 241001495125 Torulaspora pretoriensis Species 0.000 description 1
- 241000255993 Trichoplusia ni Species 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- 241001351286 Udea rubigalis Species 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- 241000589636 Xanthomonas campestris Species 0.000 description 1
- 241000064240 Yponomeuta padellus Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- 108010055615 Zein Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- ODHCTXKNWHHXJC-UHFFFAOYSA-N acide pyroglutamique Natural products OC(=O)C1CCC(=O)N1 ODHCTXKNWHHXJC-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 238000004115 adherent culture Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 238000012271 agricultural production Methods 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 229960003896 aminopterin Drugs 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000001147 anti-toxic effect Effects 0.000 description 1
- 239000000729 antidote Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 239000007640 basal medium Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 238000010256 biochemical assay Methods 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 229960000106 biosimilars Drugs 0.000 description 1
- 239000007844 bleaching agent Substances 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 125000001246 bromo group Chemical group Br* 0.000 description 1
- UDSAIICHUKSCKT-UHFFFAOYSA-N bromophenol blue Chemical compound C1=C(Br)C(O)=C(Br)C=C1C1(C=2C=C(Br)C(O)=C(Br)C=2)C2=CC=CC=C2S(=O)(=O)O1 UDSAIICHUKSCKT-UHFFFAOYSA-N 0.000 description 1
- 244000144987 brood Species 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- RICLFGYGYQXUFH-UHFFFAOYSA-N buspirone hydrochloride Chemical compound [H+].[Cl-].C1C(=O)N(CCCCN2CCN(CC2)C=2N=CC=CN=2)C(=O)CC21CCCC2 RICLFGYGYQXUFH-UHFFFAOYSA-N 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 102000023852 carbohydrate binding proteins Human genes 0.000 description 1
- 108091008400 carbohydrate binding proteins Proteins 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000002962 chemical mutagen Substances 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 210000000991 chicken egg Anatomy 0.000 description 1
- 108010031100 chloroplast transit peptides Proteins 0.000 description 1
- 229940080701 chymosin Drugs 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 229940099112 cornstarch Drugs 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 239000002619 cytotoxin Substances 0.000 description 1
- 230000032459 dedifferentiation Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 239000002274 desiccant Substances 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 235000021245 dietary protein Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000012470 diluted sample Substances 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000007598 dipping method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 229960001484 edetic acid Drugs 0.000 description 1
- 235000014103 egg white Nutrition 0.000 description 1
- 229940096118 ella Drugs 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 235000012055 fruits and vegetables Nutrition 0.000 description 1
- 239000003517 fume Substances 0.000 description 1
- ZXQYGBMAQZUVMI-GCMPRSNUSA-N gamma-cyhalothrin Chemical compound CC1(C)[C@@H](\C=C(/Cl)C(F)(F)F)[C@H]1C(=O)O[C@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 ZXQYGBMAQZUVMI-GCMPRSNUSA-N 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 230000007773 growth pattern Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 239000003228 hemolysin Substances 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 108010084553 jacalin Proteins 0.000 description 1
- 108010045069 keyhole-limpet hemocyanin Proteins 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000001418 larval effect Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 231100000636 lethal dose Toxicity 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 108010083942 mannopine synthase Proteins 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910001507 metal halide Inorganic materials 0.000 description 1
- 150000005309 metal halides Chemical class 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 210000000110 microvilli Anatomy 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 101150113864 pat gene Proteins 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 238000001935 peptisation Methods 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 230000000361 pesticidal effect Effects 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 230000008121 plant development Effects 0.000 description 1
- 239000005648 plant growth regulator Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 231100000572 poisoning Toxicity 0.000 description 1
- 230000000607 poisoning effect Effects 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- WFIZEGIEIOHZCP-UHFFFAOYSA-M potassium formate Chemical compound [K+].[O-]C=O WFIZEGIEIOHZCP-UHFFFAOYSA-M 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- KCXFHTAICRTXLI-UHFFFAOYSA-N propane-1-sulfonic acid Chemical compound CCCS(O)(=O)=O KCXFHTAICRTXLI-UHFFFAOYSA-N 0.000 description 1
- 239000011253 protective coating Substances 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 230000020978 protein processing Effects 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 101150116440 pyrF gene Proteins 0.000 description 1
- 238000000163 radioactive labelling Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004627 regenerated cellulose Substances 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 239000012882 rooting medium Substances 0.000 description 1
- 108010038196 saccharide-binding proteins Proteins 0.000 description 1
- YGSDEFSMJLZEOE-UHFFFAOYSA-M salicylate Chemical compound OC1=CC=CC=C1C([O-])=O YGSDEFSMJLZEOE-UHFFFAOYSA-M 0.000 description 1
- 229960001860 salicylate Drugs 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 235000020637 scallop Nutrition 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000011218 seed culture Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 1
- HLWRUJAIJJEZDL-UHFFFAOYSA-M sodium;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetate Chemical compound [Na+].OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC([O-])=O HLWRUJAIJJEZDL-UHFFFAOYSA-M 0.000 description 1
- RWVGQQGBQSJDQV-UHFFFAOYSA-M sodium;3-[[4-[(e)-[4-(4-ethoxyanilino)phenyl]-[4-[ethyl-[(3-sulfonatophenyl)methyl]azaniumylidene]-2-methylcyclohexa-2,5-dien-1-ylidene]methyl]-n-ethyl-3-methylanilino]methyl]benzenesulfonate Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C(=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C)C=2C(=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C)C=C1 RWVGQQGBQSJDQV-UHFFFAOYSA-M 0.000 description 1
- ALZJERAWTOKHNO-UHFFFAOYSA-M sodium;dodecyl sulfate;3-morpholin-4-ylpropane-1-sulfonic acid Chemical compound [Na+].OS(=O)(=O)CCCN1CCOCC1.CCCCCCCCCCCCOS([O-])(=O)=O ALZJERAWTOKHNO-UHFFFAOYSA-M 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 239000011877 solvent mixture Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 229940037128 systemic glucocorticoids Drugs 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000024033 toxin binding Effects 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- GOSWTRUMMSCNCW-UHFFFAOYSA-N trans-zeatin riboside Natural products C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1OC(CO)C(O)C1O GOSWTRUMMSCNCW-UHFFFAOYSA-N 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 150000003852 triazoles Chemical class 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 230000001810 trypsinlike Effects 0.000 description 1
- OOLLAFOLCSJHRE-ZHAKMVSLSA-N ulipristal acetate Chemical compound C1=CC(N(C)C)=CC=C1[C@@H]1C2=C3CCC(=O)C=C3CC[C@H]2[C@H](CC[C@]2(OC(C)=O)C(C)=O)[C@]2(C)C1 OOLLAFOLCSJHRE-ZHAKMVSLSA-N 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 229940093612 zein Drugs 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
- C07K14/325—Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N37/00—Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids
- A01N37/44—Biocides, pest repellants or attractants, or plant growth regulators containing organic compounds containing a carbon atom having three bonds to hetero atoms with at the most two bonds to halogen, e.g. carboxylic acids containing at least one carboxylic group or a thio analogue, or a derivative thereof, and a nitrogen atom attached to the same carbon skeleton by a single or double bond, this nitrogen atom not being a member of a derivative or of a thio analogue of a carboxylic group, e.g. amino-carboxylic acids
- A01N37/46—N-acyl derivatives
-
- A01N63/02—
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N63/00—Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
- A01N63/10—Animals; Substances produced thereby or obtained therefrom
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N63/00—Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
- A01N63/50—Isolated enzymes; Isolated proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8286—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Plant Pathology (AREA)
- Pest Control & Pesticides (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Environmental Sciences (AREA)
- Dentistry (AREA)
- Agronomy & Crop Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Insects & Arthropods (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Virology (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
본 발명은 바실루스 투린기엔시스(Bacillus thuringiensis) 변형된 Cry1Ca 살곤충 독소 및 이들 독소를 코딩하는 폴리뉴클레오티드 서열에 관한 것이다. 트랜스제닉 식물에서의 용도 및 곤충 해충 손상으로부터 작물을 보호하는 방법이 기재된다.
Description
본 발명은 바실루스 투린기엔시스(Bacillus thuringiensis) 살충 독소의 변형, 이들 독소를 코딩하는 폴리뉴클레오티드 서열 및 이들 독소를 생산하는 트랜스제닉 식물에 관한 것이다.
곤충 및 다른 해충으로 인해 농부는 작물 손실 및 이들 해충을 방제 하에 두기 위한 비용으로 매년 수십억 달러를 지불한다. 재배지 작물의 손실 뿐만 아니라, 곤충 해충은 또한 채소 및 과일 재배자, 관상용 꽃의 생산자 및 가정 정원사에게도 부담이 된다. 농업 생산 환경에서 곤충 해충에 의해 유발된 손실은 작물 수확량의 감소, 작물 품질의 저하 및 수확 비용의 증가를 포함한다.
곤충 해충은 주로 곤충 성장의 억제, 곤충 섭식 또는 재생산의 방지, 또는 사멸 유발을 통해 작용하는 화학 살충제의 집중 적용에 의해 방제된다. 이에 따라 우수한 곤충 방제에 도달할 수 있으나, 이들 화학물질은 때때로 다른 유익한 곤충에 영향을 미칠 수 있다. 화학 살충제의 광범위한 사용으로부터 발생하는 또 다른 문제는 저항성 곤충 집단의 출현이다. 이는 다양한 저항성 관리 실시에 의해 부분적으로 개선되었으나, 대안적 해충 방제제에 대한 필요는 증가하고 있다. 생물학적 해충 방제제, 예컨대 델타-내독소와 같이 살충 독소를 발현하는 바실루스 투린기엔시스 (B.t.) 균주가 또한 작물 식물에 적용되어 만족스러운 결과를 나타냄으로써, 화학 살충제에 대한 대안 또는 보완을 제공하였다. 이들 델타-내독소 중 일부를 코딩하는 유전자를 단리하고, 이종 숙주에서의 그의 발현을 밝혀내어 경제적으로 중요한 곤충 해충의 방제를 위한 또 다른 도구를 제공하였다. 특히, 트랜스제닉 식물에서 살곤충 독소, 예컨대 바실루스 투린기엔시스 델타-내독소의 발현은 선택된 곤충 해충에 대해 효율적인 보호를 제공하였고, 이러한 독소를 발현하는 트랜스제닉 식물은 상업화되어 농부가 화학 곤충 방제제의 적용을 감소시키게 되었다.
인시류는 해마다 많은 양의 손상을 유발하는 농업, 원예 및 가정 해충의 중요한 군이다. 이 곤충 목은 잎- 및 뿌리-섭식 유충 및 성충을 포괄한다. 인시류 곤충 해충은 하기를 포함하나 이에 제한되지는 않는다: 아크로이아 그리셀라(Achroia grisella), 아클레리스 글로베라나(Acleris gloverana), 아클레리스 바리아나(Acleris variana), 아독소피에스 오라나(Adoxophyes orana), 아그로티스 입실론(Agrotis ipsilon) (검거세미밤나방 "BCW"), 알라바마 아르길라세아(Alabama argillacea), 알소필라 포메타리아(Alsophila pometaria), 아미엘로이스 트란시텔라(Amyelois transitella), 아나가스타 쿠에니엘라(Anagasta kuehniella), 아나르시아 리네아텔라(Anarsia lineatella), 아니소타 세나토리아(Anisota senatoria), 안테라에아 페르니이(Antheraea pernyi), 안티카르시아 겜마탈리스(Anticarsia gemmatalis) (벨벳빈 모충 "VBC"), 아르킵스(Archips) 종, 아르기로타에니아(Argyrotaenia) 종, 아테티스 민다라(Athetis mindara), 봄빅스 모리(Bombyx mori), 부쿨라트릭스 투르베리엘라(Bucculatrix thurberiella), 카드라 카우텔라(Cadra cautella), 코리스토네우라(Choristoneura) 종, 코킬리스 호스페스(Cochylis hospes), 콜리아스 유리테메(Colias eurytheme), 코르시라 세팔로니카(Corcyra cephalonica), 시디아 라티페레아누스(Cydia latiferreanus), 시디아 포모넬라(Cydia pomonella), 다타나 인테게리마(Datana integerrima), 덴드롤리무스 시비리쿠스(Dendrolimus sibiricus), 데스미아 푸네랄리스(Desmia funeralis), 디아파니아 히알리나타(Diaphania hyalinata), 디아파니아 니티달리스(Diaphania nitidalis), 디아트라에아 그란디오셀라(Diatraea grandiosella) (남서부 옥수수 천공충 "SWCB"), 디아트라에아 사카랄리스(Diatraea saccharalis), 엔노모스 서브시그나리아(Ennomos subsignaria), 에오레우마 로프티니(Eoreuma loftini), 에페스티아 엘루텔라(Ephestia elutella), 에란니스 틸리아리아(Erannis tiliaria), 에스티그메네 아크레아(Estigmene acrea), 율리아 살루브리콜라(Eulia salubricola), 유포코엘리아 암비구엘라(Eupocoellia ambiguella), 유포에실리아 암비구엘라(Eupoecilia ambiguella), 유프록티스 크리소로에아(Euproctis chrysorrhoea), 육소아 메소리아(Euxoa messoria), 갈레리아 멜로넬라(Galleria mellonella), 그라폴리타 몰레스타(Grapholita molesta), 하리시나 아메리카나(Harrisina americana), 헬리코베르파 서브플렉사(Helicoverpa subflexa), 헬리코베르파 제아(Helicoverpa zea) (옥수수 이삭벌레 "CEW"), 헬리오티스 비레센스(Heliothis virescens) (회색담배나방 "TBW"), 헤밀레우카 올리비아에(Hemileuca oliviae), 호모에오소마 엘렉텔룸(Homoeosoma electellum), 히판트리아 쿠네아(Hyphantria cunea), 케이페리아 리코페르시셀라(Keiferia lycopersicella), 람브디나 피스셀라리아 피스셀라리아(Lambdina fiscellaria fiscellaria), 람브디나 피스셀라리아 루구브로사(Lambdina fiscellaria lugubrosa), 류코마 살리시스(Leucoma salicis), 로베시아 보트라나(Lobesia botrana), 록소스테게 스틱티칼리스(Loxostege sticticalis), 리만트리아 디스파르(Lymantria dispar), 마칼라 티리살리스(Macalla thyrisalis), 말라코소마(Malacosoma) 종, 마메스트라 브라시카에(Mamestra brassicae), 마메스트라 콘피구라타(Mamestra configurata), 만두카 퀸퀘마쿨라타(Manduca quinquemaculata), 만투카 섹타(Manduca sexta), 마루카 테스툴랄리스(Maruca testulalis), 멜란크라 픽타(Melanchra picta), 오페로프테라 브루마타(Operophtera brumata), 오르기이아(Orgyia) 종, 오스트리니아 누빌랄리스(Ostrinia nubilalis) (유럽 옥수수 천공충 "ECB"), 팔레아크리타 베르나타(Paleacrita vernata), 파파이페마 네브리스(Papaipema nebris) (일반 자루 천공충), 파필리오 크레스폰테스(Papilio cresphontes), 펙티노포라 고시피엘라(Pectinophora gossypiella), 프리가니디아 칼리포르니카(Phryganidia californica), 필로노릭테르 블란카르델라(Phyllonorycter blancardella), 피에리스 나피(Pieris napi), 피에리스 라파에(Pieris rapae), 플라티페나 스카브라(Plathypena scabra), 플라티노타 플로우엔다나(Platynota flouendana), 플라티노타 스툴타나(Platynota stultana), 플라티프틸리아 카르두이닥틸라(Platyptilia carduidactyla), 플로디아 인테르푼크텔라(Plodia interpunctella), 플루텔라 크실로스텔라(Plutella xylostella) (배추좀나방 "DBM"), 폰티아 프로토디세(Pontia protodice), 슈달레티아 우니푼크타(Pseudaletia unipuncta), 슈도플루시아 인클루덴스(Pseudoplusia includens) (대두 자벌레 "SBL"), 사불로데스 아에그로타타(Sabulodes aegrotata), 쉬주라 콘신나(Schizura concinna), 시토트로가 세레알렐라(Sitotroga cerealella), 스필로노타 오셀라나(Spilonota ocellana), 스포도프테라 에리다니아(Spodoptera eridania) (남부 거염벌레 "SAW"), 스포도프테라 프루기페르다(Spodoptera frugiperda) (가을 거염벌레 "FAW"), 스포도프테라 엑시구아(Spodoptera exigua) (비트 거염벌레 "BAW"), 타우마토포에아 피티오캄파(Thaumatopoea pityocampa), 엔솔라 비셀리엘라(Ensola bisselliella), 트리코플루시아 니(Trichoplusia ni) (양배추 자벌레 "CL"), 우데아 루비갈리스(Udea rubigalis), 크실로미게스 쿠리알리스(Xylomyges curialis), 및 이포노메우타 파델라(Yponomeuta padella). 일반적으로, 상기 열거된 임의의 속 (및 다른 것들)은 또한 본 발명의 일부로서 표적화될 수 있다. 임의의 이들 속에서 임의의 추가 곤충도 (표적으로서) 또한 본 발명의 범위 내에 포함된다.
바실루스 투린기엔시스 (B.t.)는 델타 내독소 또는 Cry 단백질로 공지된 살곤충 결정 단백질을 생산하는 토양-매개, 그람-양성, 포자 형성 박테리아이다 (문헌 [Schnepf et al., 1998]에서 검토됨). 새로운 살곤충 특성을 갖는 신규 결정 (Cry) 단백질이 계속 증가하는 속도로 발견되고 있으며, 440종이 넘는 Cry 유전자가 보고되었다. 현재, 57가지 1차 상동성 등급으로 분류된 450종이 넘는 특유한 Cry 및 세포독소 (Cyt) 단백질이 존재한다. Cry 단백질은 서열 동일성의 정도에 기초하여 명명되며, 1차, 2차 및 3차 경계는 각각 대략 45%, 78% 및 95% 동일성에서 나타나고; 가까운 대립유전자는 새로운 4차 명칭을 할당받는다 (Crickmore et al., 1998). 델타 내독소의 광범위한 목록이 http://www.lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/intro.html에서 유지되고 정기적으로 개정되고 있다. 현재, 추가의 Cyt 독소 및 영양 살곤충 단백질 (VIP) 독소 등과 함께, "Cry" 독소의 73종의 주요 군 (Cry1-Cry73)이 존재한다. 각각의 번호군 중 다수는 대문자 하위군을 갖고, 대문자 하위군은 소문자 하위-하위군을 갖는다. (예를 들어, Cry1은 A-L을 갖고, Cry1A는 a-i를 가짐).
B.t. 단백질은 현재까지 성공적으로 등록되거나 규제 완화되고 상업화된 곤충-저항성 트랜스제닉 식물을 생성하는데 사용되어 왔다. 이들은 옥수수에서 Cry1Ab, Cry1Ac, Cry1F, Vip3A, Cry34Ab1/Cry35Ab1, 및 Cry3Bb, 목화에서 Cry1Ac, Vip3A 및 Cry2Ab, 및 감자에서 Cry3A를 포함한다. B.t. 독소는 생물살충제 시장의 90%를 넘게 차지하고, 본질적으로 곤충 섭식에 대한 저항성을 제공하도록 개발된 트랜스제닉 작물에 대한 전체 유전자 공급원을 대표한다.
Cry 단백질은 감수성 곤충의 중장 세포에 작용함으로써 기능하는 경구 중독제이다. 다수의 Cry 단백질의 활성 형태는 3가지 특징적인 단백질 도메인을 포함한다. 가장 잘 연구된 B.t. 단백질은 3-도메인 Cry 델타-내독소의 구성원이다. 이들 단백질의 크기는 대략 70 kDa 내지 130 kDa 범위이다. 1차 단백질 서열 분석이 5개의 고도로 보존된 서열 블록 및 보존된 블록 3 및 5 사이의 고도의 서열 변이성을 밝혀내었다 (Schnepf et al., 1998).
예로서 Cry1Aa1, Cry2Aa1, Cry3Aa1, Cry3Bb1, Cry4Aa, Cry4Ba 및 Cry8Ea1에 대해 3차원 결정 구조가 결정되었다. 이들 구조는 현저하게 유사하고, 하기 특색을 갖는 3개의 특징적인 도메인으로 구성된다 (문헌 [de Maagd et al., 2003]에서 검토됨). 도메인 I는 나선 5가 6개의 양쪽친매성 나선으로 둘러싸인 7개의 알파 나선의 묶음이다. 이 도메인은 중장 막 삽입 및 포어 형성에 관련되었다. 이는 용혈소 및 콜리신을 포함한 다른 포어 형성 단백질과 상동성을 공유한다. 도메인 II는 베타 프리즘으로 함께 패킹된 3개의 역평행 베타 시트로 구성된다. 이 도메인은 비텔린 및 자칼린을 포함한 특정 탄수화물-결합 단백질과 상동성을 공유한다. 이 도메인의 루프는 곤충 중장 수용체 결합에 있어서 중요한 역할을 한다. Cry1A 단백질에서, 도메인 II 베타 시트의 정점에서의 표면 노출 루프가 인시류 카드헤린 수용체에 결합하는 것에 관련된다. 도메인 III는 그의 예가 Cry1A 단백질의 경우에 아미노펩티다제 및 알칼리성 포스파타제인 제2 부류의 수용체와 상호작용하는 베타 샌드위치 구조이다 (Piggot and Ellar, 2007). 구조적으로 이 도메인은 단백질, 예컨대 글루카나제, 갈락토스 옥시다제, 시알리다제 및 다른 것의 탄수화물-결합 도메인에 관련된다. 이 도메인은 특정 부류의 수용체 단백질에 결합하며, 아마도 올리고머 독소 프리-포어의 삽입에 참여할 것이다. 보존된 B.t. 서열 블록 2 및 3은 각각 도메인 2의 N-말단 및 C-말단 근처에서 맵핑된다. 따라서, 이들 보존된 서열 블록 2 및 3은 3개의 기능적 도메인 사이의 대략적인 경계 영역이다. 보존된 DNA의 이들 영역 및 단백질 상동성이 재조합 B.t. 독소를 조작하는데 이용되어 왔다 (미국 특허 번호 6,090,931, WO 91/01087, WO95/06730, WO 1998022595).
Cry 단백질 작용 방식에 대한 하나의 제안된 모델은 감수성 곤충의 중장 막에서의 포어 형성에 기초한다 (Knowles and Ellar, 1987). 이 모델의 현재 버전에서 (Bravo et al., 2007), 인시류 중장 막 상의 카드헤린 및 아미노펩티다제 수용체 둘 다에 대한 결합이 Cry 단백질 독성에 요구된다. 포어 형성 모델에 따르면, Cry 단백질 중독은 여러 단계를 수반한다: 1) 활성화된 코어 독소에 대한 가용성 Cry 전독소의 단백질분해 처리; 2) 곤충 중장 상의 카드헤린 수용체에 대한 Cry 단백질 결합; 3) α-나선 영역을 제거하기 위한 코어 독소 N-말단에서의 추가의 단백질분해 절단; 4) 프리-포어를 형성하기 위한 Cry 단백질 올리고머화; 5) 제2 부위 막 수용체 (아미노펩티다제 및 알칼리성 포스파타제)에 대한 프리-포어 결합; 6) 막으로의 프리-포어 삽입 및 7) 중장 파괴 및 곤충 사멸로 이어지는 삼투성 세포 용해.
곤충-저항성 트랜스제닉 식물 기술의 광범위한 채택은 해충 집단에서 이들 식물에 의해 생산된 살곤충 단백질에 대한 저항성이 발생할 우려가 제기된다. 은신처와의 조합, 및 상이한 독소와의 교대, 또는 공동-배치로 단백질을 고용량으로 배치하는 것을 포함하여 B.t.-기반 곤충 저항성 형질의 유용성을 보존하기 위한 여러 전략이 제안되었다 (McGaughey et al. (1998), "B.t. Resistance Management," Nature Biotechnol. 16:144-146).
B.t. Cry 단백질에 대한 곤충 저항성은 여러 메카니즘을 통해 발생할 수 있다 (Heckel et al., 2007, Piggot and Ellar, 2007). Cry 단백질에 대한 여러 수용체 단백질 부류가 곤충 내에서 확인되었으며, 여러 예가 각각의 수용체 부류 내에 존재한다. 특정한 Cry 단백질에 대한 저항성은, 예를 들어 수용체 단백질의 카드헤린 도메인의 독소-결합 부분 내에서의 돌연변이에 의해 발생할 수 있다. 추가의 저항성 수단은 전독소-프로세싱 프로테아제를 통해 매개될 수 있다. 따라서, 인시목 종에서의 Cry1A 독소에 대한 저항성은 적어도 4종의 특징적인 주요 저항성 유전자에 의한 복잡한 유전적 기초를 갖는다. Cry 단백질에 대해 저항성을 갖는 인시류 곤충이, 플루텔라 크실로스텔라 (Tabashnik, 1994), 트리코플루시아 니 (Janmaat and Myers 2003, 2005), 헬리코베르파 제아 (Tabashnik et al., 2008), 및 스포도프테라 프루기페르다 (Storer, et al., 2010)에 대하여 재배지에서 발생하였다. 새로운 고효능 Cry 단백질의 개발은 인시류 곤충 해충의 관리를 위한 추가의 도구를 제공할 것이다.
본 발명은 Cry1Ac 및 Cry1F에 대해 저항성을 갖는 곤충을 방제하는데 효과적인 B.t. 살곤충 단백질을 제공한다. 이들 단백질 독소는 유리하게는 농경 작물을 곤충 섭식 손상으로부터 보호하는데 사용될 수 있다. 충분한 양의 기능적 활성 단백질이 관심 작물에 존재하도록 하는 방식으로 이들 곤충 독소를 발현하는 능력이 또한 본 발명의 대상이다.
서열식별번호: 2의 잔기 2 내지 68을 포함하며, 여기서 아미노산 잔기 54는 Gly 및 Ala로 이루어진 군으로부터 선택되고, 아미노산 잔기 57은 Leu 및 Met로 이루어진 군으로부터 선택되고, 아미노산 잔기 68은 Val, Phe, 및 Ile로 이루어진 군으로부터 선택되는 것인 변형된 Cry1Ca 독소. 서열식별번호: 210의 잔기 2 내지 628을 포함하며, 여기서 아미노산 잔기 54는 Gly 및 Ala로 이루어진 군으로부터 선택되고, 아미노산 잔기 57은 Leu 및 Met로 이루어진 군으로부터 선택되고, 아미노산 잔기 68은 Val, Phe, 및 Ile로 이루어진 군으로부터 선택되고, 아미노산 잔기 73은 Trp, Ala 및 Met로 이루어진 군으로부터 선택되고, 아미노산 잔기 596은 Phe, Met 및 Ala로 이루어진 군으로부터 선택되고, 아미노산 잔기 620은 Leu 및 Phe로 이루어진 군으로부터 선택되는 것인 변형된 Cry1Ca 독소. 서열식별번호: 36의 아미노산 잔기 629 내지 1164로 이루어진 카르복시 말단 연장부를 추가로 포함하는 상기 변형된 Cry1Ca 독소. 서열식별번호: 36의 아미노산 잔기 629 내지 1164로 이루어진 카르복시 말단 연장부를 추가로 포함하는 상기 변형된 Cry1Ca 독소. 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 상기 변형된 Cry1Ca 독소. 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 상기 변형된 Cry1Ca 독소. 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 상기 변형된 Cry1Ca 독소. 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 상기 변형된 Cry1Ca 독소.
변형된 Cry1Ca 독소를 코딩하는 DNA, 변형된 Cry1Ca 독소를 생산하는 트랜스제닉 식물 및 변형된 Cry1Ca 독소를 사용하여 곤충 해충을 방제하는 방법이 본 발명에 포함된다.
본 발명은 식물 및 농업에 해로운 절지동물 해충을 방제하기 위한 신규 물질 및 방법에 관한 것이다. 바람직한 실시양태에서, 본 발명은 인시류 해충의 방제를 위한 물질 및 방법을 제공한다.
본 발명에 따라 유용한 특정 B.t. Cry 단백질 (내독소, 독소)은 MR-1206으로 명명되는 B.t. 단리물로부터 수득할 수 있는 독소를 포함한다. 본 발명은 또한 프로테아제 프로세싱에 저항성이 있거나, 또는 유전자가 이종 발현 시스템으로 형질전환된 경우에 고 수준으로 발현하는 개선된 인시류-활성 특성을 갖는 예시된 B.t. 단리물 및 독소의 돌연변이체의 용도를 포함한다. 돌연변이체를 제조하는 절차는 미생물학 분야에 널리 공지되어 있다. 자외선 및 화학적 돌연변이유발원, 예컨대 니트로소구아니딘이 이 목적을 위해 광범위하게 사용된다.
본 발명의 단백질 독소는 다양한 방식으로 표적 곤충과 접촉하도록 "적용"되거나 또는 제공될 수 있다. 예를 들어, 트랜스제닉 식물 (여기서, 단백질은 식물에 의해 생산되고 식물 내에 존재함)이 사용될 수 있고, 이는 관련 기술분야에 널리-공지되어 있다. 독소 유전자의 발현은 또한 뿌리, 잎 등과 같은 식물의 특정 조직에서 선택적으로 달성될 수 있다. 이는, 예를 들어 조직-특이적 프로모터의 사용을 통해 달성될 수 있다. 분무 적용이 또 다른 예이며, 이는 또한 관련 기술분야에 공지되어 있다. 본 발명의 단백질은 목적하는 최종 용도를 위해 적절하게 제제화된 다음, 침입이 발견되기 전에, 표적 곤충이 발견된 후에, 그 이전 및 이후 둘 다 등에서 보호될 식물 상에 및/또는 식물 주위에 및/또는 식물 부근에 분무 (또는 다르게는 적용)될 수 있다. 본 발명의 단백질은 또한 적절하게 제제화되고, 단백질이 식물의 뿌리 구역과 접촉하여 이를 뿌리 섭식 곤충으로부터 보호하도록 하는 종자 처리로서 종자에 적용될 수 있다. 예를 들어 미끼 과립이 또한 사용될 수 있고, 이는 관련 기술분야에 공지되어 있다.
본 발명의 단백질을 사용하여 실질적으로 임의의 유형의 식물을 인시류 곤충에 의한 손상으로부터 보호할 수 있다. 이러한 식물의 예는 몇 가지 예로 메이즈, 해바라기, 대두, 목화, 카놀라, 벼, 수수, 밀, 보리, 채소, 관상식물, 페퍼 (고추 포함), 사탕무, 과일, 및 잔디풀을 포함한다. 특히 바람직한 식물은 메이즈, 대두 및 목화이다. 가장 바람직한 식물은 메이즈이다. 또 다른 가장 바람직한 식물은 대두이다. 또 다른 가장 바람직한 식물은 목화이다.
본 발명의 한 실시양태에서, 본 발명의 폴리뉴클레오티드 서열은 대략 68-71 kDa의 독소를 코딩한다. 이들 독소는 인시류 해충, 특히 가을 거염벌레, 배추좀나방, 남서부 옥수수 천공충, 남부 거염벌레, 옥수수 이삭벌레, 및 유럽 옥수수 천공충을 방제하는데 사용된다. 바람직한 실시양태에서, 본 발명은 형질전환 식물 세포가 표적 해충에 의해 소비되는 조직에서 본 발명의 살충 독소를 생산하고 함유하도록 본 발명의 적어도 하나의 폴리뉴클레오티드 서열로 형질전환된 식물 세포에 관한 것이다.
대안적으로, 본 발명의 B.t. 단리물, 또는 본원에 기재된 살충 독소 단백질을 코딩하는 유전자를 발현하는 재조합 미생물이 곤충 해충을 방제하는데 사용될 수 있다. 이와 관련하여, 본 발명은 실질적으로 무손상인 B.t. 세포, 및/또는 실질적으로 무손상인 세포가 표적 해충의 환경에 적용된 경우에 살충 활성이 연장되도록 처리된 본 발명의 독소를 함유하는 재조합 세포의 처리를 포함한다. 처리된 세포는 살충 독소에 대해 보호 코팅으로서 작용한다. 독소는 표적 곤충에 의해 섭취되면 활성이 된다.
본 발명의 한 측면은 살충 단백질 및 폴리펩티드 또는 그의 생물학적 활성 부분을 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산 분자 뿐만 아니라 본 발명의 독소를 코딩하는 핵산을 확인하기 위한 혼성화 프로브로서 사용하기에 충분한 핵산 분자에 관한 것이다. 본원에 사용된 용어 "핵산 분자"는 DNA 분자 (예를 들어, cDNA 또는 게놈 DNA) 및 RNA 분자 (예를 들어, mRNA) 및 뉴클레오티드 유사체를 사용하여 생성된 DNA 또는 RNA의 유사체를 포함하도록 의도된다. 핵산 분자는 단일-가닥 또는 이중-가닥일 수 있지만, 이중-가닥 DNA가 바람직하다.
본 발명의 단백질을 코딩하는 뉴클레오티드 서열은 서열식별번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39에 제시된 서열, 및 그의 상보체를 포함한다. "상보체"는 주어진 뉴클레오티드 서열에 대해 혼성화되어 안정한 듀플렉스 (이중-가닥) 분자를 형성할 수 있도록 주어진 뉴클레오티드 서열에 대해 충분히 상보적인 뉴클레오티드 서열을 의도한다. 이들 뉴클레오티드 서열에 의해 코딩되는 살충 활성 변형된 Cry1Ca 독소에 대해 상응하는 아미노산 서열은 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40에 제시된다.
본 발명의 독소-코딩 뉴클레오티드 서열의 단편인 핵산 분자가 또한 본 발명에 포괄된다. "단편"은 본 발명의 변형된 Cry1Ca 독소의 단편을 코딩하는 뉴클레오티드 서열의 부분을 의도한다. 뉴클레오티드 서열의 단편은 본 발명의 독소 단백질의 생물학적 활성 부분을 코딩할 수 있거나, 또는 이는 하기 개시된 방법을 사용하여 혼성화 프로브 또는 PCR 프라이머로서 사용될 수 있는 단편일 수 있다.
서열의 간단한 설명
서열식별번호: 1은 DIG-468을 코딩하는 DNA 서열이다.
서열식별번호: 2는 DIG-468 단백질 서열이다.
서열식별번호: 3은 DIG-483를 코딩하는 DNA 서열이다.
서열식별번호: 4는 DIG-483 단백질 서열이다.
서열식별번호: 5는 DIG-485를 코딩하는 DNA 서열이다.
서열식별번호: 6은 DIG-485 단백질 서열이다.
서열식별번호: 7은 DIG-487을 코딩하는 DNA 서열이다.
서열식별번호: 8은 DIG-487 단백질 서열이다.
서열식별번호: 9는 DIG-462를 코딩하는 DNA 서열이다.
서열식별번호: 10은 DIG-462 단백질 서열이다.
서열식별번호: 11은 DIG-463을 코딩하는 DNA 서열이다.
서열식별번호: 12는 DIG-463 단백질 서열이다.
서열식별번호: 13은 DIG-464를 코딩하는 DNA 서열이다.
서열식별번호: 14는 DIG-464 단백질 서열이다.
서열식별번호: 15는 DIG-465를 코딩하는 DNA 서열이다.
서열식별번호: 16은 DIG-465 단백질 서열이다.
서열식별번호: 17은 DIG-466를 코딩하는 DNA 서열이다.
서열식별번호: 18은 DIG-466 단백질 서열이다.
서열식별번호: 19는 DIG-467을 코딩하는 DNA 서열이다.
서열식별번호: 20은 DIG-467 단백질 서열이다.
서열식별번호: 21은 DIG-469를 코딩하는 DNA 서열이다.
서열식별번호: 22는 DIG-469 단백질 서열이다.
서열식별번호: 23은 DIG-473를 코딩하는 DNA 서열이다.
서열식별번호: 24는 DIG-473 단백질 서열이다.
서열식별번호: 25는 DIG-474를 코딩하는 DNA 서열이다.
서열식별번호: 26은 DIG-474 단백질 서열이다.
서열식별번호: 27은 DIG-482를 코딩하는 DNA 서열이다.
서열식별번호: 28은 DIG-482 단백질 서열이다.
서열식별번호: 29는 메이즈에 대해 최적화된 변형된 Cry1Ca 코돈 (IRDIG544.11)을 코딩하는 DNA 서열이다.
서열식별번호: 30은 변형된 Cry1Ca 단백질 단백질 독소 서열 (IRDIG544.11)이다.
서열식별번호: 31은 고 GC 코돈 최적화된, 변형된 Cry1Ca, IRDIG544.12를 코딩하는 DNA 서열이다.
서열식별번호: 32는 IRDIG544.12에 대한 단백질 독소 서열이다.
서열식별번호: 33은 변형된 Cry1Ca, IRDIG544.9를 코딩하는 쌍자엽식물 최적화 DNA 서열이다.
서열식별번호: 34는 변형된 Cry1Ca, IRDIG544.9의 단백질 서열이다.
서열식별번호: 35는 변형된 Cry1Ca, IRDIG544.8을 코딩하는 쌍자엽식물 최적화 DNA 서열이다.
서열식별번호: 36은 쌍자엽식물에 대해 최적화된 IRDIG544.8 단백질 코돈이다.
서열식별번호: 37은 Cry1Ab 전독소 절편에 융합된 변형된 Cry1Ca 독소를 코딩하는 DNA 서열이다.
서열식별번호: 38은 서열식별번호: 37의 DNA로부터 생산된 단백질 독소 서열이다.
서열식별번호: 39는 TraP12에 융합된 변형된 Cry1Ca, IRDIG544.12를 코딩하는 고 GC 코돈 최적화 DNA 서열이다.
서열식별번호: 40은 TraP12에 융합된 변형된 Cry1Ca 독소, IRDIG544.12이다.
도 1은 잎 펀치에 의해 샘플링된 T1 메이즈 잎에서 구축물 115752에 의한 DIG-465의 및 구축물 115753에 의한 DIG-473의 발현 수준을 보여준다.
도 2는 FAW 또는 Cry1Fa 저항성 FAW에 의해 유발된 메이즈에서의 잎 손상의 양 대 DIG-465의 발현 수준의 플롯이다.
도 3은 FAW 또는 Cry1Fa 저항성 FAW에 의해 유발된 메이즈에서의 잎 손상의 양 대 DIG-473의 발현 수준의 플롯이다.
도 2는 FAW 또는 Cry1Fa 저항성 FAW에 의해 유발된 메이즈에서의 잎 손상의 양 대 DIG-465의 발현 수준의 플롯이다.
도 3은 FAW 또는 Cry1Fa 저항성 FAW에 의해 유발된 메이즈에서의 잎 손상의 양 대 DIG-473의 발현 수준의 플롯이다.
본원에서 용어 "유전 물질"의 사용은 모든 유전자, 핵산, DNA 및 RNA를 포함하도록 의도된다. 이들 서열은 유전자가 식물, 특히 메이즈 및 쌍자엽식물에서 형질전환되는 경우 발현된 단백질 독소의 안정성을 증가시키는 방식으로 변경되었다. 본원에서 논의된 단백질 독소는 전형적으로 "살곤충제" 또는 "살곤충"으로 지칭된다. 살곤충제 및 살곤충은 본원에서 단백질 독소가 본원에 추가로 정의된 바와 같은 "기능적 활성"을 가지며, 곤충 방제제로서 사용된다는 것을 의미한다.
"기능적 활성"은 본원에서 단백질 독소가 단백질이 경구 활성이거나, 또는 독성 효과를 갖거나, 또는 섭식을 방해하거나 또는 저지할 수 있는 (이는 곤충 사멸을 유발할 수도 또는 유발하지 않을 수도 있음) 곤충 방제제로서 기능한다는 것을 의미한다. 곤충이 트랜스제닉 식물 발현, 제제화된 단백질 조성물(들), 분무가능한 단백질 조성물(들), 미끼 매트릭스 또는 다른 전달 시스템을 통해 전달되는 유효량의 독소와 접촉하는 경우, 그 결과는 전형적으로 곤충의 사멸이거나 또는 곤충에 이용가능한 독소를 만드는 공급원을 곤충이 섭식하지 않는 것이다.
용어 "올리고뉴클레오티드"의 사용은 RNA 또는 DNA의 뉴클레오티드의 단쇄로 이루어진 거대분자를 의미한다. 이러한 길이는 적어도 1개의 뉴클레오티드일 수 있으나, 전형적으로 약 10 내지 약 12개 뉴클레오티드의 범위이다. 올리고뉴클레오티드의 길이의 결정은 관련 기술분야의 통상의 기술자의 기술 범위 내에 있고, 본원에서 제한되지 않아야 한다. 따라서, 올리고뉴클레오티드는 10개 미만 또는 12개 초과일 수 있다. 본 발명은 이들 부류의 독소를 코딩하는 폴리뉴클레오티드 서열 뿐만 아니라, 독소를 발현하는 재조합 숙주를 생산하기 위한 이들 폴리뉴클레오티드 서열의 용도에 관한 것이다.
본원에 사용된 바와 같이 용어 "독성의" 또는 "독성"의 사용은 바실루스 투린기엔시스에 의해 생산된 독소가 본원에 정의된 바와 같은 "기능적 활성"을 갖는다는 것을 의미한다.
용어 "변형된 Cry1Ca 독소(들)"의 사용은 본원에 기재된 서열 목록의 모든 단백질 서열 및 그의 모든 변이체를 포함하는 것을 의미한다.
본원에서 용어 "유전 물질"의 사용은 모든 유전자, 핵산, DNA 및 RNA를 포함하는 것을 의미한다.
폴리뉴클레오티드, DNA, RNA, 올리고뉴클레오티드 및 프라이머의 뉴클레오티드 잔기의 명명을 위해, 및 단백질의 아미노산 잔기의 명명를 위해, 표준 IUPAC 약어가 본 문헌 전반에 걸쳐 사용된다. 핵산 서열은 표준 5'에서 3'으로의 방향으로 제시되며, 단백질 서열은 표준인 아미노 (N) 말단에서 카르복시 (C) 말단으로의 방향으로 제시된다.
본 발명의 독소 및 유전자는 추가로 그의 아미노산 및 뉴클레오티드 서열, 및 전장 DNA 및 아미노산 서열에 의해 포함되는 특유한 단편의 서열로 정의될 수 있다. 각각의 신규 부류 내의 분자의 서열은 특정 예시된 서열에 대한 상동성과 관련하여, 뿐만 아니라 특정 예시된 프로브 및 프라이머와 혼성화되거나 또는 이에 의해 증폭되는 능력과 관련하여 정의될 수 있다. 본원에 제공된 독소의 부류는 또한 특정 항체와의 그의 면역반응성에 기초하여 확인될 수 있다.
독소 구조. 본 발명의 독소는 또한 구조 및 도메인 조성과 관련하여 특징화될 수 있다. 생물활성 스펙트럼의 차이와 단백질 서열 변이성의 상관관계는 블록 3 및 5 사이의 "초가변" 영역이 B.t. 델타-내독소 사이의 곤충 특이성의 차이의 원인이 된다는 초기 가설에 도달하였다.
천연 전장 Cry1Ca 단백질을 코딩하는 유전자가 메이즈 세포에 삽입되어 발현되는 경우, 적어도 5가지 검출가능한 단백질분해에 의한 분해 생성물이 관찰된다. 이들 5가지 폴리펩티드는 하기 아미노산 길이를 갖는 것으로 결정되었다: 1-1164, 1-628, 29-628, 74-628, 및 74-596. 검출된 5가지 Cry1Ca 분해 생성물 중에서, 단편 중 2개는 중요한 드라이버 곤충 해충에 대해 불활성인 것으로 밝혀졌다. 대부분의 경우, 이들 2가지 불활성 단편이 메이즈 세포에서 검출되는 Cry1Ca-관련 단백질의 주요 부분을 차지한다. 메이즈에서의 Cry1Ca에 대한 천연 전장 유전자의 발현은 중요한 곤충 해충, 예컨대 에스. 프루기페르다에 대해 불충분한 기능적 활성을 갖는 식물을 발생시킨다.
말단절단 천연 Cry1Ca 단백질 (aa 1-628)을 발현하는 유전자가 메이즈 세포에 삽입되어 발현되는 경우, 단백질분해 프로세싱이 보다 적게 발생한다. 대부분이 비프로세싱되고 기능적 활성인 채로 남아있다. 따라서 메이즈 세포에서의 말단절단 Cry1Ca 유전자의 발현은 메이즈 세포에서의 감소된 단백질분해로 인해 중요한 곤충 해충에 대해 충분한 기능적 활성을 갖는 식물을 발생시킨다.
Cry1Ca의 1차 아미노산 서열의 변경은 중요한 곤충 해충에 대해 지속적인 생물학적 활성을 허용하고, 프로테아제 효소로서 키모트립신을 사용하여 시험관내에서 측정시에 단백질의 보다 적은 단백질분해 프로세싱을 발생시킨다. 변경된 Cry1Ca 단백질의 보다 적은 단백질분해 프로세싱은 식물에 보다 많은 양의 기능적 활성 단백질이 축적되도록 하며, 표적 곤충 해충에 대해 보다 큰 활성을 발생시킨다.
프로테아제 감수성 변이체. 곤충 장 프로테아제는 전형적으로 곤충이 먹이 단백질로부터 필요한 아미노산을 수득하는 것을 보조하는 기능을 한다. 가장 잘 이해된 곤충 소화 프로테아제가 세린 프로테아제라는 것인데, 이는 특히 인시류 종에서 가장 흔한 유형인 것으로 보인다 (Englemann and Geraerts, 1980). 딱정벌레류 곤충은 인시류 장보다 더 중성 내지 산성인 장을 갖는다. 대다수의 딱정벌레류 유충 및 성충, 예를 들어 콜로라도 감자 딱정벌레는 약간 산성인 중장을 가지며, 시스테인 프로테아제가 주요 단백질분해 활성을 제공한다 (Wolfson and Murdock, 1990). 더욱 정확하게는, 문헌 [Thie and Houseman (1990)]에서는 콜로라도 감자 딱정 벌레에서 카텝신 B-유사 및 카텝신 H-유사 시스테인 프로테아제들과, 카텝신 D-유사 아스파르틸 프로테아제가 확인 및 특성화되었다. 문헌 [Gillikin et al., (1992)]에서는 서부 옥수수 뿌리벌레 유충의 장에서의 단백질분해 활성이 특징화되었으며 이는 주로 시스테인 프로테아제임이 발견되었다. 미국 특허 번호 7230167은 세린 프로테아제, 카텝신 G가 서부 옥수수 뿌리벌레에 존재함이 개시되어 있다. 곤충 장 프로테아제의 다양성 및 상이한 활성 수준은 특정한 B.t. 독소에 대한 곤충의 감수성에 영향을 줄 수 있다.
한 실시양태에서, 독소는 메이즈 식물에서 자연적으로 발견되는 프로테아제에 의해 발현된 단백질의 프로테아제 프로세싱의 수준을 유의하게 감소시키는 그의 아미노산 서열에서의 특정 변화를 갖는다. 아미노산의 변화는 메이즈에서 발현되는 경우 단백질의 높은 수준의 기능적 활성을 발생시킨다. 프로테아제 절단 부위는 화학적 유전자 합성 또는 스플라이스 중첩 PCR에 의해 목적 위치에 도입될 수 있다 (Horton et al., 1989). 예를 들어 세린 프로테아제 인식 서열이 특정 곤충 해충의 중장 내에서 목적하는 결실 지점에서의 단백질 프로세싱에 영향을 미치도록 Cry 단백질 구조 내의 특정 부위에 임의로 삽입될 수 있다. 인시류 중장 세린 프로테아제, 예컨대 트립신 또는 트립신-유사 효소, 키모트립신, 엘라스타제 등 (Christeller et al., 1992)은 목적 프로세싱 부위에서 프로테아제 인식 서열을 조작함으로써 Cry 단백질의 활성화에 사용될 수 있다. 마찬가지로, 딱정벌레류 세린 프로테아제, 예컨대 트립신, 키모트립신 및 카텝신 G-유사 프로테아제는 목적 프로세싱 부위에서 인식 서열을 조작함으로써 유사하게 사용될 수 있다. 추가로, 딱정벌레류 시스테인 프로테아제, 예컨대 카텝신 (B-유사, L-유사, O-유사, 및 K-유사 프로테아제) (Koiwa et al., 2000 및 Bown et al., 2004), 메탈로프로테아제, 예컨대 ADAM10 (Ochoa-Campuzano et al., 2007), 및 아스파르트산 프로테아제, 예컨대 카텝신 D-유사 및 E-유사, 펩신, 플라스멥신, 및 키모신은 목적 프로세싱 부위에서 인식 서열을 조작함으로써 사용될 수 있다.
본 발명의 범위는 곤충, 식물 또는 미생물 프로테아제에 의한 보다 큰 변이체 단백질의 단백질분해 절단을 허용 또는 제거하도록 적절한 위치에서의 프로테아제 프로세싱 부위의 도입 또는 제거에 의해 본 발명의 살곤충 단백질에 대한 코딩 서열을 조작하여 생산된 변이체 Cry1Ca 살곤충 단백질을 포함한다. 이러한 조작의 최종 결과는 무손상 (전장) 독소 단백질과 동일하거나 그보다 더 우수한 활성을 갖는 독소 분자의 생성이다.
그의 DNA 기질의 인식 및 절단에서 제II형 제한 엔도뉴클레아제와 연관된 높은 서열 특이성과 달리, 단백질분해 효소는 절단 인식 부위를 포함하는 아미노 서열에서 보다 더 비특이적이다. 일부 범용성은 일부 프로테아제 절단 부위, 특히 카텝신 B, K, L, 및 S와 비교하여 카텝신 G를 포함하는 아미노산 구조와 관련하여 발견되었다 (Bown et al., 2004). 하기 예시된 프로테아제 절단 부위의 명명법에서, 절단 부위로부터 상류 아미노산 잔기 (즉 N-말단을 향함)는 P1, P2, P3, P4, P5 등으로 넘버링되고, 잔기 P1은 절단 부위에 바로 인접하고, 잔기 P5는 절단 부위로부터 N-말단 방향으로 5번째로 가장 멀리 있다. 절단 부위로부터 하류 아미노산 잔기 (즉 C-말단을 향함)는 P1', P2', P3', P4', P5' 등으로 넘버링되고, 잔기 P1'는 절단 부위에 바로 인접하고, 잔기 P5'는 절단 부위로부터 C-말단 방향으로 5번째로 가장 멀리 있다. 카텝신 G는 P1 잔기 글루타민, 리신, 트립토판, 또는 페닐알라닌 뒤에서 우선적 절단을 나타내는 것으로 공지되어 있으며, 여기서 잔기 P2, P3, P4, P5 등, 및 P1', P2', P3', P4', P5' 등은 천연 단백질에서 보통 발견되는 20가지 아미노산 중 임의의 것일 수 있다. 어느 정도 증진된 절단 부위 서열 특이성은 카텝신 B, K, L, 및 S에 의해 입증되며, 여기서 P2 아미노산의 측쇄는 카텝신의 기질 결합 부위 S2에 핏팅된다. 이들 카텝신의 S2 부위는 큰 소수성 측쇄 (예를 들어 발린, 류신, 이소류신, 페닐알라닌, 트립토판, 및 티로신에서 발견된 바와 같음)를 갖는 P2 아미노산과 우선적으로 상호작용하고, 하전된 측쇄를 갖는 P2 잔기와의 상호작용을 기피한다 (예외적으로 카텝신 B 및 L은 P2 위치에 아르기닌의 큰 친수성 하전된 측쇄를 허용함). 일부 특이성은 P3 위치에서 아미노산의 동일성에서 나타난다. 예를 들어, 카텝신 L은 페닐알라닌 또는 아르기닌이 P2 위치를 점유하는 경우 P1 위치에서 아르기닌 뒤를 우선적으로 절단한다. P3 아미노산은 방향족 유형 (예를 들어 페닐알라닌, 트립토판, 히스티딘, 또는 티로신) 또는 소수성 유형 (예를 들어 알라닌, 발린, 류신, 이소류신, 페닐알라닌, 트립토판, 또는 티로신)일 수 있다. 위치 P4, P5 등, 및 P1', P2', P3', P4', P5' 등은 천연 단백질에서 보통 발견되는 20가지 아미노산 중 임의의 것일 수 있다.
단백질분해 절단은 각 프로테아제에 대한 대상 절단 서열의 이용가능성에 추가로 의존하며; 단백질의 3차원 구조 내의 잠재적 절단 부위의 격리는 단백질을 특정한 프로테아제에 의한 절단에 저항성을 갖도록 할 수 있다. 곤충 장 프로테아제의 다양성 및 상이한 활성 수준은 특정한 B.t. 독소에 대한 곤충의 감수성에 영향을 미칠 수 있는 것으로 생각된다. 생화학 및 분자 생물학 분야의 통상의 기술자는 감수성 곤충의 장 프로테아제에 의한 보다 큰 단백질의 프로테아제 절단/활성화에 의해 생성된 살곤충 단백질 단편의 생화학적 특징을 조사할 수 있다 (폴리펩티드의 N-말단 및 C-말단을 포함하는 아미노산의 서열의 결정을 포함하나 이에 제한되지는 않음). 또한 비감수성 곤충 또는 숙주 식물의 장의 프로테아제 체제, 및 조작자를 B.t. 살곤충 단백질의 코딩 서열 내의 적절한 위치, 비감수성 곤충의 장 프로테아제에 의해 절단되기 쉬운 서열 또는 B.t. 살곤충 단백질이 트랜스제닉적으로 생산될 것으로 기대되는 숙주 식물에서 특징화할 수 있다. 본 발명의 B.t. 살곤충 단백질의 이러한 분석 및 조작은 본 발명의 범위 내에 포함될 것으로 이해된다.
또 다른 실시양태에서, 독소는 식물 및 박테리아를 포함한 다양한 상이한 발현 시스템에서 발현되는 경우 단백질 발현의 수준을 유의하게 증진시키는 그의 아미노산 서열에서의 특정 변화를 갖는다. 단백질의 증가된 발현의 결과로 발현 시스템에서 기능성 활성이 증가한다. 이는 치사 용량 미만의 단백질 독소를 제공받은 곤충의 작은 집단의 생존으로 인해 곤충에서 독소에 대한 저항성이 발생하는 것을 방지할 수 있도록 곤충에게 고용량의 독소를 제공하는데 유리하다.
유전자 및 독소. 본원의 실시양태의 단백질 분자는 공지된 살충 단백질, 특히 B.t. Cry 단백질, 보다 특히 Cry1Ca 단백질 (진뱅크 수탁 번호 AAA22343)에 상동인 아미노산 서열을 포함한다. 실시양태의 뉴클레오티드 서열에 의해 코딩되는 예측된 아미노산 서열은 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40으로 개시된다.
본 발명의 독소의 서열은 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40으로 제공된다. 바람직한 실시양태에서, 본 발명의 독소는 하기 특징 중 적어도 하나를 갖는다:
(a) 상기 독소는 서열식별번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39로 이루어진 군으로부터 선택된 뉴클레오티드 서열, 또는 그의 상보적 서열과 엄격한 조건 하에 혼성화되는 뉴클레오티드 서열에 의해 코딩된다.
(b) 상기 독소는 바실루스 투린기엔시스 단리물로부터 대략 68-71 kDa 곤충 독소, 또는 그의 단편에 대해 생성된 항체와 면역반응성이다.
(c) 상기 독소는 이러한 뉴클레오티드 서열의 부분이 프라이머 쌍을 사용하여 PCR에 의해 증폭되어 약 25-40 bp의 단편을 생성할 수 있는 뉴클레오티드 서열에 의해 코딩된다,
(d) 상기 독소는 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40에 제시된 아미노산 서열의 살충 부분을 포함한다,
(e) 상기 독소는 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40으로 이루어진 군으로부터 선택된 아미노산 서열의 살충 부분과 적어도 약 (90%) 상동성을 갖는 아미노산 서열을 포함한다,
(f) 상기 독소는 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40을 코딩하는 DNA로 이루어진 군으로부터 선택된 뉴클레오티드 서열의 살곤충 부분과 엄격한 조건 하에 혼성화되는 뉴클레오티드 서열에 의해 코딩된다,
(g) 상기 독소는 바실루스 투린기엔시스 단리물, MR-1206으로부터의 대략 68 kDa 또는 130 kDa 살충 독소, 또는 그의 단편에 대한 항체와 면역반응성이다.
(h) 상기 독소는 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40으로 이루어진 군으로부터 선택된 아미노산 서열 및 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40의 살충 부분과 적어도 약 (90%) 상동성을 갖는 아미노산 서열을 포함한다.
본원에 예시된 특정 유전자, 이들 유전자의 변이 및 이들 유전자의 단편은 또한 예를 들어 임의의 여러 상업적 공급업체에 의해 현재 실시되는 방법에 의한 합성 구축에 의해 수득될 수 있다 (예를 들어 미국 특허 번호 7482119 참조). 이들 유전자, 또는 그의 부분 또는 변이체는 또한 예를 들어 유전자 합성기의 사용 및 예를 들어 미국 특허 번호 5,380,831 방법에 의해 또한 합성에 의해 구축될 수 있다. 대안적으로, 합성 또는 자연 발생 유전자의 변이는 점 돌연변이를 만드는 표준 분자 생물학적 기술을 사용하여 용이하게 구축될 수 있다. 이들 유전자의 단편은 또한 표준 절차에 따라 상업적으로 입수가능한 엑소뉴클레아제 또는 엔도뉴클레아제를 사용하여 만들어질 수 있다. 예를 들어, 효소, 예컨대 Bal31 또는 부위-지정 돌연변이유발이 이들 유전자의 말단으로부터 뉴클레오티드를 체계적으로 절단하는데 사용될 수 있다. 또한, 활성 독소 단편을 코딩하는 유전자 단편은 다양한 제한 효소를 사용하여 수득될 수 있다.
본 발명의 독소-코딩 뉴클레오티드 서열의 단편인 핵산 분자는 의도되는 용도에 따라 적어도 약 15, 20, 30, 40, 50, 60, 75, 100, 200, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 3000, 3500개 뉴클레오티드, 또는 최대로 본원에 개시된 전장의 본 발명의 살곤충 독소-코딩 뉴클레오티드 서열에 존재하는 개수의 뉴클레오티드 (예를 들어, 서열식별번호: 1의 경우 1,878개 뉴클레오티드; 서열식별번호: 37의 경우 3,495개 뉴클레오티드)를 포함한다. 본 발명의 청구된 단백질의 생물학적 활성 부분을 코딩하는 뉴클레오티드 서열의 단편은 적어도 약 15, 25, 30, 40, 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 800, 900, 1000, 1100 또는 1200개의 인접 아미노산, 또는 최대로 본 발명의 전장 살곤충 단백질에 존재하는 총 개수의 아미노산 (예를 들어, 서열식별번호: 2의 경우 625개 아미노산 또는 서열식별번호: 38의 경우 1,164개 아미노산)을 코딩할 것이다.
재조합 숙주. 본 발명의 독소-코딩 유전자는 광범위하게 다양한 미생물 또는 식물 숙주 내로 도입될 수 있다. 독소 유전자의 발현은 직접적으로 또는 간접적으로 살충 단백질을 세포내에서 생산 및 유지한다. 적합한 미생물 숙주, 예를 들어 슈도모나스를 사용하는 경우, 미생물은 그가 증식하고 섭취될 해충 환경에 적용될 수 있다. 그 결과는 해충의 방제이다. 대안적으로, 독소 유전자의 숙주인 미생물은 독소의 활성을 연장시키고 세포를 안정화시키는 조건 하에서 처리될 수 있다. 이어서, 독성 활성을 유지하는 처리된 세포는 표적 해충의 환경에 적용될 수 있다.
독소 유전자가 적합한 벡터를 통해 미생물 숙주 내로 도입되고, 상기 숙주가 살아있는 상태로 환경에 적용되는 경우, 특정 숙주 미생물이 사용되는 것이 필수적이다. 하나 이상의 관심 작물의 "식물권" (엽면, 엽권, 근권 및/또는 근면)을 점유하는 것으로 공지된 미생물 숙주가 선택된다. 이들 미생물은 특정한 환경 (작물 및 다른 곤충 서식지)에서 야생형 토착 미생물과 성공적으로 경쟁할 수 있도록 선택되고, 폴리펩티드 살충제를 발현하는 유전자의 안정한 유지 및 발현을 제공하고, 바람직하게는 환경 분해 및 불활성화로부터의 살충제의 개선된 보호를 제공한다.
B.t. 포자 또는 재조합 숙주 세포는 또한 식물에 적용되거나 또는 식물에서 적용을 위해 제제화되기 전에 처리될 수 있다. 예를 들어, 단리된 B.t. 포자 및/또는 독소 결정은 살곤충 활성이 연장되도록 화학적으로 처리될 수 있고, 이에 의해 본 발명의 처리된 폴리펩티드를 포함한다 (미국 특허 번호 4,695,462 및 Gaertner et al., 1993).
수많은 미생물이 매우 다양한 중요한 작물의 엽면 (식물 잎의 표면) 및/또는 근권 (식물 뿌리 주위 토양)에 산다는 것이 알려져 있다. 이들 미생물은 박테리아, 조류, 및 진균을 포함한다. 특히 관심있는 것은 미생물, 예컨대 박테리아, 예를 들어 슈도모나스, 에르위니아(Erwinia), 세라티아(Serratia), 클레브시엘라(Klebsiella), 크산토모나스(Xanthomonas), 스트렙토미세스(Streptomyces), 리조비움(Rhizobium), 시노리조비움(Sinorhizobium), 로도슈도모나스(Rhodopseudomonas), 메틸로필리우스(Methylophilius), 아그로박테리움(Agrobacterium), 아세토박터(Acetobacter), 락토바실루스(Lactobacillus), 아르트로박터(Arthrobacter), 아조토박터(Azotobacter), 류코노스톡(Leuconostoc), 및 알칼리게네스(Alcaligenes) 속; 진균, 특히 효모, 예를 들어 사카로미세스(Saccharomyces), 크립토코쿠스(Cryptococcus), 클루이베로미세스(Kluyveromyces), 스포로볼로미세스(Sporobolomyces), 로도토룰라(Rhodotorula), 및 아우레오바시디움(Aureobasidium) 속이다. 특히 관심있는 것은 식물권 박테리아 종, 예컨대 슈도모나스 시린가에(Pseudomonas syringae), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 세라티아 마르세센스(Serratia marcescens), 아세토박터 크실리눔(Acetobacter xylinum), 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens), 아그로박테리움 라디오박터(Agrobacterium radiobacter), 로도슈도모나스 스페로이데스(Rhodopseudomonas spheroides), 크산토모나스 캄페스트리스(Xanthomonas campestris), 시노리조비움 멜리로티(Sinorhizobium meliloti) (이전에 리조비움 멜리로티(Rhizobium meliloti)), 알칼리게네스 유트로푸스(Alcaligenes eutrophus), 및 아조토박터 비네란디이(Azotobacter vinelandii); 식물권 효모 종, 예컨대 로도토룰라 루브라(Rhodotorula rubra), 알. 글루티니스(R. glutinis), 알. 마리나(R. marina), 알. 아우란티아카(R. aurantiaca), 크립토코쿠스 알비두스(Cryptococcus albidus), 씨. 디풀루엔스(C. diffluens), 씨. 라우렌티이(C. laurentii), 사카로미세스 로세이(Saccharomyces rosei), 에스. 프레토리엔시스 (S. pretoriensis), 에스. 세레비지아에(S. cerevisiae), 스포로볼로미세스 로세우스(Sporobolomyces roseus), 에스. 오도루스(S. odorus), 클루이베로미세스 베로나에(Kluyveromyces veronae), 및 아우레오바시디움 폴루란스(Aureobasidium pollulans)이다. 특히 관심있는 것은 유색 미생물이다.
본 발명의 바람직한 실시양태는 본 발명의 살곤충 단백질 또는 그의 변이체를 코딩하는 유전자를 사용한 식물의 형질전환이다. 형질전환 식물은 형질전환 식물의 세포내 방제량의 본 발명의 살곤충 단백질 또는 그의 변이체의 존재에 의해 곤충 표적 해충에 의한 공격에 대해 저항성을 갖는다. B.t. 살곤충 독소의 살곤충 특성을 코딩하는 유전 물질을 특정한 곤충 해충에 의해 섭취된 식물의 게놈에 도입함으로써, 성충 또는 유충은 먹이 식물을 소모한 후 사멸할 것이다. 단자엽 및 쌍자엽 분류의 수많은 구성원이 형질전환되었다. 트랜스제닉 농경 작물 뿐만 아니라 과일 및 채소가 상업적 관심 대상이다. 이러한 작물은 메이즈, 벼, 대두, 카놀라, 해바라기, 알팔파, 수수, 밀, 목화, 땅콩, 토마토, 감자 등을 포함하나, 이에 제한되지는 않는다. 외래 유전 물질을 단자엽 또는 쌍자엽 식물 세포 내로 도입하고 도입된 유전자를 안정하게 유지 및 발현하는 생식력 있는 식물을 수득하기 위한 여러 기술이 존재한다. 이러한 기술은 마이크로입자 상에 코팅된 유전 물질을 직접적으로 세포 내로 가속화하는 것을 포함한다 (미국 특허 4945050 및 5141131). 식물은 아그로박테리움 기술을 사용하여 형질전환될 수 있다 (미국 특허 5177010, 미국 특허 5104310, 유럽 특허 출원 0131624B1, 유럽 특허 출원 120516, 유럽 특허 출원 159418B, 유럽 특허 출원 176112, 미국 특허 5149645, 미국 특허 5469976, 미국 특허 5464763, 미국 특허 4940838, 미국 특허 4693976, 유럽 특허 출원 116718, 유럽 특허 출원 290799, 유럽 특허 출원 320500, 유럽 특허 출원 604662, 유럽 특허 출원 627752, 유럽 특허 출원 0267159, 유럽 특허 출원 0292435, 미국 특허 5231019, 미국 특허 5463174, 미국 특허 4762785, 미국 특허 5004863, 및 미국 특허 5159135 참조). 다른 형질전환 기술은 WHISKERS™ 기술을 포함한다 (미국 특허 5302523 및 미국 특허 5464765 참조). 전기천공 기술이 또한 식물을 형질전환하기 위해 사용될 수 있다 (WO 87/06614, 미국 특허 5472869, 미국 특허 5384253, WO9209696, 및 WO9321335 참조). 이들 형질전환 특허 및 공보는 모두 참조로 포함된다. 식물 형질전환을 위한 수많은 기술 뿐만 아니라, 외래 유전자와 접촉되는 조직의 유형이 또한 다양할 수 있다. 이러한 조직은 배아발생 조직, 제I형 및 제II형 캘러스 조직, 배축, 분열조직 등을 포함하나, 이에 제한되지는 않을 것이다. 거의 모든 식물 조직은 통상의 기술자의 기술 내에서 적절한 기술을 사용하여 탈분화 동안에 형질전환될 수 있다.
변형된 Cry1Ca 살곤충 독소 및 변이체를 코딩하는 유전자는 상기 개시된 바와 같이 관련 기술분야에 널리 공지된 다양한 기술을 사용하여 식물 세포 내로 삽입될 수 있다. 예를 들어, 형질전환 미생물 세포 및 이. 콜라이에서 기능하는 복제 시스템의 선택을 가능하게 하는 마커를 포함하는 수많은 클로닝 벡터가 고등 식물 내로의 삽입을 위한 외래 유전자의 제조 및 변형에 이용가능하다. 이러한 조작은, 예를 들어 의도된 용도에 목적되는 바와 같이 돌연변이의 삽입, 말단절단, 부가, 결실 또는 치환을 포함할 수 있다. 벡터는 예를 들어, pBR322, pUC 시리즈, M13mp 시리즈, pACYC184 등을 포함한다. 따라서, Cry 단백질 또는 변이체를 코딩하는 서열은 적합한 제한 부위에서 벡터 내로 삽입될 수 있다. 생성된 플라스미드는 이. 콜라이의 형질전환에 사용되며, 그의 세포는 적합한 영양 배지에서 배양된 다음, 수거되고, 작업가능한 양의 플라스미드가 회수되도록 용해된다. 서열 분석, 제한 단편 분석, 전기영동, 및 다른 생화학적-분자 생물학적 방법이 일반적으로 분석 방법으로서 수행된다. 각각의 조작 후에, 사용된 DNA 서열은 절단되어, 다음 DNA 서열에 연결될 수 있다. 각각의 조작된 DNA 서열은 동일한 또는 다른 플라스미드에서 클로닝될 수 있다.
식물 형질전환 방법에 따라, 보조 DNA 서열이 필요할 수 있다. 예를 들어, Ti 또는 Ri 플라스미드가 식물 세포의 형질전환에 사용되는 경우, Ti 또는 Ri 플라스미드의 적어도 T-DNA 우측 경계 반복부, 그러나 종종 우측 경계 반복부 및 좌측 경계 반복부 둘 다가, 삽입될 목적 유전자의 플랭킹 영역으로서 식물 세포내로 연결될 것이다. 식물 세포의 형질전환을 위한 T-DNA-함유 벡터의 용도가 집중적으로 연구되었고, EP 120516; 문헌 [Lee and Gelvin (2008), Fraley et al., (1986), 및 An et al., (1985)]에 충분히 기재되었고, 이는 관련 분야에 널리 확립되어 있다.
삽입된 DNA가 식물 게놈에 통합되면, 후속 세대 전반에 걸쳐 비교적 안정하다. 식물 세포를 형질전환시키는데 사용되는 벡터는 보통 형질전환 식물 세포에 제초제 또는 항생제, 예컨대 특히 비알라포스, 카나마이신, G418, 블레오마이신, 또는 히그로마이신에 대한 내성을 부여하는 단백질을 코딩하는 선택 마커 유전자를 함유한다. 개별적으로 사용되는 선택 마커 유전자는 따라서 형질전환 세포의 선택을 가능하게 해야 하고, 삽입된 DNA를 함유하지 않는 세포의 성장은 선택적 화합물에 의해 억제된다.
수많은 기술이 DNA를 숙주 식물 세포 내로 삽입하는데 이용가능하다. 이들 기술은 형질전환 작용제로서 아그로박테리움 투메파시엔스 또는 아그로박테리움 리조게네스(Agrobacterium rhizogenes)에 의해 전달되는 T-DNA로의 형질전환을 포함한다. 추가적으로, 전달될 DNA를 함유하는 리포솜과의 식물 원형질체의 융합, DNA의 직접 주입, 바이오리스틱 형질전환 (마이크로입자 충격), 또는 전기천공 뿐만 아니라 다른 가능한 방법이 사용될 수 있다. 식물 형질전환 분야의 통상의 기술자라면 다수의 방법론이 형질전환 식물의 생산에 이용가능하다는 점과, 그들이 다양한 숙주식물 종 사이의 생물학적 차이에 순응하도록 변형 및 특수화될 수 있다는 점을 이해할 것이다.
아그로박테리움 균주가 형질전환에 사용되는 경우, 삽입될 DNA는 특수 플라스미드, 즉 중간 (셔틀) 벡터 또는 이원 벡터 내로 클로닝될 것이다. 중간 벡터는 Ti 또는 Ri 플라스미드와 중간 플라스미드 사이에 상동인 서열로 인해 상동 재조합에 의하여 Ti 또는 Ri 플라스미드 또는 그의 유도체 내로 통합될 수 있다. Ti 또는 Ri 플라스미드는 또한 T-DNA의 전달에 필요한 vir 유전자를 포함하는 vir 영역을 포함한다. 중간 벡터는 아그로박테리아에서 복제될 수 없다. 중간 벡터는 헬퍼 플라스미드에 의해 (박테리아 접합을 통해), 전기천공에 의해, 화학적으로 매개되는 직접 DNA 형질전환에 의해, 또는 다른 방법론에 의해 아그로박테리움 투메파시엔스로 전달될 수 있다. 이원 벡터는 이. 콜라이 및 아그로박테리움 세포, 둘 다에서 자율적으로 복제될 수 있다. 이는 우측 및 좌측 T-DNA 경계 반복부 영역에 의해 프레이밍되며, 형질전환 식물 세포 선택을 위해 기능하는 선택 마커 유전자, 클로닝 링커, 클로닝 폴리링커, 또는 식물 세포 형질전환을 위해 예정된 유전자에 대한 도입 부위로서 기능할 수 있는 다른 서열을 포함할 수 있는 서열을 포함한다. 이들은 전기천공에 의해, 또는 직접 DNA에 의해 아그로박테리움 세포에 직접 형질전환되거나 (Holsters et al., (1978)), 화학적으로 매개되어 형질전환되거나, 또는 박테리아 접합에 의해 또는 다른 방법론에 의해 도입될 수 있다. 숙주 세포로서 사용된 아그로박테리움은 vir 영역을 수반하는 플라스미드를 포함해야 한다. 이러한 vir 영역은 T-DNA를 식물 세포 내로 전이시키는데 필요하다. B.t. 살곤충 독소 단백질 또는 그의 변이체를 코딩하는 유전자를 함유하는 것에 대해 부가적인 추가의 T-DNA 영역이 아그로박테리움 숙주 세포에 존재할 수 있다. 이와 같이 형질전환 박테리아는 식물 세포의 형질전환에 사용된다. 이롭게는, DNA를 식물 세포 내로 전달하기 위해 식물 외식편 (예를 들어, 잎 조각, 자루 절편, 뿌리 뿐만 아니라 원형질체 또는 현탁액-배양된 세포)이 아그로박테리움 투메파시엔스 또는 아그로박테리움 리조게네스와 함께 배양될 수 있다. 이어서, 형질전환 식물 세포의 선택을 위한 항생제 또는 제초제를 함유할 수 있는 적합한 성장 조건 및 배양 배지에 배치한 후, 감염된 식물 물질로부터 전체 식물을 재생시킬 수 있다. 이어서, 이와 같이 수득한 식물은 삽입된 DNA의 존재에 대해 시험될 수 있다.
형질전환 세포는 일반적 방식으로 식물 내부에서 성장한다. 이들은 배세포를 형성하고 형질전환 형질(들)을 자손 식물에 물려줄 수 있다. 이러한 식물은 보통의 방식으로 성장하고 동일한 형질전환 유전성 인자 또는 다른 유전성 인자를 갖는 식물과 교배될 수 있다. 생성되는 잡종 개체는 상응하는 표현형 특성, 예를 들어 식물 해충 곤충의 섭식 방제 능력을 갖는다.
주사 및 전기천공을 위해 사용되는 것의 경우에 플라스미드의 구축에 특별한 요구가 주어지지 않는다. 보편적 플라스미드, 예컨대, 예를 들어, 식물 세포로 전달될 목적 유전자 모두를 함유하도록 적절하게 변형된 pUC 유도체를 사용하는 것이 가능하다.
식물 세포 내로 삽입된 재조합 폴리뉴클레오티드의 활성은 삽입부에 인접한 내인성 식물 DNA의 영향에 의존할 수 있다. 따라서, 다른 옵션은 삽입을 위한 식물 게놈에서 탁월한 위치로 공지된 사례의 이점을 갖는다. Cry1F 및 Cry1Ac 목화 사례와 관련하여 예를 들어 WO 2005/103266 A1을 참조한다; 대상 B.t. 살곤충 독소 유전자가 이들 게놈 유전자좌에 Cry1F 또는 Cry1Ac 삽입물 대신 대체될 수 있다. 예를 들어 표적화된 상동 재조합이 본 발명에 따라 사용될 수 있다. 이러한 유형의 기술은 예를 들어, 표적화된 재조합을 위한 아연 핑거의 사용에 관련된 WO 03/080809 및 대응되는 공개 미국 출원 (USPA 20030232410)의 대상이다. 레콤비나제 (예를 들어 cre-lox 및 flp-frt)의 사용이 또한 관련 기술분야에 공지되어 있다.
본 발명의 바람직한 실시양태에서, 식물은 유전자로 형질전환될 것이며, 여기서 단백질 코딩 영역의 코돈 사용빈도는 식물에 대해 최적화되어 있다. 예를 들어, 본원에 참조로 포함된 미국 특허 번호 5,380,831을 참조한다. 또한, 유리하게는, 말단절단 독소를 코딩하는 식물이 사용될 것이다. 말단절단 독소는 전형적으로 전장 독소의 약 55% 내지 약 80%를 코딩할 것이다. 식물에서 사용하기 위한 합성 B.t. 유전자를 생성하는 방법은 관련 기술분야에 공지되어 있다 (Stewart 2007).
또 다른 변수는 선택 마커의 선택이다. 특정한 마커에 대한 선호는 통상의 기술자의 판단이지만, 하기의 선택 마커 중 임의의 것이 선택 마커로서 기능할 수 있는, 본원에 나열되지 않은 임의의 다른 유전자와 함께 사용될 수 있다. 이러한 선택 마커는 항생제 카나마이신, 네오마이신 및 G418에 대한 저항성을 코딩하는, 트랜스포손 Tn5의 아미노글리코시드 포스포트랜스퍼라제 유전자 (Aph II), 뿐만 아니라 글리포세이트; 히그로마이신; 메토트렉세이트; 포스피노트리신 (비알라포스), 이미다졸리논, 술포닐우레아 및 트리아졸로피리미딘 제초제, 예컨대 클로로술푸론, 브로목시닐, 달라폰 등에 대한 내성을 코딩하는 유전자를 포함하나, 이에 제한되지는 않는다. 이러한 유전자의 예는 본원에 참조로 포함된 문헌 [Merlo, (2002)]에 제공된다.
선택 마커 뿐만 아니라, 리포터 유전자를 사용하는 것이 바람직할 수 있다. 일부 경우에서, 리포터 유전자는 선택 마커 없이 사용될 수 있다. 리포터 유전자는 전형적으로 수용자 유기체 또는 조직에 성장 이점을 제공하지 않는 유전자이다. 리포터 유전자는 전형적으로 일부 표현형 변화 또는 효소 특성을 제공하는 단백질을 코딩한다. 바람직한 리포터 유전자는 글루쿠로니다제 (GUS) 유전자이다. 리포터 유전자의 다른 예는 문헌 [Merlo (2002)]에 제공된다.
형질전환 기술에도 불구하고, 유전자는 바람직하게는 벡터 내에 식물 프로모터를 포함함으로써 식물 세포에서 B.t. 살곤충 독소 유전자 및 변이체를 발현시키도록 구성된 유전자 전달 벡터에 도입된다. 식물 프로모터 뿐만 아니라, 다양한 공급원으로부터의 프로모터가 식물 세포에서 효율적으로 사용되어, 외래 유전자를 발현할 수 있다. 예를 들어, 박테리아 기원의 프로모터, 예컨대 옥토핀 신타제 프로모터, 노팔린 신타제 프로모터, 만노핀 신타제 프로모터; 바이러스 기원의 프로모터, 예컨대 콜리플라워 모자이크 바이러스의 35S 및 19S 프로모터 등이 사용될 수 있다. 식물 프로모터는 리불로스-1,6-비스포스페이트 (RUBP) 카르복실라제 소형 서브유닛 (ssu), 베타-콘글리시닌 프로모터, 파세올린 프로모터, ADH (알콜 데히드로게나제) 프로모터, 열-쇼크 프로모터, ADF (액틴 탈중합 인자) 프로모터, 및 조직 특이적 프로모터를 포함하나, 이에 제한되지는 않는다. 프로모터는 또한 전사 효율을 개선할 수 있는 특정 인핸서 서열 요소를 함유할 수 있다. 전형적인 인핸서는 ADH1-인트론 1 및 ADH1-인트론 6을 포함하나, 이에 제한되지 않는다. 구성적 프로모터가 사용될 수 있다. 구성적 프로모터는 거의 모든 세포 유형에서 거의 항상 연속 유전자 발현을 유도한다 (예를 들어, 액틴, 유비퀴딘, CaMV 35S). 조직 특이적 프로모터는 특정 세포 또는 조직 유형, 예컨대 잎 또는 종자에서의 유전자 발현 (예를 들어, 제인, 올레오신, 나핀, ACP (아실 담체 단백질))을 담당하며, 이들 프로모터가 또한 사용될 수 있다. 식물 발생의 특정 단계 동안에 활성인 프로모터 뿐만 아니라, 특정한 식물 조직 및 기관에서 활성인 프로모터가 또한 사용될 수 있다. 이러한 프로모터의 예는 뿌리 특이적, 화분-특이적, 배아 특이적, 옥수수 수염 특이적, 목화 섬유 특이적, 종자 내배유 특이적, 체관부 특이적 프로모터 등을 포함하나, 이에 제한되지는 않는다.
특정 환경 하에서 유도성 프로모터를 사용하는 것이 바람직할 수 있다. 유도성 프로모터는 특정 신호, 예컨대: 물리적 자극 (예를 들어, 열 쇼크 유전자); 광 (예를 들어, RUBP 카르복실라제); 호르몬 (예를 들어, 글루코코르티코이드); 항생제 (예를 들어, 테트라시클린); 대사물; 및 스트레스 (예를 들어, 가뭄)에 반응하는 유전자의 발현을 담당한다. 식물에서 기능하는 다른 바람직한 전사 및 번역 요소, 예컨대 5' 비번역 리더 서열, RNA 전사 종결 서열 및 폴리-아데닐레이트 부가 신호 서열이 사용될 수 있다. 수많은 식물-특이적 유전자 전달 벡터가 관련 기술분야에 공지되어 있다.
본 발명은 전능이지 않은 (비-전능) 식물 세포, 증식 물질이 아닌 식물 세포 (예를 들어, 일부 실시양태에서 잎 세포; 종자 세포는 일부 실시양태에서 제외됨), 및 전체 식물로 분화할 수 없는 식물 세포를 포함한다. 본 발명은 전체 식물로의 재생 이외의 용도를 갖는 식물 세포를 포함한다. 예를 들어, 상기 식물 세포는 단백질 (예컨대 본 발명의 DIG-465 단백질)을 생산하는데 사용될 수 있다. 따라서, 본 발명의 식물 세포는 전능성 이외의 용도를 갖는 것을 포함한다 (즉, 본 발명의 일부 세포는 전체 식물로 재생될 수 없음). 그러나, 일부 실시양태는 전체 식물로 재생될 수 있는 종자 세포 및 식물 세포를 포함한다.
본 발명의 독소 및 유전자를 확인하는 추가의 방법은 올리고뉴클레오티드 프로브의 사용을 통한 것이다. 이들 프로브는 검출가능한 뉴클레오티드 서열이다. 이들 서열은 적절한 방사능 표지에 의해 검출가능하게 될 수 있거나, 또는 미국 특허 번호 6268132에 기재된 바와 같이 내재적으로 형광성이 되게 할 수 있다. 관련 기술분야에 널리 공지된 바와 같이, 프로브 분자 및 핵산 샘플이 두 분자 사이에 강한 염기-쌍형성 결합을 형성함으로써 혼성화되는 경우, 프로브 및 샘플은 상당한 서열 상동성을 갖는 것으로 합리적으로 가정될 수 있다. 바람직하게는, 혼성화는, 예를 들어 문헌 [Keller and Manak (1993)]에 기재된 바와 같은, 관련 기술분야에 널리 공지된 기술에 의해 엄격한 조건 하에서 수행된다. 프로브의 검출은 혼성화가 일어났는지 여부를 공지된 방식으로 결정하기 위한 수단을 제공한다. 이러한 프로브 분석은 본 발명의 독소-코딩 유전자를 확인하는 신속한 방법을 제공한다. 본 발명에 따라 프로브로서 사용되는 뉴클레오티드 절편은 DNA 합성기 및 표준 절차를 사용하여 합성될 수 있다. 이들 뉴클레오티드 서열은 또한 본 발명의 유전자를 증폭시키기 위한 PCR 프라이머로서 사용될 수 있다.
본원에 사용된 용어 "엄격한 조건" 또는 "엄격한 혼성화 조건"은 프로브가 다른 서열에 혼성화되는 것보다 검출가능하게 더 큰 정도로 (예를 들어, 배경에 비해 적어도 2배) 그의 표적 서열에 혼성화될 (어닐링될) 조건을 지칭하는 것으로 의도된다. 엄격한 조건은 서열 의존성이며, 상이한 상황에 따라 다를 것이다. 혼성화 및/또는 세척 조건의 엄격성을 제어함으로써, 프로브에 100% 상보적인 표적 서열을 확인할 수 있다 (상동 프로빙). 다르게는, 엄격함 조건을 조절하여 서열에서 일부 미스매칭을 가능하게 하여, 보다 낮은 정도의 유사성이 검출되도록 한다 (이종 프로빙). 일반적으로, 프로브는 길이가 약 1000개 뉴클레오티드 미만, 바람직하게는 길이가 500개 뉴클레오티드 미만이다.
전형적으로, 엄격한 조건은 염 농도가 pH 7.0 내지 pH 8.3에서 Na 이온 약 1.5 M 미만, 전형적으로는 Na 이온 농도 (또는 다른 염) 약 0.01 내지 1.0 M이고, 온도가 짧은 프로브 (예를 들어, 10 내지 50개의 뉴클레오티드)에 대해서는 적어도 약 30℃이고, 긴 프로브 (예를 들어, 50개 초과의 뉴클레오티드)에 대해서는 적어도 약 60℃인 조건일 것이다. 엄격한 조건은 또한 포름아미드와 같은 탈안정화제를 첨가함으로써 달성될 수 있다. 예시적인 저 엄격도 조건은 37℃에서 30% 내지 35% 포름아미드, 1 M NaCl, 1% SDS (소듐 도데실 술페이트)의 완충제 용액을 사용한 혼성화, 및 50℃ 내지 55℃에서 1x 내지 2xSSC (20xSSC = 3.0 M NaCl/0.3 M 시트르산삼나트륨)에서의 세척을 포함한다. 예시적인 중간 정도의 엄격도 조건은 37℃에서 40% 내지 45% 포름아미드, 1.0 M NaCl, 1% SDS에서의 혼성화, 및 55℃ 내지 60℃에서 0.5x 내지 1xSSC에서의 세척을 포함한다. 예시적인 고 엄격도 조건은 37℃에서 50% 포름아미드, 1 M NaCl, 1% SDS에서의 혼성화, 및 60℃ 내지 65℃에서 0.1xSSC에서의 세척을 포함한다. 임의로, 세척 완충제는 약 0.1% 내지 약 1% SDS를 포함할 수 있다. 혼성화의 지속시간은 일반적으로 약 24시간 미만, 통상적으로 약 4 내지 약 12시간이다.
특이성은 전형적으로 혼성화후 세척의 함수이고, 결정적인 인자는 이온 강도 및 최종 세척 용액의 온도이다. DNA/DNA 하이브리드에 있어서, 열융점 (Tm)은 상보적 표적 서열의 50%가 완벽하게 매치된 프로브에 혼성화되는 온도 (정의된 이온 강도 및 pH 하에서)이다. Tm은 각각의 1%의 미스매칭에 대해 약 1℃만큼 감소하며; 따라서, Tm, 혼성화 조건 및/또는 세척 조건을 조정하여 목적 동일성의 서열의 어닐링을 용이하게 할 수 있다. 예를 들어, >90% 동일성을 갖는 서열이 목적되는 경우, Tm은 10℃ 감소할 수 있다. 일반적으로, 엄격한 조건은 정해진 이온 강도 및 pH에서 특정 서열 및 그의 상보체에 대한 Tm보다 약 5℃ 더 낮도록 선택된다. 그러나, 고도로 엄격한 조건은 Tm보다 1℃, 2℃, 3℃, 또는 4℃ 더 낮은 온도에서 혼성화 및/또는 세척을 사용할 수 있고; 중간 정도의 엄격한 조건은 Tm보다 6℃, 7℃, 8℃, 9℃, 또는 10℃ 더 낮은 온도에서 혼성화 및/또는 세척을 사용할 수 있고, 낮은 엄격한 조건은 Tm보다 11℃, 12℃, 13℃, 14℃, 15℃, 또는 20℃ 더 낮은 온도에서 혼성화 및/또는 세척을 사용할 수다.
Tm (℃)은 실험적으로 결정될 수 있거나 또는 계산에 의해 근사화될 수 있다. DNA-DNA 하이브리드에 있어서, Tm은 문헌 [Meinkoth and Wahl (1984)]의 식으로부터 근사화될 수 있다:
Tm (℃) = 81.5℃ + 16.6(log M) + 0.41(%GC) - 0.61(%포름아미드) - 500/L;
여기서, M은 1가 양이온의 몰농도이며, %GC는 DNA 중 구아노신 및 시토신 뉴클레오티드의 백분율이고, %포름아미드는 혼성화 용액 중 포름아미드의 백분율이며, L은 염기쌍 중 하이브리드의 길이이다.
대안적으로, 하기 식에 의해 Tm이 기재된다 (Beltz et al., 1983).
Tm (℃) = 81.5℃ + 16.6(log[Na+]) + 0.41(%GC) - 0.61(%포름아미드) - 600/L
여기서, [Na+]는 나트륨 이온의 몰농도이며, %GC는 DNA 중 구아노신 및 시토신 뉴클레오티드의 백분율이고, %포름아미드는 혼성화 용액 중 포름아미드의 백분율이며, L은 염기쌍 중 하이브리드의 길이이다.
상기 식, 혼성화 및 세척 조성물, 및 목적 Tm을 사용하여, 통상의 기술자는 혼성화 및/또는 세척 용액의 엄격도의 변동이 내재적으로 기재된다는 것을 이해할 것이다. 목적하는 정도의 미스매칭이 45℃ 미만의 Tm (수용액) 또는 32℃ 미만의 Tm (포름아미드 용액)을 발생시키는 경우, 보다 높은 온도가 사용될 수 있도록 SSC 농도를 증가시키는 것이 바람직하다. 핵산의 혼성화에 대한 광범위한 안내를 문헌 [Tijssen (1993) 및 Ausubel et al., (1995)]에서 찾아볼 수 있다. 문헌 [Sambrook et al., (1989)]을 또한 참조한다.
고정된 DNA가 방사성 표지된 유전자-특이적 프로브와 서던 블롯 상에서 혼성화되는 것이 표준 방법에 의해 수행될 수 있다 ([Sambrook et al., 상기 문헌]). 폴리뉴클레오티드 프로브의 표지에 사용되는 방사성 동위원소는 32P, 33P, 14C, 또는 3H를 포함할 수 있다. 폴리뉴클레오티드 프로브 분자 내로의 방사성 동위원소의 혼입은 분자 생물학 분야의 통상의 기술자에게 널리 공지된 여러 방법 중 임의의 것에 의해 이루어질 수 있다. (예를 들어, [Sambrook et al., 상기 문헌] 참조). 일반적으로, 혼성화 및 후속 세척은 본 발명의 독소 코딩 유전자에 대하여 상동성을 갖는 표적 서열의 검출을 허용하는 엄격한 조건 하에 실시될 수 있다. 이중-가닥 DNA 유전자 프로브에 대해, 6X SSPE, 5X 덴하르트(Denhardt) 용액, 0.1% SDS, 0.1 ㎎/mL 변성 DNA에서 DNA 하이브리드의 Tm보다 20℃-25℃ 낮은 온도에서 밤새 혼성화가 수행될 수 있다 [20X SSPE는 3M NaCl, 0.2 M NaHPO4, 및 0.02M EDTA (에틸렌디아민 테트라-아세트산 나트륨 염)이고; 100X 덴하르트 용액은 20 gm/L 폴리비닐피롤리돈, 20 gm/L 피콜(Ficoll) 유형 400 및 20 gm/L 소 혈청 알부민 (분획 V)이다].
세척은 전형적으로 하기와 같이 실시될 수 있다:
(1) 실온에서 15분 동안 1X SSPE, 0.1% SDS에서 2회 (저 엄격도 세척).
(2) Tm -20℃에서 15분 동안 0.2X SSPE, 0.1% SDS에서 1회 (중간 정도의 엄격도 세척).
올리고뉴클레오티드 프로브에 대해, 6X SSPE, 5X 덴하르트 용액, 0.1% SDS, 0.1 mg/mL 변성 DNA에서 하이브리드의 Tm보다 10-20℃ 낮은 온도에서 밤새 혼성화가 수행될 수 있다. 올리고뉴클레오티드 프로브에 대한 Tm은 하기 식에 의해 결정할 수 있다 (Suggs et al., 1981).
Tm (℃ ) = 2(T/A 염기 쌍의 수) + 4(G/C 염기 쌍의 수)
세척은 전형적으로 하기와 같이 실시될 수 있다:
(1) 실온에서 15분 동안 1X SSPE, 0.1% SDS에서 2회 (저 엄격도 세척).
(2) 혼성화 온도에서 15분 동안 1X SSPE, 0.1% SDS에서 1회 (중간 정도의 엄격도 세척).
관련 기술분야의 숙련자는 혼성화를 위한 프로브 분자 및 프로브와 표적 분자 사이에 형성된 하이브리드 분자가 방사성 표지 이외의 수단에 의해 검출가능하게 될 수 있음을 알 것이다.
변이체 독소. 본 발명에 따른 유용한 유전자 및 독소는 개시된 말단절단 서열 뿐만 아니라 전장 서열, 이들 서열의 단편, 변이체, 돌연변이체 및 본원에 구체적으로 예시된 독소의 특징적 살충 활성을 보유한 융합 단백질을 포함한다. 본원에 사용된 용어 유전자의 "변이체" 또는 "변이"는 동일한 독소를 코딩하거나 살충 활성을 갖는 등가의 독소를 코딩하는 뉴클레오티드 서열을 지칭한다. 추가로 본원에 사용된 용어 "등가의 독소"는 표적 해충에 대해 본 발명의 독소와 동일하거나 본질적으로 동일한 생물학적 활성을 갖는 독소를 지칭한다. 따라서, 본 발명의 독소의 변이체 또는 변이는 본 발명의 독소의 활성의 적어도 약 30%, 바람직하게는 적어도 약 50%, 보다 바람직하게는 적어도 약 70%, 보다 더 바람직하게는 적어도 약 80%를 가질 것이다. 살충 활성을 측정하는 방법은 관련 기술분야에 널리 공지되어 있으며, 본원에 예시된다. "변이체"는 본원에서 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40의 아미노산 서열에 대해 적어도 약 60%, 65%, 바람직하게는 약 70%, 75%, 보다 바람직하게는 약 80%, 85%, 가장 바람직하게는 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 갖는 단백질 또는 폴리펩티드를 포함하도록 의도된다. 변이체는 또한 염격한 조건 하에 서열식별번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 또는 39, 또는 그의 상보체의 핵산 분자에 혼성화되는 핵산 분자에 의해 코딩되는 폴리펩티드를 포함한다. 이러한 변이체는 일반적으로 청구된 활성을 유지할 것이다. 변이체는 돌연변이 유발로 인해 아미노산 서열이 상이한 폴리펩티드를 포함한다. 본 발명에 의해 포괄되는 변이체 단백질은 살충 활성이다.
1차 아미노산 서열 수준에서는 상이하지만 동일한 또는 유사한 전체 본질적 3차원 구조, 표면 전하 분포 등을 보유하는 변이체 단백질이 또한 설계될 수 있다. 예를 들어 미국 특허 번호 7,058,515; 문헌 [Larson et al., (2002); Crameri et al., (1997); Stemmer, W. P .C. (1994a); Stemmer, W. P .C. (1994b) " Stemmer, W. P. C. (1995); Crameri et al., (1996a); 및 Crameri et al., (1996b)]을 참조한다.
본 발명의 특정 독소가 본원에 구체적으로 예시된다. 이들 독소는 단지 본 발명의 독소의 예시이므로, 본 발명이 예시된 독소와 동일한 또는 유사한 살충 활성을 갖는 변이체 또는 등가의 독소 (및 등가의 독소를 코딩하는 뉴클레오티드 서열)를 포함한다는 것이 용이하게 명백해질 것이다. 등가의 독소는 예시된 독소와 아미노산 상동성을 가질 것이다. 아미노산 동일성은 전형적으로 60% 초과, 바람직하게는 75% 초과, 보다 바람직하게는 80% 초과, 보다 바람직하게는 90% 초과일 것이며, 95% 초과일 수 있다. 아미노산 상동성은 생물학적 활성을 설명하거나 또는 궁극적으로 생물학적 활성을 담당하는 3차원 구조의 결정에 관련된 독소의 임계 영역에서 가장 높을 것이다. 이와 관련하여, 특정 아미노산 치환이 허용가능하고, 이들 치환이 활성에 중요하지 않은 영역에 있거나 분자의 3차원 구조에 영향을 미치지 않는 보존적 아미노산 치환인 경우에 예상될 수 있다. 예를 들어, 아미노산은 하기 부류로 분류될 수 있다: 비극성, 비하전된 극성, 염기성 및 산성. 한 부류의 아미노산이 동일한 유형의 또 다른 아미노산으로 교체되는 보존적 치환은 치환이 화합물의 생물학적 활성을 실질적으로 변경시키지 않는 한 본 발명의 범위 내에 포함된다. 표 1은 각각의 부류에 속하는 아미노산의 예의 목록을 제공한다.
표 1
아미노산의 부류 및 예.
일부 경우, 비-보존적 치환이 이루어질 수도 있다. 결정적 인자는 이들 치환이 독소의 생물학적 활성을 유의하게 손상시키지 않아야 한다는 것이다.
본 발명의 바람직한 살곤충 독소 단백질은 서열식별번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 또는 39의 뉴클레오티드 서열에 대해 충분히 동일한 뉴클레오티드 서열에 의해 코딩된다. "충분히 동일한"은 아미노산 또는 뉴클레오티드 서열이 표준 파라미터를 사용하여 본원에 기재된 정렬 프로그램 중 하나로 분석시에 참조 서열과 비교하여 적어도 약 60% 또는 65% 서열 동일성, 바람직하게는 약 70% 또는 75% 서열 동일성, 보다 바람직하게는 약 80% 또는 85% 서열 동일성, 가장 바람직하게는 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 것을 의도한다. 관련 기술분야의 통상의 기술자는 이들 값이, 코돈 축중성, 아미노산 유사성, 리딩 프레임 위치 설정 등을 고려함으로써 2개의 뉴클레오티드 서열에 의해 코딩된 단백질의 상응하는 동일성을 결정하기 위해 적절하게 조정될 수 있다는 것을 인식할 것이다.
2개의 아미노산 서열의 또는 2개의 핵산 서열의 동일성 퍼센트를 결정하기 위하여, 서열을 최적의 비교 목적을 위해 정렬한다. 2개의 서열 사이의 동일성 퍼센트는 서열에 의해 공유된 동일한 위치의 수의 함수이다 (즉, 동일성 퍼센트 = 동일한 위치의 수/위치 (예를 들어, 중첩 위치)의 총수 x100). 한 실시양태에서, 2개의 서열은 길이가 동일하다. 2개의 서열 사이의 동일성 퍼센트는 갭을 허용하거나 허용하지 않으면서, 하기 기재된 것들과 유사한 기술을 이용하여 결정될 수 있다. 동일성 퍼센트의 계산에서, 전형적으로 정확한 매치를 계수한다.
2개의 서열 사이의 동일성 퍼센트의 결정은 수학적 알고리즘을 이용하여 달성될 수 있다. 2개의 서열의 비교에 사용된 수학적 알고리즘의 비제한적 예는 문헌 [Karlin and Altschul (1990)]의 알고리즘이며, 문헌 [Karlin and Altschul (1993)]에서와 같이 변형되었다. 이러한 알고리즘은 문헌 [Altschul et al., (1990)]의 BLASTN 및 BLASTX 프로그램에 혼입된다. BLAST 검색은 핵산 또는 단백질 데이터베이스에서 질의 서열과 상동인 (유사한) 서열을 확인하는데 편리하게 사용될 수 있다. BLAST 뉴클레오티드 검색이 BLASTN 프로그램, 점수 = 100, 워드 길이 = 12로 수행되어, 본 발명의 청구된 핵산 분자에 대해 상동성을 갖는 뉴클레오티드 서열이 확인될 수 있다. BLAST 단백질 검색이 BLASTX 프로그램, 점수 = 50, 워드 길이 = 3으로 수행되어, 본 발명의 청구된 살곤충 단백질 분자에 대한 상동성을 갖는 아미노산 서열이 확인될 수 있다.
비교 목적으로 갭이 있는 정렬을 수득하기 위해, 갭드(Gapped) BLAST가 문헌 [Altschul et al., (1997)]에 기재된 바와 같이 사용될 수 있다. 대안적으로, PSI-Blast를 사용하여 분자 사이의 먼 관계를 검출하는 반복 검색을 수행할 수 있다 (Altschul et al., (1997)). BLAST, 갭드 BLAST 및 PSI-Blast 프로그램을 사용하는 경우, 각 프로그램 (예를 들어, BLASTX 및 BLASTN)의 디폴트 파라미터가 사용될 수 있다. www.ncbi.nlm.nih.gov를 참조한다. 정렬은 또한 검사에 의해 수동으로 수행될 수 있다.
서열 비교에 사용되는 수학적 알고리즘의 비제한적 예는 클러스탈W(ClustalW) 알고리즘이다 (Thompson et al., (1994)). 클러스탈W는 서열을 비교하고, 아미노산 또는 DNA 서열의 전체를 정렬하고, 그에 따라 전체 아미노산 서열 또는 뉴클레오티드 서열의 서열 보존에 관한 데이터를 제공할 수 있다. 클러스탈W 알고리즘은 여러 개의 상업적으로 입수가능한 DNA/아미노산 분석 소프트웨어 패키지, 예컨대 벡터 NTI 프로그램 스위트(Vector NTI Program Suite) (인비트로젠, 인크.(Invitrogen, Inc.), 캘리포니아주 칼스배드)의 ALIGNX 모듈에서 사용된다. 아미노산 서열을 ALIGNX로 정렬한 경우, 갭 개방 페널티 10, 갭 연장 페널티 0.1 및 blosum63mt2 비교 매트릭스를 갖는 디폴트 설정을 편리하게 사용할 수 있다. 2개의 단백질 서열을 ALIGNX로 정렬한 후에, 2개의 서열 사이의 아미노산 유사성 (컨센서스) 또는 동일성 퍼센트가 평가될 수 있다. 2개의 DNA 서열을 ALIGNX로 정렬한 경우, 갭 개방 페널티 15, 갭 연장 페널티 6.6 및 swgapdnamt 비교 매트릭스를 갖는 디폴트 설정을 편리하게 사용할 수 있다. 2개의 DNA 서열을 ALIGNX로 정렬한 후에, 2개의 서열 사이의 동일성 퍼센트가 평가될 수 있다.
클러스탈W 정렬의 분석에 유용한 소프트웨어 프로그램의 제2 비제한적 예는 GeneDoc™이다 (칼 니콜라스(Karl Nicholas)에 의해 개발됨, http://iubio.bio.indiana.edu/soft/molbio/ibmpc/genedoc-readme.html). GeneDoc™은 다수의 단백질 사이의 아미노산 (또는 DNA) 유사성 및 동일성의 평가를 가능하게 한다.
서열의 비교에 사용되는 수학적 알고리즘의 또 다른 비제한적 예는 문헌 [Myers and Miller (1988)]의 알고리즘이다. 이러한 알고리즘은 wEMBOSS 서열 정렬 소프트웨어 패키지 (http://emboss.sourceforge.net/에서 입수가능함)의 일부인 wSTRETCHER 프로그램에 포함된다. STRETCHER은 선형 공간을 사용하는 전형적인 동적 프로그래밍 알고리즘의 변형을 사용하여 2개의 서열의 최적 전체 정렬을 계산한다. 출력은 표준 정렬 파일이다. 정렬의 계산에 사용되는 치환 매트릭스, 갭 삽입 페널티 및 갭 연장 페널티는 명시될 수 있다. 뉴클레오티드 서열의 비교를 위해 STRETCHER 프로그램을 사용할 때, 갭 개방 페널티 16 및 갭 연장 페널티 4가 사용될 수 있다. DNA 서열을 비교하기 위한 점수화 매트릭스 파일은 EDNAFULL이다. 아미노산 서열의 비교에 사용될 때, 갭 개방 페널티 12 및 갭 연장 페널티 2가 사용될 수 있다. 단백질 서열을 비교하기 위한 점수화 매트릭스 파일은 EBLOSUM62이다.
서열의 비교에 사용되는 수학적 알고리즘의 추가의 비제한적 예는 문헌 [Needleman and Wunsch (1970)]의 알고리즘이며, 이는 서열 정렬 소프트웨어 패키지 갭(GAP) 버전 10 및 wNEEDLE (http://emboss.sourceforge.net/)에 혼입된다. 갭 버전 10은 하기 파라미터를 사용하여 서열 동일성 또는 유사성을 결정하는데 사용될 수 있다: 뉴클레오티드 서열의 경우, % 동일성 및 % 유사성은 갭 가중치 50 및 길이 가중치 3, 및 nwsgapdna. cmp 점수화 매트릭스를 사용하여 확인된다. 아미노산 서열 비교의 경우, % 동일성 및 % 유사성은 갭 가중치 8 및 길이 가중치 2, 및 BLOSUM62 점수화 프로그램을 사용하여 결정된다. wNEEDLE는 2개의 입력 서열을 판독하고, 그의 전체 길이를 따라 최적 정렬 (갭 포함)을 찾아내고, 그의 최적 전체 서열 정렬을 파일에 기록한다. 알고리즘은 모든 가능한 정렬을 찾아내어 최선의 것을 선택함으로써 정렬이 최적이 되도록 하는 동적 프로그래밍 방법을 사용한다. 모든 가능한 잔기 또는 뉴클레오티드 매치에 대한 값을 함유하는 점수화 매트릭스가 판독된다. wNEEDLE는 최대의 가능한 점수를 갖는 정렬을 찾아내며, 여기서 정렬의 점수는 점수화 매트릭스로부터 취해진 매치의 합에서 정렬된 서열 내의 갭의 개방 및 연장에서 생기는 페널티를 차감한 것과 동일하다. 치환 매트릭스 및 갭 개방 및 연장 페널티는 사용자-명시된다. 아미노산 서열이 비교될 때, 디폴트 갭 개방 페널티 10, 갭 연장 페널티 0.5, 및 EBLOSUM62 비교 매트릭스가 사용된다. DNA 서열을 wNEEDLE를 사용하여 비교한 경우, 갭 개방 페널티 10, 갭 연장 페널티 0.5, 및 EDNAFULL 비교 매트릭스가 사용된다.
등가의 프로그램이 또한 사용될 수 있다. "등가의 프로그램"은 임의의 2개의 당해 서열에 대해, ALIGNX, wNEEDLE, 또는 wSTRETCHER에 의해 생성된 상응하는 정렬과 비교한 경우 동일한 뉴클레오티드 잔기 매치 및 동일한 서열 동일성 퍼센트를 갖는 정렬을 생성시키는 임의의 서열 비교 프로그램을 의도한다. % 동일성은 보고된 정렬된 영역 (길이에서 임의의 갭을 포함함) 상에서의 2개의 서열 사이의 동일한 매치의 백분율이고, % 유사성은 보고된 정렬된 영역 (길이에서 임의의 갭을 포함함) 상에서의 2개의 서열 사이의 매치의 백분율이다.
독소 단편 및 등가물. 예시적인 독소의 살충 활성을 보유하는 단편 및 등가물은 본 발명의 범위 내에 포함될 것이다. 또한, 유전자 코드의 축중성으로 인해, 다양한 상이한 DNA 서열이 본원에 개시된 아미노산 서열을 코딩할 수 있다. 동일한, 또는 본질적으로 동일한 독소를 코딩하는 이들 대안적 DNA 서열을 생성하는 것은 관련 기술분야의 숙련된 통상의 기술자의 기술 내에 충분히 포함된다. 이들 변이체 DNA 서열은 본 발명의 범위 내에 포함된다. 본원에 사용된 "본질적으로 동일한" 서열의 언급은 살충 활성에 실질적으로 영향을 미치지 않는 아미노산 치환, 결실, 부가 또는 삽입을 갖는 서열을 지칭한다. 살충 활성을 보유한 단편이 이 정의에 또한 포함된다.
변경은 생물학적 활성을 유지하는 폴리펩티드를 발생시키도록 본 발명의 살곤충 단백질 및 변이체의 아미노 또는 카르복시 말단에서 만들어질 수 있다. 단편 또는 생물학적 활성 부분은 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40에 제시된 아미노산 서열과 충분히 동일한 아미노산 서열을 포함하는 폴리펩티드 단편을 포함한다. 델타 내독소 단백질의 생물학적 활성 부분은 길이가 예를 들어 10, 25, 50, 100개 또는 그 초과의 아미노산인 폴리펩티드일 수 있다. 이러한 생물학적 활성 부분은 관련 기술분야에 널리 공지된 재조합 단백질 조작 기술에 의해 제조될 수 있고, 살곤충 활성에 대해 평가될 수 있다. 살충 활성을 측정하는 방법은 관련 기술분야에 널리 공지되어 있다. 본원에 사용된 단편은 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40의 적어도 8개의 인접 아미노산을 포괄한다. 그러나, 본 발명은 다른 단편, 예컨대 약 10, 20, 30, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100 ,1150, 또는 1200개 초과의 아미노산, 최대로 서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40의 살곤충 단백질 또는 변이체 단백질의 전장까지의 단백질 내의 임의의 단편을 포괄한다.
개선된 생물학적 활성, 해충 스펙트럼 또는 저항성 곤충 집단을 방제하는 능력을 갖는 단편이 또한 본 발명에 제공된다. 변형은 개선된 포어 형성 및 이에 의해 살충 활성을 갖는 단편이 생산되도록 Cry 단백질에 대해 이루어질 수 있다. 3-도메인 Cry 단백질의 경우, 도메인 1은 감수성 곤충의 중장에서 포어 형성에 관여하는 7개의 α-나선으로 구성된다. 개선된 활성을 갖는 변형된 DIG 단백질은 도메인 1의 α-헬릭스 1 및 α-헬릭스 2에 대해 추정 2차 구조 상동성을 갖는 영역에 N-말단 결실을 갖도록 설계될 수 있다.
이들 독소의 활성 단편을 직접적으로 수득하기 위하여 프로테아제가 사용될 수 있다. 본 발명의 살곤충 독소의 단편은 적어도 약 15, 25, 30, 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 800, 900, 1000, 1100 또는 1200개의 인접 아미노산, 또는 최대로 본 발명의 전장 살곤충 독소 내에 존재하는 총 개수의 아미노산 (예를 들어, 서열식별번호: 2의 경우 625개 아미노산 또는 서열식별번호: 4의 경우 625개 아미노산)을 포함할 것이다.
코어 독소 및 전독소 키메라. 대다수의 바실루스 투린기엔시스 델타-내독소 결정 단백질 분자는 2개의 기능적 절편으로 구성된다. 프로테아제-저항성 코어 독소는 제1 절편이고, 단백질 분자의 약 제1 절반부에 상응한다. 분자의 대략 C-말단 절반부가 제2 절편이다. 본 출원의 목적을 위해, 이 제2 절편은 "전독소 절편"으로서 본원에 지칭될 것이다. 전독소 절편은 독소 결정 형성에 참여하는 것으로 여겨진다 (Arvidson et al., (1989)). 전체 130 kDa의 독소 분자는 곤충의 장에서 프로테아제에 의해 저항성 코어 절편으로 신속하게 프로세싱된다. 따라서 전독소 절편은 독소 분자의 프로테아제 프로세싱을 감소시킴으로써 (Haider et al., (1986)) 또는 독소 용해도를 감소시킴으로써 (Aronson et al., (1991)) 곤충에 대한 코어의 접근성을 제한함으로써 독소에 대한 부분적 곤충 특이성을 전달할 수 있다.
Cry1Fa와 Cry1Ab의 독소 도메인 내에서 유리하게 연결된 키메라 단백질이 보고되었다 (미국 특허 번호 5,527,883). 구역 내의 다른 성공도 문헌에서 보고되었다. 예를 들어, 하이브리드 델타-내독소의 구축이 하기 관련 기술분야에서 보고된다. 국제 특허 출원 공개 번호 WO 95/30753은 Cry1F의 비-독성 전독소 단편이 미국 특허 번호 5,128,130에 개시된 Cry1Ac/Cry1Ab로부터의 비-독성 전독소 단편으로 대체된 슈도모나스 플루오레센스에서의 생산을 위한 하이브리드 비. 투린기엔시스 델타-내독소의 구축을 개시한다. 그 특허는 또한 Cry1Ac의 비-독성 전독소 절편의 부분이 Cry1Ab의 상응하는 비-독성 전독소 단편으로 대체된 피. 플루오레센스에서의 생산을 위한 하이브리드 비. 투린기엔시스 델타-내독소의 구축을 개시한다. 미국 특허 번호 5,055,294는 피. 플루오레센스에서의 생산을 위한 Cry1Ac (아미노산 잔기 1-466)와 Cry1Ab (아미노산 잔기 466-1155) 사이의 특정 하이브리드 델타-내독소의 구축을 개시한다. 상기 언급된 특허는 활성 독소 절편 내의 하이브리드 독소의 구축은 개시하였으나, 하이브리드 독소의 살곤충 활성과 관련하여 어떠한 구체적 내용도 제시하지 않았다. 국제 특허 출원 공개 번호 WO 95/30752는 Cry1C의 비-독성 전독소 절편이 Cry1Ab로부터의 비-독성 전독소 절편으로 대체된 피. 플루오레센스에서의 생산을 위한 하이브리드 비. 투린기엔시스 델타-내독소의 구축을 개시한다. 상기 언급된 출원은 하이브리드 델타-내독소의 스포도프테라 엑시구아에 대한 활성이 모 활성 독소, Cry1C의 것보다 개선됨을 추가로 개시한다. 국제 특허 출원 공개 번호 WO 95/06730은 도메인 3에 커플링된 Cry1E의 도메인 1 및 2 및 Cry1C의 비-독성 전독소 절편으로 이루어진 하이브리드 비. 투린기엔시스 델타-내독소의 구축을 개시한다. 만두카 섹타 (Cry1C 및 Cry1E에 대해 감수성임), 스포도프테라 엑시구아 (Cry1C에 대해 감수성임) 및 마메스트라 브라시카에 (Cry1C에 대해 감수성임)에 대해 수행된 곤충 생물검정은 Cry1E/Cry1C 하이브리드 독소가 엠. 섹타, 에스. 엑시구아 및 엠. 브라시카에에 대해 활성임을 보여준다. 생물검정 결과는 LC50 값 (50% 사망률을 제공하는 독소 농도)보다는 EC50 값 (50% 성장 감소를 제공하는 독소 농도)으로 표현되었다. 생물검정에 사용된 델타-내독소가 비. 투린기엔시스에서 생산되었을지라도, 오직 델타-내독소의 인공-생성 활성 절편이 이용되었으며, 상업적 비. 투린기엔시스 제제에 존재하는 비. 투린기엔시스에 의해 전형적으로 생산된 자연-생산된 결정은 이용되지 않았다. 생물검정 결과는 에스. 프루기페르다에 대해 하이브리드 Cry1E/Cry1C 결정의 LC50 값이 본래 Cry1C보다 1.5 내지 1.7배 더 낮다는 것을 (즉, 보다 활성임을) 나타내었다. 하이브리드 독소의 활성 또는 유용성와 관련하여 데이터가 제공되지는 않았으나, 이 기술은 또한 Cry1Ab (도메인 1 및 2) 및 Cry1C (도메인 3 및 비-독성 전독소 절편) 사이의 하이브리드 비. 투린기엔시스 델타-내독소의 구축을 개시한다.
문헌 [Lee et al., (1995)]은 활성 독소 절편 내의 Cry1Ac와 Cry1Aa 사이의 하이브리드 비. 투린기엔시스 델타-내독소의 구축을 보고한다. 하이브리드 독소의 인공 생성 활성 절편이 감수성 곤충 솔가장자리 막 소포 (BBMV)에서의 단백질 상호작용을 시험하는데 사용되었다. 하이브리드 독소의 생물활성은 보고되지 않았다. 문헌 [Honee et al., (1991)]은 Cry1C (도메인 1)와 Cry1Ab (도메인 2 및 3) 사이의 하이브리드 델타-내독소 및 Cry1Ab (도메인 1)와 Cry1C (도메인 2 및 3) 사이의 상호 하이브리드의 구축을 보고한다. 이들 하이브리드는 감수성 곤충에 대한 활성의 임의의 유의한 증가를 보여주는데 실패하였다. 게다가, Cry1C (도메인 1)/Cry1Ab (도메인 2 및 3) 하이브리드 독소는 프로테아제 분해에 대해 과다감수성인 것으로 밝혀졌다. 감수성 곤충 유충에 대해 활성의 어떠한 유의한 증가도 관찰되지 않았으나, 문헌 [Schnepf et al., (1990)]의 보고는 도메인 2의 작은 부분이 Cry1Aa의 상응하는 영역으로 대체된 Cry1Ac 하이브리드 독소의 구축을 개시한다.
본 발명의 키메라 독소는 B.t. 독소의 전체 코어 N-말단 독소 부분을 포함하고, 독소 부분의 말단을 지난 일부 지점에서 단백질은 이종 전독소 서열로의 전이를 갖는다. 이종 전독소 절편으로의 전이는 대략 천연 독소/전독소 접합부에서 발생할 수 있거나, 또는 천연 전독소의 부분 (독소 부분을 지나 연장됨)이 하류에서 발생하는 이종 전독소로의 전이와 함께 유지될 수 있다. 예를 들어, 본 발명의 키메라 독소는 변형된 Cry1Ca 독소, 예컨대 DIG-473 또는 DIG-465의 아미노산 1-628의 전체 독소 부분 및 이종 전독소 절편 (아미노산 629에서 C-말단까지)을 가질 수 있다. 바람직한 실시양태에서, 이종 전독소 절편 부분은 Cry1Ab로부터 가져온다.
관련 기술분야의 통상의 기술자라면, 심지어 특정 부류 내의 B.t. 독소가 길이 및 코어 독소 부분으로부터 전독소 부분으로의 정확한 전이 위치가 어느 정도 달라질 것임을 이해할 것이다. 코어 독소 부분에서 전독소 부분으로의 전이는 전형적으로 전장 독소의 약 50% 내지 약 60%에서 일어날 것이다. 본 발명의 키메라 독소는 이 코어 N-말단 독소 부분의 전체 연장부를 포함하고, 이는 IRDIG544.12 살곤충 독소 단백질의 전체 628개 아미노산 길이이다. 본 발명의 한 실시양태에서 서열식별번호: 15는 DIG-465-코딩 DNA의 1887개 뉴클레오티드 서열을 개시하며, 그의 5'-말단 1887개 뉴클레오티드는 돌연변이 L57A (아미노산 위치 57에 있는 류신이 알라닌으로 치환됨)를 갖는 Cry1Ca의 코어 독소 절편에 대한 코딩 영역을 포함한다. 서열식별번호: 16은 전장 DIG-465의 폴리펩티드 628개 아미노산 서열을 개시하며, Cry1Ca의 N-말단 코어 부분은 상기 언급된 아미노산 치환을 갖는다. 본 발명의 또 다른 대상에서 서열식별번호: 23은 돌연변이 F596M (아미노산 위치 596에 있는 페닐알라닌이 메티오닌으로 치환됨)을 갖는 Cry1Ca의 코어 독소 절편에 대한 코딩 영역을 포함하는 DIG-473-코딩 DNA의 1887개 뉴클레오티드 서열을 개시한다. 서열식별번호: 24는 상기 언급된 아미노산 치환을 갖는 Cry1Ca의 부분을 포함하는 전장 DIG-473 폴리펩티드의 628개 아미노산 서열을 개시한다.
전독소 부분과 관련하여, 천연 Cry1Ab 전독소 부분의 전체 연장부는 Cry1Ab 전장 단백질의 독소 부분의 말단으로부터 분자의 C-말단까지 연장된다. 이 전독소의 마지막의 약 100 내지 150개 아미노산이 주의를 끌며, 이를 본 발명의 키메라 독소 내에 포함시키는 것이 중요하다.
Cry 단백질이 선택적 살곤충 활성을 가지고 있기 때문에, 대부분은 제한된 범위의 표적 해충에 대해 활성이다. 따라서, Cry 단백질의 생물학적 활성 특성을 추가로 개선시킬 필요가 있다. 특유한 결합 특성 및 작용 방식을 갖는 Cry 단백질이 방제되는 곤충 해충의 범위를 확대하거나 B.t. 저항성 발생에 대항하기 위한 전략에 유용하다.
도메인 III 변형. 본원에 기재된 바와 같이, 본 발명의 B.t. 살곤충 독소는 3-도메인 유형 독소이고, 도메인 I, 도메인 II 및 도메인 III를 포함한다. 도메인 III는 특정 부류의 수용체 단백질에 결합하며, 아마도 올리고머 독소 프리-포어의 삽입에 참여할 것이다. 도메인 III 치환을 포함하는 특정 하이브리드 독소는 스포돕테라 엑시구아에 대해 우수한 독성을 갖는 것으로 밝혀졌으며 (de Maagd et al., 1996), Cry 독소 도메인 교환의 설계에 대한 지침이 존재한다 (Knight et al., 2004).
도메인 I 변형. 생화학적 및 분자 접근법을 사용하는 수많은 연구는 Cry 단백질 결합 및 곤충 중장 막으로의 삽입의 결정자에 관한 정보를 제공하였다 (문헌 [Piggot and Ellar, 2007]에서 검토됨). Cry1A 및 Cry3A 단백질로부터의 도메인 I이 막에서의 삽입 및 포어 형성 능력에 대해 연구되었다. 도메인 I의 α-나선 4 및 5가 막 삽입 및 포어 형성에서 중요한 역할을 하고 (Walters et al., 1993, Gazit et al., 1998; Nunez-Valdez et al., 2001), 이때 다른 나선은 우산살과 같이 막 표면과 접촉하는 것으로 제안되었다 (Gazit et al., 1998).
알파-나선 3은 일부 경우에 올리고머 프리-포어 형성 및 독성에 요구되는 것으로 보인다. 일부 α-나선 3 돌연변이체는 수용체에 결합할 수 있으나 올리고머를 형성하지 않고, 만두카 섹타에 대해 비-독성이다 (문헌 [Jimenez-Juarez et al., 2008]에서 검토됨). 그러나, Cry3Aa1의 단백질분해 활성 형태는 α-나선 1, 2 및 3이 결여되어 있다 (Carroll et al., 1997).
알파-나선 1은 수용체 결합에 따라 제거된다. 문헌 [Gomez et al., (2002)]에서, BBMV 수용체 결합 시 형성된 Cry1Ab 올리고머에 도메인 I의 α-나선 1 부분이 결여되어 있음이 발견되었다. 또한, 문헌 [Soberon et al., (2007)]에서, 3차원 Cry 구조 상에서 α-나선 1을 둘러싸는 대략 60개의 아미노산이 결여되어 있는 Cry1Ab 및 Cry1Ac의 N-말단 결실 돌연변이체가 분자량 약 60 kDa의 단량체들을 카드헤린 결합의 부재 하에 프리-포어로 조립할 수 있는 것으로 나타났다. 이들 N-말단 결실 돌연변이체는 Cry-저항성 곤충 유충에 대해 활성인 것으로 보고되었다. 또한, 문헌 [Diaz-Mendoza et al., (2007)]은 지중해 옥수수 천공충 (세사미아 노나그리오이데스(Sesamia nonagrioides))에 대한 활성을 보유한 43 kDa 및 46 kDa의 Cry1Ab 단편이 기재하였다. 이들 단편은 아미노산 잔기 116 내지 423을 포함하는 것으로 입증되었지만, 정확한 아미노산 서열은 밝혀지지 않았으며, 이들 단백질 분해 단편의 활성 메카니즘은 공지되어 있지 않다. 문헌 [Gomez et al., (2002), Soberon et al., 2007 및 Diaz-Mendoza et al., (2007)]에서의 결과는 Cry1Ab의 N-말단으로부터의 아미노산 36개의 결실이 살곤충 활성의 상실을 초래하였음이 보고된 문헌 [Hofte et al., (1986)]에서의 결과와 대조적이다.
항-독소 항체. 등가의 독소 및/또는 이들 등가의 독소를 코딩하는 유전자는 본원에 제공된 교시를 사용하여 바실루스 투린기엔시스 단리물 및/또는 DNA 라이브러리로부터 유래될 수 있다. 본 발명의 살충 독소를 수득하기 위한 다수의 방법이 존재한다. 예를 들어, 본원에 개시된 및 청구된 살충 독소에 대해 면역반응성인 항체는 다른 독소를 단백질의 혼합물로부터 확인 및 분리하는데 사용될 수 있다. 특히, 항체는 가장 불변하고 다른 B.t. 독소와 가장 구분되는 독소의 부분에 대해 생성될 수 있다. 이어서 이들 항체는 예를 들어 면역침전, 효소 연결 면역흡착 검정 (ELISA), 또는 이뮤노블롯팅 (웨스턴 블롯팅)에 의해 특징적 활성을 갖는 등가의 독소를 구체적으로 확인하는 데 사용될 수 있다. 본원에 개시된 독소 또는 등가의 독소, 또는 이들 독소의 단편에 대한 항체를 관련 기술분야에서의 표준 절차를 사용하여 용이하게 제조할 수 있다. 이들 독소를 코딩하는 유전자는 이어서 독소를 생산하는 미생물로부터 수득될 수 있다.
B.t. 살곤충 독소가 단리되면, 그 독소에 특이적인 항체가 관련 기술분야에 널리 공지된 통상적인 방법에 의해 발생될 수 있다. 수주 또는 수개월의 기간에 걸친 선택된 숙주 내로의 반복 주입은 면역 반응을 유발하여 유의한 항-B.t. 독소의 혈청 역가를 발생시킨다. 바람직한 숙주는 포유동물 종이고, 보다 고도로 바람직한 종은 토끼, 염소, 양 및 마우스이다. 이러한 면역화 동물로부터 채혈된 혈액은 B.t. 살곤충 독소와 반응성인 항혈청 (폴리클로날 항체)을 수득하기 위하여 확립된 방법에 의해 처리될 수 있다. 그 후 항혈청은 관련 기술분야에 공지된 기술에 따라 독소에의 흡착에 의해 친화성 정제될 수 있다. 친화성 정제된 항혈청을 관련 기술분야에 공지된 절차를 사용하여 항혈청 내의 이뮤노글로불린 분획을 단리시킴으로써 추가로 정제할 수 있다. 생성된 물질은 B.t. 살곤충 독소와 반응성인 이뮤노글로불린의 불균질한 집단이다.
항-B.t. 독소 항체는 또한 면역원성 담체에 접합된 B.t. 살곤충 독소의 합성 펩티드 단편으로 이루어진 반합성 면역원을 제조함으로써 생성될 수 있다. 펩티드 단편의 제조에 유용한 다수의 방식 및 기기가 관련 기술분야에 널리 공지되어 있다. 다수의 적합한 면역원성 담체, 예컨대 소 혈청 알부민 (BSA) 또는 키홀 림펫 헤모시아닌이 또한 관련 기술분야에 널리 공지되어 있으며, 이는 면역원 및 담체 단백질을 커플링시키는 기술이 그러한 바와 같다. 반합성 면역원이 구축되면, B.t. 살곤충 독소 단편에 특이적인 항체의 제조 절차는 천연 B.t. 독소와 반응성인 항체의 제조에 사용되는 것과 동일하다.
항-B.t. 독소 모노클로날 항체 (MAb)는 정제된 B.t. 살곤충 독소를 사용하여 용이하게 제조된다. MAb를 제조하는 방법은 15년에 걸쳐 실행되었으며, 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 아주반트 중 정제된 B.t. 살곤충 독소의 반복된 복강내 또는 피하 주사는 대부분의 동물에서 면역 반응을 유발한다. 고면역화된 B-림프구를 동물로부터 제거하고 무기한 배양이 가능한 적합한 융합 파트너 세포주와 융합시킨다. B-림프구가 과다면역화되고 MAb의 생성에 사용될 수 있는 바람직한 동물은 포유동물이다. 보다 바람직한 동물은 래트 및 마우스이며, 가장 바람직한 것은 BALB/c 마우스 계통이다.
다수의 포유동물 세포주가 하이브리도마의 생산에 적합한 융합 파트너이다. 다수의 이러한 세포주는 아메리칸 타입 컬쳐 콜렉션 (American Type Culture Collection; ATCC, 버지니아주 마나사스) 및 상업적 공급업체로부터 입수가능하다. 바람직한 융합 파트너 세포주는 마우스 골수종 및 HL-1® 프렌들리(Friendly) 골수종-653 세포주 (벤트렉스 (Ventrex), 메인주 포틀랜드)가 가장 바람직하다. 융합되면, 생성된 하이브리도마를 1 내지 2주 동안 선택 성장 배지 중에서 배양한다. 2가지 널리 공지된 선택 시스템이 비융합 골수종 세포의 제거, 또는 혼합 하이브리도마 배양물로부터의 골수종 세포들 사이의 융합에 이용가능하다. 선택 시스템을 선택하는 것은 면역화된 마우스의 계통 및 사용되는 골수종 융합 파트너에 따른다. 문헌 [Taggart and Samloff, (1983)]에 기술된 AAT 선택 시스템이 사용될 수 있으나; 상기 언급된 바람직한 마우스 계통 및 융합 파트너와의 상용성으로 인해, 문헌 [Littlefield, (1964)]에 기재된 HAT (하이포크산틴, 아미노프테린, 티미딘) 선택 시스템이 바람직하다. 이어서, 소비된 성장 배지를 면역특이적 MAb 분비에 대하여 스크리닝한다. 효소 결합 면역흡착 검정 (ELISA) 절차가 이 목적에 최상으로 적합하지만, 큰 부피의 스크리닝용으로 수정된 방사면역검정이 또한 허용된다. 상당한 수의 관계없는 또는 덜 요망되는 배양을 연속적으로 줄이도록 설계된 다수의 스크린이 수행될 수 있다. B.t. 살곤충 독소와 반응성인 MAb를 분비하는 배양물은 공지된 B.t. 살곤충 독소와의 교차 반응성에 대해 스크리닝될 수 있다. 바람직한 B.t. 살곤충 독소에 우선적으로 결합하는 MAb는 상업적으로 입수가능한 분석물을 이용하여 이소타이핑될 수 있다. 바람직한 MAb는 IgG 부류이고, 더욱 고도로 바람직한 MAb는 IgG1 및 IgG2a 하위이소형이다.
바람직한 MAb를 분비하는 하이브리도마 배양물은 단클론성 및 안정성을 확립하기 위하여 수회 서브클로닝될 수 있다. 진핵성, 비-부착 세포 배양물을 서브클로닝하는 널리 공지된 방법은 한계 희석, 연질 아가로스 및 형광 활성 세포 분류 기술을 포함한다. 각각의 서브클로닝 후, 생성된 배양물은 바람직하게는 항체 분비 및 이소형에 대하여 재분석하여 안정한 바람직한 MAb-분비 배양물이 확립되었음을 보장한다.
항-B.t. 독소 항체는 본 발명의 청구된 B.t. 살곤충 독소 및 그의 변이체 또는 단편을 검출하는 다양한 방법에서 유용하다. 리포팅 기로 표지된 항체가 다양한 환경에서 항원의 존재를 확인하는데 사용될 수 있다는 것이 널리 공지되어 있다. 방사성동위원소로 표지된 항체가 큰 정확성 및 감수성으로 다양한 생물 유체 중 항원의 존재의 확인을 위하여 방사선면역검정에서 수십년 동안 사용되었다. 보다 최근에는, 효소 표지된 항체가 ELISA 검정에서 방사성표지된 항체의 대용물로서 사용되었다. 또한, 본 발명의 B.t. 살곤충 독소에 대하여 면역반응성인 항체는 고정화 물질, 예컨대 폴리스티렌 웰 또는 입자에 결합시켜 면역검정에서 사용하여 B.t. 독소가 시험 샘플에 존재하는지를 결정할 수 있다.
하나의 바람직한 실시양태에서, 살곤충 단백질 또는 변이체는 본 발명의 독소를 발현하는 핵산 서열을 포함하는 트랜스제닉 식물을 통해 경구로 전달된다. 본 발명은 본 발명의 핵산 분자를 식물 내로 도입하는 단계를 포함하며, 여기서 독소는 곤충을 방제하는데 유효한 양으로 트랜스제닉 식물에서 발현가능한 것인, 곤충-저항성 트랜스제닉 식물을 생산하는 방법을 제공한다. 비제한적 예에서, 기본 클로닝 전략은 전장 또는 변형 Cry 코딩 서열 (CDS)을 NcoI 및 SacI 제한 부위에서 식물 발현 플라스미드 내로 서브클로닝하는 것일 수 있다. 예를 들어, 게이트웨이(Gateway)® 기술 또는 표준 제한 효소 단편 클로닝 절차를 사용하여 식물 발현 요소 (예를 들어, 식물 발현가능한 프로모터, 3' 말단 전사 종결 및 폴리아데닐레이트 부가 결정자 등)의 제어 하에 적절한 Cry 코딩 영역을 함유하는 생성된 식물 발현 카세트를 이원 벡터 플라스미드 내로 서브클로닝한다. 게이트웨이® 기술이 사용되는 경우, 예를 들어, LR 클로나제(LR Clonase)™ (인비트로젠)를 사용하여 전장 및 변형된 유전자 식물 발현 카세트를 이원 식물 형질전환 플라스미드로 재조합시킬 수 있다. 플라스미드가 이. 콜라이 및 아그로박테리움 세포에 존재하는 경우, 항생제 스펙티노마이신에 대한 저항성을 부여하는 박테리아 유전자를 보유하는 이원 식물 형질전환 벡터를 사용하는 것이 편리하다. 목적하는 숙주 식물에서 기능적인 식물-발현가능한 선택 마커 유전자를 함유하는 이원 벡터 플라스미드를 사용하는 것이 또한 편리하다. 식물-발현성 선택 마커 유전자의 예는 항생제 카나마이신, 네오마이신 및 G418에 대한 저항성을 코딩하는, 트랜스포손 Tn5의 아미노글리코시드 포스포트랜스퍼라제 유전자 (Aph II) 뿐만 아니라 글리포세이트; 히그로마이신; 메토트렉세이트; 포스피노트리신 (비알라포스), 이미다졸리논, 술포닐우레아 및 트리아졸로피리미딘 제초제, 예컨대 클로로술푸론, 브로목시닐, 달라폰 등에 대한 내성을 코딩하는 유전자를 포함하나, 이에 제한되지는 않는다.
대안적으로, DIG-465, DIG-473, DIG-468, DIG-483, DIG-462, DIG-463, DIG-464, DIG-466, DIG-467, DIG-469, DIG-474, DIG-482, DIG-485, DIG-487, IRDIG544.8, IRDIG544.9, IRDIG544.11, 또는 IRDIG544.12 유전자 삽입물을 함유하는 이원 식물 형질전환 벡터의 플라스미드 구조물은 아그로박테리움 조작 분야의 통상의 기술자에게 널리 공지된 표준 분자 생물학 방법에 의해 후보 아그로박테리움 단리물로부터 제조된 플라스미드 DNA의 제한 소화 핑거프린트 맵핑에 의해 수행된다.
아그로박테리움-매개된 형질전환 방법을 통해 형질전환 식물을 수득하는 관련 기술분야의 통상의 기술자는 Z707S 이외의 다른 아그로박테리움 균주가 사용될 수 있다는 것 및 균주의 선택이 형질전환시키고자 하는 숙주 식물 종의 동일성에 좌우될 수 있다는 것을 이해할 것이다.
다음은 본 발명을 실시하기 위한 절차를 설명하는 예이다. 이들 실시예는 제한하는 것으로 간주되지 않아야 한다. 달리 언급되지 않는 한 모든 백분율은 중량 기준이고, 모든 용매 혼합물 비율는 부피 기준이다. 본원에서 지칭되거나 인용된 모든 특허, 특허 출원, 가출원 및 공개는 본 명세서의 명백한 교시와 상반되지 않는 정도로 그 전체내용이 참조로 포함된다. 구체적으로 나타내거나 시사하지 않는 한, 단수 용어는 본원에 사용된 바와 같은 "적어도 하나"를 의미한다.
실시예 1
B.t. 살곤충 단백질에 대한 코딩 서열의 식물-최적화 버전의 설계
트랜스제닉 단자엽 및 쌍자엽 식물에서 살곤충 단백질을 생산하기 위해 식물 코돈 편향을 갖는 DNA 서열을 설계하고 합성하였다. 메이즈 (제아 메이스 엘.)에 대한 코돈 사용빈도 표를 진뱅크에 기탁된 서열로부터 수득된 706개의 단백질 코딩 서열 (CDS)로부터 계산하였다. 담배 (니코티아나 타바쿰(Nicotiana tabacum), 1268 CDS), 카놀라 (브라시카 나푸스(Brassica napus), 530 CDS), 목화 (고시피움 히르수툼(Gossypium hirsutum), 197 CDS) 및 대두 (글리신 맥스(Glycine max); 약 1000 CDS)에 대한 코돈 사용빈도 표는 웹사이트 http://www.kazusa.or.jp/codon/의 데이터로부터 다운로드받았다. 어느 한 식물 유형에서 아미노산에 대해 총 코돈 사용의 약 10% 미만으로 사용된 임의의 여분 코돈을 생략한 후에, 적절한 가중 평균 상대량으로 메이즈 및 쌍자엽 데이터세트 둘 다에 공통인 고도로 사용된 코돈을 포함하는 편향 코돈 세트를 계산하였다. 살곤충 단백질을 코딩하는 식물 최적화 서열을 유도하기 위해, 살곤충 단백질 DNA 서열에 대한 코돈 치환이, 생성된 DNA 서열이 식물-최적화 코돈 편향 표의 전체 코돈 조성을 갖도록 이루어졌다. 바람직하지 않은 제한 효소 인식 부위, 잠재적 식물 인트론 스플라이스 부위, A/T 또는 C/G 잔기가 길게 이어진 부분, 및 식물 세포에서의 코딩 영역의 RNA 안정성, 전사 또는 번역을 방해할 수 있는 다른 모티프가 제거되도록 서열의 추가의 개량이 이루어졌다. 목적 제한 효소 인식 부위가 도입되고, 긴 내부 오픈 리딩 프레임 (+1 이외의 프레임)이 제거되도록 다른 변화가 이루어졌다. 이들 변화는 모두 식물-편향된 코돈 조성을 유지하는 제약 내에서 이루어졌다. 설계를 완성하기 위해, 모든 6개의 오픈 리딩 프레임에서 번역 정지 코돈을 코딩하는 서열을 코딩 영역의 3' 말단에 부가하고, 적절한 제한 인식 부위를 서열의 5' 및 3' 말단에 부가하였다. 설계된 서열의 합성은 상업적 공급자 (DNA2.0, 캘리포니아주 멘로 파크)에 의해 수행되었다. 합성 유전자의 생산에 관한 추가의 안내는, 예를 들어 WO 97/13402 및 미국 특허 번호 5,380,831에서 찾아볼 수 있다.
본 발명의 DIG 단백질을 코딩하는 식물-최적화 DNA 서열 (서열식별번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 및 40)이 서열식별번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 및 39로 개시된다. 서열식별번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 및 39에 개시된 서열을 포함하는 DNA 분자를 상업적 엔티티 (DNA2.0)로 합성에 의해 조립하였다.
실시예 2
살곤충 독소를 코딩하는 발현 플라스미드의 구축 및 박테리아 숙주에서의 발현.
표준 클로닝 방법을 식물-최적화 코딩 영역에 의해 코딩된 DIG-465 (서열식별번호: 16), DIG-473 (서열식별번호: 24), DIG-468 (서열식별번호: 2), DIG-483 (서열식별번호: 4), DIG-462 (서열식별번호: 10), DIG-463 (서열식별번호: 12), DIG-464 (서열식별번호: 14), DIG-466 (서열식별번호: 18), DIG-467 (서열식별번호: 20), DIG-469 (서열식별번호: 22), DIG-474 (서열식별번호: 26), DIG-482 (서열식별번호: 28), DIG-485 (서열식별번호: 6), 및 DIG-487 (서열식별번호: 8) 단백질을 생산하도록 조작된 슈도모나스 플루오레센스(Pseudomonas fluorescens) (Pf) 발현 플라스미드의 구축에 사용하였다. 제한 엔도뉴클레아제를 뉴 잉글랜드 바이오랩스(New England BioLabs) (NEB; 매사추세츠주 입스위치)로부터 입수하였고, T4 DNA 리가제 (인비트로젠 코포레이션(Invitrogen Corporation), 캘리포니아주 칼스배드)를 DNA 라이게이션에 사용하였다.
기본 클로닝 전략은 DIG-465, DIG-473, DIG-468, DIG-483, DIG-462, DIG-463, DIG-464, DIG-466, DIG-467, DIG-469, DIG-474, DIG-482, DIG-485, 또는 DIG-487 독소 코딩 서열 (CDS)을 pDOW1169에 제한 부위, 예컨대 SpeI 및 XhoI에서 서브클로닝하고, 이에 의해 이것이 플라스미드 pKK223-3 (피엘 파마시아(PL Pharmacia), 위스콘신주 밀워키)으로부터의 Ptac 프로모터 및 rrnBT1T2 터미네이터의 발현 제어 하에 놓이게 되는 것을 수반한다. pDOW1169는 RSF1010 복제 기점, pyrF 유전자, 및 리보솜 결합 부위, 이에 이어서 단백질 코딩 영역을 함유하는 DNA 단편이 도입될 수 있는 제한 효소 인식 부위가 있는 저 카피 플라스미드이다 (미국 특허 출원 US20080193974). 발현 플라스미드를 DC454 (돌연변이 ΔpyrF 및 lsc::lacIQI를 갖는 거의 야생형인 피. 플루오레센스 균주), 또는 그의 유도체 내로 전기천공에 의해 형질전환시키고, SOC-소이 가수분해물 배지에서 회수하고, 선택 배지 (우라실이 결여되어 있는 M9 글루코스 한천, [Sambrook et al., 상기 문헌]) 상에 플레이팅하였다. 미생물학적 조작에 관한 상세내용은 본원에 참조로 포함되는 문헌 [Squires, C. H. et al., (2004)], 미국 특허 출원 20060008877, 미국 특허 출원 20080193974, 및 미국 특허 출원 20080058262에서 이용가능하다. 균주를 미니프렙 플라스미드 DNA의 제한 소화에 의해 검증하였다.
진탕 플라스크에서의 성장 및 발현 분석. 특징화 및 곤충 생물검정을 위한 DIG-465, DIG-473, DIG-468, DIG-483, DIG-462, DIG-463, DIG-464, DIG-466, DIG-467, DIG-469, DIG-474, DIG-482, DIG-485, 또는 DIG-487 독소의 생산을 발현 구축물을 보유하는 진탕-플라스크-성장시킨 피. 플루오레센스 균주에 의해 달성하였다. 1% 글루코스 및 미량 원소가 보충된 M9 배지에서 성장시킨 종자 배양물을 사용하여 5% 글리세롤을 포함하는 50 mL의 규정 최소 배지 (테크노바(Teknova) 카탈로그 번호 3D7426, 캘리포니아주 홀리스터)에 접종하였다. 진탕시키면서 30℃에서 24시간 동안 초기 인큐베이션한 후에 이소프로필-β-D-1-티오갈락토피라노시드 (IPTG)의 첨가에 의해 Ptac 프로모터를 통한 살곤충 단백질 독소 유전자의 발현을 유도하였다. 배양물을 유도 시점에 및 유도후 다양한 시점에 샘플링하였다. 세포 밀도를 600 nm에서의 광학 밀도 (OD600)에 의해 측정하였다. 예를 들어, 문헌 [Huang et al., 2007] 및 미국 특허 출원 20060008877에 기재된 바와 같이, 슈도모나스 플루오레센스의 성장에 적합한 다른 배양 배지를 또한 사용할 수 있다.
진탕 플라스크 샘플의 세포 분획화 및 SDS-PAGE 분석. 각각의 샘플링 시간에, 0.5 mL 분취물을 5분 동안 14000 x g에서 원심분리하였다. 세포 펠릿을 -80℃에서 동결시켰다. 동결된 진탕 플라스크 세포 펠릿 샘플로부터의 가용성 및 불용성 분획을 버그버스터(BugBuster) 마스터 믹스 (EMD밀리포어(EMDMillipore)®, 독일 다름슈타트)를 사용하여 생성하였다. 각각의 세포 펠릿을 0.5 mL 버그버스터 마스터 믹스™ 용액에 재현탁시키고, 30분 동안 실온에서 진탕시키면서 인큐베이션하였다. 샘플을 3분 동안 0.1 mm 유리 비드를 갖는 비드비터를 사용하여 용해시켰다. 용해물을 14,000 rpm에서 5분 동안 원심분리하고, 상청액을 가용성 분획으로서 회수하였다. 이어서 펠릿 (불용성 분획)을 동등 부피의 추출 완충제 (8 M 우레아, 0.5 M NaCl, 25 mM NaPO4, pH 10.4)에 재현탁시켰다.
샘플을 디티오트레이톨 (DTT)을 함유하는 2X 누페이지(NuPAGE) 트리스 글리신 SDS 샘플 완충제 (인비트로젠, 캘리포니아주 칼스배드)와 1:1 혼합하고, 5분 동안 비등시킨 후에 노벡스 4-20% 트리스 글리신 SDS 폴리아크릴아미드 겔 (인비트로젠, 캘리포니아주 칼스배드) 상에 로딩하였다. 전기영동을 권장된 트리스-글리신 완충제 중에서 수행하였다. 겔을 제조업체 (바이오-라드 인크.(Bio-Rad Inc.), 캘리포니아주 허큘레스) 프로토콜에 따라 바이오-세이프(Bio-Safe) 쿠마시 염료로 염색하고, GE 타이푼 시리즈 영상화 시스템 (펜실베니아주 피츠버그)을 사용하여 영상화하였다.
봉입체 제조. Cry 단백질 봉입체 (IB) 제조는, SDS-PAGE 및 MALDI-MS (매트릭스 보조 레이저 탈착/이온화 질량 분광측정법)에 의해 입증되는 바와 같이 불용성 B.t. 살곤충 단백질을 생산하는 피. 플루오레센스 발효물로부터의 세포 상에서 수행하였다. 피. 플루오레센스 발효 펠릿을 37℃ 수조에서 해동시켰다. 세포를 용해 완충제 (50 mM 트리스, pH 7.5, 200 mM NaCl, 20 mM EDTA 이나트륨 염 (에틸렌디아민테트라아세트산), 1% 트리톤 X-100, 및 5 mM 디티오트레이톨 (DTT); 5 mL/L의 박테리아 프로테아제 억제제 칵테일 (P8465 시그마-알드리치(Sigma-Aldrich), 미주리주 세인트 루이스)을 사용 직전에 첨가함)에 25% w/v로 재현탁시켰다. 핸드-헬드 균질화기를 최저 설정으로 사용하여 세포를 현탁시켰다 (티슈 티어러(Tissue Tearor), 바이오스펙 프로덕츠, 인크.(BioSpec Products, Inc.), 오클라호마주 바틀스빌). 리소자임 (25 mg의 시그마-알드리치 L7651, 닭 난백 유래)을 금속 스패튤라를 사용하여 혼합함으로써 세포 현탁액에 첨가하고, 현탁액을 실온에서 1시간 동안 인큐베이션하였다. 현탁액을 얼음 상에서 15분 동안 냉각시키고, 이어서 브랜슨 소니파이어(Branson Sonifier) 250 (2회의 1분의 세션, 50%의 듀티 사이클, 30%의 출력)를 사용하여 초음파처리하였다. 세포 용해를 현미경검사에 의해 체크하였다. 필요한 경우 추가의 25 mg의 리소자임을 첨가하고, 인큐베이션 및 초음파처리를 반복하였다. 세포 용해를 현미경검사에 의해 확인하였을 때, 용해물을 11,500 x g으로 25분 동안 (4℃) 원심분리하여 IB 펠릿을 형성시키고, 상청액을 따라내었다. IB 펠릿을 100 mL 용해 완충제로 현탁시키고, 핸드-헬드 혼합기로 균질화하고, 상기와 같이 원심분리하였다. 상청액이 무색이 되며 IB 펠릿이 단단해지고 회백색의 색이 될 때까지, IB 펠릿을 현탁 (50 mL 용해 완충제 중), 균질화, 초음파처리 및 원심분리에 의해 반복적으로 세척하였다. 최종 세척의 경우, IB 펠릿을 2 mM EDTA를 함유하는 멸균-여과 (0.22 μm) 증류수에 현탁시키고, 원심분리하였다. 최종 펠릿을 2 mM EDTA를 함유하는 멸균-여과 증류수에 현탁시키고, 1 mL 분취물로 -80℃에 저장하였다.
IB 제제 중 단백질의 SDS-PAGE 분석 및 정량화는, IB 펠릿의 1 mL 분취물을 해동시키고, 멸균-여과 증류수로 1:20 희석함으로써 수행하였다. 이어서 희석된 샘플을 4X 환원 샘플 완충제 [250 mM 트리스, pH 6.8, 40% 글리세롤 (v/v), 0.4%의 브로모페놀 블루(Bromophenol Blue) (w/v), 8% SDS (w/v) 및 8% β-메르캅토-에탄올 (v/v)]와 비등시키고, 노벡스® 4-20% 트리스-글리신 상에 로딩하고, 12+2 웰 겔 (인비트로젠)을 1X 트리스/글리신/SDS 완충제 (바이오라드)로 전개시켰다. 겔을 200 볼트에서 60분 동안 전개시킨 다음, 쿠마시 블루(Coomassie Blue) (45% 메탄올, 10% 아세트산 중 50% G-250/50% R-250)로 염색하고, 증류수 중 7% 아세트산, 5% 메탄올로 탈염색하였다. 표적 밴드의 정량화는, 밴드에 대한 밀도측정 값을 동일한 겔 상에서 전개시킨 소 혈청 알부민 (BSA) 샘플에 대하여 비교함으로써 수행하여, 표준 곡선을 생성하였다.
봉입체의 가용화. DIG-465, DIG-473, DIG-468, DIG-483, DIG-462, DIG-463, DIG-464, DIG-466, DIG-467, DIG-469, DIG-474, DIG-482, DIG-485, 또는 DIG-487 단백질을 함유하는 Pf 클론으로부터의 봉입체 현탁액의 6 mL를 에펜도르프 모델 5415C 미세원심분리기 (대략 14,000 x g)의 가장 높은 설정 상에서 원심분리하여 함유물을 펠릿화하였다. 저장 완충제 상청액을 제거하고, 50 mL 원추형 튜브 내에서 25 mL의 100 mM 탄산나트륨 완충제, pH 11로 대체하였다. 함유물을 피펫을 사용하여 재현탁시키고, 볼텍싱하여 철저히 혼합하였다. 튜브를 완만한 요동 플랫폼 상에 4℃에서 밤새 두어 표적 단백질을 추출하였다. 추출물을 30,000 x g에서 4℃에서 30분 동안 원심분리하고, 생성된 상청액을 아미콘(Amicon) 울트라-15 재생 셀룰로오스 원심분리 필터 장치 (30,000의 분자량의 컷오프; 밀리포어)를 사용하여 5배 농축시켰다. 이어서, 샘플 완충제를 일회용 PD-10 칼럼 (지이 헬스케어(GE Healthcare), 뉴저지주 피스카타웨이)을 사용하여 10 mM CAPS [3-(시클로헥사미노)1-프로판술폰산] pH 10으로 변화시켰다.
겔 전기영동. 농축된 추출물을 환원제로서 5 mM 디티오트레이톨을 함유하는 누페이지® LDS 샘플 완충제 (인비트로젠) 중에 1:50 희석함으로써 전기영동을 위해 제조하고, 4분 동안 95℃에서 가열하였다. 샘플을 (표준 곡선 생성을 위해) 0.2 내지 2 μg/레인 범위의 5개의 BSA 표준물과 함께 4-12% 누페이지® 겔의 이중 레인에 로딩하였다. 전압을 트래킹 염료가 겔의 바닥에 도달할 때까지 MOPS SDS 전개 완충제 (인비트로젠)를 사용하여 200V에서 적용하였다. 겔을 45% 메탄올, 10% 아세트산 중 0.2% 쿠마시 블루 G-250으로 염색하고, 배경이 투명해질 때까지 처음에는 간단하게 45% 메탄올, 10% 아세트산으로 탈염색하고 다음에 길게 7% 아세트산, 5% 메탄올로 탈염색하였다. 탈염색 후에, 겔을 바이오라드 플루오르-S 멀티이미저(Fluor-S MultiImager)로 스캐닝하였다. 기기의 퀀터티 원(Quantity One) v.4.5.2 소프트웨어를 사용하여 염색된 단백질 밴드의 배경-차감 부피를 수득하고, BSA 표준 곡선을 생성하였으며, 이를 사용하여 스톡 용액 중 DIG-465, DIG-473, DIG-468, DIG-483, DIG-462, DIG-463, DIG-464, DIG-466, DIG-467, DIG-469, DIG-474, DIG-482, DIG-485, 또는 DIG-487 단백질의 농도를 계산하였다.
DIG-465, DIG-473, DIG-468, DIG-483, DIG-463, DIG-464, DIG-466, DIG-467, DIG-469, DIG-474, DIG-482, DIG-485, 및 DIG-487의 발현 수준을 슈도모나스 플루오레센스 박테리아 세포에서 발현되는 경우 말단절단 Cry1Ca (DIG-462)의 발현 수준과 비교하였다. 말단절단 Cry1Ca (DIG-462)는 대략 1 g/l로 발현된 반면, DIG-473은 대략 0.5 g/l로 발현되었다. DIG-465는 말단절단 Cry1Ca보다 대략 5배 더 높이, 4.9 g/l로 발현되었다. 이들 시험관내 결과는 L57A 돌연변이가 말단절단 Cry1Ca 단백질을 보다 많이 발현시킨다는 것을 보여준다.
실시예 3
슈도모나스 플루오레센스에서 생산된 DIG 단백질의 살곤충 활성
B.t. 살곤충 독소 DIG-462, DIG-463, DIG-464, DIG-465, DIG-466, DIG-467, DIG-468, DIG-469, DIG-470, DIG-473, 및 DIG-474가 배추좀나방 (DBM; 플루텔라 크실로스텔라 (린나에우스)) 및 가을 거염벌레 (FAW, 스포도프테라 프루기페르다 (스미스))를 포함한 인시류 종에 대해 활성인 것으로 입증되었다.
샘플 제조 및 생물검정. 10 mM CAPS pH 10 내의 봉입체 제제를 10 mM CAPS, pH 10에서 적절하게 희석하였고, 모든 생물검정은 이 완충제로 이루어진 대조군 처리를 함유하였으며, 이는 사멸률 또는 성장 억제에 대한 배경 체크로서 제공된다.
생물검정 완충제 중 단백질 농도를 BSA를 사용하여 겔 전기영동에 의해 추정하여, 겔 밀도측정을 위한 표준 곡선을 생성하였으며, 이는 바이오라드 영상화 시스템 (퀀터티 원 소프트웨어 버전 4.5.2를 사용하는 플루오르-S 멀티이미저)을 사용하여 측정하였다. 겔 매트릭스 중 단백질을 쿠마시 블루-기반 염색으로 염색하고, 판독 전에 탈염색하였다.
정제된 단백질을 인공 곤충 먹이에서 신생 인시류 유충을 사용하여 수행한 생물검정에서 살곤충 활성에 대해 시험하였다. DBM 및 FAW의 유충을 상업적 곤충실험실 (벤존 리서치 인크.(Benzon Research Inc.), 펜실베니아주 칼라일)에 의해 유지되는 콜로니로부터 수득된 알로부터 부화시켰다. rFAW의 유충을 독점적 콜로니 (다우 아그로사이언시스 엘엘씨(Dow AgroSciences LLC), 인디애나주 인디애나폴리스)로부터 수거한 알로부터 부화시켰다.
이들 생물검정은 곤충 생물검정을 위해 특수하게 설계된 128-웰 플라스틱 트레이 (씨-디 인터내셔널(C-D International), 뉴저지주 피트만)에서 수행하였다. 각각의 웰은 1.0 mL의 다수-종 인시목 먹이 (사우스랜드 프로덕츠(Southland Products), 아칸소주 레이크 빌리지)를 함유하였다. 단백질 샘플의 40 μL 분취물을 피펫으로 각각의 웰의 1.5 cm2 먹이 표면 상에 전달하였다 (26.7 μL/cm2). 웰 내 표면적의 제곱 센티미터 (cm2) 당 DIG 단백질의 양 (ng)으로서 Cry 단백질 농도를 계산하였다. 처리된 트레이를 먹이 표면 상의 액체가 증발하거나 먹이 내로 흡수될 때까지 흄 후드에서 유지하였다.
우화 수시간 이내에, 습윤 낙타모 브러시로 개별 유충을 피킹하고, 웰당 유충 1마리를 처리된 먹이 상에 위치시켰다. 이어서, 감염된 웰을 가스 교환을 허용하도록 통기되는, 투명한 플라스틱의 접착 시트 (씨-디 인터내셔널, 뉴저지주 피트만)로 밀봉하였다. 생물검정 트레이를 제어된 환경 조건 (28℃, ~60% 상대 습도, 16:8 [명:암]) 하에서 5일 동안 유지한 후에, 각각의 단백질 샘플에 노출된 곤충의 총수, 사멸 곤충의 수 및 생존 곤충의 중량을 기록하였다. 사멸률 퍼센트 및 성장 억제 퍼센트를 각각의 처리에 대해 계산하였다. 성장 억제 (GI)는 하기와 같이 계산하였다:
GI = [1 - (TWIT/TNIT)/(TWIBC/TNIBC)]
여기서 TWIT는 처리군에서의 곤충의 총 중량이고,
TNIT는 처리군에서의 곤충의 총수이고;
TWIBC는 배경 체크 (완충제 대조군)에서의 곤충의 총 중량이고,
TNIBC는 배경 체크 (완충제 대조군)에서의 곤충의 총수이다.
DBM 생물검정에서, 10 및 300 ng/cm2의 DIG-462, DIG-463, DIG-464, DIG-465, DIG-466, DIG-467, DIG-468, DIG-469, DIG-470, DIG-471, DIG-472, DIG-473, 및 DIG-474를 곤충 종에 대해 시험하였다. FAW를 DIG-462, DIG-465, DIG-473의 봉입체 제제와 함께 1X 및 5X 희석률에서 시험하였다. 사멸률 및 성장 억제 퍼센트 결과를 비교하였다.
사멸률은 DIG-462, DIG-463, DIG-464, DIG-465, DIG-466, DIG-468, DIG-469, DIG-473, 및 DIG-474 처리의 경우 300 ng/cm2에서 100%였다 (표 2 및 표 3). 성장 억제는 DIG-465 및 DIG-473 처리의 경우 10 ng/cm2에서 70-90% 성장 억제 및 300 ng/cm2에서 100% 억제였다 (표 2).
표 2
사멸률 및 성장 억제 둘 다를 측정하는, DBM에 대한 DIG-462, DIG-465 및 DIG-473 단백질의 생물검정 시험의 결과
사멸률의 경우, ++ = 10 ng/cm2에서 0-20% 및 300 ng/cm2에서 100%, +++ = 10 ng/cm2에서 30-60% 및 300 ng/cm2에서 100%. 성장 억제의 경우, ++++ = 10 ng/cm2에서 70-90% 성장 억제 및 300 ng/cm2에서 100% 억제.
표 3
10 ng/cm2 및 300 ng/cm2 농도에서 DBM에 대해 시험된 단백질 돌연변이체의 생물검정 결과
FAW 유충에 대한 Cry1Ca 코어 독소 (DIG-462), DIG-465, 및 DIG-473 단백질의 성장 억제는 모든 처리에서 >40%인 것으로 결정되었다 (표 4). 단백질을 전체 강도에서 시험하고, 완충제 (10 mM CAPS, pH 10)로 5-배 희석하였다.
표 4
FAW에 대한 DIG-462, DIG-465, 및 DIG-473의 성장 억제 퍼센트
키모트립신에 의해 소화될 정제 단백질의 DBM 활성 및 감수성을 평가하였다. DIG-473이 키모트립신 절단에 대해 저항성인 한편 동시에 DBM에 대해 DIG-462와 동일한 효력을 갖는다는 예상하지 못한 놀라운 발견이 있었다. 이는 시험관내 키모트립신 절단에 감수성인 Cry1Ca 코어 (DIG-462) 및 DIG-465 단백질과는 대조적이다 (표 5).
표 5
DBM (DIG-462는 표준임)에 대한 활성 및 키모트립신에 의한 절단에 대한 단백질 저항성을 갖는 단백질
실시예 4
유럽 옥수수 천공충 (ECB), 남서부 옥수수 천공충 (SWCB) 및 남부 거염벌레 (SAW) 생물검정
생물검정을 32-웰 시험 트레이에서 수행하였다. 대략 5 mL의 2% 물-한천 용액을 각각의 웰에 적용하고, 한천이 완전히 고체화되도록 하였다.
식물은 대략 3주령이었고, T1 세대에서 시험하였다. T1 잎 물질의 3중 반복이 완료되었다. 1개의 잎을 절단하고 (1" X 0.5" 직사각형), 트레이의 단일 웰에 넣었다. 각각의 웰을 ECB, Cry1Fa rECB 또는 SWCB의 10마리 개별 곤충 유충 (통상적으로 24시간령 미만)으로 감염시켰다. SAW의 경우, 5마리 개별 곤충 유충을 웰당 감염시켰다. B104 근교계 기원의 종자 기재 식물 및 황색 형광 단백질 (YFP) 형질전환 식물이 음성 대조군으로서 제공되었다.
이어서, 감염된 웰을 가스 교환을 허용하도록 통기되는, 투명한 플라스틱의 접착 시트 (씨-디 인터내셔널, 뉴저지주 피트만)로 밀봉하였다. 트레이를 콘비론(conviron) 인큐베이터에 넣고, 3일 동안 28℃ (16:8h 명:암, 60% RH)에서 유지시킨 후, 각각의 잎 조각에 대한 손상의 총량 (0, 5, 10, 15, 25, 50, 75% 손상 등, 100%까지)을 기록하였다.
곤충 유충이 말단절단 Cry1Ca 변형된 단백질을 함유하는 식물에 노출된 경우에 ECB 및 Cry1Fa 저항성 ECB (rECB)에 의해 유발된 섭식 손상이 감소하였다. 먹이 생물검정에서 시험될 때, 정제된 전장 Cry1Ca를 인공 곤충 먹이 위에 놓고 개별 곤충이 독소를 함유하는 먹이를 섭식하도록 하는 경우에 변형된 Cry1Ca는 ECB 및 rECB에 대해 불활성인 것으로 밝혀졌다. 그러나, >120 ng/cm2의 농도에서 메이즈에서 발현되는 경우, 식물에서의 Cry1Ca의 발현은 ECB 및 특히 rECB에 의해 유발되는 섭식 손상에 대해 예상하지 못한 보호를 제공한다.
표 6
유럽 옥수수 천공충 (ECB) 및 Cry1Fa-저항성 ECB (rECB)에 섭식시킨 경우의 IRDIG544.12 T1 메이즈의 생물검정 결과
곤충 유충을 말단절단 Cry1Ca 변형된 단백질을 140-340 ng/cm2의 단백질 발현 범위에서 함유하는 식물에 노출시켰을 때 남서부 옥수수 천공충 (SWCB) 및 남부 거염벌레 (SAW)에 의해 유발된 섭식 손상의 감소가 관찰되었다 (표 7). 평균 발현은 210 ng/cm2 (표준 편차 35)였다.
표 7
남서부 옥수수 천공충 (SWCB) 및 남부 거염벌레 (SAW)에게 섭식시킨 경우의 IRDIG544.12 T1 메이즈 식물의 생물검정
옥수수 천공충에 대한 재배지 시험을 2개 위치에 수행하였다: 하나는 미국 인디애나주 (IN), 다른 하나는 미국 미시시피주 (MS). 다수의 구축물 및 사례를 각각의 처리에 대해 시험하였다. Cry1Ab 및 Cry1F는 ECB 시험에서 양성 대조군으로서 제공되었다. 널이 음성 대조군으로서 제공되었다.
ECB 효능을 평가하기 위해, 각각의 식물에게 V6-V7 단계 식물의 윤생에 10마리 제2령 ECB 유충을 제공하였다. MS에서, 남서부 옥수수 천공충 (SWCB) 제2령 유충을 또한 V9 옥수수의 윤생에 인공적으로 감염시켰다 (식물당 22마리 유충). 사용된 ECB 및 SWCB는 벤존 래보러토리에서 입수하였다. 두 ECB 시험에서, 식물을 감염 2주 후에 잎 손상에 대해 평가하였으며 (거스리 1-9 척도) (Guthrie et al. 1960), 여기서 1은 가시적 손상 없는 경우이고, 9는 대부분의 잎이 긴 병변을 갖는 경우이다 (표 8). MS SWCB 시험에서, 식물을 자루 손상 및 살아있는 곤충에 대해 윤생 등급화 4-5일 후에 조사하였다. 수집된 데이터는 자루당 터널의 수, 터널 길이 및 자루당 살아있는 유충/번데기를 포함하였다.
표 8
옥수수 천공충 손상 점수 기준 (윤생 손상).
ECB 재배지 시험. ECB 윤생 손상을 Cry1Ca 활성에 대해 측정하였으며, 널과 비교한 경우 유의하게 보다 우수한 윤생 보호를 나타내었다. Cry1Ca 사례 활성은 Cry1Ab 및 Cry1F에 의해 제공된 윤생 보호와 통계학상 동등하지 않았다.
MS에서 생성된 데이터는 Cry1Ca에 대한 예상하지 못한 높은 수준의 식물 보호를 추가로 보강하였다. 높은 섭식 압박이 이 연구에서 확립되었다. 널 상의 잎 및 자루 손상에 비교한 경우 Cry1Ca에서 유의한 방제가 측정되었다. 단지 몇 마리의 살아있는 곤충만이 Cry1Ca 자루에서 생존한 것으로 밝혀졌다. 널과 비교한 경우 Cry1Ab 및 Cry1F 사례에서 유의한 윤생 및 자루 보호가 측정되었다.
표 9
ECB 잎 윤생 데이터, IN (다수의 사례에 대한 평균)
상이한 문자가 뒤따르는 평균은 유의하게 상이하다 (P ≤ 0.05).
표 10
ECB 잎 윤생 및 자루 데이터, MS (다수의 사례에 대한 평균)
모든 데이터 칼럼에서, 모든 유전자 사례는 널 값과 유의하게 상이하였다 (P < 0.05). 각각의 칼럼 내에서, 상이한 문자가 뒤따르는 평균은 유의하게 상이하다 (P ≤ 0.05).
SWCB 시험에서, B.t.당 오직 2개의 사례를 평가하였다. 높은 섭식 압박이 이 연구에서 확립되었다. 통계학상 동등한 자루 보호 및 자루당 유충 및 번데기의 수가 Cry1Ab, Cry1F, 및 Cry1Ca 사례에서 측정되었다.
표 11
SWCB 잎 윤생 및 자루 데이터, MS
각각의 칼럼 내에서, 상이한 문자가 뒤따르는 평균은 유의하게 상이하다 (P ≤0.05).
Cry1Ca의 활성 형태는 아미노산 29-628로 구성된다. 전장 (1-1164), 또는 절단된 형태 (1-628 및 29-628)는 곤충에게 제공되는 경우 이들이 29-628 형태로 프로세싱되기 때문이 활성이다.
실시예 5
옥수수 이삭벌레 재배지 시험
옥수수 이삭벌레에 대한 재배지 시험은 다수의 구축물 및 사례 (서열식별번호: 31)를 사용하여 인디애나주 파울러에서 수행하였다. 널은 음성 대조군으로서 제공되었다. 각각의 식물에게 옥수수 이삭의 녹색 수염에 5마리의 제1령 유충을 제공하였다. CEW는 벤존 래보러토리로부터 입수하였다. 사례당 플롯당 10개의 옥수수 이삭을 평가하여 CEW로 감염된 옥수수 이삭에서 커넬 손상의 수준을 평가하였다. 모든 트랜스제닉 사례는 널과 비교한 경우에 유의하게 보다 낮은 수준의 커넬 손상을 제공하였다. Cry1Ca 식물 상에서 유충 섭식의 유의한 억제가 존재하였다 (표 12).
표 12
CEW 커넬 소비 데이터, IN
실시예 6
아그로박테리움 형질전환.
이원 식물 형질전환 및 발현 플라스미드의 구축에 표준 클로닝 방법을 사용하였다. cry1Ca 발현 카세트를 함유하는 아그로박테리움 이원 플라스미드를 게이트웨이® 기술 (인비트로젠, 캘리포니아주 칼스배드)을 사용하여 조작하고, 아그로박테리움-매개 식물 형질전환에 사용하였다. 제한 엔도뉴클레아제를 뉴 잉글랜드 바이오랩스 (NEB; 매사추세츠주 입스위치)로부터 입수하고, T4 DNA 리가제 (인비트로젠)를 DNA 라이게이션에 사용하였다. 게이트웨이 반응을 게이트웨이® LR 클로나제® 효소 믹스 (인비트로젠)를 사용하여 수행하였다. 뉴클레오스핀(NucleoSpin)® 플라스미드 제조 키트 또는 뉴클레오본드® AX Xtra 미디 키트(NucleoBond® AX Xtra Midi kit) (둘 다 마슈레-나겔(Macherey-Nagel))를 사용하여 제조업체의 지침에 따라 플라스미드 제조를 수행하였다. 겔 단리 후 DNA 단편을 퀴아퀵(QIAquick) PCR 정제 키트 또는 퀴아엑스 II(QIAEX II) 겔 추출 키트 (둘 다 퀴아젠(Qiagen))를 사용하여 정제하였다.
살곤충 단백질 또는 그의 단편을 코딩하는 뉴클레오티드 서열을 포함하는 DNA 단편은 상업적 공급자 (예를 들어 DNA2.0, 캘리포니아주 멘로 파크)에 의해 합성하여, 표준 플라스미드 벡터에 클로닝된 단편으로 공급될 수 있거나, 또는 적절한 뉴클레오티드 서열을 함유하는 다른 구축물의 표준 분자 생물학 조작에 의해 수득될 수 있었다. 각각의 유전자에 대해 내부인 특유한 제한 부위를 확인하고, 각각 특정 결실 또는 삽입을 함유하는 각각의 유전자의 단편들을 합성하였다. 변형된 Cry 단편을 적절한 제한 부위에서 다른 Cry 단편으로 서브클로닝하여 목적 전장 단백질, 융합 단백질 또는 결실 변이체 단백질을 코딩하는 코딩 영역을 수득하였다.
아그로박테리움 투메파시엔스 균주 Z707S (Z707의 스트렙토마이신-저항성 유도체; Hepburn et al., 1985)의 전기-적격 세포를 제조하고, 전기천공을 사용하여 형질전환시켰다 (Weigel and Glazebrook, 2002). 전기천공 후, 1 mL의 YEP 브로쓰 (gm/L: 효모 추출물, 10; 펩톤, 10; NaCl, 5)를 큐벳에 첨가하고, 세포-YEP 현탁액을 15 mL 배양 튜브로 옮기고, 4시간 동안 연속 교반하면서 수조에서 28℃에서 인큐베이션하였다. 세포를 스펙티노마이신 (200 μg/mL) 및 스트렙토마이신 (250 μg/mL)을 포함하는 YEP 플러스 한천 (25 gm/L) 상에 플레이팅하고, 플레이트를 28℃에서 2-4일 동안 인큐베이션하였다. 잘 분리된 단일 콜로니를 선택하고, 상기와 같이 스펙티노마이신 및 스트렙토마이신을 포함하는 새로운 YEP + 한천 플레이트 상에 스트리킹하고, 28℃에서 1-3일 동안 인큐베이션하였다.
이원 식물 형질전환 벡터 중 살곤충 단백질 유전자 삽입물의 존재에 대해, 선택된 아그로박테리움 콜로니로부터 제조된 주형 플라스미드 DNA와 함께 벡터-특이적 프라이머를 사용하여 PCR 분석을 수행하였다. 상기와 같이 스펙티노마이신 및 스트렙토마이신을 포함하는 YEP에서 밤새 성장시킨 배양물 15 mL 중 4 mL 분취물로부터의 세포 펠릿을 제조업체의 지침에 따라 수행된 퀴아젠 스핀 미니 프렙을 사용하여 추출하였다. 아그로박테리움 전기천공 형질전환에 사용된 이원 벡터로부터의 플라스미드 DNA를 대조군으로서 포함시켰다. 인비트로젠으로부터의 Taq DNA 폴리머라제를 0.5x 농도로 제조업체의 지침에 따라 사용하여 PCR 반응을 완료하였다. 하기 조건으로 프로그래밍된 MJ 리서치 펠티에 써멀 사이클러(MJ Research Peltier Thermal Cycler)에서 PCR 반응을 수행하였다: 단계 1) 94℃에서 3분 동안; 단계 2) 94℃에서 45초 동안; 단계 3) 55℃에서 30초 동안; 단계 4) 72℃에서 예상되는 생성물 길이 kb당 1분씩; 단계 5) 단계 2로 29회; 단계 6) 72℃에서 10분 동안. 사이클링 후 4℃에서 반응을 유지하였다. 증폭 생성물을 아가로스 겔 전기영동 (예를 들어 0.7% 내지 1% 아가로스, w/v)에 의해 분석하고, 에티듐 브로마이드 염색에 의해 가시화하였다. PCR 생성물이 플라스미드 대조군과 동일한 콜로니를 선택하였다.
표 13
메이즈에서 DIG-465 및 DIG-473의 발현을 위한 플라스미드의 설명
실시예 7
단자엽 식물에서의 DIG-465 및 DIG-473 B.t. 살곤충 단백질 및 변이체의 생산.
메이즈의 아그로박테리움-매개된 형질전환. 하이 II F1 교배 (Armstrong et al., 1991)로부터의 종자를 95%의 메트로-믹스(Metro-Mix) 360 무토양 성장 배지 (선 그로 홀티컬쳐(Sun Gro Horticulture), 워싱턴주 벨뷰) 및 5% 점토/양토의 혼합물을 함유하는 5-갤런-포트에 식재하였다. 16:8시간 명:암 광주기로 고압 나트륨 및 금속 할라이드 램프의 조합을 사용하여 온실에서 식물을 성장시켰다. 형질전환을 위한 미성숙 F2 배아를 얻기 위해, 제어된 형매-수분을 수행하였다. 수분 8-10일 후에 배아가 대략 1.0 내지 2.0 mm 크기일 때 미성숙 배아를 단리하였다.
감염 및 공동-배양. 메이즈 이삭을, 액체 비누로 문지르고, 2분 동안 70% 에탄올 중에 침지시킨 다음, 30분 동안 20% 상업용 표백제 (0.1% 차아염소산나트륨) 중에 침지시킨 후에 멸균수로 세정하여 표면 멸균시켰다. 100 mg/L 스펙티노마이신, 10 mg/L 테트라시클린 및 250 mg/L 스트렙토마이신을 함유하는 YEP 고체 배지 상에서 28℃에서 2-3일 동안 성장시킨 1-2 루프의 박테리아를 100 μM 아세토시린곤을 함유하는 5 mL의 액체 감염 배지 (LS 기초 배지 (Linsmaier and Skoog, 1965), N6 비타민 (Chu et al., 1975), 1.5 mg/L 2,4-디클로로페녹시아세트산 (2,4-D), 68.5 gm/L 수크로스, 36.0 gm/L 글루코스, 6 mM L-프롤린, pH 5.2) 내로 옮김으로써 초이원 벡터를 함유하는 아그로박테리움 세포의 현탁액을 제조하였다. 균일한 현탁액이 달성될 때까지 용액을 볼텍싱하고, 농도를 자주색 필터가 구비된 클렛-서머슨(Klett-Summerson) 비색계를 사용하여 200 클렛 단위의 최종 밀도로 조정하였다. 미성숙 배아를 2 mL의 감염 배지를 함유하는 미세 원심분리 튜브 내로 직접 단리하였다. 배지를 제거하고, 밀도가 200 클렛 단위인 아그로박테리움 용액 1 mL로 대체하고, 아그로박테리움 및 배아 용액을 실온에서 5분 동안 인큐베이션한 다음, 암기 조건 하에 25℃에서 5일 동안 공동-배양 배지 (LS 기초 배지, N6 비타민, 1.5 mg/L 2,4-D, 30.0 gm/L 수크로스, 6 mM L-프롤린, 0.85 mg/L AgNO3, 100 μM 아세토시린곤, 3.0 gm/L 겔란(Gellan) 검 (피토테크놀로지 래보러토리즈(PhytoTechnology Laboratories), 캔자스주 레넥사), pH 5.8)로 옮겼다.
공동-배양 후에, 배아를 선택 배지로 옮기고, 이후에 대략 8주의 기간에 걸쳐 형질전환 단리물을 수득하였다. 식물 발현가능한 pat 또는 bar 선택 마커 유전자를 함유하는 초이원 플라스미드로 형질전환된 메이즈 조직의 선택을 위해, LS 기재 배지 (LS 기초 배지, N6 비타민, 1.5 mg/L 2,4-D, 0.5 gm/L MES (2-(N-모르폴리노)에탄술폰산 1수화물; 피토테크놀로지스 래버러토리즈), 30.0 gm/L 수크로스, 6 mM L-프롤린, 1.0 mg/L AgNO3, 250 mg/L 세포탁심, 2.5 gm/L 젤란 검, pH 5.7)를 비알라포스(Bialaphos) (골드 바이오테크놀로지(Gold BioTechnology))와 함께 사용하였다. 배아발생 단리물을 수득할 때까지 3 mg/L 비알라포스를 함유하는 선택 배지로 배아를 옮겼다. 회수된 단리물을 재생 및 추가 분석을 위해 2주 간격으로 새로운 선택 배지로 옮김으로써 증대시켰다.
재생 및 종자 생산. 재생을 위해, 배양물을 "28" 유도 배지 (MS 염 및 비타민, 30 gm/L 수크로스, 5 mg/L 벤질아미노퓨린, 0.25 mg/L 2,4-D, 3 mg/L 비알라포스, 250 mg/L 세포탁심, 2.5 gm/L 겔란 검, pH 5.7)로 1주일 동안 저광 조건 (14 μEm-2s-1) 하에, 이어서 1주일 동안 고광 조건 (대략 89 μEm-2s-1) 하에 옮겼다. 이후에 조직을 "36" 재생 배지 (유도 배지와 동일, 예외적으로, 식물 성장 조절인자 결여됨)로 옮겼다. 묘목이 3-5 cm 길이로 성장하였을 때, 이를 SHGA 배지 (Schenk and Hildebrandt salts and vitamins (1972); PhytoTechnologies Labr.), 1.0 gm/L 미오-이노시톨, 10 gm/L 수크로스 및 2.0 gm/L 겔란 검, pH 5.8)를 함유하는 유리 배양 튜브로 옮겨서, 싹 및 뿌리의 추가의 성장 및 발달을 가능하게 하였다. 본원에 이전에 기재된 바와 동일한 토양 혼합물에 식물을 이식하고, 온실에서 개화까지 성장시켰다. 종자 생산을 위해 제어된 수분을 수행하였다.
구축물 115752에 의한 DIG-465의 발현 수준 및 구축물 115753에 의한 DIG-473의 발현 수준이 도 1에 제시된다. 둘 다는 조직 샘플을 수득하기 위해 잎 펀치를 사용하여 잎에서 측정시에 유사한 수준의 그의 각 단백질을 대략 70-80 ng/cm2로 발현시켰다.
전장 Cry1Ca 단백질 (MR-1206) (mw 130 kDa)을 코딩하는 유전자를 발현하는 메이즈로부터의 추출물의 SDS-PAGE를 수행하였다. 적어도 5가지 단백질 생성물이 Cry1Ca에 대해 지시된 폴리클로날 항체를 사용하는 면역-블롯팅에 의해 검출되었다. 메이즈에 삽입된 유전자에 의해 코딩되는 바와 같은 전장 (130 kDa) 단백질이 검출되었다. 다른 밴드는 이 단백질의 단백질분해 생성물을 나타낸다. 코어 독소를 나타내는 아미노산 서열 1-628로 구성된 단백질 단편은 70 kDa의 분자량을 갖는 것으로 결정되었다. 68 kDa 밴드는 N-말단으로부터 처음 28개 아미노산이 결실된 아미노산 29-628로 구성된 단백질을 나타낸다. 처음 3개의 밴드는 에스. 프루기페르다 및 다른 인시류 곤충에 대해 기능적으로 활성이었다. 제4 밴드는 아미노산 74-628로 구성된 절단 단백질 (mw 62 kDa)을 나타내고, 제5 밴드는 아미노산 74-596으로 추가로 프로세싱된 Cry1Ca 단백질 (mw 59 kDa)을 나타내었다. 62 kDa 및 59 kDa 밴드는 에스. 프루기페르다 및 다른 인시류 곤충에 대해 기능적으로 활성이 아니였으나, 여전히 주요 단백질 생성물을 나타낸다.
실시예 8
트랜스제닉 메이즈의 생물검정.
식물 세포에서 생산된 DIG-465 및 DIG-473 단백질 및 변이체의 생물활성을 관련 기술분야의 통상의 기술자에게 공지된 방법에 의해 입증하였다 (예를 들어, 문헌 [Huang et al., 2006] 참조). DIG-465 또는 DIG-473 단백질 또는 변이체를 생산하는 식물로부터 유래된 다양한 식물 조직 또는 조직 조각을 제어된 섭식 환경에서 표적 곤충에게 섭식시킴으로써 효능이 입증될 수 있다. 대안적으로, DIG-465 또는 DIG-473 단백질 또는 변이체를 생산하는 식물로부터 유래된 다양한 식물 조직으로부터 단백질 추출물을 제조하고, 본원에 이전에 기재된 바와 같은 인공 사료 생물검정에 혼입시킬 수 있었다. 이러한 섭식 검정의 결과는 DIG-465 또는 DIG-473 단백질 또는 변이체를 생산하지 않는 숙주 식물로부터의 적절한 대조군 조직, 또는 다른 대조군 샘플을 사용하는 유사하게 수행된 생물검정과 비교되어야 하는 것으로 이해된다.
구축물 115752 (DIG-465)로부터 메이즈에서 생산된 다양한 사례의 생물학적 활성을 FAW 또는 Cry1Fa 저항성 FAW (rFAW)의 섭식 활성에 의해 유발된 잎 손상을 방지하는 것에 대해 시험하였다. 결과는 DIG-465 단백질을 발현하는 사례가 단백질을 발현하지 않는 식물보다 적은 섭식 손상을 나타내고, 효과는 용량 의존성으로, DIG-465의 발현이 높을수록 FAW 또는 rFAW에 의해 유발되는 섭식 손상이 적어지며, rFAW에 대해 명백하게 더 크게 영향을 미친다는 것을 보여준다 (표 14 및 도 2).
유사하게, 구축물 115753 (DIG-473)으로부터 메이즈에서 생산된 다양한 사례의 생물학적 활성을 FAW 또는 Cry1Fa 저항성 FAW (rFAW)의 섭식 활성에 의해 유발되는 잎 손상을 방지하는 것에 대해 시험하였다. 결과는 DIG-473 단백질을 발현하는 사례가 단백질을 발현하지 않는 식물보다 적은 섭식 손상을 나타내고, 효과는 용량 의존성으로, DIG-473의 발현이 높을수록 FAW 또는 rFAW에 의해 유발되는 섭식 손상이 적어지며, rFAW에 대해 명백하게 더 크게 영향을 미친다는 것으로 보여준다 (표 14 및 도 3).
표 14
DIG-465, DIG-473, 또는 대조군에 노출된 경우의 FAW 생물검정 데이터
실시예 9
쌍자엽 식물에서의 Bt 살곤충 단백질 및 변이체의 생산.
아라비돕시스 형질전환. 아라비돕시스 탈리아나 Col-01을 꽃 침지 방법을 사용하여 형질전환시켰다 (Weigel and Glazebrook, 2002). 선택된 아그로박테리움 콜로니를 사용하여 선택에 적절한 항생제를 함유하는 YEP 브로쓰의 1 mL 내지 15 mL 배양물에 접종하였다. 배양물을 밤새 28℃에서 220 rpm에서 연속 교반하면서 인큐베이션하였다. 각각의 배양물을 사용하여 선택에 적절한 항생제를 함유하는 YEP 브로쓰의 2개의 500 mL 배양물에 접종하고, 새로운 배양물을 밤새 28℃에서 연속 교반하면서 인큐베이션하였다. 세포를 대략 8700 x g에서 10분 동안 실온에서 원심분리하고, 생성된 상청액을 따라내었다. 세포 펠릿을 부드럽게 하기를 함유하는 500 mL의 침윤 배지에 재현탁시켰다: 1/2x 무라시게(Murashige) 및 스쿠그(Skoog) 염 (시그마-알드리치)/갬보르그(Gamborg) B5 비타민 (골드 바이오테크놀로지, 미주리주 세인트 루이스), 10% (w/v) 수크로스, 0.044 μM 벤질아미노퓨린 (10 μL/L의 DMSO 중 1 mg/mL 스톡) 및 300 μL/L 실웨트(Silwet) L-77. 대략 1개월령의 식물을 가장 새로운 화서가 침수되도록 주의하면서 배지에 15초 종안 침지시켰다. 이어서 식물을 옆으로 눕혀 24시간 동안 덮어 두고 (투명 또는 불투명), 물로 세척하고, 똑바로 세워놓았다. 식물을 22℃에서 16:8 명:암 광주기로 성장시켰다. 침지 대략 4주 후에, 종자를 수거하였다.
아라비돕시스 성장 및 선택. 새로 수거된 T1 종자를 적어도 7일 동안 실온에서 건조제의 존재 하에 건조시켰다. 종자를 0.1% 한천/물 (시그마-알드리치) 용액에 현탁시킨 다음, 4℃에서 2일 동안 계층화하였다. 식재를 제조하기 위해, 10.5 인치 x 21 인치 발아 트레이 (티.오. 플라스틱스 인크.(T.O. Plastics Inc.), 미네소타주 클리어워터) 내 선샤인 믹스 LP5(Sunshine Mix LP5) (선 그로 홀티컬쳐 인크., 워싱턴주 벨뷰)를 미세 버미큘라이트로 덮고, 습윤될 때까지 호글랜드 용액 (Hoagland and Arnon, 1950)으로 지하-관개한 다음, 24시간 동안 배수시켰다. 계층화된 종자를 버미큘라이트에 파종하고 습윤 돔 (코드 프로덕츠(KORD Products), 캐나다 온타리오 브라말레아)으로 7일 동안 덮었다. 종자를 발아시키고, 식물을 콘비론 (모델 CMP4030 또는 CMP3244; 컨트롤드 인바이런먼츠 리미티드(Controlled Environments Limited), 캐나다 매니토바주 윈니펙)에서 일정한 온도 (22℃) 및 습도 (40-50%) 하에 120-150 μmol/m2sec의 광 강도로 긴 낮 조건 (16:8 명/암 광주기) 하에 성장시켰다. 식물에 초기에 호글랜드 용액을 급수하고, 후속적으로 토양을 수분은 있지만 습윤되지는 않게 유지되도록 탈이온수를 급수하였다.
파종 5-6일 후에 돔을 제거하고, 비형질전환 종자로부터 발아한 식물을 사멸시키기 위해 화학적 선택제를 식물에 분무하였다. 예를 들어, 이원 식물 형질전환 벡터에 의해 제공되는 식물 발현가능한 선택 마커 유전자가 pat 또는 bar 유전자인 경우에 (Wehrmann et al., 1996), 형질전환 식물에 피날레(Finale) (5.78% 글루포시네이트 암모늄, 파르남 캄파니즈 인크.(Farnam Companies Inc.), 애리조나주 피닉스)의 1000X 용액을 분무함으로써 선택할 수 있었다. 5-7일 간격으로 2회의 순차적 분무를 수행하였다. 최종 분무로부터 7-10일 후에 생존물 (활발하게 성장하는 식물)을 확인하고, 선샤인 믹스 LP5로 제조된 포트 내로 이식하였다. 이식된 식물을 3-4일 동안 습윤 돔으로 덮고, 상기 언급된 성장 조건 하에서 콘비론 인큐베이터에 넣었다.
쌍자엽 식물 형질전환 분야의 통상의 기술자는 다른 식물 발현가능한 선택 마커 유전자 (예를 들어, 제초제 내성 유전자)가 사용되는 경우에 형질전환 식물의 다른 선택 방법도 이용가능하다는 것을 이해할 것이다.
실시예 10
DIG 단백질을 포함하는 트랜스제닉 글리신 맥스
Cry1Ca 단백질을 포함하는 핵산에 대한 발현 벡터를 보유하는 10 내지 20종의 트랜스제닉 T0 글리신 맥스 식물을 관련 기술분야에 공지된 바와 같이, 예를 들어 아그로박테리움-매개 형질전환에 의해 제조하였다. 성숙 대두 (글리신 맥스) 종자를 16시간 동안 염소 가스로 밤새 멸균시켰다. 염소 가스로 멸균시킨 후, 종자를 라미나르(LAMINAR)™ 유동 후드 내의 개방 용기에 놓아두어 염소 가스를 없앴다. 다음에, 멸균된 종자에 24℃에서 블랙 박스를 사용하여 암실에서 16시간 동안 멸균 H2O를 흡수시켰다.
분할-종자 대두의 제조. 배축 프로토콜의 부분을 포함하는 분할 대두 종자는, 종피를 분리하고 제거하며 종자를 2개의 자엽 섹션으로 분할하기 위해 종자의 제를 따라 스칼펠에 고정된 #10 블레이드를 사용하여 세로로 절단한 대두 종자 물질의 제조에 요구되었다. 배축을 부분적으로 제거하는데 세심한 주의가 필요하였으며, 여기서 배축의 약 1/2 - 1/3이 자엽의 마디 끝에 여전히 부착된 채로 있었다.
접종. 이어서, 배축의 일부 부분을 포함하는 분할 대두 종자를 DIG 단백질을 포함하는 이원 플라스미드를 함유하는 아그로박테리움 투메파시엔스 (예를 들어, 균주 EHA 101 또는 EHA 105)의 용액 중에 약 30분 동안 침지시켰다. 배축을 포함하는 자엽을 침지시키기 전에 아그로박테리움 투메파시엔스 용액을 λ=0.6 OD650의 최종 농도로 희석하였다.
공동-배양. 접종 후에, 분할 대두 종자를 한 장의 여과지로 덮인 페트리 디쉬 내 공동-배양 배지 상에서 5일 동안 아그로박테리움 투메파시엔스 균주와 공동-배양하였다 (Wang, Kan. Agrobacterium Protocols. 2. 1. New Jersey: Humana Press, 2006. Print.).
싹 유도. 공동-배양 5일 후에, 분할 대두 종자는 B5 염, B5 비타민, 28 mg/L 제1철, 38 mg/L Na2EDTA, 30 g/L 수크로스, 0.6 g/L MES, 1.11 mg/L BAP, 100 mg/L 티멘틴(TIMENTIN)™, 200 mg/L 세포탁심, 및 50 mg/L 반코마이신 (pH 5.7)으로 이루어진 액체 싹 유도 (SI) 배지에서 세척하였다. 분할 대두 종자를 이어서 B5 염, B5 비타민, 7 g/L 노블 한천, 28 mg/L 제1철, 38 mg/L Na2EDTA, 30 g/L 수크로스, 0.6 g/L MES, 1.11 mg/L BAP, 50 mg/L 티멘틴™, 200 mg/L 세포탁심, 50 mg/L 반코마이신 (pH 5.7)으로 이루어진 싹 유도 I (SI I) 배지 상에서 자엽의 편평한 면을 위로 향하게 하고 자엽의 마디 끝은 배지에 침지되도록 하면서 배양하였다. 배양 2주 후에, 형질전환 분할 대두 종자로부터의 외식편을 6 mg/L 글루포시네이트 (리버티(LIBERTY)®)가 보충된 SI I 배지를 함유하는 싹 유도 II (SI II) 배지로 옮겼다.
싹 신장. SI II 배지 상에서 배양 2주 후에, 외식편으로부터 자엽을 제거하고, 자엽의 기저부에서 절단을 수행함으로써, 배축을 함유하는 플러시 싹 패드를 절제하였다. 이와 같이 자엽으로부터 단리된 싹 패드를 싹 신장 (SE) 배지에 옮겼다. SE 배지는 MS 염, 28 mg/L 제1철, 38 mg/L Na2EDTA, 30 g/L 수크로스 및 0.6 g/L MES, 50 mg/L 아스파라긴, 100 mg/L L-피로글루탐산, 0.1 mg/L IAA, 0.5 mg/L GA3, 1 mg/L 제아틴 리보시드, 50 mg/L 티멘틴™, 200 mg/L 세포탁심, 50 mg/L 반코마이신, 6 mg/L 글루포시네이트, 7 g/L 노블 한천 (pH 5.7)으로 이루어졌다. 이 배양물을 2주마다 새로운 SE 배지에 옮겼다. 배양물을 80-90 μmol/m2sec의 광 강도 하에 18시간 광주기를 사용하여 24℃ 하의 콘비론™ 성장 챔버 내에서 성장시켰다.
발근. 자엽 싹 패드로부터 발생된 신장된 싹을, 이러한 자엽 싹 패드의 기저부에서 신장된 싹을 절단하고, 신장된 싹을 1 내지 3분 동안 1 mg/L IBA (인돌 3-부티르산)에 담가두어 단리함으로써 발근을 촉진시켰다. 다음에, 신장된 싹을 피타 트레이 내 발근 배지 (MS 염, B5 비타민, 28 mg/L 제1철, 38 mg/L Na2EDTA, 20 g/L 수크로스 및 0.59 g/L MES, 50 mg/L 아스파라긴, 100 mg/L L-피로글루탐산, 7 g/L 노블 한천, pH 5.6)로 옮겼다.
배양. 1-2주 동안 24℃, 18시간 광주기에서 콘비론™ 성장 챔버 내에서 배양한 후에, 뿌리가 발생된 싹을 뚜껑이 있는 선데 컵 내의 토양 혼합물로 옮기고, 소식물체의 적응을 위해 일정한 온도 (22℃) 및 습도 (40-50%) 하에 120 내지 150 μmol/m2sec의 광 강도에서 긴 낮 조건 (16시간 명기/8시간 암기) 하에 콘비론™ 성장 챔버 (모델 CMP4030 및 CMP3244, 컨트롤드 인바이런먼츠 리미티드, 캐나다 매니토바주 윈니펙)에 넣었다. 이와 같이 발근된 모종은 선데 컵에서 수주 동안 적응시킨 후에, 강건한 트랜스제닉 대두 식물의 추가의 적응 및 확립을 위해 온실로 옮겼다.
트랜스제닉 계통의 발생 및 형태학적 특징을 비형질전환 식물과 비교하였다. 식물 뿌리, 싹, 잎 및 생식 특징을 비교하였다. 트랜스제닉 및 비형질전환 식물의 뿌리 길이 및 성장 패턴에 있어서 어떠한 관찰가능한 차이도 존재하지 않았다. 식물 싹 특징, 예컨대 높이, 잎의 수 및 크기, 개화 시기, 꽃의 크기 및 외관은 유사하였다. 일반적으로, 시험관내 및 온실내 토양에서 배양하였을 때, 트랜스제닉 계통과 DIG 단백질이 발현되지 않은 것 사이에는 어떠한 관찰가능한 형태학적 차이도 존재하지 않았다.
실시예 11
추가의 작물 종의 형질전환
관련 기술분야의 통상의 기술자에게 공지된 방법, 예를 들어 이전에 미국 특허 7,838,733의 실시예 9, 또는 PCT 국제 특허 공개 번호 WO 2007/053482의 실시예 12에 기재된 것과 실질적으로 동일한 기술을 사용하여, 목화를 B.t. 단백질 (엽록체 통과 펩티드의 존재 또는 부재 하에)로 형질전환시켜 인시류 곤충의 방제를 제공하였다.
본원에 기재된 실시예 및 실시양태는 예시적 목적을 위한 것이고, 그를 고려하여 관련 기술분야의 통상의 기술자에게 다양한 변형 또는 변화가 제안될 것이고 본 출원의 취지와 범위 및 첨부된 청구범위의 범위 내에 포함되어야 함을 이해해야 한다. 본원에 제공된 교시와 함께, 관련 기술분야의 통상의 기술자는 본원에 기재된 다양한 독소 및 폴리뉴클레오티드 서열을 용이하게 생산 및 사용할 수 있다.
SEQUENCE LISTING
<110> Dow AgroSciences LLC
Sheets, Joel
Narva, Ken E.
Meade, Thomas
Hey, Timothy
Tan, Sek Yee
Etter, Audrey
Glancy, Todd
Armstrong, Janna
Coram, Tristan
Madduri, Krishna
King, James Edward
Lee, Ryan M.
Lin, Gaofeng
Li, Jianquan
<120> CRY1CA MUTANTS USEFUL FOR CONTROL OF INSECT PESTS
<130> 70951
<160> 40
<170> PatentIn version 3.5
<210> 1
<211> 1878
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 1
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180
atcgacttcg tctggggaat tgtccagtgg gatgcgtttc tggtgcagat agagcagctg 240
atcaacgaga ggatcgctga gttcgcgaga aatgctgcaa tcgccaacct tgaagggctt 300
ggcaacaact tcaacatcta cgtggaggcg ttcaaggagt gggaagagga ccctaagaat 360
ccagcgacca gaacgagggt tatagatcgg ttccgcatcc tcgatggcct tttggagagg 420
gacatcccga gcttccgcat ttcgggattt gaggttcctc tgctctcagt ctacgctcaa 480
gctgctaatc tgcatctggc catcttgagg gattcagtca tctttggcga acgctggggt 540
cttacgacta tcaacgtgaa cgagaactac aatcggttga ttcggcacat agacgagtat 600
gccgaccact gtgctaacac ctacaatagg ggtctgaaca atctgccaaa gtcaacgtat 660
caagactgga taacctacaa taggctcaga cgggacctca ctctcaccgt gctggacata 720
gctgccttct ttccgaacta cgacaaccgg agatatccta ttcaacccgt tggtcagctc 780
actcgcgagg tctacaccga tcccctcatc aacttcaatc cccagctgca atcggtcgca 840
cagctgccca ccttcaatgt gatggaaaac tcagcgatcc ggaatcccca tctgtttgac 900
atacttaaca acctcactat cttcaccgat tggttttcag ttggacgcaa cttctactgg 960
ggagggcaca gagtgatttc aagcctcatt ggaggaggga acattacatc gcctatctat 1020
ggaagggagg ccaaccaaga gccaccaagg tctttcacct tcaacggtcc ggtgttcaga 1080
acacttagca atcccacatt gcgcttgctg caacagccgt ggccagcacc accattcaat 1140
ctgaggggag tggagggtgt ggagttctcg acgcctacaa actcctttac gtacagaggc 1200
agagggacag tggactcact gacagaactc ccacctgagg acaactctgt tcctccgagg 1260
gagggctact cgcaccggct ttgccatgcc accttcgtcc agaggtctgg cacgcctttt 1320
ctgaccactg gggttgtctt tagctggact caccgctcag cgacgctgac caacacaatc 1380
gacccagaga ggatcaatca gatccctctg gtgaagggct ttcgcgtttg gggtggcaca 1440
agcgtgatca ccggacctgg tttcactggt ggggatatcc tcagacgcaa tacgtttggc 1500
gatttcgtga gccttcaagt caacatcaat tccccaatca cccagagata tcggctccgc 1560
ttcagatacg cctcatccag agacgcaagg gtcatcgtcc ttactggagc agccagcacc 1620
ggagtcggag gccaagttag cgtcaacatg ccgttgcaga aaacgatgga aatcggtgaa 1680
aacctcacca gcagaacctt tcgctataca gatttcagca accctttctc cttcagagcc 1740
aatccggaca taatcggcat atccgagcag cccttgttcg gtgctgggtc catctcttct 1800
ggcgagctgt acatcgacaa gattgagatc attctcgcag atgcgactct ggaggctgaa 1860
tcggatcttg aaaggtga 1878
<210> 2
<211> 625
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 2
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu
65 70 75 80
Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn
85 90 95
Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys
100 105 110
Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile
115 120 125
Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser
130 135 140
Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln
145 150 155 160
Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly
165 170 175
Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg
180 185 190
Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr
195 200 205
Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile
210 215 220
Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile
225 230 235 240
Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro
245 250 255
Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe
260 265 270
Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met
275 280 285
Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn
290 295 300
Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp
305 310 315 320
Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr
325 330 335
Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe
340 345 350
Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg
355 360 365
Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val
370 375 380
Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly
385 390 395 400
Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser
405 410 415
Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe
420 425 430
Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser
435 440 445
Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg
450 455 460
Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr
465 470 475 480
Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg
485 490 495
Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro
500 505 510
Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp
515 520 525
Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly
530 535 540
Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu
545 550 555 560
Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe
565 570 575
Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu
580 585 590
Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile
595 600 605
Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu
610 615 620
Arg
625
<210> 3
<211> 1878
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 3
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg ccggcttcct tgttggcctt 180
atcgacttcg tctggggaat tgtccagtgg gatgcgtttc tggtgcagat agagcagctg 240
atcaacgaga ggatcgctga gttcgcgaga aatgctgcaa tcgccaacct tgaagggctt 300
ggcaacaact tcaacatcta cgtggaggcg ttcaaggagt gggaagagga ccctaagaat 360
ccagcgacca gaacgagggt tatagatcgg ttccgcatcc tcgatggcct tttggagagg 420
gacatcccga gcttccgcat ttcgggattt gaggttcctc tgctctcagt ctacgctcaa 480
gctgctaatc tgcatctggc catcttgagg gattcagtca tctttggcga acgctggggt 540
cttacgacta tcaacgtgaa cgagaactac aatcggttga ttcggcacat agacgagtat 600
gccgaccact gtgctaacac ctacaatagg ggtctgaaca atctgccaaa gtcaacgtat 660
caagactgga taacctacaa taggctcaga cgggacctca ctctcaccgt gctggacata 720
gctgccttct ttccgaacta cgacaaccgg agatatccta ttcaacccgt tggtcagctc 780
actcgcgagg tctacaccga tcccctcatc aacttcaatc cccagctgca atcggtcgca 840
cagctgccca ccttcaatgt gatggaaaac tcagcgatcc ggaatcccca tctgtttgac 900
atacttaaca acctcactat cttcaccgat tggttttcag ttggacgcaa cttctactgg 960
ggagggcaca gagtgatttc aagcctcatt ggaggaggga acattacatc gcctatctat 1020
ggaagggagg ccaaccaaga gccaccaagg tctttcacct tcaacggtcc ggtgttcaga 1080
acacttagca atcccacatt gcgcttgctg caacagccgt ggccagcacc accattcaat 1140
ctgaggggag tggagggtgt ggagttctcg acgcctacaa actcctttac gtacagaggc 1200
agagggacag tggactcact gacagaactc ccacctgagg acaactctgt tcctccgagg 1260
gagggctact cgcaccggct ttgccatgcc accttcgtcc agaggtctgg cacgcctttt 1320
ctgaccactg gggttgtctt tagctggact caccgctcag cgacgctgac caacacaatc 1380
gacccagaga ggatcaatca gatccctctg gtgaagggct ttcgcgtttg gggtggcaca 1440
agcgtgatca ccggacctgg tttcactggt ggggatatcc tcagacgcaa tacgtttggc 1500
gatttcgtga gccttcaagt caacatcaat tccccaatca cccagagata tcggctccgc 1560
ttcagatacg cctcatccag agacgcaagg gtcatcgtcc ttactggagc agccagcacc 1620
ggagtcggag gccaagttag cgtcaacatg ccgttgcaga aaacgatgga aatcggtgaa 1680
aacctcacca gcagaacctt tcgctataca gatttcagca accctttctc cttcagagcc 1740
aatccggaca taatcggcat atccgagcag cccttgttcg gtgctgggtc catctcttct 1800
ggcgagctgt acatcgacaa gattgagatc attctcgcag atgcgactct ggaggctgaa 1860
tcggatcttg aaaggtga 1878
<210> 4
<211> 625
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 4
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Ala Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu
65 70 75 80
Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn
85 90 95
Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys
100 105 110
Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile
115 120 125
Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser
130 135 140
Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln
145 150 155 160
Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly
165 170 175
Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg
180 185 190
Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr
195 200 205
Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile
210 215 220
Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile
225 230 235 240
Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro
245 250 255
Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe
260 265 270
Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met
275 280 285
Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn
290 295 300
Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp
305 310 315 320
Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr
325 330 335
Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe
340 345 350
Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg
355 360 365
Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val
370 375 380
Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly
385 390 395 400
Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser
405 410 415
Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe
420 425 430
Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser
435 440 445
Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg
450 455 460
Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr
465 470 475 480
Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg
485 490 495
Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro
500 505 510
Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp
515 520 525
Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly
530 535 540
Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu
545 550 555 560
Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe
565 570 575
Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu
580 585 590
Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile
595 600 605
Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu
610 615 620
Arg
625
<210> 5
<211> 1878
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 5
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcgc cgttggcctt 180
atcgacttcg tctggggaat tgtccagtgg gatgcgtttc tggtgcagat agagcagctg 240
atcaacgaga ggatcgctga gttcgcgaga aatgctgcaa tcgccaacct tgaagggctt 300
ggcaacaact tcaacatcta cgtggaggcg ttcaaggagt gggaagagga ccctaagaat 360
ccagcgacca gaacgagggt tatagatcgg ttccgcatcc tcgatggcct tttggagagg 420
gacatcccga gcttccgcat ttcgggattt gaggttcctc tgctctcagt ctacgctcaa 480
gctgctaatc tgcatctggc catcttgagg gattcagtca tctttggcga acgctggggt 540
cttacgacta tcaacgtgaa cgagaactac aatcggttga ttcggcacat agacgagtat 600
gccgaccact gtgctaacac ctacaatagg ggtctgaaca atctgccaaa gtcaacgtat 660
caagactgga taacctacaa taggctcaga cgggacctca ctctcaccgt gctggacata 720
gctgccttct ttccgaacta cgacaaccgg agatatccta ttcaacccgt tggtcagctc 780
actcgcgagg tctacaccga tcccctcatc aacttcaatc cccagctgca atcggtcgca 840
cagctgccca ccttcaatgt gatggaaaac tcagcgatcc ggaatcccca tctgtttgac 900
atacttaaca acctcactat cttcaccgat tggttttcag ttggacgcaa cttctactgg 960
ggagggcaca gagtgatttc aagcctcatt ggaggaggga acattacatc gcctatctat 1020
ggaagggagg ccaaccaaga gccaccaagg tctttcacct tcaacggtcc ggtgttcaga 1080
acacttagca atcccacatt gcgcttgctg caacagccgt ggccagcacc accattcaat 1140
ctgaggggag tggagggtgt ggagttctcg acgcctacaa actcctttac gtacagaggc 1200
agagggacag tggactcact gacagaactc ccacctgagg acaactctgt tcctccgagg 1260
gagggctact cgcaccggct ttgccatgcc accttcgtcc agaggtctgg cacgcctttt 1320
ctgaccactg gggttgtctt tagctggact caccgctcag cgacgctgac caacacaatc 1380
gacccagaga ggatcaatca gatccctctg gtgaagggct ttcgcgtttg gggtggcaca 1440
agcgtgatca ccggacctgg tttcactggt ggggatatcc tcagacgcaa tacgtttggc 1500
gatttcgtga gccttcaagt caacatcaat tccccaatca cccagagata tcggctccgc 1560
ttcagatacg cctcatccag agacgcaagg gtcatcgtcc ttactggagc agccagcacc 1620
ggagtcggag gccaagttag cgtcaacatg ccgttgcaga aaacgatgga aatcggtgaa 1680
aacctcacca gcagaacctt tcgctataca gatttcagca accctttctc cttcagagcc 1740
aatccggaca taatcggcat atccgagcag cccttgttcg gtgctgggtc catctcttct 1800
ggcgagctgt acatcgacaa gattgagatc attctcgcag atgcgactct ggaggctgaa 1860
tcggatcttg aaaggtga 1878
<210> 6
<211> 625
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 6
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Ala Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu
65 70 75 80
Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn
85 90 95
Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys
100 105 110
Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile
115 120 125
Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser
130 135 140
Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln
145 150 155 160
Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly
165 170 175
Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg
180 185 190
Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr
195 200 205
Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile
210 215 220
Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile
225 230 235 240
Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro
245 250 255
Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe
260 265 270
Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met
275 280 285
Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn
290 295 300
Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp
305 310 315 320
Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr
325 330 335
Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe
340 345 350
Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg
355 360 365
Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val
370 375 380
Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly
385 390 395 400
Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser
405 410 415
Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe
420 425 430
Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser
435 440 445
Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg
450 455 460
Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr
465 470 475 480
Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg
485 490 495
Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro
500 505 510
Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp
515 520 525
Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly
530 535 540
Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu
545 550 555 560
Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe
565 570 575
Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu
580 585 590
Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile
595 600 605
Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu
610 615 620
Arg
625
<210> 7
<211> 1878
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 7
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcat ggttggcctt 180
atcgacttcg tctggggaat tgtccagtgg gatgcgtttc tggtgcagat agagcagctg 240
atcaacgaga ggatcgctga gttcgcgaga aatgctgcaa tcgccaacct tgaagggctt 300
ggcaacaact tcaacatcta cgtggaggcg ttcaaggagt gggaagagga ccctaagaat 360
ccagcgacca gaacgagggt tatagatcgg ttccgcatcc tcgatggcct tttggagagg 420
gacatcccga gcttccgcat ttcgggattt gaggttcctc tgctctcagt ctacgctcaa 480
gctgctaatc tgcatctggc catcttgagg gattcagtca tctttggcga acgctggggt 540
cttacgacta tcaacgtgaa cgagaactac aatcggttga ttcggcacat agacgagtat 600
gccgaccact gtgctaacac ctacaatagg ggtctgaaca atctgccaaa gtcaacgtat 660
caagactgga taacctacaa taggctcaga cgggacctca ctctcaccgt gctggacata 720
gctgccttct ttccgaacta cgacaaccgg agatatccta ttcaacccgt tggtcagctc 780
actcgcgagg tctacaccga tcccctcatc aacttcaatc cccagctgca atcggtcgca 840
cagctgccca ccttcaatgt gatggaaaac tcagcgatcc ggaatcccca tctgtttgac 900
atacttaaca acctcactat cttcaccgat tggttttcag ttggacgcaa cttctactgg 960
ggagggcaca gagtgatttc aagcctcatt ggaggaggga acattacatc gcctatctat 1020
ggaagggagg ccaaccaaga gccaccaagg tctttcacct tcaacggtcc ggtgttcaga 1080
acacttagca atcccacatt gcgcttgctg caacagccgt ggccagcacc accattcaat 1140
ctgaggggag tggagggtgt ggagttctcg acgcctacaa actcctttac gtacagaggc 1200
agagggacag tggactcact gacagaactc ccacctgagg acaactctgt tcctccgagg 1260
gagggctact cgcaccggct ttgccatgcc accttcgtcc agaggtctgg cacgcctttt 1320
ctgaccactg gggttgtctt tagctggact caccgctcag cgacgctgac caacacaatc 1380
gacccagaga ggatcaatca gatccctctg gtgaagggct ttcgcgtttg gggtggcaca 1440
agcgtgatca ccggacctgg tttcactggt ggggatatcc tcagacgcaa tacgtttggc 1500
gatttcgtga gccttcaagt caacatcaat tccccaatca cccagagata tcggctccgc 1560
ttcagatacg cctcatccag agacgcaagg gtcatcgtcc ttactggagc agccagcacc 1620
ggagtcggag gccaagttag cgtcaacatg ccgttgcaga aaacgatgga aatcggtgaa 1680
aacctcacca gcagaacctt tcgctataca gatttcagca accctttctc cttcagagcc 1740
aatccggaca taatcggcat atccgagcag cccttgttcg gtgctgggtc catctcttct 1800
ggcgagctgt acatcgacaa gattgagatc attctcgcag atgcgactct ggaggctgaa 1860
tcggatcttg aaaggtga 1878
<210> 8
<211> 625
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 8
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Met Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu
65 70 75 80
Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn
85 90 95
Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys
100 105 110
Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile
115 120 125
Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser
130 135 140
Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln
145 150 155 160
Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly
165 170 175
Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg
180 185 190
Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr
195 200 205
Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile
210 215 220
Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile
225 230 235 240
Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro
245 250 255
Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe
260 265 270
Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met
275 280 285
Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn
290 295 300
Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp
305 310 315 320
Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr
325 330 335
Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe
340 345 350
Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg
355 360 365
Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val
370 375 380
Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly
385 390 395 400
Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser
405 410 415
Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe
420 425 430
Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser
435 440 445
Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg
450 455 460
Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr
465 470 475 480
Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg
485 490 495
Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro
500 505 510
Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp
515 520 525
Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly
530 535 540
Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu
545 550 555 560
Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe
565 570 575
Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu
580 585 590
Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile
595 600 605
Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu
610 615 620
Arg
625
<210> 9
<211> 1887
<212> DNA
<213> Bacillus thuringiensis
<400> 9
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180
atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240
gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860
gaggctgaat cggatcttga aaggtga 1887
<210> 10
<211> 628
<212> PRT
<213> Bacillus thuringiensis
<400> 10
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 11
<211> 1887
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 11
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg ccggcttcct tgttggcctt 180
atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240
gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860
gaggctgaat cggatcttga aaggtga 1887
<210> 12
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 12
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Ala Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 13
<211> 1887
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 13
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcat ggttggcctt 180
atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240
gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860
gaggctgaat cggatcttga aaggtga 1887
<210> 14
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 14
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Met Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 15
<211> 1887
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 15
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcgc cgttggcctt 180
atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240
gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860
gaggctgaat cggatcttga aaggtga 1887
<210> 16
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 16
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Ala Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 17
<211> 1887
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 17
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180
atcgacttcg tctggggaat tttcggaccc tcccagtggg atgcgtttct ggtgcagata 240
gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860
gaggctgaat cggatcttga aaggtga 1887
<210> 18
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 18
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 19
<211> 1887
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 19
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180
atcgacttcg tctggggaat tatcggaccc tcccagtggg atgcgtttct ggtgcagata 240
gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860
gaggctgaat cggatcttga aaggtga 1887
<210> 20
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 20
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Ile Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 21
<211> 1887
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 21
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180
atcgacttcg tctggggaat tgtcggaccc tcccaggcgg atgcgtttct ggtgcagata 240
gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860
gaggctgaat cggatcttga aaggtga 1887
<210> 22
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 22
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Ala Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 23
<211> 1887
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 23
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180
atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240
gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcagagcca atccggacat aatcggcata tccgagcagc ccttgatggg tgctgggtcc 1800
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860
gaggctgaat cggatcttga aaggtga 1887
<210> 24
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 24
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Met Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 25
<211> 1887
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 25
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggcctt 180
atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240
gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcagagcca atccggacat aatcggcata tccgagcagc ccttggccgg tgctgggtcc 1800
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860
gaggctgaat cggatcttga aaggtga 1887
<210> 26
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 26
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Ala Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 27
<211> 1887
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 27
atggataaca accccaacat taacgagtgc atcccgtaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccatcga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg ccggcttcct tgttggcctt 180
atcgacttcg tctggggaat tgtcggaccc tcccagatgg atgcgtttct ggtgcagata 240
gagcagctga tcaacgagag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaggcgt tcaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaac gagaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gtctgaacaa tctgccaaag 660
tcaacgtatc aagactggat aacctacaat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat cccctcatca acttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctgtttgaca tacttaacaa cctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaagag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aacacaatcg acccagagag gatcaatcag atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacatcaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcagagcca atccggacat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800
atctcttctg gcgagctgta catcgacaag attgagatca ttctcgcaga tgcgactctg 1860
gaggctgaat cggatcttga aaggtga 1887
<210> 28
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 28
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Ala Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Met Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 29
<211> 1887
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 29
atggataaca accccaacat taacgagtgc atcccctaca actgcctctc gaatccagaa 60
gaagtgctct tggatggcga gaggatttcg actggcaaca gctccataga catttccctc 120
tccttggttc agttccttgt gtctaacttc gtccctggcg gtggcttcct tgttggatta 180
atcgacttcg tctggggaat tgtcggaccc tcccagtggg atgcgtttct ggtgcagata 240
gagcaattaa ttaatgaaag gatcgctgag ttcgcgagaa atgctgcaat cgccaacctt 300
gaagggcttg gcaacaactt caacatctac gtggaagcat ttaaggagtg ggaagaggac 360
cctaagaatc cagcgaccag aacgagggtt atagatcggt tccgcatcct cgatggcctt 420
ttggagaggg acatcccgag cttccgcatt tcgggatttg aggttcctct gctctcagtc 480
tacgctcaag ctgctaatct gcatctggcc atcttgaggg attcagtcat ctttggcgaa 540
cgctggggtc ttacgactat caacgtgaat gaaaactaca atcggttgat tcggcacata 600
gacgagtatg ccgaccactg tgctaacacc tacaataggg gattaaataa tctgccaaag 660
tcaacgtatc aagactggat aacatataat aggctcagac gggacctcac tctcaccgtg 720
ctggacatag ctgccttctt tccgaactac gacaaccgga gatatcctat tcaacccgtt 780
ggtcagctca ctcgcgaggt ctacaccgat ccattaatta atttcaatcc ccagctgcaa 840
tcggtcgcac agctgcccac cttcaatgtg atggaaaact cagcgatccg gaatccccat 900
ctctttgaca tacttaataa tctcactatc ttcaccgatt ggttttcagt tggacgcaac 960
ttctactggg gagggcacag agtgatttca agcctcattg gaggagggaa cattacatcg 1020
cctatctatg gaagggaggc caaccaggag ccaccaaggt ctttcacctt caacggtccg 1080
gtgttcagaa cacttagcaa tcccacattg cgcttgctgc aacagccgtg gccagcacca 1140
ccattcaatc tgaggggagt ggagggtgtg gagttctcga cgcctacaaa ctcctttacg 1200
tacagaggca gagggacagt ggactcactg acagaactcc cacctgagga caactctgtt 1260
cctccgaggg agggctactc gcaccggctt tgccatgcca ccttcgtcca gaggtctggc 1320
acgccttttc tgaccactgg ggttgtcttt agctggactc accgctcagc gacgctgacc 1380
aatacaatcg acccagagag aattaatcaa atccctctgg tgaagggctt tcgcgtttgg 1440
ggtggcacaa gcgtgatcac cggacctggt ttcactggtg gggatatcct cagacgcaat 1500
acgtttggcg atttcgtgag ccttcaagtc aacattaatt ccccaatcac ccagagatat 1560
cggctccgct tcagatacgc ctcatccaga gacgcaaggg tcatcgtcct tactggagca 1620
gccagcaccg gagtcggagg ccaagttagc gtcaacatgc cgttgcagaa aacgatggaa 1680
atcggtgaaa acctcaccag cagaaccttt cgctatacag atttcagcaa ccctttctcc 1740
ttcagagcca atccggatat aatcggcata tccgagcagc ccttgttcgg tgctgggtcc 1800
atctcttcag gcgagctgta catcgataaa attgagatca ttctcgcaga tgcgactctc 1860
gaggctgaat cggatcttga aaggtga 1887
<210> 30
<211> 628
<212> PRT
<213> Bacillus thuringiensis
<400> 30
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 31
<211> 1887
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 31
atggataaca acccgaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60
gaggtgctgc tggacggcga gaggatctca accggcaaca gcagcatcga catcagcctg 120
tccctggtgc agttcctggt gagcaacttc gtgccgggcg gcggcttcct ggtgggatta 180
atcgacttcg tgtggggcat cgtcggcccg tcccagtggg acgccttcct ggttcagatc 240
gagcaattaa ttaatgaaag gatagcagag ttcgcgagga acgcggccat cgccaacctg 300
gagggcctgg gcaacaactt caacatctac gtggaagcat ttaaggagtg ggaggaggac 360
cccaagaacc cggccacgag gacgagggtg atcgaccgct ttcgcatcct ggacggcctg 420
ctggagaggg acatcccgtc cttcagaatc agcggcttcg aggtcccgct gctgtccgtg 480
tacgcgcaag cggccaacct gcacctggcg atcctgaggg actccgtgat attcggcgag 540
aggtggggcc tgaccaccat caacgtgaat gaaaactaca accggctgat aaggcacatc 600
gacgagtacg ccgaccactg cgccaacacc tacaataggg gattaaataa tctgcccaag 660
agcacctacc aagactggat cacatataac cggctgagga gggacctgac cctgaccgtg 720
ctggacatcg ccgcgttctt cccgaactac gacaataggc gctacccgat ccagccggtg 780
ggccagctga cccgcgaggt gtacaccgac ccattaatta atttcaaccc gcagctccag 840
tccgtggccc agctgccgac cttcaacgtg atggagaaca gcgccatccg gaacccgcac 900
ctgttcgaca tcctgaataa tctgaccatc ttcaccgact ggttctcagt gggccggaac 960
ttctactggg gcggccatag ggtgatctcc agcctgatcg gcggcggcaa catcacctcc 1020
ccgatctacg ggagggaggc gaaccaggag ccgccgaggt ccttcacctt caacggcccg 1080
gtgtttagga ccctgtccaa cccgaccctg aggctgctcc agcagccgtg gccggcgccg 1140
ccgttcaacc tgaggggcgt ggagggcgtg gagttcagca ccccgaccaa cagcttcacc 1200
taccggggga ggggcaccgt ggactcactg accgagctgc cgccggagga caacagcgtg 1260
ccgccgaggg agggctacag ccataggctg tgccacgcca ccttcgtgca gaggagcggc 1320
accccgttct tgacgaccgg cgtggtgttc tcctggaccc accggagcgc gaccctgacc 1380
aatacaatcg acccggagag aattaatcaa atcccgctgg tgaagggctt ccgggtgtgg 1440
ggcggcacct ccgtgatcac cgggccgggc tttaccggcg gcgacatcct gaggaggaac 1500
acgttcggcg acttcgtgag cctccaagtg aacattaata gcccgatcac ccagcgctac 1560
cggctgaggt tccgctacgc gtcaagccgc gacgcgaggg tgatcgtgct gaccggcgcg 1620
gcctcaaccg gcgtgggcgg ccaagtgtcc gtgaacatgc cgctgcaaaa gacgatggag 1680
atcggcgaga acctgacctc aaggaccttc cgctacaccg acttcagcaa cccgttcagc 1740
tttagggcca acccggatat aatcggcatc agcgagcagc cgctgttcgg cgccggctcc 1800
atctcaagcg gcgagctgta catcgataaa atcgagatca tcctggcgga cgcgaccttg 1860
gaggccgagt ccgacctgga gaggtga 1887
<210> 32
<211> 628
<212> PRT
<213> Bacillus thuringiensis
<400> 32
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 33
<211> 1887
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 33
atggacaaca atcccaatat caatgagtgc atcccataca actgcctttc aaatcccgag 60
gaagtcttac tggatgggga aaggattagc actggcaatt ccagcattga catttccttg 120
agtctcgttc aattccttgt gagcaacttt gtgcctggcg gagggttctt ggttggtctc 180
atagactttg tttggggaat tgtaggacca tcacagtggg atgccttctt agtccagatt 240
gaacagctta tcaatgagag aatagctgag ttcgcaagaa atgctgcaat cgctaacttg 300
gagggactcg gcaacaactt caacatctac gtggaggctt tcaaagaatg ggaagaagat 360
cctaagaatc cagctactag gactagagtc atcgataggt ttaggattct tgatgggctg 420
ttggagcgtg acattccttc ctttaggatt agtggcttcg aggttcctct cctttctgtc 480
tatgctcaag cagccaatct ccatctcgcc attctccgtg attcagtaat cttcggagaa 540
agatggggtt tgacaacgat caatgtgaat gagaactaca acagattgat cagacacatt 600
gatgagtatg ctgatcattg tgctaacaca tacaacagag ggcttaacaa cctcccgaaa 660
tcaacatatc aagattggat aacctacaat agattgagga gggatctcac actgactgta 720
ctcgacattg ctgctttctt tcccaactac gataaccgta gatatcccat tcaacccgtc 780
ggacaactca ctcgtgaagt gtacacagat ccccttatca acttcaaccc acagttacaa 840
agtgttgcac agctgccaac cttcaatgtg atggaaaact ctgccattag gaatccacat 900
ctgtttgaca tacttaacaa cttgactatc tttacggatt ggtttagtgt ggggaggaac 960
ttctattggg gaggtcacag agtgattagc tctcttatcg gaggtgggaa cattacttca 1020
ccaatctatg gacgtgaagc aaatcaagaa ccaccacgtt cattcacctt caatggaccc 1080
gttttcagaa cactgtccaa tccgactctg agactgttgc agcaaccttg gccagcacct 1140
cctttcaact tgaggggtgt agagggagtc gagttttcca cacctactaa cagtttcacc 1200
tataggggtc gtggaactgt tgattctctt actgaacttc ctccagagga caattctgtt 1260
cctccgaggg aaggctattc acaccgtttg tgtcatgcaa cttttgttca gaggtctggc 1320
acacctttct taacaactgg cgtcgttttc agctggacac ataggagtgc aaccctcacg 1380
aatactatcg atccagagag aatcaatcag attcctcttg ttaagggctt tagggtgtgg 1440
ggtgggacct cagtgataac tggtcccggt ttcaccggag gagacatact tagaaggaac 1500
acctttgggg atttcgtttc tcttcaagta aacatcaatt ctcctatcac ccagagatac 1560
agacttaggt ttagatatgc tagtagccgt gacgccagag tcatagtgtt gactggtgct 1620
gcatcaactg gtgttggtgg gcaagtttca gtgaacatgc cacttcaaaa gacaatggag 1680
ataggtgaga acttgacgtc cagaaccttc agatacactg acttttctaa tcctttctct 1740
tttcgtgcta atccagacat cataggaatc agtgaacaac cgttgtttgg agctggttcc 1800
atttctagtg gagaattgta cattgacaag attgagatca tacttgccga tgccacgctc 1860
gaggctgaat ctgatctcga aaggtga 1887
<210> 34
<211> 628
<212> PRT
<213> Bacillus thuringiensis
<400> 34
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg
625
<210> 35
<211> 3495
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 35
atggacaaca atcccaatat caatgagtgc atcccataca actgcctttc aaatcccgag 60
gaagtcttac tggatgggga aaggattagc actggcaatt ccagcattga catttccttg 120
agtctcgttc aattccttgt gagcaacttt gtgcctggcg gagggttctt ggttggtctc 180
atagactttg tttggggaat tgtaggacca tcacagtggg atgccttctt agtccagatt 240
gaacagctta tcaatgagag aatagctgag ttcgcaagaa atgctgcaat cgctaacttg 300
gagggactcg gcaacaactt caacatctac gtggaggctt tcaaagaatg ggaagaagat 360
cctaagaatc cagctactag gactagagtc atcgataggt ttaggattct tgatgggctg 420
ttggagcgtg acattccttc ctttaggatt agtggcttcg aggttcctct cctttctgtc 480
tatgctcaag cagccaatct ccatctcgcc attctccgtg attcagtaat cttcggagaa 540
agatggggtt tgacaacgat caatgtgaat gagaactaca acagattgat cagacacatt 600
gatgagtatg ctgatcattg tgctaacaca tacaacagag ggcttaacaa cctcccgaaa 660
tcaacatatc aagattggat aacctacaat agattgagga gggatctcac actgactgta 720
ctcgacattg ctgctttctt tcccaactac gataaccgta gatatcccat tcaacccgtc 780
ggacaactca ctcgtgaagt gtacacagat ccccttatca acttcaaccc acagttacaa 840
agtgttgcac agctgccaac cttcaatgtg atggaaaact ctgccattag gaatccacat 900
ctgtttgaca tacttaacaa cttgactatc tttacggatt ggtttagtgt ggggaggaac 960
ttctattggg gaggtcacag agtgattagc tctcttatcg gaggtgggaa cattacttca 1020
ccaatctatg gacgtgaagc aaatcaagaa ccaccacgtt cattcacctt caatggaccc 1080
gttttcagaa cactgtccaa tccgactctg agactgttgc agcaaccttg gccagcacct 1140
cctttcaact tgaggggtgt agagggagtc gagttttcca cacctactaa cagtttcacc 1200
tataggggtc gtggaactgt tgattctctt actgaacttc ctccagagga caattctgtt 1260
cctccgaggg aaggctattc acaccgtttg tgtcatgcaa cttttgttca gaggtctggc 1320
acacctttct taacaactgg cgtcgttttc agctggacac ataggagtgc aaccctcacg 1380
aatactatcg atccagagag aatcaatcag attcctcttg ttaagggctt tagggtgtgg 1440
ggtgggacct cagtgataac tggtcccggt ttcaccggag gagacatact tagaaggaac 1500
acctttgggg atttcgtttc tcttcaagta aacatcaatt ctcctatcac ccagagatac 1560
agacttaggt ttagatatgc tagtagccgt gacgccagag tcatagtgtt gactggtgct 1620
gcatcaactg gtgttggtgg gcaagtttca gtgaacatgc cacttcaaaa gacaatggag 1680
ataggtgaga acttgacgtc cagaaccttc agatacactg acttttctaa tcctttctct 1740
tttcgtgcta atccagacat cataggaatc agtgaacaac cgttgtttgg agctggttcc 1800
atttctagtg gagaattgta cattgacaag attgagatca tacttgccga tgccacgctc 1860
gaggctgaat ctgatctcga aagggcacag aaagctgtaa acgcattgtt tacaagttct 1920
aatcaaatcg gactcaaaac cgatgttacg gactatcaca tagatagggt ttctaatctt 1980
gtggaatgtc tttcagatga gttttgttta gatgagaaga aagaactttc agaaaaggtc 2040
aagcacgcca aaagactgtc cgatgaaagg aatctccttc aagacccaaa ctttcgtgga 2100
atcaataggc agctcgacag aggttggaga gggagcacag atatcaccat tcaaggagga 2160
gatgacgttt tcaaagagaa ctatgtcacc ttgttaggca cctttgatga gtgctatcca 2220
acttatctgt atcagaagat tgatgaatcc aagctgaagg cttacacaag atatcagctc 2280
agaggataca tcgaggactc ccaagatttg gagatatact tgattcgtta caatgcaaaa 2340
catgagaccg tgaatgttcc tggtactgga agtctctggc cactgtctgc tccgtcacct 2400
attgggaaat gtgcccatca ctcccaccat ttctcattgg acatagacgt tggctgcaca 2460
gatttgaatg aagatttggg tgtttgggtc atcttcaaga tcaaaactca agacggacac 2520
gctcgtttag gaaacttaga gtttcttgaa gagaagccct tggttgggga ggcacttgcc 2580
agagtaaaga gagctgaaaa gaagtggaga gataagaggg agaaacttga gtgggagact 2640
aacattgtgt acaaggaagc caaagaaagc gtggatgctc ttttcgtgaa ctctcagtat 2700
gataggttac aagcagacac caacatagca atgatacatg cagctgacaa aagagtccat 2760
tctattcgtg aggcttactt gccagaactt agtgtgattc ccggtgtcaa cgctgccatt 2820
ttcgaggaat tggaaggaag aatctttacg gctttcagcc tctatgacgc taggaatgtt 2880
atcaagaatg gtgatttcaa caatggcctc tcatgttgga atgtgaaagg tcatgttgat 2940
gtagaggagc aaaacaatca ccgtagcgtg ctggttgtcc cagaatggga agccgaagta 3000
agccaagaag ttagagtttg ccctggaaga ggctacattc tgcgtgtcac cgcttacaaa 3060
gaaggatatg gcgaagggtg cgtgactatt catgagattg agaacaatac tgacgaactt 3120
aagttttcaa actgcgtcga ggaggaagtg tatcctaaca acacagtgac ttgtaatgac 3180
tatacagcaa cgcaagagga atacgagggg acatacacca gtcgtaatcg tggttatgat 3240
ggtgcttatg aaagcaattc atccgttcca gctgactatg ccagtgccta cgaagagaag 3300
gcttacacgg atggcagaag agataaccca tgtgagtcca acagaggtta tggtgattac 3360
actcctcttc cagctggtta cgtgactaaa gagttagagt actttccgga gactgataag 3420
gtttggattg aaatcggaga gacagaaggg acattcatag tagattcagt tgagcttctt 3480
ctcatggaag aatga 3495
<210> 36
<211> 1164
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 36
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser
625 630 635 640
Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Arg
645 650 655
Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu
660 665 670
Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp
675 680 685
Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln
690 695 700
Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly
705 710 715 720
Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp
725 730 735
Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu
740 745 750
Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln
755 760 765
Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val
770 775 780
Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro
785 790 795 800
Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp
805 810 815
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
820 825 830
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
835 840 845
Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg
850 855 860
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr
865 870 875 880
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
885 890 895
Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile
900 905 910
His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro
915 920 925
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu
930 935 940
Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
945 950 955 960
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys
965 970 975
Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
980 985 990
Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro
995 1000 1005
Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr
1010 1015 1020
Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp
1025 1030 1035
Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asn
1040 1045 1050
Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu Tyr
1055 1060 1065
Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr
1070 1075 1080
Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu
1085 1090 1095
Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser
1100 1105 1110
Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val
1115 1120 1125
Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile
1130 1135 1140
Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu
1145 1150 1155
Leu Leu Leu Met Glu Glu
1160
<210> 37
<211> 3495
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 37
atggataaca atccgaacat caatgaatgc atcccgtaca actgcctgag caacccggaa 60
gaagtgctgt tggatggaga acggatatca actggtaatt catcaattga tatttctctg 120
tcacttgttc agtttctggt atctaacttc gtcccaggcg gaggattcct ggttggatta 180
atagattttg tatggggaat agttggccct tctcaatggg atgcatttct agtacaaatt 240
gaacaattaa ttaatgaaag aatagctgaa tttgctagga atgctgctat tgctaattta 300
gaaggattag gaaacaattt caatatatat gtggaagcat ttaaagaatg ggaagaagat 360
cctaagaatc cagcaaccag gaccagagta attgatcgct ttcgtatact tgatgggcta 420
cttgaaaggg acattccttc gtttcgaatt tctggatttg aagtacccct tttatccgtt 480
tatgctcaag cggccaatct gcatctagct atattaagag attctgtaat ttttggagaa 540
agatggggat tgacaacgat aaatgtcaat gaaaactata atagactaat taggcatatt 600
gatgaatatg ctgatcactg tgcaaatacg tataatcggg gattaaataa tttaccgaaa 660
tctacgtatc aagattggat aacatataat cgattgcgga gagacttaac attgactgta 720
ttagatatcg ccgctttctt tccaaactat gacaatagga gatatccaat tcagccagtt 780
ggtcaactaa caagggaagt ttatacggac ccattaatta attttaatcc acagttacag 840
tctgtagctc aattacctac ttttaacgtt atggagaaca gcgcaattag aaatcctcat 900
ttatttgata tattgaataa tcttacaatc tttacggatt ggtttagtgt tggacgcaat 960
ttttattggg gaggacatcg agtaatatct agccttatag gaggtggtaa cataacatct 1020
cctatatatg gaagagaggc gaaccaggag cctccaagat cctttacttt taatggaccg 1080
gtatttagga ctttatcaaa tcctacttta cgattattac agcaaccttg gccagcgcca 1140
ccatttaatt tacgtggtgt tgaaggagta gaattttcta cacctacaaa tagctttacg 1200
tatcgaggaa gaggtacggt tgattcttta actgaattgc cgcctgagga taatagtgtg 1260
ccacctcgcg aaggatatag tcatcgttta tgtcatgcaa cttttgttca aagatctgga 1320
acaccttttt taacaactgg tgtagtattt tcttggacgc atcgtagtgc aactcttaca 1380
aatacaattg atccagagag aattaatcaa atacctttag tgaaaggatt tagagtttgg 1440
gggggcacct ctgtcattac aggaccagga tttacaggag gggatatcct tcgaagaaat 1500
acctttggtg attttgtatc tctacaagtc aatattaatt caccaattac ccaaagatac 1560
cgtttaagat ttcgttacgc ttccagtagg gatgcacgag ttatagtatt aacaggagcg 1620
gcatccacag gagtgggagg ccaagttagt gtaaatatgc ctcttcagaa aactatggaa 1680
ataggggaga acttaacatc tagaacattt agatataccg attttagtaa tcctttttca 1740
tttagagcta atccagatat aattgggata agtgaacaac ctctatttgg tgcaggttct 1800
attagtagcg gtgaacttta tatagataaa attgaaatta ttctagcaga tgcaacattt 1860
gaagcagaat ctgatttaga aagagcacaa aaggcggtga atgccctgtt tacttcttcc 1920
aatcaaatcg ggttaaaaac cgatgtgacg gactatcata tcgatcgagt atccaattta 1980
gttgagtgtt tatctgatga attttgtctg gatgaaaaaa aagaattgtc cgagaaagtc 2040
aaacatgcga agcgacttag tgatgagcgg aatttacttc aagatccaaa ctttagaggg 2100
atcaatagac aactagaccg tggctggaga ggaagtacgg atattaccat ccaaggaggc 2160
gatgacgtat ccaaagagaa ttacgttacg ctattgggta cctttgatga gtgctactta 2220
acgtatttat atcaaaaaat agatgagtcg aaattaaaag cctatacccg ttaccaatta 2280
agagggtata tcgaagatag tcaagactta gaaatctatt taattcgcta caatgccaaa 2340
cacgaaacag taaatgtgcc aggtacgggt tccttatggc cgctttcagc cccaagtcca 2400
atcggaaaat gtgcccatca ttcccatcat ttctccttgg acattgatgt tggatgtaca 2460
gacttaaatg aggacttagg tgtatgggtg atattcaaga ttaagacgca agatggccat 2520
gcaagactag gaaatctaga atttctcgaa gagaaaccat tagtaggaga agcactagct 2580
cgtgtgaaaa gagcggagaa aaaatggaga gacaaacgtg aaaaattgga atgggaaaca 2640
aatattgttt ataaagaggc aaaagaatct gtagatgctt tatttgtaaa ctctcaatat 2700
gatagattac aagcggatac caacatcgcg atgattcatg cggcagataa acgcgttcat 2760
agcattcgag aagcttatct gcctgagctg tctgtgattc cgggtgtcaa tgcggctatt 2820
tttgaagaat tagaagggcg tattttcact gcattctccc tatatgatgc gagaaatgtc 2880
attaaaaatg gtgattttaa taatggctta tcctgctgga acgtgaaagg gcatgtagat 2940
gtagaagaac aaaacaacca ccgttcggtc cttgttgttc cggaatggga agcagaagtg 3000
tcacaagaag ttcgtgtctg tccgggtcgt ggctatatcc ttcgtgtcac agcgtacaag 3060
gagggatatg gagaaggttg cgtaaccatt catgagatcg agaacaatac agacgaactg 3120
aagtttagca actgtgtaga agaggaagta tatccaaaca acacggtaac gtgtaatgat 3180
tatactgcga ctcaagaaga atatgagggt acgtacactt ctcgtaatcg aggatatgac 3240
ggagcctatg aaagcaattc ttctgtacca gctgattatg catcagccta tgaagaaaaa 3300
gcatatacag atggacgaag agacaatcct tgtgaatcta acagaggata tggggattac 3360
acaccactac cagctggcta tgtgacaaaa gaattagagt acttcccaga aaccgataag 3420
gtatggattg agatcggaga aacggaagga acattcatcg tggacagcgt ggaattactt 3480
cttatggagg aataa 3495
<210> 38
<211> 1164
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 38
Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu
1 5 10 15
Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly
20 25 30
Asn Ser Ser Ile Asp Ile Ser Leu Ser Leu Val Gln Phe Leu Val Ser
35 40 45
Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu Ile Asp Phe Val
50 55 60
Trp Gly Ile Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile
65 70 75 80
Glu Gln Leu Ile Asn Glu Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala
85 90 95
Ile Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu
100 105 110
Ala Phe Lys Glu Trp Glu Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr
115 120 125
Arg Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp
130 135 140
Ile Pro Ser Phe Arg Ile Ser Gly Phe Glu Val Pro Leu Leu Ser Val
145 150 155 160
Tyr Ala Gln Ala Ala Asn Leu His Leu Ala Ile Leu Arg Asp Ser Val
165 170 175
Ile Phe Gly Glu Arg Trp Gly Leu Thr Thr Ile Asn Val Asn Glu Asn
180 185 190
Tyr Asn Arg Leu Ile Arg His Ile Asp Glu Tyr Ala Asp His Cys Ala
195 200 205
Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln
210 215 220
Asp Trp Ile Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro
245 250 255
Ile Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu
260 265 270
Ile Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe
275 280 285
Asn Val Met Glu Asn Ser Ala Ile Arg Asn Pro His Leu Phe Asp Ile
290 295 300
Leu Asn Asn Leu Thr Ile Phe Thr Asp Trp Phe Ser Val Gly Arg Asn
305 310 315 320
Phe Tyr Trp Gly Gly His Arg Val Ile Ser Ser Leu Ile Gly Gly Gly
325 330 335
Asn Ile Thr Ser Pro Ile Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro
340 345 350
Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro
355 360 365
Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu
370 375 380
Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr
385 390 395 400
Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu
405 410 415
Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His
420 425 430
Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val
435 440 445
Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp
450 455 460
Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe Arg Val Trp
465 470 475 480
Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile
485 490 495
Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn Ile
500 505 510
Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser
515 520 525
Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala Ser Thr Gly
530 535 540
Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu
545 550 555 560
Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser
565 570 575
Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu
580 585 590
Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile
595 600 605
Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser
610 615 620
Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser
625 630 635 640
Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His Ile Asp Arg
645 650 655
Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu
660 665 670
Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp
675 680 685
Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln
690 695 700
Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly
705 710 715 720
Asp Asp Val Ser Lys Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp
725 730 735
Glu Cys Tyr Leu Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu
740 745 750
Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln
755 760 765
Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val
770 775 780
Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro
785 790 795 800
Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp
805 810 815
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
820 825 830
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
835 840 845
Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg
850 855 860
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr
865 870 875 880
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
885 890 895
Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile
900 905 910
His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro
915 920 925
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu
930 935 940
Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
945 950 955 960
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys
965 970 975
Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
980 985 990
Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro
995 1000 1005
Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr
1010 1015 1020
Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp
1025 1030 1035
Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asn
1040 1045 1050
Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu Tyr
1055 1060 1065
Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr
1070 1075 1080
Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu
1085 1090 1095
Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Ser
1100 1105 1110
Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val
1115 1120 1125
Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile
1130 1135 1140
Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu
1145 1150 1155
Leu Leu Leu Met Glu Glu
1160
<210> 39
<211> 2109
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized coding region
<400> 39
atggcacaga gcagtaggat ctgccacggt gtgcagaacc cgtgcgtgat catctcgaac 60
ctgagcaagt ccaaccagaa caagtcaccg ttctccgtgt ccctcaagac ccaccagcac 120
ccgagagcct acccgatcag cagctcctgg ggactgaaga agagtggcat gaccctgatc 180
ggctccgagc tgagaccgct gaaggtgatg tccagcgtgt cagcggataa caacccgaac 240
atcaacgagt gcatccccta caactgcctg agcaaccccg aggaggtgct gctggacggc 300
gagaggatct caaccggcaa cagcagcatc gacatcagcc tgtccctggt gcagttcctg 360
gtgagcaact tcgtgccggg cggcggcttc ctggtgggat taatcgactt cgtgtggggc 420
atcgtcggcc cgtcccagtg ggacgccttc ctggttcaga tcgagcaatt aattaatgaa 480
aggatagcag agttcgcgag gaacgcggcc atcgccaacc tggagggcct gggcaacaac 540
ttcaacatct acgtggaagc atttaaggag tgggaggagg accccaagaa cccggccacg 600
aggacgaggg tgatcgaccg ctttcgcatc ctggacggcc tgctggagag ggacatcccg 660
tccttcagaa tcagcggctt cgaggtcccg ctgctgtccg tgtacgcgca agcggccaac 720
ctgcacctgg cgatcctgag ggactccgtg atattcggcg agaggtgggg cctgaccacc 780
atcaacgtga atgaaaacta caaccggctg ataaggcaca tcgacgagta cgccgaccac 840
tgcgccaaca cctacaatag gggattaaat aatctgccca agagcaccta ccaagactgg 900
atcacatata accggctgag gagggacctg accctgaccg tgctggacat cgccgcgttc 960
ttcccgaact acgacaatag gcgctacccg atccagccgg tgggccagct gacccgcgag 1020
gtgtacaccg acccattaat taatttcaac ccgcagctcc agtccgtggc ccagctgccg 1080
accttcaacg tgatggagaa cagcgccatc cggaacccgc acctgttcga catcctgaat 1140
aatctgacca tcttcaccga ctggttctca gtgggccgga acttctactg gggcggccat 1200
agggtgatct ccagcctgat cggcggcggc aacatcacct ccccgatcta cgggagggag 1260
gcgaaccagg agccgccgag gtccttcacc ttcaacggcc cggtgtttag gaccctgtcc 1320
aacccgaccc tgaggctgct ccagcagccg tggccggcgc cgccgttcaa cctgaggggc 1380
gtggagggcg tggagttcag caccccgacc aacagcttca cctaccgggg gaggggcacc 1440
gtggactcac tgaccgagct gccgccggag gacaacagcg tgccgccgag ggagggctac 1500
agccataggc tgtgccacgc caccttcgtg cagaggagcg gcaccccgtt cttgacgacc 1560
ggcgtggtgt tctcctggac ccaccggagc gcgaccctga ccaatacaat cgacccggag 1620
agaattaatc aaatcccgct ggtgaagggc ttccgggtgt ggggcggcac ctccgtgatc 1680
accgggccgg gctttaccgg cggcgacatc ctgaggagga acacgttcgg cgacttcgtg 1740
agcctccaag tgaacattaa tagcccgatc acccagcgct accggctgag gttccgctac 1800
gcgtcaagcc gcgacgcgag ggtgatcgtg ctgaccggcg cggcctcaac cggcgtgggc 1860
ggccaagtgt ccgtgaacat gccgctgcaa aagacgatgg agatcggcga gaacctgacc 1920
tcaaggacct tccgctacac cgacttcagc aacccgttca gctttagggc caacccggat 1980
ataatcggca tcagcgagca gccgctgttc ggcgccggct ccatctcaag cggcgagctg 2040
tacatcgata aaatcgagat catcctggcg gacgcgacct tggaggccga gtccgacctg 2100
gagaggtga 2109
<210> 40
<211> 702
<212> PRT
<213> Artificial Sequence
<220>
<223> translated from synthesized coding region
<400> 40
Met Ala Gln Ser Ser Arg Ile Cys His Gly Val Gln Asn Pro Cys Val
1 5 10 15
Ile Ile Ser Asn Leu Ser Lys Ser Asn Gln Asn Lys Ser Pro Phe Ser
20 25 30
Val Ser Leu Lys Thr His Gln His Pro Arg Ala Tyr Pro Ile Ser Ser
35 40 45
Ser Trp Gly Leu Lys Lys Ser Gly Met Thr Leu Ile Gly Ser Glu Leu
50 55 60
Arg Pro Leu Lys Val Met Ser Ser Val Ser Ala Asp Asn Asn Pro Asn
65 70 75 80
Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu Ser Asn Pro Glu Glu Val
85 90 95
Leu Leu Asp Gly Glu Arg Ile Ser Thr Gly Asn Ser Ser Ile Asp Ile
100 105 110
Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn Phe Val Pro Gly Gly
115 120 125
Gly Phe Leu Val Gly Leu Ile Asp Phe Val Trp Gly Ile Val Gly Pro
130 135 140
Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Glu Gln Leu Ile Asn Glu
145 150 155 160
Arg Ile Ala Glu Phe Ala Arg Asn Ala Ala Ile Ala Asn Leu Glu Gly
165 170 175
Leu Gly Asn Asn Phe Asn Ile Tyr Val Glu Ala Phe Lys Glu Trp Glu
180 185 190
Glu Asp Pro Lys Asn Pro Ala Thr Arg Thr Arg Val Ile Asp Arg Phe
195 200 205
Arg Ile Leu Asp Gly Leu Leu Glu Arg Asp Ile Pro Ser Phe Arg Ile
210 215 220
Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn
225 230 235 240
Leu His Leu Ala Ile Leu Arg Asp Ser Val Ile Phe Gly Glu Arg Trp
245 250 255
Gly Leu Thr Thr Ile Asn Val Asn Glu Asn Tyr Asn Arg Leu Ile Arg
260 265 270
His Ile Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Asn Arg Gly
275 280 285
Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp Ile Thr Tyr Asn
290 295 300
Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp Ile Ala Ala Phe
305 310 315 320
Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro Ile Gln Pro Val Gly Gln
325 330 335
Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile Asn Phe Asn Pro Gln
340 345 350
Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Asn Ser
355 360 365
Ala Ile Arg Asn Pro His Leu Phe Asp Ile Leu Asn Asn Leu Thr Ile
370 375 380
Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly His
385 390 395 400
Arg Val Ile Ser Ser Leu Ile Gly Gly Gly Asn Ile Thr Ser Pro Ile
405 410 415
Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn
420 425 430
Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln
435 440 445
Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly Val
450 455 460
Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly Thr
465 470 475 480
Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Pro
485 490 495
Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln Arg
500 505 510
Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr His
515 520 525
Arg Ser Ala Thr Leu Thr Asn Thr Ile Asp Pro Glu Arg Ile Asn Gln
530 535 540
Ile Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val Ile
545 550 555 560
Thr Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr Phe
565 570 575
Gly Asp Phe Val Ser Leu Gln Val Asn Ile Asn Ser Pro Ile Thr Gln
580 585 590
Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val
595 600 605
Ile Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser
610 615 620
Val Asn Met Pro Leu Gln Lys Thr Met Glu Ile Gly Glu Asn Leu Thr
625 630 635 640
Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg
645 650 655
Ala Asn Pro Asp Ile Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly Ala
660 665 670
Gly Ser Ile Ser Ser Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile Ile
675 680 685
Leu Ala Asp Ala Thr Leu Glu Ala Glu Ser Asp Leu Glu Arg
690 695 700
Claims (27)
- 서열식별번호: 2의 잔기 2 내지 68을 포함하며, 여기서 서열식별번호: 2의 아미노산 잔기 54는 Gly 및 Ala로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 57은 Leu 및 Met로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 68은 Val, Phe, 및 Ile로 이루어진 군으로부터 선택되는 것인, 변형된 Cry1Ca 독소.
- 서열식별번호: 10의 잔기 2 내지 628을 포함하며, 여기서 서열식별번호: 2의 아미노산 잔기 54는 Gly 및 Ala로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 57은 Leu 및 Met로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 68은 Val, Phe, 및 Ile로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 73은 Trp, Ala 및 Met로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 596은 Phe, Met 및 Ala로 이루어진 군으로부터 선택되고, 서열식별번호: 2의 아미노산 잔기 620은 Leu 및 Phe로 이루어진 군으로부터 선택되는 것인 변형된 Cry1Ca 독소.
- 제1항에 있어서, 서열식별번호: 36의 아미노산 잔기 629 내지 1164로 이루어진 카르복시 말단 연장부를 추가로 포함하는 변형된 Cry1Ca 독소.
- 제2항에 있어서, 서열식별번호: 36의 아미노산 잔기 629 내지 1164로 이루어진 카르복시 말단 연장부를 추가로 포함하는 변형된 Cry1Ca 독소.
- 제1항에 있어서, 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 변형된 Cry1Ca 독소.
- 제2항에 있어서, 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 변형된 Cry1Ca 독소.
- 제3항에 있어서, 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 변형된 Cry1Ca 독소.
- 제4항에 있어서, 서열식별번호: 40의 아미노산 잔기 1 내지 74로 이루어진 아미노 말단 연장부를 추가로 포함하는 변형된 Cry1Ca 독소.
- 서열식별번호: 2, 서열식별번호: 4, 서열식별번호: 6, 서열식별번호: 8, 서열식별번호: 10, 서열식별번호: 12, 서열식별번호: 14, 서열식별번호: 16, 서열식별번호: 18, 서열식별번호: 20, 서열식별번호: 22, 서열식별번호: 24, 서열식별번호: 26, 서열식별번호: 28, 서열식별번호: 30, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 36, 서열식별번호: 38, 및 서열식별번호: 40으로 이루어진 군으로부터 선택되는 변형된 Cry1Ca 독소.
- 제1항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
- 제2항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
- 제3항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
- 제4항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
- 제5항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
- 제6항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
- 제7항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
- 제8항의 변형된 Cry1Ca 독소를 코딩하는 핵산 서열.
- 서열식별번호: 1, 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25, 서열식별번호: 27, 서열식별번호: 29, 서열식별번호: 31, 서열식별번호: 33, 서열식별번호: 35, 서열식별번호: 37, 및 서열식별번호: 39로 이루어진 군으로부터 선택되는 핵산 서열.
- 제1항 내지 제9항 중 어느 한 항의 변형된 Cry1Ca 독소 중 하나 이상을 생산할 수 있는 트랜스제닉 식물, 식물 부분 또는 종자.
- 제19항에 있어서, 메이즈, 해바라기, 대두, 목화, 카놀라, 벼, 수수, 밀, 보리, 채소, 관상식물, 페퍼, 사탕무, 과일 및 잔디풀로 이루어진 군으로부터 선택된 트랜스제닉 식물, 식물 부분 또는 종자.
- 제19항에 있어서, 메이즈, 대두 및 목화로 이루어진 군으로부터 선택된 트랜스제닉 식물, 식물 부분 또는 종자.
- 제19항에 있어서, 메이즈인 트랜스제닉 식물, 식물 부분 또는 종자.
- 제19항에 있어서, 대두인 트랜스제닉 식물, 식물 부분 또는 종자.
- 제19항에 있어서, 목화인 트랜스제닉 식물, 식물 부분 또는 종자.
- 하나 이상의 변형된 Cry1Ca 독소를 발현하는 트랜스제닉 식물을 성장시키고, 감수성 해충을 상기 트랜스제닉 식물 상에서 섭식시키는 것을 포함하는, 식물 곤충 해충을 방제하는 방법.
- 제25항에 있어서, 하나 이상의 변형된 Cry1Ca 독소가 제1항 내지 제9항 중 어느 한 항의 하나 이상의 변형된 Cry1Ca 독소를 포함하는 것인 방법.
- 하나 이상의 변형된 Cry1Ca 독소를 발현하는 트랜스제닉 식물을 성장시키고, 감수성 해충을 상기 트랜스제닉 식물 상에서 섭식시키는 것을 포함하는, 다른 Cry 독소에 대한 저항성이 발생한 식물 곤충 해충을 방제하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462097833P | 2014-12-30 | 2014-12-30 | |
US62/097,833 | 2014-12-30 | ||
PCT/US2015/066182 WO2016109212A1 (en) | 2014-12-30 | 2015-12-16 | MODIFIED Cry1Ca TOXINS USEFUL FOR CONTROL OF INSECT PESTS |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20170099907A true KR20170099907A (ko) | 2017-09-01 |
Family
ID=56284908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177017297A KR20170099907A (ko) | 2014-12-30 | 2015-12-16 | 곤충 해충의 방제에 유용한 변형된 Cry1Ca 독소 |
Country Status (20)
Country | Link |
---|---|
US (3) | US10570182B2 (ko) |
EP (2) | EP3240560B1 (ko) |
JP (1) | JP2018501798A (ko) |
KR (1) | KR20170099907A (ko) |
CN (3) | CN107106634B (ko) |
AR (1) | AR103310A1 (ko) |
AU (1) | AU2015372474B2 (ko) |
BR (1) | BR112017013514A2 (ko) |
CA (2) | CA2972016C (ko) |
CL (1) | CL2017001707A1 (ko) |
CO (1) | CO2017006326A2 (ko) |
IL (1) | IL253093A0 (ko) |
MX (2) | MX2017008413A (ko) |
NZ (1) | NZ732360A (ko) |
PH (1) | PH12017501195A1 (ko) |
RU (1) | RU2017122359A (ko) |
TW (1) | TW201629091A (ko) |
UY (1) | UY36482A (ko) |
WO (1) | WO2016109212A1 (ko) |
ZA (1) | ZA201704299B (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3240560B1 (en) * | 2014-12-30 | 2022-08-31 | Corteva Agriscience LLC | MODIFIED Cry1Ca TOXINS USEFUL FOR CONTROL OF INSECT PESTS |
US11129906B1 (en) | 2016-12-07 | 2021-09-28 | David Gordon Bermudes | Chimeric protein toxins for expression by therapeutic bacteria |
AR126481A1 (es) * | 2021-07-20 | 2023-10-11 | Syngenta Crop Protection Ag | Composiciones y métodos para controlar insectos |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4762785A (en) | 1982-08-12 | 1988-08-09 | Calgene, Inc. | Novel method and compositions for introducting alien DNA in vivo |
EP0116718B2 (en) | 1983-01-13 | 1996-05-08 | Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. | Process for the introduction of expressible genes into plant cell genomes and agrobacterium strains carrying hybrid Ti plasmid vectors useful for this process |
WO1984002919A1 (en) | 1983-01-17 | 1984-08-02 | Monsanto Co | Plasmids for transforming plant cells |
NL8300698A (nl) | 1983-02-24 | 1984-09-17 | Univ Leiden | Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten. |
NL8300699A (nl) | 1983-02-24 | 1984-09-17 | Univ Leiden | Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; werkwijze voor het produceren van agrobacterium tumefaciens bacterien; stabiele cointegraat plasmiden; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten. |
US5380831A (en) | 1986-04-04 | 1995-01-10 | Mycogen Plant Science, Inc. | Synthetic insecticidal crystal protein gene |
NL8401048A (nl) | 1984-04-03 | 1985-11-01 | Rijksuniversiteit Leiden En Pr | Werkwijze voor het inbouwen van vreemd dna in het genoom van eenzaadlobbige planten. |
US5231019A (en) | 1984-05-11 | 1993-07-27 | Ciba-Geigy Corporation | Transformation of hereditary material of plants |
US5149645A (en) | 1984-06-04 | 1992-09-22 | Rijksuniversiteit Leiden | Process for introducing foreign DNA into the genome of plants |
NL8401780A (nl) | 1984-06-04 | 1986-01-02 | Rijksuniversiteit Leiden En Pr | Werkwijze voor het inbouwen van vreemd dna in het genoom van planten. |
US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US4695462A (en) | 1985-06-28 | 1987-09-22 | Mycogen Corporation | Cellular encapsulation of biological pesticides |
CA1341092C (en) | 1985-12-12 | 2000-09-05 | David L. Edwards | Process for altering the host range of bacillus thuringiensis toxins, and novel toxins produced thereby |
AU7360087A (en) | 1986-04-30 | 1987-11-24 | Boyce Thompson Institute For Plant Research Inc. | Electric field mediated dna transformation of plant cells and organelles |
US5188958A (en) | 1986-05-29 | 1993-02-23 | Calgene, Inc. | Transformation and foreign gene expression in brassica species |
US5177010A (en) | 1986-06-30 | 1993-01-05 | University Of Toledo | Process for transforming corn and the products thereof |
EP0267159A3 (de) | 1986-11-07 | 1990-05-02 | Ciba-Geigy Ag | Verfahren zur genetischen Modifikation monokotyler Pflanzen |
SE455438B (sv) | 1986-11-24 | 1988-07-11 | Aga Ab | Sett att senka en brennares flamtemperatur samt brennare med munstycken for oxygen resp brensle |
US5004863B2 (en) | 1986-12-03 | 2000-10-17 | Agracetus | Genetic engineering of cotton plants and lines |
ES2074999T3 (es) | 1987-05-20 | 1995-10-01 | Ciba Geigy Ag | Plantas de zea mays y plantas de zea mays transgenicas regeneradas de protoplastos o celulas derivadas de protoplastos. |
US5128130A (en) | 1988-01-22 | 1992-07-07 | Mycogen Corporation | Hybrid Bacillus thuringiensis gene, plasmid and transformed Pseudomonas fluorescens |
US5055294A (en) | 1988-03-03 | 1991-10-08 | Mycogen Corporation | Chimeric bacillus thuringiensis crystal protein gene comprising hd-73 and berliner 1715 toxin genes, transformed and expressed in pseudomonas fluorescens |
US5302523A (en) | 1989-06-21 | 1994-04-12 | Zeneca Limited | Transformation of plant cells |
US5141131A (en) | 1989-06-30 | 1992-08-25 | Dowelanco | Method and apparatus for the acceleration of a propellable matter |
IT1231157B (it) | 1989-07-20 | 1991-11-19 | Crc Ricerca Chim | Nuovi geni ibridi funzionali di bacillus thuringiensis ottenuti mediante ricombinazione in vivo. |
WO1992009696A1 (en) | 1990-11-23 | 1992-06-11 | Plant Genetic Systems, N.V. | Process for transforming monocotyledonous plants |
US5384253A (en) | 1990-12-28 | 1995-01-24 | Dekalb Genetics Corporation | Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes |
US5652099A (en) | 1992-02-12 | 1997-07-29 | Conrad; Michael J. | Probes comprising fluorescent nucleosides and uses thereof |
US5679558A (en) | 1992-04-15 | 1997-10-21 | Plant Genetic Systems, N.V. | Transformation of monocot cells |
US5591616A (en) | 1992-07-07 | 1997-01-07 | Japan Tobacco, Inc. | Method for transforming monocotyledons |
US5469976A (en) | 1993-04-30 | 1995-11-28 | Burchell; James R. | Shelf allocation and management system |
EP0627752B1 (en) | 1993-06-04 | 1997-07-23 | CAVIS S.r.l. | An inertia device for interrupting the electrical circuit of a vehicle with an internal combustion engine |
GB9318207D0 (en) | 1993-09-02 | 1993-10-20 | Sandoz Ltd | Improvements in or relating to organic compounds |
US5593881A (en) | 1994-05-06 | 1997-01-14 | Mycogen Corporation | Bacillus thuringiensis delta-endotoxin |
US5527883A (en) | 1994-05-06 | 1996-06-18 | Mycogen Corporation | Delta-endotoxin expression in pseudomonas fluorescens |
ES2330168T3 (es) | 1995-10-13 | 2009-12-04 | Dow Agrosciences Llc | Gen mopdificado de bacillus thuringiensis para combatir los lepidopteros en plantas. |
ID25530A (id) | 1996-11-20 | 2000-10-12 | Ecogen Inc | δ-ENDOTOKSIN BERSPEKTRUM-LEBAR |
EP1130093A1 (en) | 1999-01-19 | 2001-09-05 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US7230167B2 (en) | 2001-08-31 | 2007-06-12 | Syngenta Participations Ag | Modified Cry3A toxins and nucleic acid sequences coding therefor |
US20030232410A1 (en) | 2002-03-21 | 2003-12-18 | Monika Liljedahl | Methods and compositions for using zinc finger endonucleases to enhance homologous recombination |
US7482119B2 (en) | 2002-04-01 | 2009-01-27 | Blue Heron Biotechnology, Inc. | Solid phase methods for polynucleotide production |
GB0227919D0 (en) * | 2002-11-29 | 2003-01-08 | Univ Sussex | Insecticidal agent |
CA2546157C (en) | 2003-11-21 | 2014-07-22 | Dow Global Technolgies Inc. | Improved expression systems with sec-system secretion |
US7179965B2 (en) | 2004-03-26 | 2007-02-20 | Dow Agrosciences Llc | Cry1F and Cry1Ac transgenic cotton lines and event-specific identification thereof |
EP2308977B2 (en) | 2004-04-30 | 2017-04-26 | Dow AgroSciences LLC | Novel herbicide resistance gene |
CN103361316B (zh) | 2005-10-28 | 2017-05-17 | 美国陶氏益农公司 | 新除草剂抗性基因 |
US8569015B2 (en) | 2006-05-30 | 2013-10-29 | Pfenex Inc. | RPA optimization |
EP2468869B1 (en) | 2007-01-31 | 2015-03-18 | Pfenex Inc. | Bacterial leader sequences for increased expression |
JP2012529910A (ja) * | 2009-06-16 | 2012-11-29 | ダウ アグロサイエンシィズ エルエルシー | Dig−5殺虫性cry毒素 |
AU2010339916B2 (en) * | 2009-12-16 | 2016-04-21 | Dow Agrosciences Llc | Modified Cry1CA insecticidal Cry proteins |
UA111936C2 (uk) * | 2009-12-16 | 2016-07-11 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | ТРАНСГЕННА РОСЛИНА, ЯКА МІСТИТЬ ДНК, ЩО КОДУЄ ІНСЕКТИЦИДНИЙ БІЛОК Vip3Ab, І ДНК, ЩО КОДУЄ ІНСЕКТИЦИДНИЙ БІЛОК Cry1Ca, ДЛЯ КЕРУВАННЯ РЕЗИСТЕНТНІСТЮ КОМАХ |
ES2710850T3 (es) * | 2009-12-16 | 2019-04-29 | Dow Agrosciences Llc | Uso de Cry1Da en combinación con Cry1Ca para el control de insectos resistentes |
CN104219950B (zh) * | 2012-02-01 | 2018-02-06 | 陶氏益农公司 | 人造的芸苔属衍生的叶绿体转运肽 |
CA2886787A1 (en) | 2012-10-05 | 2014-04-10 | Dow Agrosciences Llc | Use of cry1ea in combinations for management of resistant fall armyworm insects |
EP3240560B1 (en) * | 2014-12-30 | 2022-08-31 | Corteva Agriscience LLC | MODIFIED Cry1Ca TOXINS USEFUL FOR CONTROL OF INSECT PESTS |
-
2015
- 2015-12-16 EP EP15875965.4A patent/EP3240560B1/en active Active
- 2015-12-16 RU RU2017122359A patent/RU2017122359A/ru not_active Application Discontinuation
- 2015-12-16 AU AU2015372474A patent/AU2015372474B2/en not_active Ceased
- 2015-12-16 WO PCT/US2015/066182 patent/WO2016109212A1/en active Application Filing
- 2015-12-16 US US15/541,303 patent/US10570182B2/en active Active
- 2015-12-16 CN CN201580071104.4A patent/CN107106634B/zh active Active
- 2015-12-16 CN CN202111347312.6A patent/CN114213511A/zh active Pending
- 2015-12-16 NZ NZ732360A patent/NZ732360A/en not_active IP Right Cessation
- 2015-12-16 BR BR112017013514-0A patent/BR112017013514A2/pt unknown
- 2015-12-16 CA CA2972016A patent/CA2972016C/en active Active
- 2015-12-16 KR KR1020177017297A patent/KR20170099907A/ko unknown
- 2015-12-16 CA CA3192494A patent/CA3192494A1/en active Pending
- 2015-12-16 MX MX2017008413A patent/MX2017008413A/es unknown
- 2015-12-16 JP JP2017534663A patent/JP2018501798A/ja active Pending
- 2015-12-16 EP EP22192978.9A patent/EP4183405A1/en active Pending
- 2015-12-16 CN CN202111346425.4A patent/CN114213510A/zh active Pending
- 2015-12-21 TW TW104142969A patent/TW201629091A/zh unknown
- 2015-12-29 UY UY0001036482A patent/UY36482A/es not_active Application Discontinuation
- 2015-12-29 AR ARP150104328A patent/AR103310A1/es unknown
-
2017
- 2017-06-22 IL IL253093A patent/IL253093A0/en unknown
- 2017-06-22 MX MX2022011850A patent/MX2022011850A/es unknown
- 2017-06-23 PH PH12017501195A patent/PH12017501195A1/en unknown
- 2017-06-23 ZA ZA2017/04299A patent/ZA201704299B/en unknown
- 2017-06-27 CL CL2017001707A patent/CL2017001707A1/es unknown
- 2017-06-27 CO CONC2017/0006326A patent/CO2017006326A2/es unknown
-
2020
- 2020-02-03 US US16/780,501 patent/US20200157154A1/en not_active Abandoned
-
2022
- 2022-09-19 US US17/933,203 patent/US20230183300A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2419441B1 (en) | Dig-3 insecticidal cry toxins | |
US9487798B2 (en) | DIG-10 insecticidal cry toxins | |
US20200184403A1 (en) | Engineered cry6a insecticidal proteins | |
US8461422B2 (en) | DIG-5 insecticidal Cry toxins | |
MX2011013675A (es) | Toxinas cry dig-11 insecticidas. | |
US20230183300A1 (en) | MODIFIED Cry1Ca TOXINS USEFUL FOR CONTROL OF INSECT PESTS | |
US10028510B2 (en) | DIG-17 insecticidal cry toxins | |
CN114685630B (zh) | 工程化的cry6a杀虫蛋白 | |
US20160060306A1 (en) | Dig-14 insecticidal cry toxins |