PL181408B1 - Fragment hybrydowej toksyny Bacillus thuringiensis i rekombinant DNA kodujacy fragment hybrydowej toksyny Bacillus thuringiensis PL PL PL PL PL PL PL PL PL - Google Patents
Fragment hybrydowej toksyny Bacillus thuringiensis i rekombinant DNA kodujacy fragment hybrydowej toksyny Bacillus thuringiensis PL PL PL PL PL PL PL PL PLInfo
- Publication number
- PL181408B1 PL181408B1 PL94313317A PL31331794A PL181408B1 PL 181408 B1 PL181408 B1 PL 181408B1 PL 94313317 A PL94313317 A PL 94313317A PL 31331794 A PL31331794 A PL 31331794A PL 181408 B1 PL181408 B1 PL 181408B1
- Authority
- PL
- Poland
- Prior art keywords
- leu
- glu
- asn
- gly
- ala
- Prior art date
Links
- 239000003053 toxin Substances 0.000 title claims abstract description 87
- 231100000765 toxin Toxicity 0.000 title claims abstract description 85
- 239000012634 fragment Substances 0.000 claims abstract description 63
- 150000001413 amino acids Chemical class 0.000 claims abstract description 59
- 239000002773 nucleotide Substances 0.000 claims abstract description 29
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 29
- 241000238631 Hexapoda Species 0.000 claims abstract description 23
- 230000000749 insecticidal effect Effects 0.000 claims abstract description 22
- 239000012528 membrane Substances 0.000 claims abstract description 13
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract 7
- 235000013351 cheese Nutrition 0.000 claims description 373
- 108020004511 Recombinant DNA Proteins 0.000 claims description 18
- 241000193388 Bacillus thuringiensis Species 0.000 claims description 9
- 229940097012 bacillus thuringiensis Drugs 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 12
- 230000000968 intestinal effect Effects 0.000 abstract description 3
- 101710182223 Toxin B Proteins 0.000 abstract 1
- 108090000623 proteins and genes Proteins 0.000 description 99
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 86
- 235000018102 proteins Nutrition 0.000 description 72
- 102000004169 proteins and genes Human genes 0.000 description 72
- 108700012359 toxins Proteins 0.000 description 71
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 66
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 52
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 47
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 40
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 35
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 34
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 32
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 27
- 235000001014 amino acid Nutrition 0.000 description 26
- 229940024606 amino acid Drugs 0.000 description 26
- 108010038633 aspartylglutamate Proteins 0.000 description 26
- 108010061238 threonyl-glycine Proteins 0.000 description 26
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 25
- 239000013612 plasmid Substances 0.000 description 25
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 22
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 20
- 108010087823 glycyltyrosine Proteins 0.000 description 20
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 18
- 108010029020 prolylglycine Proteins 0.000 description 18
- 101710151559 Crystal protein Proteins 0.000 description 17
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 17
- 108010013835 arginine glutamate Proteins 0.000 description 17
- 231100000331 toxic Toxicity 0.000 description 17
- 230000002588 toxic effect Effects 0.000 description 17
- 108020004414 DNA Proteins 0.000 description 16
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 16
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 15
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 15
- 108010049041 glutamylalanine Proteins 0.000 description 15
- 108010050848 glycylleucine Proteins 0.000 description 15
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 14
- 101150049404 cry1Ca gene Proteins 0.000 description 14
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 13
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 13
- 108010089804 glycyl-threonine Proteins 0.000 description 13
- 108010081551 glycylphenylalanine Proteins 0.000 description 13
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 12
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 12
- 108010047857 aspartylglycine Proteins 0.000 description 12
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 11
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 11
- 108010057821 leucylproline Proteins 0.000 description 11
- 108010090894 prolylleucine Proteins 0.000 description 11
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 10
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 10
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 10
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 10
- 108010012581 phenylalanylglutamate Proteins 0.000 description 10
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 9
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 9
- 241000588724 Escherichia coli Species 0.000 description 9
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 9
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 9
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 9
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 9
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 9
- 108010093581 aspartyl-proline Proteins 0.000 description 9
- 108010092854 aspartyllysine Proteins 0.000 description 9
- 239000013078 crystal Substances 0.000 description 9
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 108010073969 valyllysine Proteins 0.000 description 9
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 8
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 8
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 8
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 8
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 8
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 8
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 8
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 8
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 8
- 241000196324 Embryophyta Species 0.000 description 8
- MPZWMIIOPAPAKE-BQBZGAKWSA-N Glu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N MPZWMIIOPAPAKE-BQBZGAKWSA-N 0.000 description 8
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 8
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 8
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 8
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 8
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 8
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 8
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 8
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 8
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 8
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 8
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 8
- 108010087924 alanylproline Proteins 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 8
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 8
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 8
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 8
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 8
- 108010077515 glycylproline Proteins 0.000 description 8
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 8
- 239000002245 particle Substances 0.000 description 8
- 108010070643 prolylglutamic acid Proteins 0.000 description 8
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 7
- OQWQTGBOFPJOIF-DLOVCJGASA-N Ala-Lys-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N OQWQTGBOFPJOIF-DLOVCJGASA-N 0.000 description 7
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 7
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 7
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 7
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 7
- XEEIQMGZRFFSRD-XVYDVKMFSA-N Cys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N XEEIQMGZRFFSRD-XVYDVKMFSA-N 0.000 description 7
- GMXSSZUVDNPRMA-FXQIFTODSA-N Cys-Arg-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GMXSSZUVDNPRMA-FXQIFTODSA-N 0.000 description 7
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 7
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 7
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 7
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 7
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 7
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 7
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 7
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 7
- ONHCDMBHPQIPAI-YTQUADARSA-N Leu-Trp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N ONHCDMBHPQIPAI-YTQUADARSA-N 0.000 description 7
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 7
- RYOLKFYZBHMYFW-WDSOQIARSA-N Lys-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 RYOLKFYZBHMYFW-WDSOQIARSA-N 0.000 description 7
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 7
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 7
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 7
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 7
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 7
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 7
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 7
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 7
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 7
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 7
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 7
- 108010036533 arginylvaline Proteins 0.000 description 7
- 108010040030 histidinoalanine Proteins 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 238000005215 recombination Methods 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 6
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 6
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 6
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 6
- NPDLYUOYAGBHFB-WDSKDSINSA-N Asn-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NPDLYUOYAGBHFB-WDSKDSINSA-N 0.000 description 6
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 6
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 6
- SQZIAWGBBUSSPJ-ZKWXMUAHSA-N Asn-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N SQZIAWGBBUSSPJ-ZKWXMUAHSA-N 0.000 description 6
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 6
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 6
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 6
- BLGNLNRBABWDST-CIUDSAMLSA-N Cys-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BLGNLNRBABWDST-CIUDSAMLSA-N 0.000 description 6
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 6
- KIMXNQXJJWWVIN-AVGNSLFASA-N Glu-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O KIMXNQXJJWWVIN-AVGNSLFASA-N 0.000 description 6
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 6
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 6
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 6
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 6
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 6
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 6
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 6
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 6
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 6
- FEHQLKKBVJHSEC-SZMVWBNQSA-N Leu-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FEHQLKKBVJHSEC-SZMVWBNQSA-N 0.000 description 6
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 6
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 6
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 6
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 6
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 6
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 6
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 6
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 6
- 102000004142 Trypsin Human genes 0.000 description 6
- 108090000631 Trypsin Proteins 0.000 description 6
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 6
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 6
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 6
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 6
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 6
- 108010016616 cysteinylglycine Proteins 0.000 description 6
- 108010084760 glycyl-tyrosyl-glycyl-aspartate Proteins 0.000 description 6
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 239000012588 trypsin Substances 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 5
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 5
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 5
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 5
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 5
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 5
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 5
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 5
- YJRORCOAFUZVKA-FXQIFTODSA-N Asn-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N YJRORCOAFUZVKA-FXQIFTODSA-N 0.000 description 5
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 5
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 5
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 5
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 5
- 241000193830 Bacillus <bacterium> Species 0.000 description 5
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 5
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 5
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 5
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 5
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 5
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 5
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 5
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 5
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 5
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 5
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 5
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 5
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 5
- KZJQUYFDSCFSCO-DLOVCJGASA-N Lys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N KZJQUYFDSCFSCO-DLOVCJGASA-N 0.000 description 5
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 5
- XBAJINCXDBTJRH-WDSOQIARSA-N Lys-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N XBAJINCXDBTJRH-WDSOQIARSA-N 0.000 description 5
- 241000255908 Manduca sexta Species 0.000 description 5
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 5
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 5
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 5
- QHSSUIHLAIWXEE-IHRRRGAJSA-N Pro-Tyr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O QHSSUIHLAIWXEE-IHRRRGAJSA-N 0.000 description 5
- 241000256247 Spodoptera exigua Species 0.000 description 5
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 5
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 5
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 5
- GVRKWABULJAONN-VQVTYTSYSA-N Val-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVRKWABULJAONN-VQVTYTSYSA-N 0.000 description 5
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 102000039446 nucleic acids Human genes 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 108010018625 phenylalanylarginine Proteins 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 108010004914 prolylarginine Proteins 0.000 description 5
- 108091035539 telomere Proteins 0.000 description 5
- 102000055501 telomere Human genes 0.000 description 5
- 108010038745 tryptophylglycine Proteins 0.000 description 5
- ALBODLTZUXKBGZ-JUUVMNCLSA-N (2s)-2-amino-3-phenylpropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound NCCCC[C@H](N)C(O)=O.OC(=O)[C@@H](N)CC1=CC=CC=C1 ALBODLTZUXKBGZ-JUUVMNCLSA-N 0.000 description 4
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 4
- 108010076441 Ala-His-His Proteins 0.000 description 4
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 4
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 4
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 4
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 4
- LFFOJBOTZUWINF-ZANVPECISA-N Ala-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O)=CNC2=C1 LFFOJBOTZUWINF-ZANVPECISA-N 0.000 description 4
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 4
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 4
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 4
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 4
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 4
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 4
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 4
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 4
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 4
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 4
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 4
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 4
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 4
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 4
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 4
- DPSUVAPLRQDWAO-YDHLFZDLSA-N Asn-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)N)N DPSUVAPLRQDWAO-YDHLFZDLSA-N 0.000 description 4
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 4
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 4
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 4
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 4
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 4
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 4
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 4
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 4
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 4
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 4
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- ZLFRUAFDAIFNHN-LKXGYXEUSA-N Cys-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O ZLFRUAFDAIFNHN-LKXGYXEUSA-N 0.000 description 4
- 241001200922 Gagata Species 0.000 description 4
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 4
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 4
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 4
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 4
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 4
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 4
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 4
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 4
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 4
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 4
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 4
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 4
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 4
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 4
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 4
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 4
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 4
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 4
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 4
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 4
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 4
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 4
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 4
- COZMNNJEGNPDED-HOCLYGCPSA-N Gly-Val-Trp Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O COZMNNJEGNPDED-HOCLYGCPSA-N 0.000 description 4
- NIKBMHGRNAPJFW-IUCAKERBSA-N His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 NIKBMHGRNAPJFW-IUCAKERBSA-N 0.000 description 4
- VHOLZZKNEBBHTH-YUMQZZPRSA-N His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 VHOLZZKNEBBHTH-YUMQZZPRSA-N 0.000 description 4
- MUENHEQLLUDKSC-PMVMPFDFSA-N His-Tyr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CNC=N1 MUENHEQLLUDKSC-PMVMPFDFSA-N 0.000 description 4
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 4
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 4
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 4
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 4
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 4
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 4
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 4
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 4
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 4
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 4
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 4
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 4
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 4
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 4
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 4
- 239000000020 Nitrocellulose Substances 0.000 description 4
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 4
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 4
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 4
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 4
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 4
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 4
- XBCOOBCTVMMQSC-BVSLBCMMSA-N Phe-Val-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 XBCOOBCTVMMQSC-BVSLBCMMSA-N 0.000 description 4
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 4
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 4
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 4
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 4
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 4
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 4
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 4
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 4
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 4
- XSTGOZBBXFKGHA-YJRXYDGGSA-N Thr-His-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O XSTGOZBBXFKGHA-YJRXYDGGSA-N 0.000 description 4
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 4
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 4
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 4
- NJGMALCNYAMYCB-JRQIVUDYSA-N Thr-Tyr-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJGMALCNYAMYCB-JRQIVUDYSA-N 0.000 description 4
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 4
- QAXCHNZDPLSFPC-PJODQICGSA-N Trp-Ala-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QAXCHNZDPLSFPC-PJODQICGSA-N 0.000 description 4
- SCQBNMKLZVCXNX-ZFWWWQNUSA-N Trp-Arg-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N SCQBNMKLZVCXNX-ZFWWWQNUSA-N 0.000 description 4
- UYKREHOKELZSPB-JTQLQIEISA-N Trp-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(O)=O)=CNC2=C1 UYKREHOKELZSPB-JTQLQIEISA-N 0.000 description 4
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 4
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 4
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 4
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 4
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 4
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 4
- DLYOEFGPYTZVSP-AEJSXWLSSA-N Val-Cys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N DLYOEFGPYTZVSP-AEJSXWLSSA-N 0.000 description 4
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 4
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 4
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 4
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 4
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 4
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 4
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 4
- 108010011559 alanylphenylalanine Proteins 0.000 description 4
- 108010070783 alanyltyrosine Proteins 0.000 description 4
- 230000000692 anti-sense effect Effects 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 229920001220 nitrocellulos Polymers 0.000 description 4
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 231100000419 toxicity Toxicity 0.000 description 4
- 230000001988 toxicity Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 4
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 4
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 3
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 3
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 3
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 3
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 3
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 3
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 3
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 3
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 3
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 3
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 3
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 3
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 3
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 3
- 101000583086 Bunodosoma granuliferum Delta-actitoxin-Bgr2b Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- ALCAUWPAMLVUDB-FXQIFTODSA-N Glu-Gln-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ALCAUWPAMLVUDB-FXQIFTODSA-N 0.000 description 3
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 3
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 3
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 3
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 3
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 3
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 3
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 3
- RXJFSLQVMGYQEL-IHRRRGAJSA-N Glu-Tyr-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 RXJFSLQVMGYQEL-IHRRRGAJSA-N 0.000 description 3
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 3
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 3
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 3
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 3
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 3
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 3
- OZBDSFBWIDPVDA-BZSNNMDCSA-N His-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N OZBDSFBWIDPVDA-BZSNNMDCSA-N 0.000 description 3
- JSQIXEHORHLQEE-MEYUZBJRSA-N His-Phe-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JSQIXEHORHLQEE-MEYUZBJRSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- HQPHMEPBNUHPKD-XIRDDKMYSA-N Leu-Cys-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N HQPHMEPBNUHPKD-XIRDDKMYSA-N 0.000 description 3
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 3
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 3
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 3
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 3
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 3
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 3
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 3
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 3
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 3
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 3
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 3
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 3
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 3
- UETQMSASAVBGJY-QWRGUYRKSA-N Lys-Gly-His Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 UETQMSASAVBGJY-QWRGUYRKSA-N 0.000 description 3
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 3
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 3
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 3
- 241000555303 Mamestra brassicae Species 0.000 description 3
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 3
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 3
- RORUIHAWOLADSH-HJWJTTGWSA-N Phe-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 RORUIHAWOLADSH-HJWJTTGWSA-N 0.000 description 3
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 3
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 3
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 3
- LCWXSALTPTZKNM-CIUDSAMLSA-N Pro-Cys-Glu Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O LCWXSALTPTZKNM-CIUDSAMLSA-N 0.000 description 3
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 3
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 3
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 3
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 3
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 3
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 3
- ODSAPYVQSLDRSR-LKXGYXEUSA-N Thr-Cys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O ODSAPYVQSLDRSR-LKXGYXEUSA-N 0.000 description 3
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 3
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 3
- WCRFXRIWBFRZBR-GGVZMXCHSA-N Thr-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WCRFXRIWBFRZBR-GGVZMXCHSA-N 0.000 description 3
- PXQPYPMSLBQHJJ-WFBYXXMGSA-N Trp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PXQPYPMSLBQHJJ-WFBYXXMGSA-N 0.000 description 3
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 3
- NXJZCPKZIKTYLX-XEGUGMAKSA-N Trp-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NXJZCPKZIKTYLX-XEGUGMAKSA-N 0.000 description 3
- DXYWRYQRKPIGGU-BPNCWPANSA-N Tyr-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DXYWRYQRKPIGGU-BPNCWPANSA-N 0.000 description 3
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 3
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 3
- 108010064997 VPY tripeptide Proteins 0.000 description 3
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 3
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 3
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 3
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 3
- WFTKOJGOOUJLJV-VKOGCVSHSA-N Val-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C)=CNC2=C1 WFTKOJGOOUJLJV-VKOGCVSHSA-N 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 230000001588 bifunctional effect Effects 0.000 description 3
- 238000004166 bioassay Methods 0.000 description 3
- 238000007413 biotinylation Methods 0.000 description 3
- 230000006287 biotinylation Effects 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 108010054813 diprotin B Proteins 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 210000001035 gastrointestinal tract Anatomy 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 108010020688 glycylhistidine Proteins 0.000 description 3
- 108010084389 glycyltryptophan Proteins 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 210000002490 intestinal epithelial cell Anatomy 0.000 description 3
- 108010053037 kyotorphin Proteins 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 210000000110 microvilli Anatomy 0.000 description 3
- 210000004897 n-terminal region Anatomy 0.000 description 3
- 229920002401 polyacrylamide Polymers 0.000 description 3
- 101150079601 recA gene Proteins 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- 108010078580 tyrosylleucine Proteins 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 2
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 2
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 2
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 2
- IHRGVZXPTIQNIP-NAKRPEOUSA-N Ala-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)N IHRGVZXPTIQNIP-NAKRPEOUSA-N 0.000 description 2
- OMNVYXHOSHNURL-WPRPVWTQSA-N Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMNVYXHOSHNURL-WPRPVWTQSA-N 0.000 description 2
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 2
- 241000024188 Andala Species 0.000 description 2
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 2
- JSLGXODUIAFWCF-WDSKDSINSA-N Arg-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O JSLGXODUIAFWCF-WDSKDSINSA-N 0.000 description 2
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 2
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 2
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 2
- DQNLFLGFZAUIOW-FXQIFTODSA-N Arg-Cys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DQNLFLGFZAUIOW-FXQIFTODSA-N 0.000 description 2
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 2
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 2
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 2
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 2
- BNODVYXZAAXSHW-IUCAKERBSA-N Arg-His Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BNODVYXZAAXSHW-IUCAKERBSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 2
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 2
- FTMRPIVPSDVGCC-GUBZILKMSA-N Arg-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FTMRPIVPSDVGCC-GUBZILKMSA-N 0.000 description 2
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 2
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 2
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 2
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 2
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 2
- PPMTUXJSQDNUDE-CIUDSAMLSA-N Asn-Glu-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PPMTUXJSQDNUDE-CIUDSAMLSA-N 0.000 description 2
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 2
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 2
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 2
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 2
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 2
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 2
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 2
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 2
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 2
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 2
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 2
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 2
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 2
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- FKBFDTRILNZGAI-IMJSIDKUSA-N Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O FKBFDTRILNZGAI-IMJSIDKUSA-N 0.000 description 2
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 2
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 2
- YVHGKXAOSVBGJV-CIUDSAMLSA-N Asp-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N YVHGKXAOSVBGJV-CIUDSAMLSA-N 0.000 description 2
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 2
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 2
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 2
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 2
- 101150102464 Cry1 gene Proteins 0.000 description 2
- ZEXHDOQQYZKOIB-ACZMJKKPSA-N Cys-Glu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZEXHDOQQYZKOIB-ACZMJKKPSA-N 0.000 description 2
- XVLMKWWVBNESPX-XVYDVKMFSA-N Cys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N XVLMKWWVBNESPX-XVYDVKMFSA-N 0.000 description 2
- DXSBGVKEPHDOTD-UBHSHLNASA-N Cys-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N DXSBGVKEPHDOTD-UBHSHLNASA-N 0.000 description 2
- CLEFUAZULXANBU-MELADBBJSA-N Cys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CS)N)C(=O)O CLEFUAZULXANBU-MELADBBJSA-N 0.000 description 2
- FNXOZWPPOJRBRE-XGEHTFHBSA-N Cys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)N)O FNXOZWPPOJRBRE-XGEHTFHBSA-N 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 2
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 2
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 2
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 2
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 2
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 2
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 2
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 2
- SITLTJHOQZFJGG-XPUUQOCRSA-N Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 2
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 2
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 2
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 2
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 2
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 2
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 2
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 2
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 2
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 2
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 2
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 2
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 2
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 2
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 2
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 2
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 2
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 2
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 2
- HQKADFMLECZIQJ-HVTMNAMFSA-N His-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N HQKADFMLECZIQJ-HVTMNAMFSA-N 0.000 description 2
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 2
- 241000255777 Lepidoptera Species 0.000 description 2
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 2
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 2
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 2
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 2
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 2
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 2
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 2
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 2
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 2
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 2
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 2
- OZILORBBPKKGRI-RYUDHWBXSA-N Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 OZILORBBPKKGRI-RYUDHWBXSA-N 0.000 description 2
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 2
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 2
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 2
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 2
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 2
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 2
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 2
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 2
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 2
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 2
- VGTJSEYTVMAASM-RPTUDFQQSA-N Phe-Thr-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VGTJSEYTVMAASM-RPTUDFQQSA-N 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 2
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 2
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 2
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 2
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 2
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 2
- SNSYSBUTTJBPDG-OKZBNKHCSA-N Pro-Trp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N4CCC[C@@H]4C(=O)O SNSYSBUTTJBPDG-OKZBNKHCSA-N 0.000 description 2
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 2
- 241000256248 Spodoptera Species 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 2
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 2
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 2
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 2
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- XZSJDSBPEJBEFZ-QRTARXTBSA-N Trp-Asn-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O XZSJDSBPEJBEFZ-QRTARXTBSA-N 0.000 description 2
- CZWIHKFGHICAJX-BPUTZDHNSA-N Trp-Glu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 CZWIHKFGHICAJX-BPUTZDHNSA-N 0.000 description 2
- MPYZGXUYLNPSNF-NAZCDGGXSA-N Trp-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O MPYZGXUYLNPSNF-NAZCDGGXSA-N 0.000 description 2
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 2
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 2
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 2
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 2
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 2
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 2
- NUQZCPSZHGIYTA-HKUYNNGSSA-N Tyr-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NUQZCPSZHGIYTA-HKUYNNGSSA-N 0.000 description 2
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 2
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 2
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- OXGVAUFVTOPFFA-XPUUQOCRSA-N Val-Gly-Cys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N OXGVAUFVTOPFFA-XPUUQOCRSA-N 0.000 description 2
- BNQVUHQWZGTIBX-IUCAKERBSA-N Val-His Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CN=CN1 BNQVUHQWZGTIBX-IUCAKERBSA-N 0.000 description 2
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 2
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 2
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 2
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 2
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- HWYHZTIRURJOHG-UHFFFAOYSA-N luminol Chemical compound O=C1NNC(=O)C2=C1C(N)=CC=C2 HWYHZTIRURJOHG-UHFFFAOYSA-N 0.000 description 2
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 108010024607 phenylalanylalanine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 238000000159 protein binding assay Methods 0.000 description 2
- 235000004252 protein component Nutrition 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 1
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 1
- OGZBJJLRKQZRHL-KJEVXHAQSA-N Arg-Thr-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OGZBJJLRKQZRHL-KJEVXHAQSA-N 0.000 description 1
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 1
- VJIQPOJMISSUPO-BVSLBCMMSA-N Arg-Trp-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VJIQPOJMISSUPO-BVSLBCMMSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 1
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 1
- ABMMIOIRQJNRHG-XKNYDFJKSA-N Asn-Asn-Pro-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ABMMIOIRQJNRHG-XKNYDFJKSA-N 0.000 description 1
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 1
- QGNXYDHVERJIAY-ACZMJKKPSA-N Asn-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGNXYDHVERJIAY-ACZMJKKPSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- MECFLTFREHAZLH-ACZMJKKPSA-N Asn-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N MECFLTFREHAZLH-ACZMJKKPSA-N 0.000 description 1
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 1
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 1
- OSZBYGVKAFZWKC-FXQIFTODSA-N Asn-Pro-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(O)=O OSZBYGVKAFZWKC-FXQIFTODSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 1
- JNCRAQVYJZGIOW-QSFUFRPTSA-N Asn-Val-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNCRAQVYJZGIOW-QSFUFRPTSA-N 0.000 description 1
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- NURJSGZGBVJFAD-ZLUOBGJFSA-N Asp-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O NURJSGZGBVJFAD-ZLUOBGJFSA-N 0.000 description 1
- GSMPSRPMQQDRIB-WHFBIAKZSA-N Asp-Gln Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O GSMPSRPMQQDRIB-WHFBIAKZSA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- ZARXTZFGQZBYFO-JQWIXIFHSA-N Asp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)N)C(O)=O)=CNC2=C1 ZARXTZFGQZBYFO-JQWIXIFHSA-N 0.000 description 1
- ZQFZEBRNAMXXJV-KKUMJFAQSA-N Asp-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O ZQFZEBRNAMXXJV-KKUMJFAQSA-N 0.000 description 1
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 108700003918 Bacillus Thuringiensis insecticidal crystal Proteins 0.000 description 1
- 241000724266 Broad bean mottle virus Species 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- PLBJMUUEGBBHRH-ZLUOBGJFSA-N Cys-Ala-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLBJMUUEGBBHRH-ZLUOBGJFSA-N 0.000 description 1
- PKNIZMPLMSKROD-BIIVOSGPSA-N Cys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N PKNIZMPLMSKROD-BIIVOSGPSA-N 0.000 description 1
- KIQKJXYVGSYDFS-ZLUOBGJFSA-N Cys-Asn-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KIQKJXYVGSYDFS-ZLUOBGJFSA-N 0.000 description 1
- NITLUESFANGEIW-BQBZGAKWSA-N Cys-Pro-Gly Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O NITLUESFANGEIW-BQBZGAKWSA-N 0.000 description 1
- OELDIVRKHTYFNG-WDSKDSINSA-N Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CS OELDIVRKHTYFNG-WDSKDSINSA-N 0.000 description 1
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 1
- QQAYIVHVRFJICE-AEJSXWLSSA-N Cys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N QQAYIVHVRFJICE-AEJSXWLSSA-N 0.000 description 1
- 241001071944 Cyta Species 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- SNRUBQQJIBEYMU-UHFFFAOYSA-N Dodecane Natural products CCCCCCCCCCCC SNRUBQQJIBEYMU-UHFFFAOYSA-N 0.000 description 1
- 241001302160 Escherichia coli str. K-12 substr. DH10B Species 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 1
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 1
- ZDJZEGYVKANKED-NRPADANISA-N Gln-Cys-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O ZDJZEGYVKANKED-NRPADANISA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- ZQFAGNFSIZZYBA-AAEUAGOBSA-N Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)N)C(O)=O)=CNC2=C1 ZQFAGNFSIZZYBA-AAEUAGOBSA-N 0.000 description 1
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 1
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- PABVKUJVLNMOJP-WHFBIAKZSA-N Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(O)=O PABVKUJVLNMOJP-WHFBIAKZSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 1
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- RZMXBFUSQNLEQF-QEJZJMRPSA-N Glu-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RZMXBFUSQNLEQF-QEJZJMRPSA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 1
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 1
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 1
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- FRJIAZKQGSCKPQ-FSPLSTOPSA-N His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 FRJIAZKQGSCKPQ-FSPLSTOPSA-N 0.000 description 1
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 1
- DZMVESFTHXSSPZ-XVYDVKMFSA-N His-Ala-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DZMVESFTHXSSPZ-XVYDVKMFSA-N 0.000 description 1
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 1
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 1
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 1
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 1
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 1
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 1
- KDDKJKKQODQQBR-NHCYSSNCSA-N His-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KDDKJKKQODQQBR-NHCYSSNCSA-N 0.000 description 1
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 1
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 1
- QNBYCZTZNOVDMI-HGNGGELXSA-N Ile-His Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QNBYCZTZNOVDMI-HGNGGELXSA-N 0.000 description 1
- JLWLMGADIQFKRD-QSFUFRPTSA-N Ile-His-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CN=CN1 JLWLMGADIQFKRD-QSFUFRPTSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- XOZOSAUOGRPCES-STECZYCISA-N Ile-Pro-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XOZOSAUOGRPCES-STECZYCISA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- QSXSHZIRKTUXNG-STECZYCISA-N Ile-Val-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QSXSHZIRKTUXNG-STECZYCISA-N 0.000 description 1
- QLROSWPKSBORFJ-BQBZGAKWSA-N L-Prolyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- JYOAXOMPIXKMKK-YUMQZZPRSA-N Leu-Gln Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCC(N)=O JYOAXOMPIXKMKK-YUMQZZPRSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 1
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 description 1
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 1
- CHQWUYSNAOABIP-ZPFDUUQYSA-N Met-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N CHQWUYSNAOABIP-ZPFDUUQYSA-N 0.000 description 1
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 1
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 1
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 1
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- JMCOUWKXLXDERB-WMZOPIPTSA-N Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 JMCOUWKXLXDERB-WMZOPIPTSA-N 0.000 description 1
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 1
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 1
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 1
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 1
- VPVHXWGPALPDGP-GUBZILKMSA-N Pro-Asn-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPVHXWGPALPDGP-GUBZILKMSA-N 0.000 description 1
- HXNYBZQLBWIADP-WDSKDSINSA-N Pro-Cys Chemical compound OC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 HXNYBZQLBWIADP-WDSKDSINSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- BEPSGCXDIVACBU-IUCAKERBSA-N Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BEPSGCXDIVACBU-IUCAKERBSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 1
- 101100173636 Rattus norvegicus Fhl2 gene Proteins 0.000 description 1
- 241000831652 Salinivibrio sharmensis Species 0.000 description 1
- 229920005654 Sephadex Polymers 0.000 description 1
- 239000012507 Sephadex™ Substances 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- UCXDHBORXLVBNC-ZLUOBGJFSA-N Ser-Asn-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O UCXDHBORXLVBNC-ZLUOBGJFSA-N 0.000 description 1
- DGPGKMKUNGKHPK-QEJZJMRPSA-N Ser-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGPGKMKUNGKHPK-QEJZJMRPSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 1
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- XOLLWQIBBLBAHQ-WDSOQIARSA-N Trp-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O XOLLWQIBBLBAHQ-WDSOQIARSA-N 0.000 description 1
- SWSUXOKZKQRADK-FDARSICLSA-N Trp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SWSUXOKZKQRADK-FDARSICLSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- OEVJGIHPQOXYFE-SRVKXCTJSA-N Tyr-Asn-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OEVJGIHPQOXYFE-SRVKXCTJSA-N 0.000 description 1
- DWJQKEZKLQCHKO-SRVKXCTJSA-N Tyr-Asn-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O DWJQKEZKLQCHKO-SRVKXCTJSA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 1
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 1
- VNYDHJARLHNEGA-RYUDHWBXSA-N Tyr-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 1
- MFEVVAXTBZELLL-GGVZMXCHSA-N Tyr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-GGVZMXCHSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- FZADUTOCSFDBRV-RNXOBYDBSA-N Tyr-Tyr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 FZADUTOCSFDBRV-RNXOBYDBSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- CWOSXNKDOACNJN-BZSNNMDCSA-N Val-Arg-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N CWOSXNKDOACNJN-BZSNNMDCSA-N 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 1
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 1
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 1
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- QHSSPPHOHJSTML-HOCLYGCPSA-N Val-Trp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N QHSSPPHOHJSTML-HOCLYGCPSA-N 0.000 description 1
- IOUPEELXVYPCPG-UHFFFAOYSA-N Valylglycine Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000843 anti-fungal effect Effects 0.000 description 1
- 230000001679 anti-nematodal effect Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 238000012742 biochemical analysis Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 208000002352 blister Diseases 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000012470 diluted sample Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 230000000887 hydrating effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 239000002917 insecticide Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- DVCSNHXRZUVYAM-BQBZGAKWSA-N leu-asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 238000002803 maceration Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000011368 organic material Substances 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000012898 sample dilution Substances 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000028070 sporulation Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000002723 toxicity assay Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
- C07K14/325—Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N63/00—Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
- A01N63/50—Isolated enzymes; Isolated proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S530/00—Chemistry: natural resins or derivatives; peptides or proteins; lignins or reaction products thereof
- Y10S530/82—Proteins from microorganisms
- Y10S530/825—Bacteria
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Microbiology (AREA)
- Virology (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Agronomy & Crop Science (AREA)
- Biotechnology (AREA)
- Gastroenterology & Hepatology (AREA)
- Pest Control & Pesticides (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Dentistry (AREA)
- Wood Science & Technology (AREA)
- Environmental Sciences (AREA)
- Peptides Or Proteins (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Compounds Of Unknown Constitution (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Nitrogen Condensed Heterocyclic Rings (AREA)
Abstract
1 F ragm ent hybrydow ej toksyny B acillus thuringiensis m ajacy sekw encje am inokw asó w od am inokw asu 1 do am inokw asu 620 o kreslona w Sek ID N r 6 lub m ajacy te sekw encje z co najm niej je d n a z nastepujacych zm ian I le w pozycji 609 je s t zastapiona przez Leu, A la w pozycji 6 1 8 je s t zastapiona przez Glu, Ser w pozycji 620 je s t zastapiona przez Tyr lub toksyna p o dobna w co naim m ej 85% do niej, która m a podobna aktyw nosc ow adobojcza lub p o d o b n a zdolnosc w iazania w blonie je lita srodkow ego ow ada 2 F ragm ent hybrydow ej toksyny B acillus thuringiensis m ajacy sekw encje am inokw asów od am inokw asu 1 do am inokw asu 627, o kreslona w Sek ID N r 8 lub m ajacy te sekw encje z co najm niej je d n a z nastepujacych zm ian Ile w pozycji 617 jest zastapiona przez Leu, A la w pozycji 625 je s t zastapiona przez Glu, Ser w pozycji 627 je s t zastapiona przez t yr lub toksyna p o d o b n a w co najm niej 85% do nich która m a podobna aktyw nosc ow adobójc z a lub p o d o b n a zdolnosc w ia zania w blonie je lita srodkow ego ow ada 3 R ekom binant DNA kodujacy fragm ent hybrydow ej toksyny B acillus thuringiensis m ajacy sekw encje am in o k w asów od am inokw asu 1 do am inokw asu 620 okreslona w Sek ID N r 6 lub m ajacy te sekw encje z co n ajm n iej je d n a z nastep u jacych zm ian Ile w pozycji 609 jest zastapiona przez Leu, A la w pozycji 618 je st zastapiona przez Glu, Ser w pozycji 620 je s t zastapiona przez Tyr lub kodujacy frag m en t hybrydow ej toksyny B acillus thuringiensis m ajacy sekw encje am inokw asów od am inokw asu okolo 1 do am in o k w a- su okolo 627 o kreslona w Sek ID N r 8 lub m ajacy te sekw encje z co najm niej je d n a z nastepujacych zm ian I le w pozycji 617 je s t zastapiona przez Leu, A la w pozycji 625 je s t zastapiona przez Glu, Ser w pozycji 627 je s t zastapiona przez T yr lub toksyne p o d o b n a w co najm niej 85% do nich, która m a podobna aktyw nosc ow adobójcza lub p o d o b n a zdolnosc w iazania w blonie je lita srodkow ego ow ada 4 R ek o m b in an t D N A w edlug zastrz 3, znamienny tym, ze zaw iera sekw encje od nukleotydu 1 do nukleotydu 1860 okreslona w Sek ID N r 5 lub sekw encje od nukleotydu 1 do nukleotydu 1881 w Sek ID N r 7 PL PL PL PL PL PL PL PL PL
Description
Przedmiotem wynalazku jest fragment hybrydowej toksyny Bacillus thuringiensis i rekombinant DNA kodujący fragment hybrydowej toksyny Bacillus thuringiensis.
Fragmenty hybrydowej toksyny oraz toksyn zawierające te fragmenty, pochodzą od owadobójczych białek krystalicznych Bacillus thuringiensis
Bacillus thuringiensis (dalej B. t.) jest zdolny do wytwarzania białek, które są akumulowane wewnątrz komórki w postaci kryształów. Te krystaliczne białka są toksyczne dla wielu larw owadów. W oparciu o homologię sekwencji i specyficzność działania owadobójczego białka krystaliczne zostały zaliczone do różnych klas. Najlepiej zbadana jest klasa białek Cry1, które są wytwarzane jako protoksyny o masie 140 kD i wykazują aktywność wobec motyli.
181 408
Sposób działania białek krystalicznych został częściowo wyjaśniony. Po spożyciu kryształy rozpuszczają się w alkalicznym środowisku jelita larwy. Rozpuszczone białka są następnie przekształcane przez proteinazy jelita w oporny na proteinazę toksyczny fragment o wielkości około 65 kD, który wiąże się z receptorami komórek nabłonkowych jelita owada i wnika do błony komórkowej. To prowadzi ostatecznie do pękania komórek i śmierci larwy.
Zakres aktywności poszczególnych białek krystalicznych jest w dużej mierze określony przez występowanie receptorów na powierzchni komórek nabłonkowych jelita wrażliwych owadów Zakres ten jest jednocześnie określony przez wydajność rozpuszczania kryształu białkowego i jego proteolitycznej aktywacji in vivo.
Istotne znaczenie wiązania kryształu białkowego do reecptorów nabłonkowych jelita jest dalej wykazane dla owadów, które rozwinęły oporność najedno z białek Ikystallcznych, a mianowicie wiązanie białek krystalicznych do komórek nabłonkowych jelita owadów opornych jest znacząco obniżone.
Zgodnie z wynalazkiem fragment hybrydowej toksyny Bacillus thuringiposis ma sekwencję aminokwasów od aminokwasu 1 do aminokwasu 620 określoną w Sek. ID Nr 6 lub ma tę sekwencję z co najmniej jedną z następujących zmian:
Ile w pozycji 609 jest zastąpiona przez Leu,
Ala w pozycji 618 jest zastąpiona przez Glu,
Ser w pozycji 620 jest zastąpiona przez Tyr lub toksyna podobna w co najmniej 85% do niej, która ma podobną aktywność owadobójczą lub podobną zdolność wiązania w błonie jelita środkowego owada.
Zgodnie z wynalazkiem fragment hybrydowej toksyny Bacillus thurmgipntis ma sekwencję aminokwasów od aminokwasu 1 do aminokwasu 627, określoną w Sek. ID Nr 8 lub ma tę sekwencję z co najmniej jedną z następujących zmian·
Ile w pozycji 617 jest zastąpiona przez Leu,
Ala w pozycji 625 jest zastąpiona przez Glu,
Ser w pozycji 627 jest zastąpiona przez Tyr lub toksyna podobna w co najmniej 85% do nich, która ma podobną aktywność owadobójczą lub podobną zdolność wiązania w błonie jelita środkowego owada.
Rekombinant DNA według wynalazku koduje fragment hybrydowej toksyny Bacillus mający sekwencję aminokwasów od aminokwasu 1 do aminokwasu 620 określoną w Sek. ID Nr 6 lub mający tę sekwencję z co najmniej jedną z następujących zmian
Ile w pozycji 609 jest zastąpiona przez Leu,
Ala w pozycji 618 jest zastąpiona przez Glu,
Ser w pozycji 620 jest zastąpiona przez Tyr lub kodujący fragment hybrydowej toksyny Bacillus thuriogientit mający sekwencję aminokwasów od aminokwasu około 1 do aminokwasu około 627 określoną w Sek ID Nr 8 lub mający tę sekwencję z co najmniej jedną z następujących zmian:
Ile w pozycji 617 jest zastąpiona przez Leu,
Ala w pozycji 625 jest zastąpiona przez Glu,
Ser w pozycji 627 jest zastąpiona przez Tyr lub toksynę podobną w co najmniej 85% do nich, która ma podobną aktywność owadobójczą lub podobną zdolność wiązania w błonie jelita środkowego owada, przy czym korzystnie rekombinant. DNA zawiera sekwencję od nukleotydu 1 do nukleotydu 1860 określoną w Sek. ID Nr 5 lub sekwencję od nukleotydu 1 do nukleotydu 1881 w Sek. ID Nr 7.
Uważa się, ze toksyczne fragmenty białek krystalicznych składają się z trzech odrębnych domen strukturalnych Domena I, skrajna N-końcowa domena składa się z 7 a-heliksów Domena II zawiera 3 b-kartki, a domena III (C-końcowa) fałduje się tworząc b-kanapkę (ang sandwich). Jeżeli przełożyć to na sekwencję Cry1, domena I rozciąga się w przybliżeniu od aminokwasu 28 do 260, domena II od 260 do 460, a domena III od 460 do 600
Poniżej jest podana sekwencja nukleotydowa genu Cry1C z B t podgat entomocidus 60 5 oznaczona jako SEQ ID Nr 1, a odpowiadająca sekwencja aminokwasowa białka kodowanego przez tę sekwencję nukleotydową jest podana jako SEQ ID Nr 2 Sekwencja nukleotydowa genu CrylE z B. t. podgat kenyae 4FI jest podana jako SEQ ID Nr 3, a odpowiadają4
181 408 ca sekwencja aminokwasów białka kodowanego przez tą sekwencję nukleotydowąjest podana jako SEQ ID Nr 4. Białka te są toksyczne dla motyli, ale w obrębie tego rzędu owadów każde białko ma odmienną specyficzność CrylC jest szczególnie aktywne w stosunku do S exigua i M brassicae.
Hybrydowy fragment toksyny, zawiera na swoim końcu C domenę III pierwszego białka Cry lub część tej domeny lub białko zasadniczo podobne do tej domeny, przy założeniu, ze N-końcowy region fragmentu jest N-końcowym regionem drugiego białka Cry lub częścią tego regionu lub białkiem zasadniczo podobnym do tego regionu. Preferowanym fragmentem jest taki, który nie wiąże się z miejscem wiązania dla Cry1C w jelicie owada, gdy zawiera na swoim końcu C domenę III Cry1C lub część tej domeny lub białko zasadniczo podobne do tej domeny; lub taki, który nie wiąże się z miejscem wiązania dla Cry1A, gdy zawiera na swoim końcu C domenę III Cry1A lub część tej domeny lub białko zasadniczo podobne do tej domeny
Jako pojęcie „zasadniczo podobne”, rozumiane są czyste białka mające sekwencję aminokwasowąw co najmniej 75% podobną do sekwencji białek według wynalazku. Korzystne jest, jeżeli stopień podobieństwa wynosi co najmniej 85%, korzystniejsze, jeżeli stopień podobieństwa wynosi co najmniej 90%, a jeszcze bardziej korzystne, jeżeli stopień podobieństwa wynosi co najmniej 95%.
W kontekście niniejszego wynalazku, dwie sekwencje aminokwasowe o wzajemnym podobieństwie co najmniej 75%, 85%, 90% lub 95% mają co najmniej 75%, 85%, 90% lub 95% identycznych reszt aminokwasowych lub konserwatywnych podstawień w podobnej pozycji przy optymalnym dopasowaniu, dopuszczającym co najwyżej 6 przerw, przy założeniu, ze przerwy obejmują nie więcej niż 15 reszt aminokwasowych. Dla celów niniejszego wynalazku, konserwatywne podstawienia mogą być dokonywane między aminokwasami w obrębie następujących grup.
I) seryna i treonina,
II) kwas glutaminowy i kwas asparaginowy;
III) arginina i lizyna;
IV) asparagina i glutamina;
V) izoleucyna, leucyna, walina i metionina;
VI) fenyloalanina, tyrozyna i tryptofan;
VII) alanina i glicyna.
przy założeniu, ze w SEQ ID Nr 6 Ser i Tyr są konserwatywnymi podstawieniami w pozycji 620, a Ala i Glu są konserwatywnymi podstawieniami w pozycji 618 oraz, ze w SEQ ID Nr 8 Ser i Tyr są konserwatywnymi podstawieniami w pozycji 627, a Ala i Glu są konserwatywnymi podstawieniami w pozycji 625.
Część białka oznacza peptyd zawarty w tym białku i stanowiący co najmniej 80% jego ciągłej sekwencji.
Miejsce wiązania się oznacza miejsce w cząsteczce, dla którego wiązanie się z toksynąjest odwracalne, tak ze Ka dla tego miejsca i toksyny jest rzędu co najmniej 104 dm3 mol‘r
Fragment toksyny może zawierać na swoim końcu N N-końcowy region dowolnego białka owadobójczego z B. t., powszechnie znanego jako Cry lub Cyt, włączając w to: CryIA(a), CryIA(b), CryIA(c), CryIB, CryIC, CryID, CryIE, CryIF, CryIG, CryIH, CryIIA, CryIIB, CryIIC, CryIIIA, CryIIIB, CryIIIB(b), CryIVA, CryIVB, CryIVC, CryIVD, CYTA, CryXI(IIIC), CryX2(IIID), CryX3, CryV i CryX4 lub część tego regionu lub białko zasadniczo podobne do tego regionu, a C-końcowym fragmentem jest domena III CryIC lub część tej domeny lub białko zasadniczo podobne do tej domeny
Fragment taki może zawierać domenę II z CryIE, CryIB, CryID lub CryIA lub część tej domeny lub białko zasadniczo podobne do tej domeny oraz domenę III z CryIC lub część tej domeny III lub białko zasadniczo podobne do tej domeny III. Jest szczególnie korzystne, jeżeli fragment zawiera domeny I i II z CryIE, CryIB, CryID lub CryIA lub ich części lub białka zasadniczo podobne do tych domen oraz domenę III z CryIC lub jej część lub białko zasadniczo podobne do tej domeny III
Jest najbardziej korzystne, jeżeli fragment toksyny zawiera na swoim końcu C region obejmujący sekwencję aminokwasów od pozycji 454 do pozycji 602 CryIC lub sekwencję
181 408 zasadniczo podobną do tej sekwencji Fragment może zawierać na swoim końcu C region obejmujący sekwencję aminokwasów od pozycji 478 do pozycji 602 CryIC lub sekwencję zasadniczo podobną do tej sekwencji, przy założeniu, ze jeżeli sekwencja zawiera aminokwasy od 478 do 602 CryIC dołączone bezpośrednio do końca C domeny II z CryIA, CryIB, CryID lub CryIE, następuje odpowiednie fałdowanie produktu fuzji, prowadząc do powstania w obrębie tego fragmentu odcinka owadobójczego Znawca może stwierdzić zaistnienie konieczności dodania peptydu do C-końcowej domeny II, który oddaliłby C-końcowy region cryIC, umożliwiając takie jego pofałdowanie, ze wykazywałby on aktywność owadobójczą
Jakkolwiek zmiany aminokwasowe są dopuszczalne, jednakże jedna lub więcej z następujących reszt wskazanych w odniesieniu do sekwencji CryIC me może podlegać zmianom Phe (501); Val (478) Trp (479) i Thr (486).
Wynalazek znajduje zastosowanie do otrzymywania czystych białek, które są w co najmniej 90% identyczne z fragmentami toksyny według wynalazku lub hybrydowymi toksynami, do otrzymywania zrekombinowanego DNA zawierającego sekwencję kodującą białko mające sekwencję aminokwasową przedstawionych powyżej toksyn lub ich fragmentów, a zwłaszcza zrekombinowanego DNA zawierającego sekwencję od nukleotydu około 1 do nukleotydu około 1860 w SEQ ID Nr 5 lub DNA do niego podobnego, kodującego zasadniczo podobne białko, lub zrekombinowanego DNA zawierającego sekwencję od nukleotydu około 1 do nukleotydu około 1881 w SEQ ID Nr 7 lub DNA do niego podobnego kodującego zasadniczo podobne białko
Określenie podobny DNA oznacza badaną sekwencję, która ma zdolność do hydrydyzowania z sekwencją będącą przedmiotem wynalazku. Gdy sekwencje, badana i będąca przedmiotem wynalazku są dwumciowe, kwas nukleinowy stanowiący sekwencję badaną powinien mieć TM w granicach 20°C w stosunku do sekwencji będącej przedmiotem wynalazku. W przypadku zmieszania razem sekwencji badanej i będącej przedmiotem wynalazku i równoczesnej denaturacji wartości TM sekwencji powinny być w granicach 10°C jedna w stosunku do drugiej. Korzystniej, jeżeli hybrydyzacja jest prowadzona w warunkach ostrych, przy czym dobrze, jeżeli bądź DNA badany bądź będący przedmiotem wynalazku jest w formie związanej. A zatem korzystne jest, jeżeli bądź DNA badany bądź będący przedmiotem wynalazku jest związany z nośnikiem i hybrydyzacja jest prowadzona przez określony okres czasu w temperaturze pomiędzy 50 i 70°C w dwukrotnie stężonym roztworze soli buforowanym cytrynianem, zawierającym 0,1% SDS, po czym następuje płukanie nośnika w tej samej temperaturze, ale buforem mającym obniżone stężenie SC. W zależności od wymaganego stopnia ostrości warunków, a zatem stopnia podobieństwa sekwencji, takie obniżone stężenie soli to zwykle jeden raz SC zawierający 0,1% SDS, dwukrotnie rozcieńczony SC zawierający 0,1% SDS i dziesięciokrotnie rozcieńczony SC zawierający 0,1% SDS. Sekwencjami mającymi większy stopień podobieństwa są takie, dla których płukanie w buforach o zmniejszonym stężeniu ma mniejszy wpływ na hybrydyzację. Najkorzystniej, jeżeli sekwencje badana i będąca przedmiotem wynalazku są tak podobne, ze na ich hybrydyzację nie ma wpływu płukanie lub inkubacja w dziesięciokrotnie rozcieńczonym roztworze cytrynianu sodu zawierającym 0,1% SDS.
Zrekombinowany DNA może ponadto kodować białko mające oporność na herbicydy, mające korzystny wpływ na wzrost roślin, własności przeciwgrzybiczne, przeciwbakteryjne. przeciwwirusowe i/lub przeciwnicieniowe. W przypadku, kiedy DNA ma być wprowadzane do organizmu heterologicznego, może być modyfikowane poprzez usunięcie znanych motywów powodujących niestabilność mRNA (takich jak regiony bogate w pary AT) i sygnałów poliadenylacji i/lub użycie kodonów, preferowanych przez organizm, do którego ma być wprowadzony zrekombinowany DNA, tak aby ekspresja tak zmodyfikowanego DNA w tym organizmie prowadziła do powstania białka zasadniczo podobnego do otrzymanego poprzez ekspresję nie zmodyfikowanego zrekombinowanego DNA w organizmie, w którym składniki białkowe toksyny hybrydowej lub fragmentów toksyny są endogenne.
Wynalazek znajduje dalej zastosowanie do wytwarzania sekwencji DNA, która jest komplementarna do tej, która hybrydyzuje w ostrych warunkach ze zrekombinowanym DNA według wynalazku, wektora zawierającego taką zrekombinowaną (lub komplementarną do
181 408 niej) sekwencję DNA oraz rośliny i/lub mikroorganizmu, który zawiera taki DNA i umożliwia jego ekspresję oraz potomstwa takich roślin, które zawiera DNA stabilnie włączony i dziedziczący się w sposób mendlowsk, a także nasion takich roślin lub ich potomstwa.
Wynalazek jest stosowany do wytwarzania białka będącego wynikiem ekspresji rekombinanta DNA według wynalazku i białka owadobójczego wytwarzanego poprzez ekspresję zrekombinowanego DNA w roślinach nim transformowanych oraz do wytwarzania kompozycji owadobójczych zawierających jeden lub więcej fragmentów hybrydowej toksyny według wynalazku Fragment toksyny według wynalazku może być stosowany do zwalczania owadów, przez wystawianie ich na działanie takich fragmentów toksyn lub kompozycji i do ekstrakcji prowadzącej do otrzymania białek owadobójczych z zawierającego je materiału organicznego, obejmujące poddawanie materiału maceracji i ekstrakcji rozpuszczalnikami
Wynalazek będzie dalej wyjaśniony poprzez następujący poniżej opis, który przedstawia wytwarzanie hybrydowych fragmentów toksyny według wynalazku, wraz z towarzyszącymi mu rysunkami i listami sekwencji
Figura 1 pokazuje powstawanie hybrydowych genów dla białka krystalicznego poprzez rekombinację in vivo. Skonstruowano tandemowe plazmidy (pBD560 i pBD650) niosące dwa skrócone geny dla białka krystalicznego, zorientowane jako proste powtórzenia. W genie znajdującym się po stronie 5' (niezaczerniony pasek) brakuje regionu kodującego protoksynę (zaczerniony pasek), a z genu znajdującego się po stronie 3' (zakreskowany pasek) usunięty jest region kodujący domenę I. W szczepie JM101 recAT następuje rekombinacja in vivo pomiędzy homologicznymi regionami (domeną II i III). Selekcja przeciwko plazmidom niezrekombinowanym poprzez trawienie NotI i BamHI i następująca potem transformacja daje w rezultacie serię plazmidów kodujących hybrydowe białko krystaliczne.
Figura 2 pokazuje wzajemne uszeregowanie reszt aminokwasowych od 420 do 630 w CryIE i CryIC Zaznaczone są granice pomiędzy domenami I i III. Przedstawiono tylko te reszty aminokwasowe CryIC, które różnią się od CryIE, reszty i identyczne zaznaczono kropkami Na rysunku zaznaczone są pozycje crossing over (G27, H13, H7, H8, H17 i H21) w hybrydowych fragmentach CryIE-CryIC toksyny według wynalazku.
Figura 3 pokazuje wzajemne uszeregowanie reszt aminokwasowych od 420 do 630 w CryIE i CryIC. Zaznaczone są granice pomiędzy domenami I i III. Przedstawiono tylko te reszty aminokwasowe CryIC, które różnią się od CryIE, reszty identyczne zaznaczono kropkami. Na rysunku zaznaczone są pozycje crossing over (F59, F71, F26 i E7) w hybrydowych fragmentach CryIC-CryIE toksyny według wynalazku.
Figura 4 pokazuje wyniki pewnych doświadczeń nad heterologicznym współzawodnictwem Biotynylowane CryIC (część A) i G27 (część B) inkubuje się z pęcherzykami BBMV S exigua w nieobecności (ścieżki a) lub obecności nadmiaru nie wyznakowanego białka, jak zaznaczono. Po inkubacji, pęcherzyki przemywa się, nakłada na żel SDS-poliakryloamid i przenosi na filtr nitrocelulozowy Biotynylowane białka krystaliczne, ponownie izolowane z pęcherzykami, są uwidocznione przy użyciu koniugatu streptawidyna-peroksydaza i zaznaczone na rysunku strzałką
Figura 5 pokazuje mapę plazmidu pSB456, który koduje fragment hybrydowej toksyny G27 i jest używany do transformacji szczepu B. t. 51 pozbawionego krystalicznej toksyny
SEQ ID Nr 1 przedstawia sekwencję nukleotydową genu CryIC z B. t. podgat entomocidus 60.5.
SEQ ID Nr 2 przedstawia sekwencję aminokwasową białka kodowanego przez gen CryIC pokazany w SEQ ID Nr 1
SEQ ID Nr 3 przedstawia sekwencję nukleotydową genu CryIE z B t podgat. kenyae 4FI.
SEQ ID Nr 4 przedstawia sekwencję aminokwasową białka kodowanego przez gen CryIE pokazany w SEQ ID Nr 3.
SEQ ID Nr 5 przedstawia sekwencję nukleotydową kodującą preferowany fragment hybrydowej toksyny CryIE/CryIC według wynalazku.
SEQ ID Nr 6 przedstawia sekwencję aminokwasową białka kodowanego przez sekwencję nukleotydową pokazaną w SEQ ID Nr 5
181 408
SEQ ID Nr 7 przedstawia sekwencję nukleotydową fragmentu hybrydowej toksyny CryIA/CryIC według wynalazku
SEQ ID Nr 8 przedstawia sekwencję aminokwasowa białka kodowanego przez sekwencję nukleotydową pokazaną jako SEQ ID Nr 7.
Wytwarzanie plazmidów kodujących fragmenty hybrydowej toksyny.
Przy wytwarzaniu plazmidów przenoszących geny CryIC lub CryIE jako gospodarza dla plazmidów stosowano Escherichia coli XLI-blue (Stratagene Inc.), z wyjątkiem przypadków gdzie używano JM101 ze względu na tło genetyczne rec/A Wektor do ekspresji białek krystalicznych w E coli pochodził od pKK233-2 (Pharmacia LKB Biotechnology) Wielkość pKK233-2 jest zredukowana poprzez usunięcie fragmentu EcoRI-PvuII, niosącego gen kodujący oporność na tetracyklinę. Następnie w miejscu HindIII dołączany jest poprzez ligację linker XhoI o długości 6 par zasad, czego rezultatem jest pBD10. Plazmid BK+jest utworzony poprzez wstawienie linkera BgIII w miejscu SacI plazmidu Bluescript SK+ (Stratagene Inc.). Polilinker z BK+, od BgIII do XhoI, jest wstawiony pomiędzy miejsca NcoI-XhoI w pBD10 Uzyskany w ten sposób wektor ekspresyjny pBDl 1 zawiera promotor trc o wysokim poziomie ekspresji, miejsce wiązania rybosomu z lacZ i kodon inicjacyjny ATG. Kodon inicjacyjny zachodzi na miejsce NcoI, a za nim znajduje się polilinker dla ułatwienia wstawiania fragmentów do wektora Transkrypcję kończy terminator transkrypcji rrnB.
Klonowanie genów' cryIC i crylE z B. t. podgat odpowiednio, entomocidus 60.5 i kenya 4F1, odbywa się jak opisano wcześniej (Honee i wsp., 1990 (Appl. Environ Microbiol. 56, str. 823-825); Visser i wsp. 1990 (J. Bacteriol. 172, str. 6783-6788)). Dla celów klonowania, miejsce NcoI zachodzące na kodon startu cryIC jest utworzone poprzez mutagenezę in vitro. Miejsce BgIII jest utworzone bezpośrednio poniżej kodonu terminacji translacji cryIC poprzez ukierunkowaną mutagenezę, w wyniku której powstaje sekwencja ATAAGATCTGtT (kodon stop podkreślony). Fragment NcoI-BgIII zawierający region kodujący cryIC jest dołączony poprzez ligację do pBD11, wynikiem czego jest plazmid pBD150 do ekspresji CryIC. pBD155 jest pochodną pBD150, z którego usunięte są sekwencje polilinkera po stronie 3' cryIC.
Fragment Dral z pEM14 (Visser i wsp 1990) zawierający kompletny gen cryIE jest sklonowany w miejscu EcoRV SK+, w wyniku czego powstaje plazmid pEM15 Następnie do kodonu startowego wprowadzane jest w wyniku ukierunkowanej mutagenezy miejsce NcoI i gen cryIE jest przeniesiony jako fragment NcoI-XhoI do pBD11, w wyniku czego powstaje pBD160, plazmid do ekspresji CryIE.
Skonstruowano plazmidy niosące jedynie regiony kodujące toksyczny fragment genów cryI W miejscach XmnI, obecnych w pozycji 1835 cryIC i w miejscu HgiAI w pozycji 1839 cryIE wstawiono poprzez ligację linkery BgIII Następnie fragmenty NcoI-BgIII, zawierające regiony kodujące toksyczne fragmenty cryIC (1835 bp) i cryIE (1939 bp), włączono w wyniku ligacji do pBD11, w wyniku czego powstały odpowiednio, pBD151 i pBD161, co jest opisane poniżej.
Tandemowe plazmidy użyte do wytworzenia hybrydowych genów cryIC-cryIE skonstruowano jak następuje. Do plazmidu pBD160 strawionego HpaI dołączono w wyniku ligacji linkery BamHI Taki DNA inkubowano z BamHI i XhoI i skrócony gen cryIE, biegnący od nukleotydu 704, włączono poprzez ligację do pBD151, w wyniku czego powstał pBD560. Celem skonstruowania tandemowego plazmidu do wytworzenia hybryd cryIE-cryIC, pBD155 strawiono NsiI i XhoI Fragment niosący skrócony gen CryIC, biegnący od nukleotydu 266, włączono poprzez ligację do pBD161 strawionego PstI/XhoI, w wyniku czego powstał plazmid pBD650 Dzięki sekwencjom polilinkera, pomiędzy skróconymi genami znajdującymi się w tandemowych plazmidach pDB560 i pDB650 obecne są unikalne miejsca restrykcyjne NotI i BamHI.
Techniki rekombinowania DNA i konstrukcja hybrydowych toksyn
Wszystkie techniki rekombinowania DNA są zgodne z opisanymi przez Sambrook i wsp 1989 (w Molecular Cloning, A Laboratory Manual: Cold Spring Harbour Press, Cold Spring Harbour), sekwencjonowanie DNA jest wykonywane metodą didedeoksytrifosforanów z fluorescencyjnymi barwnikami połączonymi z dideoksynukleotydami. Analiza jest prowa8
181 408 dzona automatycznie przy użyciu analizatora sekwencji nukleotydowej Applied Biosystem 370A.
Homologia występująca pomiędzy genami cryI umożliwia międzycząsteczkową rekombinację in vivo. Wytwarzane są dwa tandemowe plazmidy, każdy z nich niosący dwa skrócone geny dla białka krystalicznego, zachodzące na siebie jedynie na obszarze domen II i III. A zatem rekombinacja zachodzi jedynie na obszarze kodującym domeny II i III. Rekombinacja w fazie odczytu, którą można wyselekcjonować poprzez trawienie enzymami restrykcyjnymi, daje plazmidy, które wyrażają pełnej długości hybrydową toksynę o wielkości 140 kD Do wytworzenia rekombinantów in vivo tandemowy plazmid (pDB560 lub pBD650; fig 2) przenoszono do JM101. Celem wyselekcjonowania niezrekombinowanych plazmidów, z niezależnie powstałych rekombinantów izolowano 5 pg DNA i trawiono NotI i BamHI, tnąc pomiędzy dwoma skróconymi genami cryI, a następnie transformowano E. coli XI.1-blue. Założono hodowle z 5 pojedynczych kolonii i analizowano wzory białka i znajdujące się w nich plazmidy.
Używając tandemowych plazmidów pBD560 i pBD650 i umożliwiając ich rekombinację tle genetycznym recA+ wytworzono hybrydowe toksyny, odpowiednio, CryIC-CryIE i CryIE-CryIC. Następnie izolowano DNA, trawiono i przenoszono do szczepu recA- tak jak opisano wyżej.
100 kolonii z 20 niezależnych doświadczeń analizowano na żelu SDS-PAGE 85% tych klonów wytwarza białko o masie 140 kD, wskazując na zajście rekombinacji w fazie pomiędzy, odpowiednio, cryIC i cryIE oraz cryIE i cryIC. Białka CryI są wytwarzane w E. coli jako kryształy, które mogą rozpuszczać się w wysokim pH. W przybliżeniu 15% toksyn hybrydowych wytwarzanych jak wyżej jest rozpuszczalnych w wysokim pH Rekombinanty wytwarzające rozpuszczalną toksynę hybrydową są w pierwszym rzędzie klasyfikowane przy użyciu enzymów restrykcyjnych, a następnie dla każdej klasy określane jest miejsce rekombinacji selekcjonowanych hybryd poprzez analizę sekwencji DNA Wszystkie przypadki crossing over, w wyniku których powstaje rozpuszczalna toksyna hybrydowa mają miejsce w obrębie lub bardzo blisko domeny III.
Oczyszczanie i analiza białka.
Białka krystaliczne izolowano zasadniczo jak opisano w Convents i wsp (J Biol. Chem. 265, 1369-1375; Eur. J. Biochem. 195, str. 631-635). W skrócie, zrekombinowaną E. coli hodowano w 30°C w 250 ml pożywki TB do OD660 10-15. Kryształy izolowane z lizatów E. coli rozpuszczano w czasie inkubacji przez 2 godz. w 20 mM Na2CO 3, 10 mM ditiotreitol, 100 mM NaCl, pH 10 w 37°C. pH roztworu obniżano do 8 za pomocą Tris-HCl i inkubowano z trypsyną Roztwór toksyny dializowano wobec 20 mM Tris-HCl, 100 mM NaCl pH 9 Następnie fragment toksyczny oczyszczano na kolumnie Mono Q 5/5 podłączonej do systemu chromatografii cieczowej (FpLC) (Pharmacia LKB Biotechnology) Białka rozdzielano poprzez elektroforezę w 7.5% żelu siarczan sodowy dodecylu-poliakryloamid.
Analiza biochemiczna i izolacja fragmentów toksycznych o masie 65 kD.
Wyizolowane kryształy oczyszczonej CryIC, CryIE i białek hybrydowych są upłynniane w wysokim pH i inkubowane z trypsyną. Podobnie, jak CryIC i CryIE, wszystkie rozpuszczalne hybrydowe toksyny po crossing over w domenie III są przekształcane do stabilnych fragmentów o masie 65 kD. Fragmenty 65 kD mogą być oczyszczane przy użyciu chromatografii anionowymiennej w podobnych warunkach jak białka wyjściowe. Hybrydy F59 i F71 po crossing over w domenie II są całkowicie degradowane przez trypsynę. Jak widać, jakkolwiek hybrydy te me wytrącają się jako nierozpuszczalne agregaty, miejsce cięcia dla trypsyny ukryte w białku wyjściowym może być wystawione na działanie trypsyny. Z powodu tego faktu fragmenty o wielkości 65 kD nie są izolowane z F59 i F71.
Tabela 1 pokazuje skład 5 hybrydowych toksyn CryIE-CryIC: (G27; H8, H17, H13; H7 i H21) i 4 hybrydowych toksyn CryIC-CryIE (F59; F71; F26, E7) z odniesieniem do białek CryIC i CryIE, z których pochodzą. Sekwencje aminokwasowe toksyn CryIE-CryIC, zawierających toksyczne fragmenty według niniejszego wynalazku, rozciągają się do aminokwasu 1189 wyjściowego białka CryIC Sekwencje aminokwasowe toksyn CryIC-CryIE, zawierających toksyczne fragmenty według niniejszego wynalazku, rozciągają się do aminokwasu 1171
181 408 wyjściowego białka CryIE. Tabela 1 pokazuje również względną skuteczność owadobójczą różnych hybrydowych toksyn w stosunku do białek CryIC i CryIE
Tabela 1
TOKS | a a IE | aa IC | M sexta | S exigua | M brassicae |
IC | 0 | 28-627 | ++ | ++ | ++ |
IE | 29-612 | 0 | ++ | - | - |
G27 | 1-474 | 478-627 | ++ | ++(+) | +(+) |
H8 | 1-497 | 501-627 | +f | - | - |
H17 | 1-529 | 533-627 | ++ | - | - |
H7 | 1-577 | 588-627 | - | - | - |
H21 | 1-605 | 621-627 | |||
F59 | 421-612 | 1-423 | - | - | - |
F71 | 428-612 | 1-430 | - | - | - |
F26 | 455-612(1171) | 1-458 | ++ | - | - |
E7 | 588-612(1171) | 1-602 | ++ | ++ | ++ |
Tabela 1. Skład i toksyczność hybrydowych toksyn w odniesieniu do wyjściowych białek. Większość testów biologicznych wykonywano z oczyszczonymi fragmentami toksyn W przypadku CryIC rozciągały się one od aminokwasu około 28 do aminokwasu około 627, a w przypadku CryIE do 612. Długość kompletnych protoksyn jest podana w nawiasach.
Testy toksyczności dla owadów i aktywności owadobójczej produktów hybrydowych genów cryIC/cryIE
Hodowle bakteryjne zagęszczano do OD660 6.0 i 100 pl nakrapla się na 2 cm2 syntetycznego pożywienia na płytce do hodowli tkankowych z 24 zagłębieniami. Alternatywnie, rozcieńczone próbki oczyszczonych toksyn dodaje się do pożywienia. Larwy drugiego stadium
S. exigua, M Ιγι^ϊ^ρ lub M. sexta karmi się tym pożywieniem (16 na jedno rozcieńczenie próbki) przez 5 dni, po czym określa się wagę larw. Względny wzrost (EC50, stężenie dające 50% redukcji wzrostu) określa się poprzez obliczenie stosunku pomiędzy średnią wagą larw hodowanych na pożywce z dodatkiem toksyny i średniej wagi larw kontrolnych hodowanych na pożywce bez toksyny Jaja M. sexta są dostarczone przez Carolina Biological Supply Company, North Carolina, US.
Toksyczne fragmenty kodowane przez produkty hybrydowych genów testuje się pod względem aktywności wobec trzech różnych gatunków owadów, tak jak to zostało opisane powyżej. M. sexta jest wrażliwy zarówno na CryIC jak i CryIE. Jak można wywnioskować z podatności na działanie trypsyny, hybrydy F59 i F71 nie wykazują aktywności w stosunku do tych owadów (tabela 1) Jakkolwiek H7 jest przekształcany przez trypsynę w stabilne białko o masie 65 kD, nie jest ono toksyczne dla M. tpχta. Wszystkie inne hybrydy, podane w tabeli 1 są toksyczne i maj^natywną, biologicznie czynną konformację
Fragment CryIC o masie 65 kD jest wysoce toksyczny wobec S. exigua i M brassicae, podczas gdy CryIE nie. G27 (tabela 1; fig. 2), hybryda cryIE-CryIC po crossing over w miejscu połączenia domen II i III, ma aktywność wobec obu owadów. Pokazuje to, ze domena III cryIC posiada pełną aktywność wobec S exigua i M δ^^^ρ Hybryda H8, która różni się
181 408 od G27 tylko trzema resztami aminokwasowymi (patrz fig. 3), jakkolwiek jest aktywna wobec M. sexta, me ma aktywności w stosunku do S. exigua i M. brassicae.
F26 (tabela 1, fig. 3), hybryda odwrotna w stosunku do G27, w której domena III z CryIC została zamieniona na domenę III z CryIE, nie wykazuje aktywności wobec S exigua lub M. brassicae. Widocznie, jakkolwiek białko jest toksyczne dla M. sexta, sekwencje rozciągające się na między aminokwasami 28-462 nie wystarczają do zabicia S exigua i M. brassicae Jedynie gdy w hybrydzie (E7) obecne są sekwencje CryIC aż do aminokwasu 602, przywrócona jest aktywność owadobójcza wobec do tych owadów.
Niniejszy wynalazek wskazuje, ze reszty aminokwasowe 478-602 CryIC mogą wykazywać wysoką aktywność owadobójczą wobec S exigua i M brassicae
Biotynylacja białek krystalicznych i test wiązania
Biotynylację wykonuje się przy zastosowaniu estru biotyna-N-hydroxysukcymmid zasadniczo jak opisane przez producenta (Amersham). 1 mg białka krystalicznego inkubuje się z 40 |al odczynnika do biotynylacji w 50 mM NaHCOs, 150 mM NaCl pH 8, przez jedną godzinę w temp. 20°C. Celem usunięcia nie związanej biotyny roztwór nakłada się na kolumnę Sephadex 25, zrównoważoną tym samym buforem zawierającym 0,1% BSA, i próbki frakcji nakrapla się na filtr nitrocelulozowy Frakcje zawierające biotynylowane białka krystaliczne są uwidaczniane przy użyciu koniugatu streptawidyna-peroksydaza (Amersham), który katalizuje utlenienie luminolu, rezultatem czego jest chemiluminiscencja (ECL, Amersham), i łączone
Pęcherzyki błony rąbka szczoteczkowego izolowano tak jak opisano przez Wolfersberger i wsp (1987) (Comp. Blochem. Physiol. 86a, str. 301-308), z tą różnicą, ze pęcherzyki płukano jeszcze raz buforem do izolacji zawierającym 0,1% Tween 20 Wiązanie biotynylowanych białek krystalicznych do pęcherzyków błony rąbka szczoteczkowego (100 pg/ml) wykonywano w 100 pl PBS zawierającego 1% BSA, 0,1% Tween-20 (pH 7,6). Pęcherzyki (20 pg białka pęcherzyków) inkubuje się z 10 ng biotynylowanych białek krystalicznych w obecności lub nieobecności 1000-krotnego nadmiaru nie wyznakowanego białka krystalicznego przez 1 godz. w 20°C. Następnie pęcherzyki izoluje się ponownie poprzez wirowanie przez 10 min przy 14000 g w wirówce Eppendorfa, przepłukuje raz buforem do wiązania, zawiesza ponownie w buforze do nanoszenia na żel, denaturuje poprzez ogrzewanie i nakłada na 7,5% żele poliakryloamidowe Po elektroforezie białka przenosi się na filtry nitrocelulozowe i biotynylowane białka krystaliczne, które są ponownie izolowane z pęcherzykami, uwidacznia się poprzez inkubację nitrocelulozy z koniugatem streptawidynaperoksydaza (Amersham), który katalizuje utlenienie luminolu, rezultatem czego jest chemiluminiscencja (ECL, Amersham).
Ponieważ wiązanie się z komórkami nabłonka jelita jest kluczowym etapem działania białek krystalicznych, wiązanie się białek krystalicznych z pęcherzykami błony rąbka szczoteczkowego S. exigua bada się w doświadczeniach z heterologicznym współzawodnictwem Doświadczenia ze współzadownictwem wykazują, ze wiązanie się wyznakowanego CryIC (fig 4A, ścieżka a) i wyznakowanego F26 (nie pokazane) może być wyeliminowane we współzawodnictwie z nadmiarem zarówno nie wyznakowanego CryIC (ścieżka b), jak i F26 (ścieżka e), ale nie z nadmiarem G27 (ścieżka c) lub CryIE (ścieżka d) Ponadto wiązanie wyznakowanego G27 (fig. 4B, ścieżka a) i wyznakowanego CryIE (ścieżka d) może być wyeliminowane przez współzawodnictwo z nadmiarem G27 (ścieżka b), lub CryIE (ścieżka d), ale nie z nadmiarem CryIC (ścieżka a) lub F26 (ścieżka e). Na podstawie tych wyników można wysnuć wniosek, ze G27 i CryIE rozpoznają te same miejsca wiązania w błonach jelita środkowego S. exigua i ze miejsca te różnią się od rozpoznawanych przez CryIC i F26. W połączeniu, toksyczność i testy wiązania pokazują, ze G27 jest toksyczne tak jak CryIC, ale ze wiąże się z odmiennym receptorem. Jeżeli owad rozwinie oporność wobec białek krystalicznych poprzez zmianę charakterystyki wiązania przez receptor, można stosować G27 jako alternatywę dla CryIC w programach postępowania przy oporności.
Ekspresja genów dla hybrydowej toksyny cryIE/cryIC w systemach heterologicznych.
Gen cryIE/cryIC dla hybrydowej toksyny G27 jest wyrażany w E coli i produkt genu wykazuje co najmniej taką samą aktywność owadobójczą (przynajmniej wobec Spodoptera) jak CryIC Ponadto, produkt ten wykazuje zwiększoną aktywność tego typu, jeżeli jest wyra181 408 zany w szczepie Bacillus thuringiensis (patrz poniżej). Gen kodujący hybrydową toksynę G27 wprowadza się do odpowiedniego systemu wektorów bifunkcjonalnych, które wprowadza się następnie do odpowiedniego gospodarza B t. Następnie tak stransformowane komórki hoduje się i uzyskaną w rezultacie toksynę z obu całych hodowli oraz oczyszczone kryształy testuje się na pod kątem aktywności owadobójczej
Konstrukcja wektora bifunkcjonalnego, zawierającego G27, transformacja B t 51 i oczyszczanie z niego toksycznego białka.
Gen kodujący hybrydę G27 (3, 4 kb) wycina się z plazmidu ekspresyjnego E. coli pKK233 przy użyciu NcoI i XhoI. Miejsce XhoI wypełnia się przy użyciu fragmentu Klenowa z DNA polimerazy I E. coli Uzyskany fragment poddaje się ligacji z pBS635 (pBluescriptKS+, PcryIC, i terminator transkrypcji CryIA(c)) strawionym NcoI/SmaI Powstały w rezultacie plazmid, pSB453, trawi się ApaI i NotI, uzyskując fragment o długości 4,2 kb niosący promotor, otwartą ramkę odczytu hybrydy G27 i terminator Fragment ten poddaje się ligacji z pSB634 (wektor bifunkcjonalny zawierający pBC16 1 i BlueccriptKS-), dając w rezultacie pSB456 (patrz fig. 5). Plazmidowy DNA, izolowany z E coli DH10B, używa się do transformowania szczepu B t minus pod względem krystalicznej toksyny, B. t. 51 Izolowane klony pozytywne są oporne na tetracyklinę, wykazują obecność pSB456 i zawierają duże inkluzje odpowiadające białku o wielkości 135kD (co określa się poprzez SDS-PAGE). Próbki hybrydowej toksyny G27 przygotowuje się z hodowli transformowanych B. t 51, hodowanych poprzez sporulację w 30°C w podłożu CYS-Tc10. Biologiczne testy owadobójcze (tabela 2) przeprowadza się zarówno dla całych hodowli, jak i preparatów wypłukanych białek krystalicznych Kontrole obejmują Bt51 (pSB440), zawierający toksynę CryIC oraz Bt51 (pSB636), zawierający CryIE Stężenia toksyny są szacowane na podstawie SDS-PAGE.
Tabela 2
Test biologiczny dla hybrydowej toksyny G27 w porównaniu z CryIC i CryIE Liczba próbek jest podana w nawiasach Hybrydowa toksyna G27 jest około 50% bardziej skuteczna niż CryIE i CryIC w odniesieniu do toksyczności co najmniej względem Spodoptera sp
Toksyna | LC50 | ||||
Całe hodowle (ppt) | Wymyty kryształ białkowy (ppm) | ||||
CryIC | 56(2) | 36(2) | 40(4) | 7 8(2) | 8 1(4) |
CryIE | 79(1) | 78(1) | 33(4) | 11 1(6) | 7 5(4) |
G27 | 29 (2) | 21 (2) | 25(4) | 4 7(4) | 6 0(4) |
Stosunek (IC/G27) | 1 93 | 1 71 | 1 60 | 1 66 | 1 35 |
Jakkolwiek niniejszy wynalazek został szczegółowo opisany w odniesieniu do wytwarzania hybrydowej toksyny G27, znawca doceni, ze wiele innych toksyn hybrydowych, mających ulepszone właściwości owadobójcze może być wytwarzanych według niniejszego zgłoszenia Przykładowo, SEQ ID Nr 7 i 8 przedstawiają dalsze hybrydowe toksyny według wynalazku, które mają zwiększoną aktywność owadobójczą. Można wytwarzać hybrydowe toksyny zawierające domenę III z CryIC i N-końcową domenę z dowolnego innego białka Cry. Co się tyczy testu biologicznego, transformanty niosące hybrydowe toksyny można hodować na podłożu SOP celem przyspieszenia przeprowadzenia testu i zredukowania objętości wymaganego materiału Ponadto gen kodujący G27 i/lub inne hybrydowe toksyny według wynalazku może być przeniesiony do szczepów B t kodujących toksynę i/lub wbudowany do chromosomu wybranego szczepu B. t. lub rzeczywiście wprowadzony do genomów' roślinnych celem uzyskania aktywności owadobójczej in situ w samej roślinie Z tego względu jest szczególnie korzystne jeżeli zrekombinowany DNA kodujący toksyny jest w taki sposób zmodyfikowany, ze wykorzystywane sąkodony, które są preferowane przez roślinę, do której zrekombinowany DNA ma być wprowadzony, tak ze ekspresja w taki sposób zmodyfikowa12
181 408 zrekombinowany DNA ma być wprowadzony, tak ze ekspresja w taki sposób zmodyfikowanego DNA w takiej roślinie daje białko zasadniczo podobne do tego, które jest otrzymywane poprzez ekspresję me zmodyfikowanego zrekombinowanego DNA w organizmie, w którym składniki białkowe hybrydowej toksyny lub fragmenty toksyny są endogenne
181 408
WYKAZ SEKWENCJI (1) INFORMACJE OGÓLNE:
(i) ZGŁASZAJĄCY:
(A) NAZWA: Sandoz Ltd (B) ULICA: Lichtstrasse 35 (C) MIASTO: Bazylea (D) STAN: BS (E) KRAJ: Szwajcaria (F) KOD POCZTOWY (ZIP): CH-4002 (G) TELEFON: 061-324-1111 (H) TELEFAX: 061-322-7532 (I) TELEX: 965-05055 (A) NAZWA: Sandoz-Patent BMBH (B) ULICA: Humboltstrasse 3 (C) MIASTO: Lorrach (E) KRAJ: Niemcy (F) KOD POCZTOWY (ZIP): D-7850 (A) NAZWA: Sandoz Erfindungen Verwaltungsgesellschaft MBH (B) ULICA: Brunnerstrasse 59 (C) MIASTO: Wiedeń (E) KRAJ: Austria (F) KOD POCZTOWY (ZIP): A-1230 (ii) TYTUŁ WYNALAZKU: Toksyna hybrydowa (iii) LICZBA SEKWENCJI: 8 (iv) FORMA CZYTELNA DLA KOMPUTERA:
(A) TYP NOŚNIKA: dyskietka (B) KOMPUTER: kompatybilny z IBM PC (C) SYSTEM OPERACYJNY: PC-DOS/MS-DOS (D) OPROGRAMOWANIE: Patent In Release # 1.0, wersja #1.25 (EPO) (2) INFORMACJA O SEKWENCJI ID NR: 1:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 3567 par podstawowych (B) TYP: kwas nukleinowy (C) TYP ŁAŃCUCHA: pojedynczy (D) TOPOLOGIA: nieznana (ii) TYP CZĄSTECZKI: cDNA (iii) HIPOTETYCZNY: NIE (iii) ANTI-SENSE: NIE (vi) ŹRÓDŁO PIERWOTNE:
(A) ORGANIZM: Bacillus thuringiersig (ix) CECHA:
(A) NAZWA/KLUCZ: CDS (B) LOKALIZACJA: 1..3567 (xi) OPIS SEKWENCJI: SEKWENCJA ID NR: 1:
ATG GAG GAA AAT AAT CAA AAT CAA TGC ATA CCT TAC AAT TGT TTA AGT Met Glu Glu Asn Asn Gln Asn Gln Gys Ile Pro Tyr Asn Cys Leu Ser
5 10 15
181 408
AAT Asn | CCT Pro | GAA GAA GTA CTT TTG GAT GGA GAA CGG ATA TCA ACT GGT | AAT Asn | 96 | ||||||||||||
Glu | Glu Val 20 | Leu | Leu Asp | Gly 25 | Glu | Arg | Ile | Ser | Thr 30 | Gly | ||||||
TCA | TCA | ATT | GAT | ATT | TCT | CTG | TCA | CTT | GTT | CAG | TTT | CTG | GTA | TCT | AAC | 144 |
Ser | Ser | Ile | Asp | Ile | Ser | Leu | Ser | Leu | Val | Gln | Phe | Leu | Val | Ser | Asn | |
35 | 40 | 45 | ||||||||||||||
TTT | GTA | CCA | GGG | GGA | GGA | TTT | TTA | GTT | GGA | TTA | ATA | GAT | TTT | GTA | TGG | 192 |
Phe | Val | Pro | Gly | Gly | Gly | Phe | Leu | Val | Gly | Leu | Ile | Asp | Phe | Val | Trp | |
50 | 55 | 60 | ||||||||||||||
GGA | ATA | GTT | GGC | CCT | TCT | CAA | TGG | GAT | GCA | TTT | CTA | GTA | CAA | ATT | GAA | 240 |
Gly | Ile | Val | Gly | Pro | Ser | Gln | Trp | Asp | Ala | Phe | Leu | Val | Gln | Ile | Glu | |
65 | 70 | 75 | 80 | |||||||||||||
CAA | TTA | ATT | AAT | GAA | AGA | ATA | GCT | GAA | TTT | GCT | AGG | AAT | GCT | GCT | ATT | 288 |
Gln | Leu | Ile | Asn | Glu | Arg | Ile | Ala | Glu | Phe | Ala | Arg | Asn | Ala | Ala | Ile | |
85 | 90 | 95 | ||||||||||||||
GCT | AAT | TTA | GAA | GGA | TTA | GGA | AAC | AAT | TTC | AAT | ATA | TAT | GTG | GAA | GCA | 336 |
Ala | Asn | Leu | Glu | Gly | Leu | Gly | Asn | Asn | Phe | Asn | Ile | Tyr | Val | Glu | Ala | |
100 | 105 | 110 | ||||||||||||||
TTT | AAA | GAA | TGG | GAA | GAA | GAT | CCT | AAT | AAT | CCA | GAA | ACC | AGG | ACC | AGA | 384 |
Phe | Lys | Glu | Trp | Glu | Glu | Asp | Pro | Asn | Asn | Pro | Glu | Thr | Arg | Thr | Arg | |
115 | 120 | 125 | ||||||||||||||
GTA | ATT | GAT | CGC | TTT | CGT | ATA | CTT | GAT | GGG | CTA | CTT | GAA | AGG | GAC | ATT | 432 |
Val | Ile | Asp | Arg | Phe | Arg | Ile | Leu | Asp | Gly | Leu | Leu | Glu | Arg | Asp | Ile | |
130 | 135 | 140 | ||||||||||||||
CCT | TCG | TTT | CGA | ATT | TCT | GGA | TTT | GAA | GTA | CCC | CTT | TTA | TCC | GTT | TAT | 480 |
Pro | Ser | Phe | Arg | Ile | Ser | Gly | Phe | Glu | Val | Pro | Leu | Leu | Ser | Val | Tyr | |
145 | 150 | 155 | 160 | |||||||||||||
GCT | CAA | GCG | GCC | AAT | CTG | CAT | CTA | GCT | ATA | TTA | AGA | GAT | TCT | GTA | ATT | 528 |
Ala | Gln | Ala | Ala | Asn | Leu | His | Leu | Ala | Ile | Leu | Arg | Asp | Ser | Val | Ile | |
165 | 170 | 175 | ||||||||||||||
TTT | GGA | GAA | AGA | TGG | GGA | TTG | ACA | ACG | ATA | AAT | GTC | AAT | GAA | AAC | TAT | 576 |
Phe | Gly | Glu | Arg | Trp | Gly | Leu | Thr | Thr | Ile | Asn | Val | Asn | Glu | Asn | Tyr | |
180 | 185 | 190 | ||||||||||||||
AAT | AGA | CTA | ATT | AGG | CAT | ATT | GAT | GAA | TAT | GCT | GAT | CAC | TGT | GCA | AAT | 624 |
Asn | Arg | Leu | Ile | Arg | His | Ile | Asp | Glu | Tyr | Ala | Asp | His | Cys | Ala | Asn | |
195 | 200 | 205 | ||||||||||||||
ACG | TAT | AAT | CGG | CGA | TTA | AAT | AAT | TTA | CCG | AAA | TCT | ACG | TAT | CAA | GAT | 672 |
Thr | Tyr | Asn | Asn | Gly | Leu | Asn | Asn | Leu | Pro | Lys | Ser | Thr | Tyr | Gln | Asp | |
210 | 215 | 220 | ||||||||||||||
TGG | ATA | ACA | TAT | AAT | CGA | TTA | CGG | AGA | GAC | TTA | ACA | TTG | ACT | GTA | TTA | 720 |
Trp | Ile | Thr | Tyr | Asn | Arg | Leu | Arg | Arg | Asp | Leu | Thr | Leu | Thr | Val | Leu | |
225 | 230 | 235 | 240 | |||||||||||||
GAT | ATC | GCC | GCT | TTC | TTT | CCA | AAC | TAT | GAC | AAT | AGG | AGA | TAT | CCA | ATT | 768 |
Asp | Ile | Ala | Ala | Phe | Phe | Pro | Asn | Tyr | Asp | Asn | Arg | Arg | Tyr | Pro | Ile | |
245 | 250 | 255 | ||||||||||||||
CAG | CCA | GTT | GGT | CAA | CTA | ACA | AGG | GAA | GTT | TAT | ACG | GAC | CCA | TTA | ATT | 816 |
Gln | Pro | Val | Gly | Gln | Leu | Thr | Arg | Glu | Val | Tyr | Thr | Asp | Pro | Leu | Ile |
260 265 270
181 408
AAT TTT | AAT Asn 275 | CCA CAG TTA | CAG Gln | TCT GTA GCT CAA TTA CCT ACT TTT AAC | 864 | |||||||||||
Asn | Phe | Pro Gln | Leu | Ser 280 | Val | Ala | Gln | Leu | Pro 285 | Thr | Phe | Asn | ||||
GTT | ATG | GAG | AGC | AGC | GCA | ATT | AGA | AAT | CCT | CAT | TTA | TTT | GAT | ATA | TTG | 912 |
Val | Met | Glu | Ser | Ser | Ala | Ile | Arg | Asn | Pro | His | Leu | Phe | Asp | Ile | Leu | |
290 | 295 | 300 | ||||||||||||||
AAT | AAT | CTT | ACA | ATC | TTT | ACG | GAT | TGG | TTT | AGT | GTT | GGA | CGC | AAT | TTT | 960 |
Asn | Asn | Leu | Thr | Ile | Phe | Thr | Asp | Trp | Pha | Ser | Val | Gly | Arg | Asn | Phe | |
305 | 310 | 315 | 320 | |||||||||||||
TAT | TGG | GGA | GGA | CAT | CGA | GTA | ATA | TCT | ACC | CTT | ATA | GGA | GGT | GGT | AAC | 1008 |
Tyr | Trp | Gly | Gly | His | Arg | Val | Ile | Ser | Ser | Leu | Ile | Gly | Gly | Gly | Asn | |
325 | 330 | 335 | ||||||||||||||
ATA | ACA | TCT | CCT | ATA | TAT | GGA | AGA | GAG | GCG | AAC | CAG | GAG | CCT | CCA | AGA | 1056 |
Ile | Thr | Ser | Pro | Ile | Tyr | Gly | Arg | Glu | Ala | Asn | Gln | Glu | Pro | Pro | Arg | |
340 | 345 | 350 | ||||||||||||||
TCC | TTT | ACT | TTT | AAT | GGA | CCG | GTA | TTT | AGG | ACT | TTA | TCA | AAT | CCT | ACT | 1104 |
Ser | Phe | Thr | Phe | Asn | Gly | Pro | Val | Phe | Arg | Thr | Leu | Ser | Asn | Pro | Thr | |
355 | 360 | 365 | ||||||||||||||
TTA | CGA | TTA | TTA | CAG | CAA | CCT | TGG | CCA | GCG | CCA | CCA | TTT | AAT | TTA | CGT | 1152 |
Leu | Arg | Leu | Leu | Gln | Gln | Pro | Trp | Pro | Ala | Pro | Pro | Phe | Asn | Leu | Arg | |
370 | 375 | 380 | ||||||||||||||
GGT | GTT | GAA | GGA | GTA | GAA | TTT | TCT | ACA | CCT | ACA | AAT | AGC | TTT | ACG | TAT | 1200 |
Gly | Val | Glu | Gly | Val | Glu | Phe | Ser | Thr | Pro | Thr | Asn | Ser | Phe | Thr | Tyr | |
385 | 390 | 395 | 400 | |||||||||||||
CGA | GGA | AGA | GGT | ACG | GTT | GAT | TCT | TTA | ACT | GAA | TTA | CCG | CCT | GAG | GAT | 1248 |
Arg | Gly | Arg | Gly | Thr | Val | Asp | Ser | Leu | Thr | Glu | Leu | Pro | Pro | Glu | Asp | |
405 | 410 | 415 | ||||||||||||||
AAT | AGT | GTG | CCA | CCT | CGC | GAA | GGA | TAT | AGT | CAT | CGT | TTA | TGT | CAT | GCA | 1296 |
Asn | Ser | Val | Pro | Pro | Arg | Glu | Gly | Tyr | Ser | His | Arg | Leu | Cys | His | Ala | |
420 | 425 | 430 | ||||||||||||||
ACT | TTT | GTT | CAA | AGA | TCT | GGA | ACA | CCT | TTT | TTA | ACA | ACT | GGT | GTA | GTA | 1344 |
Thr | Phe | Val | Gln | Arg | Ser | Gly | Thr | Pro | Phe | Leu | Thr | Thr | Gly | Val | Val | |
435 | 440 | 445 | ||||||||||||||
TTT | TCT | TGG | ACG | CAT | CGT | AGT | GCA | ACT | CTT | ACA | AAT | ACA | ATT | GAT | CCA | 1392 |
Phe | Ser | Trp | Thr | His | Arg | Ser | Ala | Thr | Leu | Thr | Asn | Thr | Ile | Asp | Pro | |
450 | 455 | 460 | ||||||||||||||
GAG | AGA | ATT | AAT | CAA | ATA | CCT | TTA | GTG | AAA | GGA | TTT | AGA | GTT | TGG | GGG | 1440 |
Glu | Arg | Ile | Asn | Gln | Ile | Pro | Leu | Val | Lys | Gly | Phe | Arg | Val | Trp | Gly | |
465 | 470 | 475 | 480 | |||||||||||||
GGC | ACC | TCT | GTC | ATT | ACA | GGA | CCA | GGA | TTT | ACA | GGA | GGG | GAT | ATC | CTT | 1488 |
Gly | Thr | Ser | Val | Ile | Thr | Gly | Pro | Gly | Phe | Thr | Gly | Gly | Asp | Ile | Leu | |
485 | 490 | 495 | ||||||||||||||
CGA | AGA | AAT | ACC | TTT | GGT | GAT | TTT | GTA | TCT | CTA | CAA | GTC | AAT | ATT | AAT | 1536 |
Arg | Arg | Asn | Thr | Phe | Gly | Asp | Phe | Val | Ser | Leu | Gln | Val | Asn | Ile | Asn | |
500 | 505 | 510 | ||||||||||||||
TCA | CCA | ATT | ACC | CAA | AGA | TAC | CGT | TTA | AGA | TTT | CGT | TAC | GCT | TCC | AGT | 1584 |
Ser | Pro | Ile | Thr | Gln | Arg | Tyr | Arg | Leu | Arg | Phe | Arg | Tyr | Ala | Ser | Ser | |
515 | 520 | 525 |
181 408
AGG GAT GCA Arg Asp Ala | CGA GTT | ATA Ile | GTA TTA ACA GGA GCG GCA TCC ACA GGA GTG | 1632 | ||||||||||||
Arg | Val | Val 535 | Leu | Thr | Gly | Ala | Ala 540 | Ser | Thr | Gly | Val | |||||
530 | ||||||||||||||||
GGA | CGC | CAA | GTT | AGT | GTA | AAT | ATG | CCT | CTT | CAG | AAA | ACT | ATG | GAA | ATA | 1680 |
Gly | Gly | Gln | Val | Ser | Val | Asn | Met | Pro | Leu | Gln | Lys | Thr | Met | Glu | Ile | |
545 | 550 | 555 | 560 | |||||||||||||
GGG | GAG | AAC | TTA | ACA | TCT | AGA | ACA | TTT | AGA | TAT | ACC | GAT | TTT | AGT | AAT | 1728 |
Gly | Glu | Asn | Leu | Thr | Ser | Arg | Thr | Phe | Arg | Tyr | Thr | Asp | Phe | Ser | Asn | |
565 | 570 | 575 | ||||||||||||||
CCT | TTT | TAC | TTT | AGA | GCT | AAT | CCA | GAT | ATA | ATT | GGG | ATA | AGT | GAA | CAA | 1776 |
Pro | Phe | Ser | Phe | Arg | Ala | Asn | Pro | Asp | Ile | Ile | Gly | Ile | Ser | Glu | Gln | |
580 | 585 | 590 | ||||||||||||||
CCT | CTA | TTT | GGT | GCA | GGT | TCT | ATT | AGT | AGC | GGT | GAA | CTT | TAT | ATA | GAT | 1824 |
Pro | Leu | Phe | Gly | Ala | Gly | Ser | Ile | Ser | Ser | Gly | Glu | Leu | Tyr | Ile | Asp | |
595 | 600 | 605 | ||||||||||||||
AAA | ATT | GAA | ATT | ATT | CTA | GCA | GAT | GCA | ACA | TTT | GAA | GCA | GAA | TCT | GAT | 1872 |
Lys | Ile | Glu | Ile | Ile | Leu | Ala | Asp | Ala | Thr | Phe | Glu | Ala | Glu | Ser | Asp | |
610 | 615 | 620 | ||||||||||||||
TTA | GAA | AGA | GCA | CAA | AAG | GCG | GTG | AAT | GCC | CTG | TTT | ACT | TCT | TCC | AAT | 1920 |
Leu | Glu | Arg | Ala | Gln | Lys | Ala | Val | Asn | Ala | Leu | Phe | Thr | Ser | Ser | Asn | |
625 | 630 | 635 | 640 | |||||||||||||
CAA | ATC | GGG | TTA | AAA | ACC | GAT | GTG | ACG | GAT | TAT | CAT | ATT | GAT | CAA | GTA | 1968 |
Gln | Ile | Gly | Leu | Lys | Thr | Asp | Val | Thr | Asp | Tyr | His | Ile | Asp | Gln | Val | |
645 | 650 | 655 | ||||||||||||||
TCC | AAT | TTA | GTG | GAT | TGT | TTA | TCA | GAT | GAA | TTT | TGT | CTG | GAT | GAA | AAG | 2016 |
Ser | Asn | Leu | Val | Asp | Cys | Leu | Ser | Asp | Glu | Phe | Cys | Leu | Asp | Glu | Lys | |
660 | 665 | 670 | ||||||||||||||
CGA | GAA | TTG | TCC | GAG | AAA | GTC | AAA | CAT | GCG | AAG | CGA | CTC | AGT | GAT | GAG | 2064 |
Arg | Glu | Leu | Ser | Glu | Lys | Val | Lys | His | Ala | Lys | Arg | Leu | Ser | Asp | Glu | |
675 | 680 | 685 | ||||||||||||||
CGG | AAT | TTA | CTT | CAA | GAT | CCA | AAC | TTC | AGA | GGG | ATC | AAT | AGA | CAA | CCA | 2112 |
Arg | Asn | Leu | Leu | Gln | Asp | Pro | Asn | Phe | Arg | Gly | Ile | Asn | Arg | Gln | Pro | |
690 | 695 | 700 | ||||||||||||||
GAC | GGT | GGC | TGG | AGA | GGA | AGT | ACA | GAT | ATT | ACC | ATC | CAA | GGA | GGA | GAT | 2160 |
Asp | Arg | Gly | Trp | Arg | Gly | Ser | Thr | Asp | Ile | Thr | Ile | Gln | Gly | Gly | Asp | |
705 | 710 | 715 | 720 | |||||||||||||
GAC | GTA | TTC | AAA | GAG | AAT | TAC | GTC | ACA | CTA | CCG | GGT | ACC | GTT | GAT | GAG | 2208 |
Asp | Val | Phe | Lys | Glu | Asn | Tyr | Val | Thr | Leu | Pro | Gly | Thr | Val | Asp | Glu | |
725 | 730 | 735 | ||||||||||||||
TGC | TAT | CCA | ACG | TAT | TTA | TAT | CAG | AAA | ATA | GAT | GAG | TCG | AAA | TTA | AAA | 2256 |
Cys | Tyr | Pro | Thr | Tyr | Leu | Tyr | Gln | Lys | Ile | Asp | Glu | Ser | Lys | Leu | Lys | |
740 | 745 | 750 | ||||||||||||||
GCT | TAT | ACC | CGT | TAT | GAA | TTA | AGA | GGG | TAT | ATC | GAA | GAT | AGT | CAA | GAC | 2304 |
Ala | Tyr | Thr | Arg | Tyr | Glu | Leu | Arg | Gly | Tyr | Ile | Glu | Asp | Ser | Gln | Asp | |
755 | 760 | 765 | ||||||||||||||
TTA | GAA | ATC | TAT | TTG | ATC | CGT | TAC | AAT | GCA | AAA | CAC | GAA | ATA | GTA | AAT | 2352 |
Leu | Glu | Ile | Tyr | Leu | Ile | Arg | Tyr | Asn | Ala | Lys | His | Glu | Ile | Val | Asn | |
770 | 775 | 780 |
181 408
GTG CCA GGC ACG GGT TCC TTA TGG CCG CTT TCA GCC CAA AGT | CCA Pro | ATC Ile 800 | 240C | ||||||
Val Pro Gly 785 | Thr Gly | Ser Leu Trp Pro Leu Ser | Ala | Gln | Ser | ||||
790 | 795 | ||||||||
GGA AAG TGT | GGA GAA | CCG | AAT CGA TGC GCG CCA | CAC | CTT | GAA | TGG | AAT | 2448 |
Gly Lys Cys | Gly Glu | Pro | Asn Arg Cys Ala Pro | His | Leu | Glu | Trp | Asn | |
805 | 810 | 815 | |||||||
CCT GAT CTA | GAT TGT | TCC | TGC AGA GAC GGG GAA | AAA | TGT | GCA | CAT | CAT | 2496 |
Pro Asp Leu | Asp Cys | Ser | Cys Arg Asp Gly Glu | Lys | Cys | Ala | His | His | |
820 | 825 | 830 | |||||||
TCC CAT CAT | TTC ACC | TTG | GAT ATT GAT GTT CGA | TGT | ACA | GAC | TTA | AAT | 2544 |
Ser His His | Phe Thr | Leu | Asp Ile Asp Val Gly | Cys | Thr | Asp | Leu | Asn | |
835 | 840 | 845 | |||||||
GAG GAC TTA | GGT GTA | TGG | GTG ATA TTC AAG ATT | AAG | ACG | CAA | GAT | GGC | 2592 |
Glu Asp Leu | Gly Val | Trp | Val Ile Phe Lys Ile | Lys | Thr | Gln | Asp | Gly | |
850 | 855 | 860 | |||||||
CAT GCA AGA | CTA GGG | AAT | CTA GAG TTT CTC GAA | GAG | AAA | CCA | TTA | TTA | 264C |
His Ala Arg | Leu Gly | Asn | Leu Glu Phe Leu Glu | Glu | Lys | Pro | Leu | Leu | |
865 | 870 | 875 | 880 | ||||||
GGG GAA GCA | CTA GCT | CGT | GTG AAA AGA GCG GAG | AAG | AAG | TGG | AGA | GAC | 2688 |
Gly Glu Ala | Leu Ala | Arg | Val Lys Arg Ala Glu | Lys | Lys | Trp | Arg | Asp | |
885 | 890 | 895 | |||||||
AAA CGA GAG | AAA CTG | CAG | TTG GAA ACA ATT ATT | GTT | TAT | AAA | GAG | GCA | 2736 |
Lys Arg Glu | Lys Leu | Gln | Leu Glu Thr Asn Ile | Val | Tyr | Lys | Glu | Ala | |
900 | 905 | 910 | |||||||
AAA GAA TCT | GTA GAT | GCT | TTA TTT GTA AAC TCT | CAA | TAT | GAT | AGA | TTA | 2784 |
Lys Glu Ser | Val Asp | Ala | Leu Phe Val Asn Ser | Gln | Tyr | Asp | Arg | Leu | |
915 | 920 | 925 | |||||||
CAA GTG GAT | ACG AAC | ATC | GCG ATG ATT CAT GCG | GCA | GAT | AAA | CGC | GTT | 2832 |
Gln Val Asp | Thr Asn | Ile | Ala Met Ile His Ala | Ala | Asp | Lys | Arg | Val | |
930 | 935 | 940 | |||||||
CAT AGA ATC | CGG GAA | GCG | TAT CTG CCA GAG TTG | TCT | GTG | ATT | CCA | GGT | 2880 |
His Arg Ile | Arg Glu | Ala | Tyr Leu Pro Glu Leu | Ser | Val | Ile | Pro | Gly | |
945 | 950 | 955 | 960 | ||||||
GTC AAT GCG | GCC ATT | TTC | GAA GAA TTA GAG GGA | CGT | ATT | TTT | ACA | GCG | 2928 |
Val Asn Ala | Ala Ile | Phe | Glu Glu Leu Glu Gly | Arg | Ile | Pbe | Thr | Ala | |
965 | 970 | 975 | |||||||
TAT TCC TTA | TAT GAT | GCG | AGA AAT GTC ATT AAA | AAT | GGC | GAT | TTC | AAT | 2976 |
Tyr Ser Leu | Tyr Asp | Ala | Arg Asn Val Ile Lys | Asn | Gly | Asp | Phe | Asn | |
980 | 985 | 990 | |||||||
AAT GGC TTA | TTA ZGC | TGG | AAC GTG AAA GGT CAT | GTA | GAT | GTA | GAA | GAG | 3024 |
Asn Gly Leu | Leu Cys | Trp | Asn Val Lys Gly His | Val | Asp | Val | Glu | Glu | |
995 | 1000 | 1005 | |||||||
CAA AAC AAC | CAC CGT | TCG | GTC CTT GTT ATC CCA | GAA | TGG | GAG | GCA | GAA | 3072 |
Gln Asn Asn | His Arg | Ser | Val Leu Val Ile Pro | Glu | Trp | Glu | Ala | Glu | |
1010 | 1015 | 102C | |||||||
GTG TCA CAA | GAG GTT | CGT | GTC TGT CCA GGT CGT | GGC | TAT | ATC | CTT | CGT | 3120 |
Val Ser Gln | Glu Val | Arg | Val Cys Pro Gly Arg | Gly Tyr | Ile | Leu | Arg |
1025 1030 1035 1040
181 408
GTC Val | ACA GCA TAT AAA GAG GGA TAT GGA GAG GGC TGC GTA ACG ATC CAT | 3168 | |||||
Thr Ala Tyr Lys Glu 1045 | Gly | Tyr | Gly | Glu Gly Cys Val Thr Ile His | |||
1050 | 1055 | ||||||
GAG | ATC GAA GAC AAT ACA | GAC | GAA | CTG | AAA TTC AGC | AAC TGT GTA GAA | 3216 |
Glu | Ile Glu Asp Asn Thr 1060 | Asp | Glu | Leu Lys Phe Ser 1065 | Asn Cys Val Glu 1070 | ||
GAG | GAA GTA TAT CCA AAC | AAC | ACA | GTA | ACG TGT AAT | AAT TAT ACT GGG | 3264 |
Glu | Glu Val Zyr Pro Asn 1075 | Asn | Thr Val 1080 | Thr Cys Asn | Asn Tyr Thr Gly 1085 | ||
ACT | CAA GAA GAA TAT GAG | GGT | ACG | TAC | ACT TCT CGT | AAT CAA GGA TAT | 3312 |
Thr | Gln Glu Glu Tyr Glu 1090 | Gly Thr 1095 | Tyr | Thr Ser Arg Asn Gln Gly Tyr 1100 | |||
GAC | GAA GCC TAT GGT AAT | AAC | CCT | TCC | GTA CCA GCT | GAT TAC GCT TCA | 3360 |
Asp Glu Ala Tyr Gly Asn Asn 1105 1110 | Pro | Ser | Val Pro Ala 1115 | Asp Tyr Ala Ser 1120 | |||
GTC | TAT GAA GAA AAA TCG | TAT | ACA | GAT | GGA CGA AGA | GAG AAT CCT TGT | 3408 |
Val | Tyr Glu Glu Lys Ser 1125 | Tyr | Thr | Asp | Gly Arg Arg 1100 | Glu Asn Pro Cys 1135 | |
GAA | TCT AAC AGA GGC TAT | GGG | GAT | TAC | ACA CCA CTA | CCG GCT GGT TAT | 3456 |
Glu | Ser Asn Arg Gly Tyr 1140 | Gly | Asp | Tyr Thr Pro Leu 1145 | Pro Ala Gly Tyr 1150 | ||
GTA | ACA AAG GAT TTA GAG | TAC | TTC | CCA | GAG ACC GAT | AAG GTA TGG ATT | 3504 |
Val | Thr Lys Asp Leu Glu 1155 | Tyr | Phe Pro 1160 | Glu Thr Asp | Lys Val Trp Ile 1165 | ||
GAG | ATC GGA GAA ACA GAA | GGA | ACA | TTC | ATC GTG GAT | AGC GTG GAA TTA | 3552 |
Glu CTC Leu | Ile Gly Glu Thr Glu 1170 CTT ATG GAG GAA Leu Met Glu Glu | Gly Thr 1175 | Phe | Ile Val Asp Ser Val Glu Leu 1180 | 3567 |
1185 (2) INFORMACJA O SEKWENCJI ID NR: 2:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 1189 aminokwasów (B) TYP: aminokwasowa (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI: białko (xi) OPIS SEKWENCJI: SEKWENCJA ID NR: 2:
Met 1 | Glu | Glu | Asn | Asn 5 | Gln | Asn | Gln | Cys | Ile 10 | Pro | Tyr | Asn | Cys | Leu 15 | Ser |
Asn | Pro | Glu | Glu 20 | Val | Leu | Leu | Asp | Gly 25 | Glu | Arg | Ile | Ser | Thr 30 | Gly | Asn |
Ser | Ser | Ile 35 | Asp | Ile | Ser | Leu | Ser 40 | Leu | Val | Gln | Phe | Leu 45 | Val | Ser | Asn |
Phe | Val 50 | Pro | Gly Gly | Gly | Phe 55 | Leu | Val | Gly | Leu | Ile 60 | Asp | Phe | Val | Trp |
181 408
Gly 65 | Ile | Val Gly Pro Ser Gln Trp Asp Ala Phe Leu | Val | Gln | Ile | Glu 80 | |||||||||
70 | 75 | ||||||||||||||
Gln | Leu | Ile | Asn | Glu | Arg | Ile | Ala | Glu | Phe | Ala | Arg | Asn | Ala | Ala | Ile |
85 | 90 | 95 | |||||||||||||
Ala | Asn | Leu | Glu | Gly | Leu | Gly | Asn | Asn | Phe | Aen | Ile | Tyr | Val | Glu | Ala |
100 | 105 | 110 | |||||||||||||
Phe | Lys | Glu | Trp | Glu | Glu | Asp | Pro | Asn | Asn | Pro | Glu | Thr | Arg | Thr | Arg |
115 | 120 | 125 | |||||||||||||
Val | Ile | Asp | Arg | Phe | Arg | Ile | Leu | Asp | Gly | Leu | Leu | Glu | Arg | Asp | Ile |
130 | 135 | 140 | |||||||||||||
Pro | Ser | Phe | Arg | Ile | Ser | Gly | Phe | Glu | Val | Pro | Leu | Leu | Ser | Val | Tyr |
145 | 150 | 155 | 160 | ||||||||||||
Ala | Gln | Ala | Ala | Asn | Leu | His | Leu | Ala | Ile | Leu | Arg | Asp | Ser | Val | Ile |
165 | 170 | 175 | |||||||||||||
Phe | Gly | Glu | Arg | Trp | Gly | Leu | Thr | Thr | Ile | Asn | Val | Asn | Glu | Asn | Tyr |
180 | 185 | 190 | |||||||||||||
Asn | Arg | Leu | Ile | Arg | His | Ile | Asp | Glu | Tyr | Ala | Asp | His | Gys | Ala | Asn |
195 | 200 | 205 | |||||||||||||
Thr | Tyr | Asn | Arg | Gly | Leu | Asn | Asn | Leu | Pro | Lys | Ser | Thr | Tyr | Gln | Asp |
210 | 215 | 220 | |||||||||||||
Trp | Ile | Thr | Tyr | Asn | Arg | Leu | Arg | Arg | Asp | Leu | Thr | Leu | Thr | Val | Leu |
225 | 230 | 235 | 240 | ||||||||||||
Asp | Ile | Ala | Ala | Phe | Phe | Pro | Asn | Tyr | Asp | Asn | Arg | Agr | Tyr | Pro | Ile |
245 | 250 | 255 | |||||||||||||
Gln | Pro | Val | Gly | Gln | Leu | Thr | Arg | Glu | Val | Tyr | Thr | Asp | Pro | Leu | Ile |
260 | 265 | 270 | |||||||||||||
Asn | Phe | Asn | Pro | Gln | Leu | Gln | Ser | Val | Ala | Gln | Leu | Pro | Thr | Phe | Asn |
275 | 280 | 285 | |||||||||||||
Val | Met | Glu | Ser | Ser | Ala | Ile | Arg | Asn | Pro | His | Leu | Phe | Asp | Ile | Leu |
290 | 295 | 300 | |||||||||||||
Asn | Asn | Leu | Thr | Ile | Phe | Thr | Asp | Trp | Phe | Ser | Val | Gly Arg | Asn | Phe | |
305 | 310 | 315 | 320 | ||||||||||||
Tyr | Trp | Gly | Gly | His | Arg | Val | Ile | Ser | Ser | Leu | Ile | Gly Gly | Gly | Asn | |
325 | 330 | 335 | |||||||||||||
Ile | Thr | Ser | Pro | Ile | Tyr | Gly | Arg | Glu | Ala | Asn | Gln | Glu | Pro | Pro | Arg |
340 | 345 | 350 | |||||||||||||
Ser | Phe | Thr | Phe | Asn | Gly | Pro | Val | Phe | Arg | Thr | Leu | Ser | Asn | Pro | Thr |
355 | 360 | 365 | |||||||||||||
Leu | Arg | Leu | Leu | Gln | Gln | Pro | Trp | Pro | Ala | Pro | Pro | Phe | Asn | Leu | Arg |
370 | 375 | 380 | |||||||||||||
Gly | Val | Glu | Gly | Val | Glu | Phe | Ser | Thr | Pro | Thr | Asn | Ser | Phe | Thr | Tyr |
385 | 390 | 395 | 400 | ||||||||||||
Arg | Gly | Arg | Gly | Thr | Val | Asp | Ser | Leu | Thr | Glu | Leu | Pro | Pro | Glu | Asp |
405 | 410 | 415 | |||||||||||||
Asn | Ser | Val | Pro | Pro | Arg | Glu | Gly | Tyr | Ser | His | Arg | Leu | Cys | His | Ala |
420 | 425 | 430 |
181 408
Thr Phe | Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val | ||||||||||||||
435 | 440 | 445 | |||||||||||||
Phe | Ser | Trp | Thr | His | Arg | Ser | Ala | Thr | Leu | Thr | Asn | Thr | Ile | Asp | Pro |
450 | 455 | 460 | |||||||||||||
Glu | Arg | Ile | Asn | Gln | Ile | Pro | Leu | Vol | Lys | Gly | Phe | Arg | Val | Trp | Gly |
465 | 470 | 475 | 480 | ||||||||||||
Gly | Thr | Ser | Val | Ile | Thr | Gly | Pro | Gly | Phe | Thr | Gly | Gly | Asp | Ile | Leu |
485 | 490 | 495 | |||||||||||||
Arg | Arg | Asn | Thr | Phe | Gly | Asp | Phe | Val | Ser | Leu | Gln | Val | Asn | Ile | Asn |
500 | 505 | 510 | |||||||||||||
Ser | Pro | Ile | Thr | Gln | Arg | Tyr | Arg | Leu | Arg | Phe | Arg | Tyr | Ala | Ser | Ser |
515 | 520 | 525 | |||||||||||||
Arg | Asp | Ala | Arg | Val | Ile | Val | Leu | Thr | Gly | Ala | Ala | Ser | Thr | Gly | Val |
530 | 535 | 540 | |||||||||||||
Gly | Gly | Gln | Val | Ser | Val | Asn | Met | Pro | Leu | Gln | Lys | Thr | Met | Glu | Ile |
545 | 550 | 555 | 560 | ||||||||||||
Gly | Glu | Asn | Leu | Thr | Ser | Arg | Thr | Phe | Arg | Tyr | Thr | Asp | Phe | Ser | Asn |
565 | 570 | 575 | |||||||||||||
Pro | Phe | Ser | Phe | Arg | Ala | Asn | Pro | Asp | Ile | Ile | Gly | Ile | Ser | Glu | Gln |
580 | 585 | 590 | |||||||||||||
Pro | Leu | Phe | Gly | Ala | Gly | Ser | Ile | Ser | Ser | Gly | Glu | Leu | Tyr | Ile | Asp |
595 | 600 | 605 | |||||||||||||
Lys | Ile | Glu | Ile | Ile | Leu | Ala | Asp | Ala | Thr | Phe | Glu | Ala | Glu | Ser | Asp |
610 | 615 | 620 | |||||||||||||
Leu | Glu | Arg | Ala | Gln | Lys | Ala | Val | Asn | Ala | Leu | Phe | Thr | Ser | Ser | Asn |
625 | 630 | 635 | 640 | ||||||||||||
Gln | Ile | Gly | Leu | Lys | Thr | Asp | Val | Thr | Asp | Tyr | His | Ile | Asp | Gln | Val |
645 | 650 | 655 | |||||||||||||
Ser | Asn | Leu | Val | Asp | Cys | Leu | Ser | Asp | Glu | Phe | Cys | Leu | Asp | Glu | Lys |
660 | 665 | 670 | |||||||||||||
Arg | Glu | Leu | Ser | Glu | Lys | Val | Lys | His | Ala | Lys | Arg | Leu | Ser | Asp | Glu |
675 | 680 | 685 | |||||||||||||
Arg | Asn | Leu | Leu | Gln | Asp | Pro | Asn | Phe | Arg | Gly | Ile | Asn | Arg | Gln | Pro |
690 | 695 | 700 | |||||||||||||
Asp | Arg | Gly | Trp | Arg | Gly | Ser | Thr | Asp | Ile | Thr | Ile | Gln | Gly | Gly | Asp |
705 | 710 | 715 | 720 | ||||||||||||
Asp | Val | Phe | Lys | Glu | Asn | Tyr | Val | Thr | Leu | Pro | Gly | Thr | Val | Asp | Glu |
725 | 730 | 735 | |||||||||||||
Cys | Tyr | Pro | Thr | Tyr | Leu | Tyr | Gln | Lys | Ile | Asp | Glu | Ser | Lys | Leu | Lys |
740 | 745 | 750 | |||||||||||||
Ala | Tyr | Thr | Arg | Arg | Glu | Leu | Arg | Gly | Tyr | Ile | Glu | Asp | Ser | Gln | Asp |
755 | 760 | 765 | |||||||||||||
Leu | Glu | Ile | Tyr | Leu | Ile | Arg | Tyr | Asn | Ala | Lys | His | Glu | Ile | Val | Asn |
770 | 775 | 780 |
Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro Ile 785 790 795 800
181 408
Gly Lys Cys | Gly Glu Pro Asn 805 | Arg Cys Ala Pro His Leu Glu Trp Asn | |
810 | 815 | ||
Pro Asp Leu | Asp Cys Ser Cys 820 | Arg Asp Gly Glu Lys Cys Ala 825 830 | His His |
Ser His His 835 | Phe Thr Leu Asp | Ile Aep Val Gly Cys Thr Asp 840 845 | Leu Asn |
Glu Asp Leu 850 | Gly Val Trp Val 855 | Ile Phe Lys Ile Lys Thr Gln 860 | Asp Gly |
His Ala Arg 865 | Leu Gly Asn Leu 870 | Glu Phe Leu Glu Glu Lys Pro 875 | Leu Leu 880 |
Gly Glu Ala | Leu Ala Arg Val 885 | Lys Arg Ala Glu Lys Lys Trp 890 | Arg Asp 895 |
Lys Arg Glu | Lys Leu Gln Leu 900 | Glu Thr Asn Ile Val Tyr Lys 905 910 | Glu Ala |
Lys Glu Ser 915 | Val Asp Ala Leu | Phe Val Asn Ser Gln Tyr Asp 920 925 | Arg Leu |
Gln Val Asp 930 | Thr Asn Ile Ala 935 | Met Ile His Ala Ala Asp Lys 940 | Arg Val |
His Arg Ile 945 | Arg Glu Ala Tyr 950 | Leu Pro Glu Leu Ser Val Ile 955 | Pro Gly 960 |
Val Asn Ala | Ala Ile Phe Glu 965 | Glu Leu Glu Gly Arg Ile Phe 970 | Thr Ala 975 |
Tyr Ser Leu | Tyr Asp Ala Arg 980 | Asn Val Ile Lys Asn Gly Asp 985 990 | Phe Asn |
Asn Gly Leu 995 | Leu Cys Trp Asn | Val Lys Gly His Val Asp Val 1000 1005 | Glu Glu |
Gln Asn Asn 1010 | His Arg Ser Val Leu Val Ile Pro Glu Trp Glu 1015 102C | Ala Glu | |
Val Ser Gln 1025 | Glu Val Arg Val 1030 | Cys Pro Gly Arg Gly Tyr Ile 1035 | Leu Arg 1040 |
Val Thr Ala | Tyr Lys Glu Gly 1045 | Tyr Gly Glu Gly Cys Val Thr 1050 | Ile His 1055 |
Glu Ile Glu | Asp Asn Thr Asp 106C | Glu Leu Lys Phe Ser Asn Cys Val Glu 1065 107C | |
Glu Glu Val Tyr Pro Asn Asn 1075 | Thr Val Thr Cys Asn Asn Tyr 108C 1085 | Thr Gly | |
Thr Gln Glu 1090 | Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln 1095 1100 | Gly Tyr | |
Asp Glu Ala 1105 | Tyr Gly Asn Asn 1110 | Pro Ser Val Pro Ala Asp Tyr 1115 | Ala Ser 1120 |
Val Tyr Glu | Glu Lys Ser Tyr 1125 | Thr Asp Gly Arg Arg Glu Asn 1130 | Pro Cys 1135 |
Glu Ser Asn | Arg Gly Tyr Gly 1140 | Asp Tyr Thr Pro Leu Pro Ala 1145 115C | Gly Tyr 1 |
Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile 1155 1160 1165
181 408
Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu 1170 1175 1180
Leu Leu Met Glu Glu
1185 (2) INFORMACJA O SEKWENCJI ID NR: 3:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 3513 par podstawowych (B) TYP: kwas nukleinowy (C) TYP ŁAŃCUCHA: pojedynczy (D) TOPOLOGIA: nieznana (ii) TYP CZĄSTECZKI: cDNA (iii) HIPOTETYCZNY: NIE (iii) ANTI-SENSE: NIE (vi) ŹRÓDŁO PIERWOTNE:
(A) ORGANI2M1: Bacillus thuringiensis (ix) CECHA:
(A) NAZWA/KLUCZ: CDS (B) LOKALIZACJA: 1..3513 (xi) OPIS SEKWENCJI: SEKWENCJA ID NR: 3:
ATG GAG ATA GTG AAT | AAT CAG AAT CAA TGC GTG CCT TAT AAT TGT TTA | 48 | ||||||||||||||
Met Glu 1 | Ile | Val Asn 5 | Asn | Gln | Asn | Gln | Cys Val 10 | Pro | Tyr | Asn | Cys 15 | Leu | ||||
AAT | AAT | CCT | GAA | AAT | GAG | ATA | TTA | GAT | ATT | GAA | AGG | TCA | AAT | AGT | ACT | 96 |
Asn | Asn | Pro | Glu | Asn | Glu | Ile | Leu | Asp | Ile | Glu | Arg | Ser | Asn | Ser | Thr | |
20 | 25 | 30 | ||||||||||||||
GTA | GCA | ACA | AAC | ATC | GCC | TTG | GAG | ATT | AGT | CGT | CTG | CTC | GCT | TCC | GCA | 144 |
Val | Ala | Thr | Asn | Ile | Ala | Leu | Glu | Ile | Ser | Arg | Leu | Leu | Ala | Ser | Ala | |
35 | 40 | 45 | ||||||||||||||
ACT | CCA | ATA | GGG | GGG | ATT | TTA | TTA | GGA | TTG | TTT | GAT | GCA | ATA | TGG | GGG | 192 |
Thr | Pro | Ile | Gly | Gly | Ile | Leu | Leu | Gly | Leu | Phe | Asp | Ala | Ile | Trp | Gly | |
50 | 55 | 60 | ||||||||||||||
TCT | ATA | GGC | CCT | TCA | CAA | TGG | GAT | TTA | TTT | TTA | GAG | CAA | ATT | GAG | CTA | 240 |
Ser | Ile | Gly | Pro | Ser | Gln | Trp | Asp | Leu | Phe | Leu | Glu | Gln | Ile | Glu | Leu | |
65 | 70 | 75 | 80 | |||||||||||||
TTG | ATT | GAC | CAA | AAA | ATA | GAG | GAA | TTC | GCT | AGA | AAC | CAG | GCA | ATT | TCT | 288 |
Leu | Ile | Asp | Gln | Lys | Ile | Glu | Glu | Phe | Ala | Arg | Asn | Gln | Ala | Ile | Ser | |
85 | 90 | 95 | ||||||||||||||
AGA | TTG | GAA | GGG | ATA | AGC | AGT | CTG | TAC | GGA | ATT | TAT | ACA | GAA | GCT | TTT | 336 |
Arg | Leu | Glu | Gly | Ile | Ser | Ser | Leu | Tyr | Gly | Ile | Tyr | Thr | Glu | Ala | Phe | |
100 | 105 | 110 | ||||||||||||||
AGA | GAG | TGG | GAA | GCA | GAT | CCT | ACT | AAT | CCA | GCA | TTA | AAA | GAA | GAG | ATG | 384 |
Arg | Glu | Trp | Glu | Ala | Asp | Pro | Thr | Asn | Pro | Ala | Leu | Lys | Glu | Glu | Met | |
115 | 120 | 125 | ||||||||||||||
CGT | ACT | CAA | TTT | AAT | GAC | ATG | AAC | AGT | ATT | CTT | GTA | ACA | GCT | ATT | CCT | 432 |
Arg | Thr | Gln | Phe | Asn | Asp | Met | Asn | Ser | Ile | Leu | Val | Thr | Ala | Ile | Pro | |
130 | 135 | 140 |
181 408
CTT TTT | TCA GTT CAA AAT | TAT CAA GTC CCA TTT TTA TCA GTA TAT GTT | 480 | |||||||||||||
Leu 145 | Phe | Ser | Val | Gln Asn 150 | Tyr | Gln | Val Pro | Phe 155 | Leu | Ser | Val | Tyr | Val 160 | |||
CAA | GCT | GCA | AAT | TTA | CAT | TTA | TCG | GTT | TTG | AGA | GAT | GTT | TCA | GTG | TTT | 528 |
Gln | Ala | Ala | Asn | Leu | His | Leu | Ser | Val | Leu | Arg | Asp | Val | Ser | Val | Phe | |
165 | 170 | 175 | ||||||||||||||
GGA | CAG | GCT | TGG | GGA | TTT | GAT | ATA | GCA | ACA | ATA | AAT | AGT | CGT | TAT | AAT | 576 |
Gly | Gln | Ala | Trp | Gly | Phe | Asp | Ile | Ala | Thr | Ile | Asn | Ser | Arg | Tyr | Asn | |
180 | 185 | 190 | ||||||||||||||
GAT | CTG | ACT | AGA | CTT | ATT | CCT | ATA | TAT | ACA | GAT | TAT | GCT | GTA | CGC | TGG | 624 |
Asp | Leu | Thr | Arg | Leu | Ile | Pro | Ile | Tyr | Thr | Asp | Tyr | Ala | Val | Arg | Trp | |
195 | 200 | 205 | ||||||||||||||
TAC | AAT | ACG | GGA | TTA | GAT | CGC | TTA | CCA | CGA | ACT | GGT | GGG | CTG | CGA | AAC | 672 |
Tyr | Asn | Thr | Gly | Leu | Asp | Arg | Leu | Pro | Arg | Thr | Gly | Gly | Leu | Arg | Asn | |
210 | 215 | 220 | ||||||||||||||
TGG | GCA | AGA | TTT | AAT | CAG | TTT | AGA | AGA | GAG | TTA | ACA | ATA | TCA | GTA | TTA | 720 |
Trp | Ala | Arg | Phe | Asn | Gln | Phe | Arg | Arg | Glu | Leu | Thr | Ile | Ser | Val | Leu | |
225 | 230 | 235 | 240 | |||||||||||||
GAT | ATT | ATT | TCT | TTT | TTC | AGA | AAT | TAC | GAT | TCT | AGA | TTA | TAT | CCA | ATT | 768 |
Asp | Ile | Ile | Ser | Phe | Phe | Arg | Asn | Tyr | Asp | Ser | Arg | Leu | Tyr | Pro | Ile | |
245 | 250 | 255 | ||||||||||||||
CCA | ACA | AGC | TCC | CAA | TTA | ACG | CGG | GAA | GTA | TAT | ACA | GAT | CCG | GTA | ATT | 816 |
Pro | Thr | Ser | Ser | Gln | Leu | Thr | Arg | Glu | Val | Tyr | Thr | Asp | Pro | Val | Ile | |
260 | 265 | 270 | ||||||||||||||
AAT | ATA | ACT | GAC | TAT | AGA | GTT | GGC | CCC | AGC | TTC | GAG | AAT | ATT | GAG | AAC | 864 |
Asn | Ile | Thr | Asp | Tyr | Arg | Val | Gly | Pro | Ser | Phe | Glu | Asn | Ile | Glu | Asn | |
275 | 280 | 285 | ||||||||||||||
TCA | GCC | ATT | AGA | AGC | CCC | CAC | CTT | ATG | GAC | TTC | TTA | AAT | AAT | TTG | ACC | 912 |
Ser | Ala | Ile | Arg | Ser | Pro | His | Leu | Met | Asp | Phe | Leu | Asn | Asn | Leu | Thr | |
290 | 295 | 300 | ||||||||||||||
ATT | GAT | ACG | GAT | TTG | ATT | AGA | GGT | GTT | CAC | TAT | TCG | GCA | GGG | CAT | CGT | 960 |
Ile | Asp | Thr | Asp | Leu | Ile | Arg | Gly | Val | His | Tyr | Trp | Ala | Gly | His | Arg | |
305 | 310 | 315 | 320 | |||||||||||||
GTA | ACT | TCT | CAT | TTT | ACA | GGT | AGT | TCT | CAA | GTG | ATA | ACA | ACC | CCT | CAA | 1008 |
Val | Thr | Ser | His | Phe | Thr | Gly | Ser | Ser | Gln | Val | Ile | Thr | Thr | Pro | Gln | |
325 | 330 | 335 | ||||||||||||||
TAT | GGG | ATA | ACC | GCA | AAT | GCG | GAA | CCA | AGA | CGA | ACT | ATT | GCT | CCT | AGT | 1056 |
Tyr | Gly | Ile | Thr | Ala | Asn | Ala | Glu | Pro | Arg | Arg | Thr | Ile | Ala | Pro | Ser | |
340 | 345 | 350 | ||||||||||||||
ACT | TTT | CCA | GGT | CTT | AAC | CTA | TTT | TAT | AGA | ACA | TTA | TCA | AAT | CCT | TTC | 1104 |
Thr | Phe | Pro | Gly | Leu | Asn | Leu | Phe | Tyr | Arg | Thr | Leu | Ser | Asn | Pro | Phe | |
355 | 360 | 365 | ||||||||||||||
TTC | CGA | AGA | TCA | GAA | AAT | ATT | ACT | CCT | ACC | TTA | GGG | ATA | AAT | GTA | GTA | 1152 |
Phe | Arg | Arg | Ser | Glu | Asn | Ile | Thr | Pro | Thr | Leu | Gly | Ile | Asn | Val | Val | |
370 | 375 | 380 | ||||||||||||||
CAG | GGA | GTA | GGG | TTC | ATT | CAA | CCA | AAT | AAT | GCT | GAA | GTT | CTA | TAT | AGA | 1200 |
Gln | Gly | Val | Gly | Phe | Ile | Gln | Pro | Asn | Asn | Ala | Glu | Val | Leu | Tyr | Arg | |
385 | 390 | 395 | 400 |
181 408
AGT Ser | AGG Arg | GGG ACA Gly Thr | GTA GAT TCT CTT AAT GAG TTA CCA ATT GAT GGT GAG | 1248 | ||||||||||||
Val 405 | Asp | Ser | Leu | Asn | Glu Leu Pro 410 | Ile | Asp | Gly 415 | Glu | |||||||
AAT | TCA | TTA | GTT | GGA | TAT | AGT | CAT | CGA | TTA | AGT | CAT | GTT | ACA | CTA | ACC | 1296 |
Asn | Ser | Leu | Val | Gly | Tyr | Ser | His | Arg | Leu | Ser | His | Val | Thr | Leu | Thr | |
420 | 425 | 430 | ||||||||||||||
AGG | TCG | TTA | TAT | AAT | ACT | AAT | ATA | ACT | AGC | CTG | CCA | ACA | TTT | GTT | TGG | 1344 |
Arg | Ser | Leu | Tyr | Asn | Thr | Asn | Ile | Thr | Ser | Leu | Pro | Thr | Phe | Val | Trp | |
435 | 440 | 445 | ||||||||||||||
ACA | CAT | CAC | AGT | GCT | ACT | AAT | ACA | AAT | ACA | ATT | AAT | CCA | GAT | ATT | ATT | 1392 |
Thr | His | His | Ser | Ala | Thr | Asn | Thr | Asn | Thr | Ile | Asn | Pro | Asp | Ile | Ile | |
450 | 455 | 460 | ||||||||||||||
ACA | CAA | ATA | CCT | TTA | GTG | AAA | GGA | TTT | AGA | CTT | GGT | GGT | GGC | ACC | TCT | 1440 |
Thr | Gln | Ile | Pro | Leu | Val | Lys | Gly | Phe | Arg | Leu | Gly | Gly | Gly | Thr | Ser | |
465 | 470 | 475 | 480 | |||||||||||||
GTC | ATT | AAA | GGA | CCA | GGA | TTT | ACA | GGA | GGG | GAT | ATC | CTT | CGA | AGA | AAT | 1488 |
Val | Ile | Lys | Gly | Pro | Gly | Phe | Thr | Gly | Gly | Asp | Ile | Leu | Arg | Arg | Asn | |
485 | 490 | 495 | ||||||||||||||
ACC | ATT | GGT | GAG | TTT | GTG | TCT | TTA | CAA | GTC | AAT | ATT | AAC | TCA | CCA | ATT | 1536 |
Thr | Ile | Gly | Glu | Phe | Val | Ser | Leu | Gln | Val | Asn | Ile | Asn | Ser | Pro | Ile | |
500 | 505 | 510 | ||||||||||||||
ACC | CAA | AGA | TAC | CGT | TTA | AGA | TTT | CGT | TAT | GCT | TCC | AGT | AGG | GAT | GCA | 1584 |
Thr | Gln | Arg | Tyr | Arg | Leu | Arg | Phe | Arg | Tyr | Ala | Ser | Ser | Arg | Asp | Ala | |
515 | 520 | 525 | ||||||||||||||
CGA | ATT | ACT | GTA | GCG | ATA | GGA | GGA | CAA | ATT | AGA | GTA | GAT | ATG | ACC | CTT | 1632 |
Arg | Ile | Thr | Val | Ala | Ile | Gly | Gly | Gln | Ile | Arg | Val | Asp | Met | Thr | Leu | |
530 | 535 | 540 | ||||||||||||||
GAA | AAA | ACC | ATG | GAA | ATT | GGG | GAG | AGC | TTA | ACA | TCT | AGA | ACA | TTT | AGC | 1680 |
Glu | Lys | Thr | Met | Glu | Ile | Gly | Glu | Ser | Leu | Thr | Ser | Arg | Thr | Phe | Ser | |
545 | 550 | 555 | 560 | |||||||||||||
TAT | ACC | AAT | TTT | AGT | AAT | CCT | TTT | TCA | TTT | AGG | GCT | AAT | CCA | GAT | ATA | 1728 |
Tyr | Thr | Asn | Phe | Ser | Asn | Pro | Phe | Ser | Phe | Arg | Ala | Asn | Pro | Asp | Ile | |
565 | 570 | 575 | ||||||||||||||
ATT | AGA | ATA | GCT | GAA | GAA | CTT | CCT | ATT | CGT | GGT | GGT | GAG | CTT | TAT | ATA | 1776 |
Ile | Arg | Ile | Ala | Glu | Glu | Leu | Pro | Ile | Arg | Gly | Gly | Glu | Leu | Tyr | Ile | |
580 | 585 | 590 | ||||||||||||||
GAT | AAA | ATT | GAA | CTT | ATT | CTA | GCA | GAT | GCA | ACA | TTT | GAA | GAA | GAA | TAT | 1824 |
Asp | Lys | Ile | Glu | Leu | Ile | Leu | Ala | Asp | Ala | Thr | Phe | Glu | Glu | Glu | Tyr | |
595 | 600 | 605 | ||||||||||||||
GAT | TTG | GAA | AGA | GCA | CAG | AAG | GCG | GTG | AAT | GCC | CTG | TTT | ACT | TCT | ACA | 1872 |
Asp | Leu | Glu | Arg | Ala | Gln | Lys | Ala | Val | Asn | Ala | Leu | Phe | Thr | Ser | Thr | |
610 | 615 | 620 | ||||||||||||||
AAT | CAA | CTA | GGG | CTA | AAA | ACA | GAT | GTG | ACG | GAT | TAT | CAT | ATT | GAT | CAA | 1920 |
Asn | Gln | Leu | Gly | Leu | Lys | Thr | Asp | Val | Thr | Asp | Tyr | His | Ile | Asp | Gln | |
625 | 630 | 635 | 640 | |||||||||||||
GTT | TCC | AAT | TTA | GTT | GAG | TGT | TTA | TCG | GAT | GAA | TTT | TGT | CTG | GAT | GAA | 1968 |
Val | Ser | Asn | Leu | Val | Glu | Cys | Leu | Ser | Asp | Glu | Phe | Cys | Leu | Asp | Glu | |
645 | 650 | 655 |
181 408
AAG Lys | AGA Arg | GAA TTA TCC GAG AAA GTC AAA CAT GCG AAG CGA CTC AGT | GAT Asp | 2016 | ||||||||||||
Glu | Leu Ser 660 | Glu | Lys Val | Lys 665 | His | Ala | Lys | Arg | Leu 670 | Ser | ||||||
GAA | CGG | AAT | TTA | CTT | CAA | GAT | CCA | AAC | TTC | AGA | GGG | ATC | AAT | AGG | CAA | 2064 |
Glu | Arg | Asn | Leu | Leu | Gln | Asp | Pro | Asn | Phe | Arg | Gly | Ile | Asn | Arg | Gln | |
675 | 680 | 685 | ||||||||||||||
CCA | GAC | CGT | GGC | TGG | AGA | GGA | AGC | ACG | GAT | ATT | ACT | ATC | CAA | GGT | GGA | 2112 |
Pro | Asp | Arg | Gly | Trp | Arg | Gly | Ser | Thr | Asp | Ile | Thr | Ile | Gln | Gly | Gly | |
690 | 695 | 700 | ||||||||||||||
GAT | GAC | GTA | TTC | AAA | GAG | AAT | TAC | GTC | ACA | TTA | CCG | GGT | ACC | TTT | GAT | 2160 |
Asp | Asp | Val | Phe | Lys | Glu | Asn | Tyr | Val | Thr | Leu | Pro | Gly | Thr | Phe | Asp | |
705 | 710 | 715 | 720 | |||||||||||||
GAG | TGC | TAT | CCA | ACG | TAT | TTA | TAT | CAA | AAA | ATA | GAT | GAG | TCG | AAG | TTA | 2208 |
Glu | Cys | Tyr | Pro | Thr | Tyr | Leu | Tyr | Gln | Lys | Ile | Asp | Glu | Ser | Lys | Leu | |
725 | 730 | 735 | ||||||||||||||
AAA | GCT | TAT | ACC | CGC | TAT | GAA | TTA | AGA | GGG | TAT | ATC | GAG | GAT | AGT | CAA | 2256 |
Lys | Ala | Tyr | Thr | Arg | Tyr | Glu | Leu | Arg | Gly | Tyr | Ile | Glu | Asp | Ser | Gln | |
740 | 745 | 750 | ||||||||||||||
GAC | TTA | GAA | ATC | TAT | TTA | ATT | CGC | TAC | AAT | GCA | AAA | CAC | GAG | ACA | GTA | 2304 |
Asp | Leu | Glu | Ile | Tyr | Leu | Ile | Arg | Tyr | Asn | Ala | Lys | His | Glu | Thr | Val | |
755 | 760 | 765 | ||||||||||||||
AAC | GTG | CCA | GGT | ACG | GGT | TCC | TTA | TGG | CCG | CTT | TCA | GCC | CAA | AGT | CCA | 2352 |
Asn | Val | Pro | Gly | Thr | Gly | Ser | Leu | Trp | Pro | Leu | Ser | Ala | Gln | Ser | Pro | |
770 | 775 | 780 | ||||||||||||||
ATC | GGA | AAG | TGT | GGA | GAA | CCG | AAT | CGA | TGC | GCG | CCA | CAC | CTT | GAA | TGG | 2400 |
Ile | Gly | Lys | Cys | Gly | Glu | Pro | Asn | Arg | Cys | Ala | Pro | His | Leu | Glu | Trp | |
785 | 790 | 795 | 800 | |||||||||||||
AAT | CCT | AAT | CTA | GAT | TGC | TCC | TCC | AGA | GAC | GGG | GAA | AAA | TGT | GCC | CAT | 2448 |
Asn | Pro | Asn | Leu | Asp | Cys | Ser | Cys | Arg | Asp | Gly | Glu | Lys | Cys | Ala | His | |
805 | 810 | 815 | ||||||||||||||
CAT | TCC | CAT | CAT | TTC | TCC | TTG | GAC | ATT | GAT | GTT | GGA | TGT | ACA | GAC | TTA | 2496 |
His | Ser | His | His | Phe | Ser | Leu | Asp | Ile | Asp | Val | Gly | Cys | Thr | Asp | Leu | |
820 | 825 | 830 | ||||||||||||||
AAT | GAG | GAC | TTA | GGT | GTA | TGG | GTG | ATA | TTC | AAG | ATT | AAG | ACA | CAA | GAT | 2544 |
Asn | Glu | Asp | Leu | Gly | Val | Trp | Val | Ile | Phe | Lys | Ile | Lys | Thr | Gln | Asp | |
835 | 840 | 845 | ||||||||||||||
GGC | TAT | GCA | AGA | CTA | GGA | AAT | CTA | GAG | TTT | CTC | GAA | GAG | AAC | CCA | CTA | 2592 |
Gly | Tyr | Ala | Arg | Leu | Gly | Asn | Leu | Glu | Phe | Leu | Glu | Glu | Asn | Pro | Leu | |
850 | 855 | 860 | ||||||||||||||
TTA | GGG | GAA | GCA | CTA | GCT | CGT | GTG | AAA | AGA | GCG | GAG | AAA | AAA | TGG | AGA | 2640 |
Leu | Gly | Glu | Ala | Leu | Ala | Arg | Val | Lys | Arg | Ala | Glu | Lys | Lys | Trp | Arg | |
865 | 870 | 875 | 880 | |||||||||||||
GAC | AAA | TGC | GAA | AAA | TTG | GAA | TGG | GAA | ACA | AAT | ATT | GTT | TAT | AAA | GAG | 2688 |
Asp | Lys | Cys | Glu | Lys | Leu | Glu | Trp | Glu | Thr | Asn | Ile | Val | Tyr | Lys | Glu | |
885 | 890 | 895 | ||||||||||||||
GCA | AAA | GAA | TCT | GTA | GAT | GCT | TTA | TTT | GTA | AAC | TCT | CAA | TAT | GAT | AGA | 2736 |
Ala | Lys | Glu | Ser | Val | Asp | Ala | Leu | Phe | Val | Asn | Ser | Gln | Tyr | Asp | Arg |
900 905 910
181 408
TTA CAA Leu Gln | GCG GAT | ACG AAT ATC GCG ATG ATT CAT GCG GCA GAT AAA CGC | 2784 | ||||||||||
Ala 915 | Asp | Thr Asn | Ile | Ala Met 920 | Ile | His | Ala | Ala 925 | Asp | Lys | Arg | ||
GTT CAT | AGC | ATT | CGA GAA | GCG | TAT CTG | CCA | GAG | CTG | TCT | GTG | ATT | CCG | 2832 |
Val His 930 | Ser | Ile | Arg Glu | Ala 935 | Tyr Leu | Pro | Glu | Leu 940 | Ser | Val | Ile | Pro | |
GGT GTC | AAT | GCG | GCT ATT | TTT | GAA GAA | TTA | GAA | GGG | CGT | ATT | TTC | ACT | 2880 |
Gly Val 945 | Asn | Ala | Ala Ile 950 | Phe | Glu Glu | Leu Glu 955 | Gly | Arg | Ile | Phe | Thr 960 | ||
GCA TTC | TCC | CTA | TAT GAT | GCG | AGA AAT | GTC | ATT | AAA | AAT | GGC | GAT | TTC | 2928 |
Ala Phe | Ser | Leu | Tyr Asp 965 | Ala | Arg Asn | Val 970 | Ile | Lys | Asn | Gly | Asp 975 | Phe | |
AAT AAT | GGC | TTA | TCA TGC | TGG | AAC GTG | AAA | GGG | CAT | GTA | GAT | GTA | GAA | 2976 |
Asn Asn | Gly | Leu 980 | Ser Cys | Trp | Asn Val 985 | Lys | Gly | His | Val | Asp 990 | Val | Glu | |
GAA CAG | AAC | AAC | CAT CGT | TCG | GTC CTT | GTT | GTT | CCA | GAA | TGG | GAA | GCA | 3024 |
Glu Gln | Asn 995 | Asn | His Arg | Ser | Val Leu 1000 | Val | Val | Pro | Glu Trp 1005 | Glu | Ala | ||
GAA GTG | TCA | CAA | GAA GTT | CGT | GTT TGT | CCG | GGT | CGT | GGC | TAT | ATC | CTT | 3072 |
Glu Val Ser 1010 | Gln | Glu Val | Arg Val Cys 1015 | Pro | Gly | Arg Gly 1020 | Tyr | Ile | Leu | ||||
CGT GTT | ACA | GCG | TAC AAA | GAG | GGA TAT | GGA | GAG | GGC | TGT | GTA | ACG | ATT | 3120 |
Arg Val 1025 | Thr | Ala | Tyr Lys Glu 1030 | Gly Tyr | Gly | Glu Gly 1035 | Cys | Val | Thr | Ile 1040 | |||
CAT GAG | ATC | GAA | GAC AAT | ACA | GAC GAA | CTG | AAA | TTC | AGC | AAC | TGT | GTA | 3168 |
His Glu | Ile | Glu | Asp Asn 1045 | Thr | Aap Glu | Leu Lys 1050 | Phe | Ser | Asn | Cys Val 1055 | |||
GAA GAG | GAA | GTA | TAT CCA | AAC | AAC ACG | GTA | ACG | TGT | AAT | AAT | TAT | ACT | 3216 |
Glu Glu | Glu | Val Tyr Pro 1060 | Asn | Asn Thr Val 1065 | Thr | Cys | Asn | Asn Tyr 1070 | Thr | ||||
GCG ACT | CAA | GAA | GAA CAT | GAG | GGT ACG | TAC | ACT | TCC | CGT | AAT | CGA | GGA | 3264 |
Ala Thr | Gln Glu 1075 | Glu His | Glu | Gly Thr 1080 | Tyr | Thr | Ser | Arg Asn 1085 | Arg | Gly | |||
TAT GAC | GAA | GCC | TAT GAA | AGC | AAT TCT | TCT | GTA | CAT | GCG | TCA | GTC | TAT | 3312 |
Tyr Asp Glu 1090 | Ala | Tyr Glu | Ser Asn Ser 1095 | Ser | Val | His Ala 1100 | Ser | Val | Tyr | ||||
GAA GAA | AAA | TCG | TAT ACA | GAT | AGA CGA | AGA | GAG | AAT | CCT | TGT | GAA | TCT | 3360 |
Glu Glu 1105 | Lys | Ser | Tyr Thr Asp 1110 | Arg Arg | Arg | Glu Asn 1115 | Pro | Cys | Glu | Ser 1120 | |||
AAC AGA | GGA | TAT | GGG GAT | TAC | ACA CCA | CTA | CCA | GCT | GGC | TAT | GTG | ACA | 3408 |
Asn Arg | Gly Tyr | Gly Asp 1125 | Tyr | Thr Pro | Leu Pro 1130 | Ala | Gly | Tyr | Val Thr 1135 | ||||
AAA GAA | TTA | GAG | TAC TTC | CCA | GAA ACC | GAT | AAG | GTA | TGG | ATT | GAG | ATC | 3456 |
Lys Glu | Leu | Glu Tyr Phe 1140 | Pro | Glu Thr Asp 1145 | Lys | Val | Trp | Ile Glu 1150 | Ile | ||||
GGA GAA | ACG | GAA | GGA ACA | TTC | ATC GTG | GAC | AGC | GTG | GAA | TTA | CTT | CTT | 3504 |
Gly Glu | Thr 1155 | Glu Gly Thr | Phe | Ile Val 1160 | Asp | Ser | Val | Glu 1165 | Leu | Leu | Leu |
ATG GAG GAA Met Glu Glu
1170
3513
181 408 (2) INFORMACJA O SEKWENCJI ID NR: 4:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 1171 aminokwasów (B) TYP: aminokwasowa (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI: białko (xi) OPIS SEKWENCJI: SEKWENCJA ID NR: 4:
Met Glu Ile Val 1 | Asn Asn 5 | Gln | Asn | Gln Cys Val Pro Tyr Asn Cys | Leu | ||||||||||
10 | 15 | ||||||||||||||
Asn | Asn | Pro | Glu | Asn | Glu | Ile | Leu | Asp | Ile | Glu | Arg | Ser | Asn | Ser | Thr |
20 | 25 | 30 | |||||||||||||
Val | Ala | Thr | Asn | Ile | Ala | Leu | Glu | Ile | Ser | Arg | Leu | Leu | Ala | Ser | Ala |
35 | 40 | 45 | |||||||||||||
Thr | Pro | Ile | Gly | Gly | Ile | Leu | Leu | Gly | Leu | Phe | Asp | Ala | Ile | Trp | Gly |
50 | 55 | 60 | |||||||||||||
Ser | Ile | Gly | Pro | Ser | Gln | Trp | Asp | Leu | Phe | Leu | Glu | Gln | Ile | Glu | Leu |
65 | 70 | 75 | 80 | ||||||||||||
Leu | Ile | Asp | Gln | Lys | Ile | Glu | Glu | Phe | Ala | Arg | Asn | Gln | Ala | Ile | Ser |
85 | 90 | 95 | |||||||||||||
Arg | Leu | Glu | Gly | Ile | Ser | Ser | Leu | Tyr | Gly | Ile | Tyr | Thr | Glu | Ala | Phe |
100 | 105 | 110 | |||||||||||||
Arg | Glu | Trp | Glu | Ala | Asp | Pro | Thr | Asn | Pro | Ala | Leu | Lys | Glu | Glu | Met |
115 | 120 | 125 | |||||||||||||
Arg | Thr | Gln | Phe | Asn | Asp | Met | Asn | Ser | Ile | Leu | Val | Thr | Ala | Ile | Pro |
130 | 135 | 140 | |||||||||||||
Leu | Phe | Ser | Val | Gln | Asn | Tyr | Gln | Val | Pro | Phe | Leu | Ser | Val | Tyr | Val |
145 | 150 | 155 | 160 | ||||||||||||
Gln | Ala | Ala | Asn | Leu | His | Leu | Ser | Val | Leu | Arg | Asp | Val | Ser | Val | Phe |
165 | 170 | 175 | |||||||||||||
Gly | Gln | Ala | Trp | Gly | Phe | Asp | Ile | Ala | Thr | Ile | Asn | Ser | Arg | Tyr | Asn |
180 | 185 | 190 | |||||||||||||
Asp | Leu | Thr | Arg | Leu | Ile | Pro | Ile | Tyr | Thr | Asp | Tyr | Ala | Val | Arg | Trp |
195 | 200 | 205 | |||||||||||||
Tyr | Asn | Thr | Gly | Leu | Asp | Arg | Leu | Pro | Arg | Thr | Gly Gly | Leu | Arg | Asn | |
210 | 215 | 220 | |||||||||||||
Trp | Ala | Arg | Phe | Asn | Gln | Phe | Arg Arg | Glu | Leu | Thr | Ile | Ser | Val | Leu | |
Z25 | 230 | 235 | 240 | ||||||||||||
Asp | Ile | Ile | Ser | Phe | Phe | Arg | Asn | Tyr | Asp | Ser | Arg | Leu | Tyr | Pro | Ile |
245 | 250 | 255 | |||||||||||||
Pro | Thr | Ser | Ser | Gln | Leu | Thr | Arg | Glu | Val | Tyr | Thr | Asp | Pro | Val | Ile |
260 | 265 | 270 | |||||||||||||
Asn | Ile | Thr | Asp | Tyr | Arg | Val | Gly | Pro | Ser | Phe | Glu | Asn | Ile | Glu | Asn |
275 | 280 | 285 | |||||||||||||
Ser | Ala | Ile | Arg | Ser | Pro | His | Leu | Met | Asp | Phe | Leu | Asn | Asn | Leu | Thr |
290 | 295 | 300 |
181 408
Ile | Asp | Thr | Asp | Leu | Ile | Arg | Gly | Val | His | Tyr | Trp | Ala | Gly | His | Arg |
305 | 310 | 315 | 320 | ||||||||||||
Val | Thr | Ser | His | Phe | Thr | Gly | Ser | Ser | Gln | Val | Ile | Thr | Thr | Pro | Gln |
325 | 330 | 335 | |||||||||||||
Tyr | Gly | Ile | Thr | Ala | Asn | Ala | Glu | Pro | Arg | Arg | Thr | Ile | Ala | Pro | Ser |
340 | 345 | 350 | |||||||||||||
Thr | Phe | Pro | Gly | Leu | Asn | Leu | Phe | Tyr | Arg | Thr | Leu | Ser | Asn | Pro | Phe |
355 | 360 | 365 | |||||||||||||
Phe | Arg | Arg | Ser | Glu | Asn | Ile | Thr | Pro | Thr | Leu | Gly | Ile | Asn | Val | Val |
370 | 375 | 380 | |||||||||||||
Gln | Gly | Val | Gly | Phe | Ile | Gln | Pro | Asn | Asn | Ala | Glu | Val | Leu | Tyr | Arg |
385 | 390 | 395 | 400 | ||||||||||||
Ser | Arg | Gly | Thr | Val | Asp | Ser | Leu | Asn | Glu | Leu | Pro | Ile | Asp | Gly | Glu |
405 | 410 | 415 | |||||||||||||
Asn | Ser | Leu | Val | Gly | Tyr | Ser | His | Arg | Leu | Ser | His | Val | Thr | Leu | Thr |
420 | 425 | 430 | |||||||||||||
Arg | Ser | Leu | Tyr | Asn | Thr | Asn | Ile | Thr | Ser | Leu | Pro | Thr | Phe | Val | Trp |
435 | 440 | 445 | |||||||||||||
Thr | His | His | Ser | Ala | Thr | Asn | Thr | Asn | Thr | Ile | Asn | Pro | Asp | Ile | Ils |
450 | 455 | 460 | |||||||||||||
Thr | Gln | Ile | Pro | Leu | Val | Lys | Gly | Phe | Arg | Leu | Gly | Gly Gly | Thr | Ser | |
465 | 470 | 475 | 480 | ||||||||||||
Val | Ile | Lys | Gly | Pro | Gly | Phe | Thr | Gly | Gly | Asp | Ile | Leu | Arg | Arg | Asn |
485 | 490 | 495 | |||||||||||||
Thr | Ile | Gly | Glu | Phe | Val | Ser | Leu | Gln | Val | Asn | Ile | Asn | Ser | Pro | Ile |
500 | 505 | 510 | |||||||||||||
Thr | Gln | Arg | Tyr | Arg | Leu | Arg | Phe | Arg | Tyr | Ala | Ser | Ser | Arg | Asp | Ala |
515 | 520 | 525 | |||||||||||||
Arg | Ile | Thr | Val | Ala | Ile | Gly | Gly | Gln | Ile | Arg | Val | Asp | Met | Thr | Leu |
530 | 535 | 540 | |||||||||||||
Glu | Lys | Thr | Met | Glu | Ile | Gly | Glu | Ser | Leu | Thr | Ser | Arg | Thr | Phe | Ser |
545 | 550 | 555 | 560 | ||||||||||||
Tyr | Thr | Asn | Phe | Ser | Asn | Pro | Phe | Ser | Phe | Arg | Ala | Asn | Pro | Asp | Ile |
565 | 570 | 575 | |||||||||||||
Ile | Arg | Ile | Ala | Glu | Glu | Leu | Pro | Ile | Arg | Gly | Gly | Glu | Leu | Tyr | Ile |
580 | 585 | 590 | |||||||||||||
Asp | Lys | Ile | Glu | Leu | Ile | Leu | Ala | Asp | Ala | Thr | Phe | Glu | Glu | Glu | Tyr |
595 | 600 | 605 | |||||||||||||
Asp | Leu | Glu | Arg | Ala | Gln | Lys | Ala | Val | Asn | Ala | Leu | Phe | Thr | Ser | Thr |
610 | 615 | 620 | |||||||||||||
Asn | Gln | Leu | Gly | Leu | Lys | Thr | Asp | Val | Thr | Asp | Tyr | His | Ile | Asp | Gln |
625 | 630 | 635 | 640 | ||||||||||||
Val | Ser | Asn | Leu | Val | Glu | Cys | Leu | Ser | Asp | Glu | Phe | Cys | Leu | Asp | Glu |
645 | 650 | 655 | |||||||||||||
Lys | Arg | Glu | Leu | Ser | Glu | Lys | Val | Lys | His | Ala | Lys | Arg | Leu | Ser | Asp |
660 | 665 | 670 |
181 408
Glu Arg | Asn Leu 675 | Leu Gln Asp Pro 680 | Asn Phe | Arg | Gly | Ile Asn Arg Gln 685 | |||||||||
Pro | Asp | Arg | Gly | Trp | Arg | Gly | Ser | Thr | Asp | Ile | Thr | Ile | Gln | Gly | Gly |
690 | 695 | 700 | |||||||||||||
Asp | Asp | Val | Phe | Lys | Glu | Asn | Tyr | Val | Thr | Leu | Pro | Gly | Thr | Phe | Asp |
705 | 710 | 715 | 720 | ||||||||||||
Glu | Cys | Tyr | Pro | Thr | Tyr | Leu | Tyr | Gln | Lys | Ile | Asp | Glu | Ser | Lys | Leu |
725 | 730 | 735 | |||||||||||||
Lys | Ala | Tyr | Thr | Arg | Tyr | Glu | Leu | Arg | Gly | Tyr | Ile | Glu | Asp | Ser | Gln |
740 | 745 | 750 | |||||||||||||
Asp | Leu | Glu | Ile | Tyr | Leu | Ile | Arg | Tyr | Asn | Ala | Lys | His | Glu | Thr | Val |
755 | 760 | 765 | |||||||||||||
Asn | Val | Pro | Gly | Thr | Gly | Ser | Leu | Trp | Pro | Leu | Ser | Ala | Gln | Ser | Pro |
770 | 775 | 780 | |||||||||||||
Ile | Gly | Lys | Cys | Gly | Glu | Pro | Asn | Arg | Cys | Ala | Pro | His | Leu | Glu | Trp |
785 | 790 | 795 | 800 | ||||||||||||
Asn | Pro | Asn | Leu | Asp | Cys | Ser | Cys | Arg | Asp | Gly | Glu | Lys | Cys | Ala | His |
805 | 810 | 815 | |||||||||||||
His | Ser | His | His | Phe | Ser | Leu | Asp | Ile | Asp | Val | Gly | Cys | Thr | Asp | Leu |
820 | 825 | 830 | |||||||||||||
Asn | Glu | Asp | Leu | Gly | Val | Trp | Val | Ile | Phe | Lys | Ile | Lys | Thr | Gln | Asp |
835 | 840 | 845 | |||||||||||||
Gly | Tyr | Ala | Arg | Leu | Gly | Asn | Leu | Glu | Phe | Leu | Glu | Glu | Asn | Pro | Leu |
850 | 855 | 860 | |||||||||||||
Leu | Gly | Glu | Ala | Leu | Ala | Arg | Val | Lys | Arg | Ala | Glu | Lys | Lys | Trp | Arg |
865 | 870 | 875 | 880 | ||||||||||||
Asp | Lys | Cys | Glu | Lys | Leu | Glu | Trp | Glu | Thr | Asn | Ile | Val | Tyr | Lys | Glu |
885 | 890 | 895 | |||||||||||||
Ala | Lys | Glu | Ser | Val | Asp | Ala | Leu | Phe | Val | Asn | Ser | Gln | Tyr | Asp | Arg |
900 | 905 | 910 | |||||||||||||
Leu | Gln | Ala | Asp | Thr | Asn | Ile | Ala | Met | Ile | His | Ala | Ala | Asp | Lys | Arg |
915 | 920 | 925 | |||||||||||||
Val | His | Ser | Ile | Arg | Glu | Ala | Tyr | Leu | Pro | Glu | Leu | Ser | Val | Ile | Pro |
930 | 935 | 940 | |||||||||||||
Gly | Val | Asn | Ala | Ala | Ile | Phe | Glu | Glu | Leu | Glu | Gly | Arg | Ile | Phe | Thr |
945 | 950 | 955 | 960 | ||||||||||||
Ala | Phe | Ser | Leu | Tyr | Asp | Ala | Arg | Asn | Val | Ile | Lys | Asn | Gly | Asp | Phe |
965 | 970 | 975 | |||||||||||||
Asn | Asn | Gly | Leu | Ser | Cys | Trp | Asn | Val | Lys | Gly | His | Val | Asp | Val | Glu |
980 | 985 | 990 | |||||||||||||
Glu | Gln | Asn | Asn | His | Arg | Ser | Val | Leu | Val | Val | Pro | Glu | Trp | Glu | Ala |
995 | 1000 | 1005 | |||||||||||||
Glu | Val | Ser | Gln | Glu | Val | Arg | Val | Cys | Pro | Gly | Arg | Gly Tyr | Ile | Leu |
1010 1015 1020
Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile 1025 1030 1035 1040
181 408
His Glu | Ile | Glu | Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val | ||
1045 | 1050 | 1055 | |||
Glu Glu | Glu | Val | Tyr Pro Asn Asn | Thr Val Thr | Cys Asn Asn Tyr Thr |
1060 | 1065 | 1070 | |||
Ala Thr | Gln | Glu | Glu His Glu Gly | Thr Tyr Thr | Ser Arg Asn Arg Gly |
1075 | 1080 | 1085 | |||
Tyr Asp | Glu | Ala | Tyr Glu Ser Asn | Ser Ser Val | His Ala Ser Val Tyr |
1090 | 1095 | 1100 | |||
Glu Glu | Lys | Ser | Tyr Thr Asp Arg | Arg Arg Glu | Asn Pro Cys Glu Ser |
1105 | 1110 | 1115 1120 | |||
Asn Arg | Gly | Tyr | Gly Asp Tyr Thr | Pro Leu Pro | Ala Gly Tyr Val Thr |
1125 | 1130 | 1135 | |||
Lys Glu | Leu | Glu | Tyr Phe Pro Glu | Thr Asp Lys | Val Trp Ile Glu Ile |
1140 | 1145 | 1150 | |||
Gly Glu | Thr | Glu Gly Thr Phe Ile | Val Asp Ser | Val Glu Leu Leu Leu | |
1155 | 1160 | 1165 |
Met Glu Glu 1170 (2) INFORMACJA O SEKWENCJI ID NR: 5:
(i ) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 3558 par podstawowych (B) TYP: kwas nukleinowy (C) TYP ŁAŃCUCHA: pojedynczy (D) TOPOLOGIA: nieznana (ii) TYP CZĄSTECZKI: cDNA (iii) HIPOTETYCZNY: NIE (iii) ANTI-SENSE:' NIE (vi) ŹRÓDŁO PIERWOTNE:
(A) ORGANIZM: Sekwencja hybrydowa (ix) CECHA;
(A) NAZWA/KLUCZ: CDS (B) LOKALIZACJA: 1..3558 (ci) OPIS SEKWENCJI: SEKWENCJA ID NR: 5:
ATG GAG ATA | GTG AAT AAT CAG AAT CAA | TGC GTG CCT TAT AAT TGT TTA Cys Val Pro Tyr Asn Cys Leu | 48 | |||||||||||||
Met 1 | Glu | Ile | Val | Asn 5 | Asn Gln Asn | Gln | ||||||||||
10 | 15 | |||||||||||||||
AAT | AAT | CCT | GAA | AAT | GAG | ATA | TTA | GAT | ATT | GAA -AGG | TCA | AAT | AGT | ACT | 96 | |
Asn | Asn | Pro | Glu | Asn | Glu | Ile | Leu | Asp | Ile | Glu | Arg | Ser | Asn | Ser | Thr | |
20 | 25 | 30 | ||||||||||||||
GTA | GCA | ACA | AAC | ATC | GCC | TTG | GAG | ATT | AGT | CGT | CTG | CTC | GCT | TCC | GCA | 144 |
Val | Ala | Thr | Asn | Ile | Ala | Leu | Glu | Ile | Ser | Arg | Leu | Leu | Ala | Ser | Ala | |
35 | 40 | 45 | ||||||||||||||
ACT | CCA | ATA | GGG | GGG | ATT | TTA | TTA | GGA | TTG | TTT | GAT | GCA | ATA | TGG | GCG | 192 |
Thr | Pro | Ile | Gly | Gly | Ile | Leu | Leu | Gly | Leu | Phe | Asp | Ala | Ile | Trp | Gly | |
50 | 55 | 60 |
181 408
TCT ATA | GGC CCT TCA | CAA TGG Gln Trp 70 | GAT TTA TTT TTA GAG CAA ATT GAG CTA | 240 | ||||||||||||
Ser 65 | Ile | Gly | Pro | Ser | Asp | Leu | Phe | Leu 75 | Glu | Gln | Ile | Glu | Leu 80 | |||
TTG | ATT | GAC | CAA | AAA | ATA | GAG | GAA | TTC | GCT | AGA | AAC | CAG | GCA | ATT | TCT | 288 |
Leu | Ile | Asp | Gln | Lys | Ile | Glu | Glu | Phe | Ala | Arg | Asn | Gln | Ala | Ile | Ser | |
85 | 90 | 95 | ||||||||||||||
AGA | TTG | GAA | GGG | ATA | AGC | AGT | CTG | TAC | GGA | ATT | TAT | ACA | GAA | GCT | TTT | 336 |
Arg | Leu | Glu | Gly | Ile | Ser | Ser | Leu | Tyr | Gly | Ile | Tyr | Thr | Glu | Ala | Phe | |
100 | 105 | 110 | ||||||||||||||
AGA | GAG | TGG | GAA | GCA | GAT | CCT | ACT | AAT | CCA | GCA | TTA | AAA | GAA | GAG | ATG | 384 |
Arg | Glu | Trp | Glu | Ala | Asp | Pro | Thr | Asn | Pro | Ala | Leu | Lys | Glu | Glu | Met | |
115 | 120 | 125 | ||||||||||||||
CGT | ACT | CAA | TTT | AAT | GAC | ATG | AAC | AGT | ATT | CTT | GTA | ACA | GCT | ATT | CCT | 432 |
Arg | Thr | Gln | Phe | Asn | Asp | Met | Asn | Ser | Ile | Leu | Val | Thr | Ala | Ile | Pro | |
130 | 135 | 140 | ||||||||||||||
CTT | TTT | TCA | GTT | CAA | AAT | TAT | CAA | GTC | CCA | TTT | TTA | TCA | GTA | TAT | GTT | 480 |
Leu | Phe | Ser | Val | Gln | Asn | Tyr | Gln | Val | Pro | Phe | Leu | Ser | Val | Tyr | Val | |
145 | 150 | 155 | 160 | |||||||||||||
CAA | GCT | GCA | AAT | TTA | CAT | TTA | TCG | GTT | TTG | AGA | GAT | GTT | TCA | GTG | TTT | 528 |
Gln | Ala | Ala | Asn | Leu | His | Leu | Ser | Val | Leu | Arg | Asp | Val | Ser | Val | Phe | |
165 | 170 | 175 | ||||||||||||||
GGG | CAG | GCT | TGG | GGA | TTT | GAT | ATA | GCA | ACA | ATA | AAT | AGT | CGT | TAT | AAT | 576 |
Gly | Gln | Ala | Trp | Gly | Phe | Asp | Ile | Ala | Thr | Ile | Asn | Ser | Arg | Tyr | Asn | |
180 | 185 | 190 | ||||||||||||||
GAT | CTG | ACT | AGA | CTT | ATT | CCT | ATA | TAT | ACA | GAT | TAT | GCT | GTA | CGC | TGG | 624 |
Asp | Leu | Thr | Arg | Leu | Ile | Pro | Ile | Tyr | Thr | Asp | Tyr | Ala | Val | Arg | Trp | |
195 | 200 | 205 | ||||||||||||||
TAC | AAT | ACG | GGA | TTA | GAT | CGC | TTA | CCA | CGA | ACT | GGT | GGG | CTG | CGA | AAC | 672 |
Tyr | Asn | Thr | Gly | Leu | Asp | Arg | Leu | Pro | Arg | Thr | Gly | Gly | Leu | Arg | Asn | |
210 | 215 | 220 | ||||||||||||||
TGG | GCA | AGA | TTT | AAT | CAG | TTT | AGA | AGA | GAG | TTA | ACA | ATA | TCA | GTA | TTA | 720 |
Trp | Ala | Arg | Phe | Asn | Gln | Phe | Arg | Arg | Glu | Leu | Thr | Ile | Ser | Val | Leu | |
225 | 230 | 235 | 240 | |||||||||||||
GAT | ATT | ATT | TCT | TTT | TTC | AGA | AAT | TAC | GAT | TCT | AGA | TTA | TAT | CCA | ATT | 768 |
Asp | Ile | Ile | Ser | Phe | Phe | Arg | Asn | Tyr | Asp | Ser | Arg | Leu | Tyr | Pro | Ile | |
245 | 250 | 255 | ||||||||||||||
CCA | ACA | AGC | TCC | CAA | TTA | ACG | CGG | GAA | GTA | TAT | ACA | GAT | CCG | GTA | ATT | 816 |
Pro | Thr | Ser | Ser | Gln | Leu | Thr | Arg | Glu | Val | Tyr | Thr | Asp | Pro | Val | Ile | |
260 | 265 | 270 | ||||||||||||||
AAT | ATA | ACT | GAC | TAT | AGA | GTT | GGC | CCC | AGC | TTC | GAG | AAT | ATT | GAG | AAC | 864 |
Asn | Ile | Thr | Asp | Tyr | Arg | Val | Gly | Pro | Ser | Phe | Glu | Asn | Ile | Glu | Asn | |
275 | 280 | 285 | ||||||||||||||
TCA | GCC | ATT | AGA | AGC | CCC | CAC | CTT | ATG | GAC | TTC | TTA | AAT | AAT | TTG | ACC | 912 |
Ser | Ala | Ile, Arg | Ser | Pro | His | Leu | Met | Asp | Phe | Leu | Asn | Asn | Leu | Thr | ||
290 | 295 | 300 | ||||||||||||||
ATT | GAT | ACG | GAT | TTG | ATT | AGA | GGT | GTT | CAC | TAT | TGG | GCA | GGG | CAT | CGT | 960 |
Ile | Asp | Thr | Asp | Leu | Ile | Arg | Gly | Val | His | Tyr | Trp | Ala | Gly | His | Arg | |
305 | 310 | 315 | 320 |
181 408
GTA Val | ACT Thr | TCT Ser | CAT His | TTT ACA GGT AGT TCT CAA GTG | ATA ACA ACC CCT CAA | 1008 | ||||||||||
Phe 325 | Thr | Gly | Ser | Ser | Gln 330 | Val | Ile | Thr | Thr | Pro 335 | Gln | |||||
TAT | GGG | ATA | ACC | GCA | AAT | GCG | GAA | CCA | AGA | CGA | ACT | ATT | GCT | CCT | AGT | 1056 |
Tyr | Gly | Ile | Thr | Ala | Asn | Ala | Glu | Pro | Arg | Arg | Thr | Ile | Ala | Pro | Ser | |
340 | 345 | 350 | ||||||||||||||
ACT | TTT | CCA | GGT | CTT | AAC | CTA | TTT | TAT | AGA | ACA | TTA | TCA | AAT | CCT | TTC | 1104 |
Thr | Phe | Pro | Gly | Leu | Asn | Leu | Phe | Tyr | Arg | Thr | Leu | Ser | Asn | Pro | Phe | |
355 | 360 | 365 | ||||||||||||||
TTC | CGA | AGA | TCA | GAA | AAT | ATT | ACT | CCT | ACC | TTA | GGG | ATA | AAT | GTA | GTA | 1152 |
Phe | Arg | Arg | Ser | Glu | Asn | Ile | Thr | Pro | Thr | Leu | Gly | Ile | Asn | Val | Val | |
370 | 375 | 380 | ||||||||||||||
CAG | GGA | GTA | GGG | TTC | ATT | CAA | CCA | AAT | AAT | GCT | GAA | GTT | CTA | TAT | AGA | 1200 |
Gln | Gly | Val | Gly | Phe | Ile | Gln | Pro | Asn | Asn | Ala | Glu | Val | Leu | Tyr | Arg | |
385 | 390 | 395 | 400 | |||||||||||||
AGT | AGG | GGG | ACA | GTA | GAT | TCT | CTT | AAT | GAG | TTA | CCA | ATT | GAT | GGT | GAG | 1248 |
Ser | Arg | Gly | Thr | Val | Asp | Ser | Leu | Asn | Glu | Leu | Pro | Ile | Asp | Gly | Glu | |
405 | 410 | 415 | ||||||||||||||
AAT | TCA | TTA | GTT | GGA | TAT | AGT | CAT | CGA | TTA | AGT | CAT | GTT | ACA | CTA | ACC | 1296 |
Asn | Ser | Leu | Val | Gly | Tyr | Ser | His | Arg | Leu | Ser | His | Val | Thr | Leu | Thr | |
420 | 425 | 430 | ||||||||||||||
AGG | TCG | TTA | TAT | AAT | ACT | AAT | ATA | ACT | AGC | CTG | CCA | ACA | TTT | GTT | TGG | 1344 |
Arg | Ser | Leu | Tyr | Asn | Thr | Asn | Ile | Thr | Ser | Leu | Pro | Thr | Phe | Val | Trp | |
435 | 440 | 445 | ||||||||||||||
ACA | CAT | CAC | AGT | GCT | ACT | AAT | ACA | AAT | ACA | ATT | AAT | CCA | GAT | ATT | ATT | 1392 |
Thr | His | His | Ser | Ala | Thr | Asn | Thr | Asn | Thr | Ile | Asn | Pro | Asp | Ile | Ile | |
450 | 455 | 460 | ||||||||||||||
ACA | CAA | ATA | CCT | TTA | GTG | AAA | GGA | TTT | AGA | GTT | TGG | GGG | GGC | ACC | TCT | 1440 |
Thr | Gln | Ile | Pro | Leu | Val | Lys | Gly | Phe | Arg | Val | Trp | Gly | Gly | Thr | Ser | |
465 | 470 | 475 | 480 | |||||||||||||
GTC | ATT | ACA | GGA | CCA | GGA | TTT | ACA | GGA | GGG | GAT | ATC | CTT | CGA | AGA | AAT | 1488 |
Val | Ile | Thr | Gly | Pro | Gly | Phe | Thr | Gly Gly Asp | Ile | Leu | Arg | Arg | Asn | |||
485 | 490 | 495 | ||||||||||||||
ACC | TTT | GGT | GAT | TTT | GTA | TCT | CTA | CAA | GTC | AAT | ATT | AAT | TCA | CCA | ATT | 1536 |
Thr | Phe | Gly | Asp | Phe | Val | Ser | Leu | Gln | Val | Asn | Ile | Asn | Ser | Pro | Ile | |
500 | 505 | 510 | ||||||||||||||
ACC | CAA | AGA | TAC | CGT | TTA | AGA | TTT | CGT | TAC | GCT | TCC | AGT | AGG | GAT | GCA | 1584 |
Thr | Gln | Arg | Tyr | Arg | Le | Arg | Phe | Arg | Tyr | Ala | Ser | Ser | Arg | Asp | Ala | |
515 | 520 | 525 | ||||||||||||||
CGA | GTT | ATA | GTA | TTA | ACA | GGA | GCG | CCA | TCC | ACA | GGA | GTG | GGA | GGC | CAA | 1632 |
Arg | Val | Ile | Val | Leu | Thr | Gly | Ala | Ala | Ser | Thr | Gly | Val | Gly | Gly | Gln | |
530 | 535 | 540 | ||||||||||||||
GTT | AGT | GTA | AAT | ATG | CCT | CTT | CAG | AAA | ACT | ATG | GAA | ATA | GGG | GAG | AAC | 1680 |
Val | Ser | Val | Asn | Met | Pro | Leu | Gln | Lys | Thr | Met | Glu | Ile | Gly | Glu | Asn | |
545 | 550 | 555 | 560 | |||||||||||||
TTA | ACA | TCT | AGA | ACA | TTT | AGA | TAT | ACC | GAT | TTT | AGT | AAT | CCT | TTT | TCA | 1728 |
Leu | Thr | Ser | Arg | Thr | Phe | Arg | Tyr | Thr, | Asp | Phe | Ser | Asn | Pro | Phe | Ser | |
565 | 570 | 575 |
181 408
TTT AGA Phe Arg | GCT AAT CCA GAT ATA | ATT GGG ATA AGT GAA CAA CCT CTA TTT | 1776 | |||||||||||||
Ala | Asn 580 | Pro | Asp | Ile | Ile Gly 585 | Ile | Ser | Glu | Gln | Pro 590 | Leu | Phe | ||||
GGT | GCA | GGT | TCT | ATT | AGT | AGC | GGT | GAA | CTT | TAT | ATA | GAT | AAA | ATT | GAA | 1824 |
Gly | Ala | Gly | Ser | Ile | Ser | Ser | Gly | Glu | Leu | Tyr | Ile | Asp | Lys | Ile | Glu | |
595 | 600 | 605 | ||||||||||||||
ATT | ATT | CTA | GCA | GAT | GCA | ACA | TTT | GAA | GCA | GAA | TCT | GAT | TTA | GAA | AGA | 1872 |
Ile | Ile | Leu | Ala | Asp | Ala | Thr | Phe | Glu | Ala | Glu | Ser | Asp | Leu | Glu | Arg | |
610 | 615 | 620 | ||||||||||||||
GCA | CAA | AAG | GCG | GTG | AAT | GCC | CTG | TTT | ACT | TCT | TCC | AAT | CAA | ATC | GGG | 1920 |
Ala | Gln | Lys | Ala | Val | Asn | Ala | Leu | Phe | Thr | Ser | Ser | Asn | Gln | Ile | Gly | |
625 | 630 | 635 | 640 | |||||||||||||
TTA | AAA | ACC | GAT | GTG | ACG | GAT | TAT | CAT | ATT | GAT | CAA | GTA | TCC | AAT | TTA | 1968 |
Leu | Lys | Thr | Asp | Val | Thr | Asp | Tyr | His | Ile | Asp | Gln | Val | Ser | Asn | Leu | |
645 | 650 | 655 | ||||||||||||||
GTG | GAT | TGT | TTA | TCA | GAT | GAA | TTT | TGT | CTG | GAT | GAA | AAG | CGA | GAA | TTG | 2016 |
Val | Asp | Cys | Leu | Ser | Asp | Glu | Phe | Cys | Leu | Asp | Glu | Lys | Arg | Glu | Leu | |
660 | 665 | 670 | ||||||||||||||
TCC | GAG | AAA | GTC | AAA | CAT | GCG | AAG | CGA | CTC | AGT | GAT | GAG | CGG | AAT | TTA | 2064 |
Ser | Glu | Lys | Val | Lys | His | Ala | Lys | Arg | Leu | Ser | Asp | Glu | Arg | Asn | Leu | |
675 | 680 | 685 | ||||||||||||||
CTT | CAA | GAT | CCA | AAC | TTC | AGA | GGG | ATC | AAT | AGA | CAA | CCA | GAC | CGT | GGC | 2112 |
Leu | Gln | Asp | Pro | Asn | Phe | Arg | Gly | Ile | Asn | Arg | Gln | Pro | Asp | Arg | Gly | |
690 | 695 | 700 | ||||||||||||||
TGG | AGA | GGA | AGT | ACA | GAT | ATT | ACC | ATC | CAA | GGA | GGA | GAT | GAC | GTA | TTC | 2160 |
Trp | Arg | Gly | Ser | Thr | Asp | Ile | Thr | Ile | Gln | Gly | Gly | Asp | Asp | Val | Phe | |
705 | 710 | 715 | 720 | |||||||||||||
AAA | GAG | AAT | TAC | GTC | ACA | CTA | CCG | GGT | ACC | GTT | GAT | GAG | TGC | TAT | CCA | 2208 |
Lys | Glu | Asn | Tyr | Val | Thr | Leu | Pro | Gly | Thr | Val | Asp | Glu | Cys | Tyr | Pro | |
725 | 730 | 735 | ||||||||||||||
ACG | TAT | TTA | TAT | CAG | AAA | ATA | GAT | GAG | TCG | AAA | TTA | AAA | GCT | TAT | ACC | 2256 |
Thr | Tyr | Leu | Tyr | Gln | Lys | Ile | Asp | Glu | Ser | Lys | Leu | Lys | Ala | Tyr | Thr | |
740 | 745 | 750 | ||||||||||||||
CGT | TAT | GAA | TTA | AGA | GGG | TAT | ATC | GAA | GAT | AGT | CAA | GAC | TTA | GAA | ATC | 2304 |
Arg | Tyr | Glu | Leu | Arg | Gly | Tyr | Ile | Glu | Asp | Ser | Gln | Asp | Leu | Glu | Ile | |
755 | 760 | 765 | ||||||||||||||
TAT | TTG | ATC | CGT | TAC | AAT | GCA | AAA | CAC | GAA | ATA | GTA | AAT | GTG | CCA | GGC | 2352 |
Tyr | Leu | Ile | Arg | Tyr | Asn | Ala | Lys | His | Glu | Ile | Val | Asn | Val | Pro | Gly | |
770 | 775 | 780 | ||||||||||||||
ACG | GGT | TCC | TTA | TGG | CCG | CTT | TCA | GCC | CAA | AGT | CCA | ATC | GGA | AAG | TGT | 2400 |
Thr | Gly | Ser | Leu | Trp | Pro | Leu | Ser | Ala | Gln | Ser | Pro | Ile | Gly | Lys | Cys | |
785 | 790 | 795 | 800 | |||||||||||||
GGA | GAA | CCG | AAT | CGA | TGC | GCG | CCA | CAC | CTT | GAA | TGG | AAT | CCT | GAT | CTA | 2448 |
Gly | Glu | Pro | Asn | Arg | Cys | Ala | Pro | His | Leu | Glu | Trp | Asn | Pro | Asp | Leu | |
805 | 810 | 815 | ||||||||||||||
GAT | TGT | TCC | TGC | AGA | GAC | GGG | GAA | AAA | TGT | GCA | CAT | CAT | TCC | CAT | CAT | 2496 |
Asp | Cys | Ser | Cys | Arg | Asp | Gly | Glu | Lys | Cys | Ala | His | His | Ser | His | His | |
820 | 825 | 830 |
181 408
TTC ACC Phe Thr | TTG GAT Leu Asp 835 | ATT Ile | GAT Asp | GTT GGA TGT ACA GAC TTA AAT GAG GAC TTA | 2544 | ||||||||
Val Gly 840 | Cys | Thr | Asp | Leu | Asn 845 | Glu | Asp | Leu | |||||
GGT GTA | TGG GTG | ATA | TTC | AAG ATT | AAG | ACG | CAA | GAT | GGC | CAT | GCA | AGA | 2592 |
Gly Val | Trp Val | Ile | Phe | Lys Ile | Lys | Thr | Gln | Asp | Gly | His | Ala | Arg | |
850 | 855 | 860 | |||||||||||
CTA GGG | AAT CTA | GAG | TTT | CTC GAA | GAG | AAA | CCA | TTA | TTA | GGG | GAA | GCA | 2640 |
Leu Gly | Asn Leu | Glu | Phe | Leu Glu | Glu | Lys | Pro | Leu | Leu | Gly | Glu | Ala | |
865 | 870 | 875 | 880 | ||||||||||
CTA GCT | CGT GTG | AAA | AGA | GCG GAG | AAG | AAG | TGG | AGA | GAC | AAA | CGA | GAG | 2688 |
Leu Ala | Arg Val | Lys | Arg | Ala Glu | Lys | Lys | Trp | Arg | Asp | Lys | Arg | Glu | |
885 | 890 | 895 | |||||||||||
AAA CTA | CAG 1TG | GAA | ACA | AAT ATT | GTT | TAT | AAA | GAG | GCA | AAA | GAA | TCT | 2736 |
Lys Leu | Gln Leu | Glu | Thr | Asn Ile | Val | Tyr | Lys | Glu | Ala | Lys | Glu | Ser | |
900 | 905 | 910 | |||||||||||
GTA GAT | GCT TTA | TTT | GTA | AAC TCT | CAA | TAT | GAT | AGA | TTA | CAA | GTG | GAT | 2784 |
Val Asp | Ala Leu | Phe | Val | Asn Ser | Gln | Tyr | Asp | Arg | Leu | Gln | Val | Asp | |
915 | 920 | 925 | |||||||||||
ACG AAC | ATC GCG | ATG | ATT | CAT GCG | GCA | GAT | AAA | CGC | GTT | CAT | AGA | ATC | 2832 |
Thr Asn | Ile Ala | Met | Ile | His Ala | Ala | Asp | Lys | Arg | Val | His | Arg | Ile | |
930 | 935 | 940 | |||||||||||
CGG GAA | GCG TAT | CTG | CCA | GAG TIG | TCT | GTG | ATT | CCA | GGT | GTC | AAT | GCG | 2880 |
Arg Glu | Ala Tyr | Leu | Pro | Glu Leu | Ser | Val | Ile | Pro | Gly | Val | Asn | Ala | |
945 | 950 | 955 | 960 | ||||||||||
GCC ATT | TTC GAA | GAA | TTA | GAG GGA | CGT | ATT | TTT | ACA | GCG | TAT | TCC | TTA | 2928 |
Ala Ile | Phe Glu | Glu | Leu | Glu Gly | Arg | Ile | Phe | Thr | Ala | Tyr | Ser | Leu | |
965 | 970 | 975 | |||||||||||
TAT GAT | GCG AGA | AAT | GTC | ATT AAA | AAT | GGC | GAT | TTC | AAT | AAT | GGC | TTA | 2976 |
Tyr Asp | Ala Arg | Asn | Val | Ile Lys | Asn | Gly | Asp | Phe | Asn | Asn | Gly | Leu | |
980 | 985 | 990 | |||||||||||
TTA TGC | TGG AAC | GTG | AAA | GGT CAT | GTA | GAT | GTA | GAA | GAG | CAA | AAC | AAC | 3024 |
Leu Cys | Trp Asn | Val | Lys | Gly His | Val | Asp | Val | Glu | Glu | Gln | Asn | Asn | |
995 | 100 0 | 1005 | |||||||||||
CAC CGT | TCG GTC | CTT | GTT | ATC CCA | GAA | TGG | GAG | GCA | GAA | GTG | TCA | CAA | 3072 |
His Arg | Ser Val | Leu | Val | Ile Pro | Glu | Trp | Glu | Ala | Glu | Val | Ser | Gln | |
1010 | 1015 | 1020 | |||||||||||
GAG GTT | CGT GTC | TGT | CCA | GGT CGT | GGC | TAT | ATC | CTT | CGT | GTC | ACA | GCA | 3120 |
Glu Val | Arg Val | Cys | Pro | Gly Arg | Gly | Tyr | Ile | Leu | Arg | Val | Thr | Ala | |
1025 | 1030 | 1035 | 1040 | ||||||||||
TAT AAA | GAG GGA | TAT | GGA | GAG GGC | TGC | GTA | ACG | ATC | CAT | GAG | ATC | GAA | 3168 |
Tyr Lys | Glu Gly | Tyr | Gly | Glu Gly | Cys | Val | Thr | Ile | His | Glu | Ile | Glu | |
1045 | 1050 | 1055 | |||||||||||
GAC AAT | ACA GAC | GAA | CTG | AAA TTC | AGC | AAC | TGT | GTA | GAA | GAG | GAA | GTA | 3216 |
Asp Asn | Thr Asp | Glu | Leu | Lys Phe | Ser | Asn | Cys | Val | Glu | Glu | Glu | Val | |
1060 | 1065 | 1070 | |||||||||||
TAT CCA | AAC AAC | ACA | GTA | ACG 1GT | AAT | AAT | TAT | ACT | GGG | ACT | CAA | GAA | 3264 |
Tyr Pro | Asn Asn | Thr | Val | Thr Cys | Asn | Asn | Tyr | Thr | Gly | Thr | Gln | Glu | |
1075 | 1080 | 1085 |
181 408
GAA TAT GAG GGT ACG TAC ACT TCT Glu Tyr Glu Gly Thr Tyr Thr Ser | CGT AAT Arg Asn | CAA GGA TAT GAC GAA GCC | 3312 | ||||
Gln | Gly Tyr 1100 | Asp Glu Ala | |||||
1090 | 1095 | ||||||
TAT | GGT AAT AAC | CCT TCC GTA CCA | GCT GAT | TAC | GCT TCA | GTC TAT GAA | 3360 |
Tyr Gly Asn Asn 1105 | Pro Ser Val Pro 1110 | Ala Asp | Tyr Ala Ser 1115 | Val Tyr Glu 1120 | |||
GAA | AAA TCG TAT | ACA GAT GGA CGA | AGA GAG | AAT | CCT TGT | GAA TCT AAC | 3408 |
Glu | Lys Ser Tyr | Thr Asp Gly Arg 1125 | Arg Glu Asn 1130 | Pro Cys | Glu Ser Asn 1135 | ||
AGA | GGC TAT GGG | GAT TAC ACA CCA | CTA CCG | GCT | GGT TAT | GTA ACA AAG | 3456 |
Arg | Gly Tyr Gly Asp Tyr Thr Pro 1140 | Leu Pro 1145 | Ala | Gly Tyr | Val Thr Lys 1150 | ||
GAT | TTA GAG TAC | TTC CCA GAG ACC | GAT AAG | GTA | TGG ATT | GAG ATC GGA | 3504 |
Asp | Leu Glu Tyr 1155 | Phe Pro Glu Thr Asp Lys 1160 | Val | Trp Ile Glu Ile Gly 1165 | |||
GAA | ACA GAA GGA | ACA TTC ATC GTG | GAT AGC | GTG | GAA TTA | CTC CTT ATG | 3552 |
Glu | Thr Glu Gly 1170 | Thr Phe Ile Val 1175 | Asp Ser | Val | Glu Leu 1180 | Leu Leu Met |
GAG GAA 3558
Glu Glu
1185 (2) INFORMACJA O SEKWENCJI ID NR: 6:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 1186 aminokwasów (B) TYP: aminokwasowa (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI: białko (xi) OPIS SEKWENCJI: SEKWENCJA ID NR: 6:
Met 1 | Glu | Ile Val | Asn 5 | Asn Gln | Asn Gln Cys Val Pro Tyr Asn Cys Leu | ||||||||||
10 | 15 | ||||||||||||||
Asn | Asn | Pro | Glu | Asn | Glu | Ile | Leu | Asp | Ile | Glu | Arg | Ser | Asn | Ser | Thr |
20 | 25 | 30 | |||||||||||||
Val | Ala | Thr | Asn | Ile | Ala | Leu | Glu | Ile | Ser | Arg | Leu | Leu | Ala | Ser | Ala |
35 | 40 | 45 | |||||||||||||
Thr | Pro | Ile | Gly | Gly | Ile | Leu | Leu | Gly | Leu | Phe | Asp | Ala | Ile | Trp | Gly |
50 | 55 | 60 | |||||||||||||
Ser | Ile | Gly | Pro | Ser | Gln | Trp | Asp | Leu | Phe | Leu | Glu | Gln | Ile | Glu | Leu |
65 | 70 | 75 | 80 | ||||||||||||
Leu | Ile | Asp | Gln | Lys | Ile | Glu | Glu | Phe | Ala | Arg | Asn | Gln | Ala | Ile | Ser |
85 | 90 | 95 | |||||||||||||
Arg | Leu | Glu | Gly | Ile | Ser | Ser | Leu | Tyr | Gly | Ile | Tyr | Thr | Glu | Ala | Phe |
100 | 105 | 110 | |||||||||||||
Arg | Glu | Trp | Glu | Ala | Asp | Pro | Thr | Asn | Pro | Ala | Leu | Lys | Glu | Glu | Met |
115 | 120 | 125 |
Arg Thr Gln Phe Asn Asp Met Asn Ser Ile Leu Val Thr Ala Ile Pro 130 135 140
181 408
Leu | Phe | Ser | Val | Gln | Asn | Tys | Gln | Val | Pro | Phe | Leu | Ser | Val | Tyr | Val |
145 | 150 | 155 | 160 | ||||||||||||
Gln | Ala | Ala | Asn | Leu | His | Leu | Ser | Val | Leu | Arg | Asp | Val | Ser | Val | Phe |
165 | 170 | 175 | |||||||||||||
Gly | Gln | Ala | Trp | Gly | Phe | Asp | Ile | Ala | Thr | Ile | Asn | Ser | Arg | Tyr | Asn |
180 | 185 | 190 | |||||||||||||
Asp | Leu | Thr | Arg | Leu | Ile | Pro | Ile | Tyr | Thr | Asp | Tyr | Ala | Val | Arg | Trp |
195 | 200 | 205 | |||||||||||||
Tyr | Asn | Thr | Gly | Leu | Asp | Arg | Leu | Pro | Arg | Thr | Gly | Gly | Leu | Arg | Asn |
210 | 215 | 220 | |||||||||||||
Trp | Ala | Arg | Phe | Asn | Gln | Phe | Arg | Arg | Glu | Leu | Thr | Ile | Ser | Val | Leu |
225 | 230 | 235 | 240 | ||||||||||||
Asp | Ile | Ile | Ser | Phe | Phe | Arg | Asn | Tyr | Asp | Ser | Arg | Leu | Tyr | Pro | Ile |
245 | 250 | 255 | |||||||||||||
Pro | Thr | Ser | Ser | Gln | Leu | Thr | Arg | Glu | Val | Tyr | Thr | Asp | Pro | Val | Ile |
260 | 265 | 270 | |||||||||||||
Asn | Ile | Thr | Asp | Tyr | Arg | Val | Gly | Pro | Ser | Phe | Glu | Asn | Ile | Glu | Asn |
275 | 280 | 285 | |||||||||||||
Ser | Ala | Ile | Arg | Ser | Pro | His | Leu | Met | Asp | Phe | Leu | Asn | Asn | Leu | Thr |
290 | 295 | 300 | |||||||||||||
Ile | Asp | Thr | Asp | Leu | Ile | Arg | Gly | Val | His | Tyr | Trp | Ala | Gly | His | Arg |
305 | 310 | 315 | 320 | ||||||||||||
Val | Thr | Ser | His | Phe | Thr | Gly | Ser | Ser | Gln | Val | Ile | Thr | Thr | Pro | Gln |
325 | 330 | 335 | |||||||||||||
Tyr | Gly | Ile | Thr | Ala | Asn | Ala | Glu | Pro | Arg | Arg | Thr | Ile | Ala | Pro | Ser |
340 | 345 | 350 | |||||||||||||
Thr | Phe | Pro | Gly | Leu | Asn | Leu | Phe | Tyr | Arg | Thr | Leu | Ser | Asn | Pro | Phe |
355 | 360 | 365 | |||||||||||||
Phe | Arg | Arg | Ser | Glu | Asn | Ile | Thr | Pro | Thr | Leu | Gly | Ile | Asn | Val | Val |
370 | 375 | 380 | |||||||||||||
Gln | Gly | Val | Gly | Phe | Ile | Gln | Pro | Asn | Asn | Ala | Glu | Val | Leu | Tyr | Arg |
385 | 390 | 395 | 400 | ||||||||||||
Ser | Arg | Gly | Thr | Val | Asp | Ser | Leu | Asn | Glu | Leu | Pro | Ile | Asp | Gly | Glu |
405 | 410 | 415 | |||||||||||||
Asn | Ser | Leu | Val | Gly | Tyr | Ser | His | Arg | Leu | Ser | His | Val | Thr | Leu | Thr |
420 | 425 | 430 | |||||||||||||
Arg | Ser | Leu | Tyr | Asn | Thr | Asn | Ile | Thr | Ser | Leu | Pro | Thr | Phe | Val | Trp |
435 | 440 | 445 | |||||||||||||
Thr | His | His | Ser | Ala | Thr | Asn | Thr | Asn | Thr | Ile | Asn | Pro | Asp | Ile | Ile |
450 | 455 | 460 | |||||||||||||
Thr | Gln | Ile | Pro | Leu | Val | Lys | Gly | Phe | Arg | Val | Trp | Gly | Gly | Thr | Ser |
465 | 470 | 475 | 480 | ||||||||||||
Val | Ile | Thr | Gly | Pro | Gly | Phe | Thr | Gly | Gly | Asp | Ile | Leu | Arg | Arg | Asn |
485 | 490 | 495 | |||||||||||||
Thr | Phe | Gly | Asp | Phe | Val | Ser | Leu | Gln | Val | Asn | Ile | Asn | Ser | Pro | Ile |
500 | 505 | 510 |
181 408
Thr | Gln | Arg | Tyr | Arg | Leu | Arg | Phe | Arg | Tyr | Ala | Ser | Ser | Arg | Asp | Ala |
515 | 520 | 525 | |||||||||||||
Arg | Val | Ile | Val | Leu | Thr | Gly | Ala | Ala | Ser | Thr | Gly | Val | Gly | Gly | Gln |
530 | 535 | 540 | |||||||||||||
Val | Ser | Val | Asn | Met | Pro | Leu | Gln | Lys | Thr | Met | Glu | Ile | Gly | Glu | Asn |
545 | 550 | 555 | 560 | ||||||||||||
Leu | Thr | Ser | Arg | Thr | Phe | Arg | Tyr | Thr | Asp | Phe | Ser | Asn | Pro | Phe | Ser |
565 | 570 | 575 | |||||||||||||
Phe | Arg | Ala | Asn | Pro | Asp | Ile | Ile | Gly | Ile | Ser | Glu | Gln | Pro | Leu | Phe |
580 | 585 | 590 | |||||||||||||
Gly | Ala | Gly | Ser | Ile | Ser | Ser | Gly | Glu | Leu | Tyr | Ile | Asp | Lys | Ile | Glu |
595 | 600 | 605 | |||||||||||||
Ile | Ile | Leu | Ala | Asp | Ala | Thr | Phe | Glu | Ala | Glu | Ser | Asp | Leu | Glu | Arg |
610 | 615 | 620 | |||||||||||||
Ala | Gln | Lys | Ala | Val | Asn | Ala | Leu | Phe | Thr | Ser | Ser | Asn | Gln | Ile | Gly |
625 | 630 | 635 | 640 | ||||||||||||
Leu | Lys | Thr | Asp | Val | Thr | Asp | Tyr | His | Ile | Asp | Gln | Val | Ser | Asn | Leu |
645 | 650 | 655 | |||||||||||||
Val | Asp | Cys | Leu | Ser | Asp | Glu | Phe | Cys | Leu | Asp | Glu | Lys | Arg | Glu | Leu |
660 | 665 | 670 | |||||||||||||
Ser | Glu | Lys | Val | Lys | His | Ala | Lys | Arg | Leu | Ser | Asp | Glu | Arg | Asn | Leu |
675 | 680 | 685 | |||||||||||||
Leu | Gln | Asp | Pro | Asn | Phe | Arg | Gly | Ile | Asn | Arg | Gln | Pro | Asp | Arg | Gly |
690 | 695 | 700 | |||||||||||||
Trp | Arg | Gly | Ser | Thr | Asp | Ile | Thr | Ile | Gln | Gly | Gly | Asp | Asp | Val | Phe |
705 | 710 | 715 | 720 | ||||||||||||
Lys | Glu | Asn | Tyr | Val | Thr | Leu | Pro | Gly | Thr | Val | Asp | Glu | Cys | Tyr | Pro |
725 | 730 | 735 | |||||||||||||
Thr | Tyr | Leu | Tyr | Gln | Lys | Ile | Asp | Glu | Ser | Lys | Leu | Lys | Ala | Tyr | Thr |
740 | 745 | 750 | |||||||||||||
Arg | Tyr | Glu | Leu | Arg | Gly | Tyr | Ile | Glu | Asp | Ser | Gln | Asp | Leu | Glu | Ile |
755 | 760 | 765 | |||||||||||||
Tyr | Leu | Ile | Arg | Tyr | Asn | Ala | Lys | His | Glu | Ile | Val | Asn | Val | Pro | Gly |
770 | 775 | 780 | |||||||||||||
Thr | Gly | Ser | Leu | Trp | Pro | Leu | Ser | Ala | Gln | Ser | Pro | Ile | Gly | Lys | Cys |
785 | 790 | 795 | 800 | ||||||||||||
Gly | Glu | Pro | Asn | Arg | Cys | Ala | Pro | His | Leu | Glu | Trp | Asn | Pro | Asp | Leu |
805 | 810 | 815 | |||||||||||||
Asp | Cys | Ser | Cys | Arg | Asp | Gly | Glu | Lys | Cys | Ala | His | His | Ser | His | His |
820 | 825 | 830 | |||||||||||||
Phe | Thr | Leu | Asp | Ile | Asp | Val | Gly | Cys | Thr | Asp | Leu | Asn | Glu | Asp | Leu |
835 | 840 | 845 | |||||||||||||
Gly | Val | Trp | Val | Ile | Phe | Lys | Ile | Lys | Thr | Gln | Asp | Gly | His | Ala | Arg |
850 | 855 | 860 | |||||||||||||
Leu | Gly | Asn | Leu | Glu | Phe | Leu | Glu | Glu | Lys | Pro | Leu | Leu | Gly | Glu | Ala |
865 | 870 | 875 | 880 |
181 408
Leu Ala Arg Val Lys Arg Ala Glu Lys Lys | Trp | Arg Asp | Lys | Arg 895 | Glu | ||
885 | 890 | ||||||
Lys Leu Gln | Leu Glu 900 | Thr Asn Ile Val Tyr 905 | Lys | Glu Ala | Lys 910 | Glu | Ser |
Val Asp Ala 915 | Leu Phe | Val Asn Ser Gln Tyr 920 | Asp | Arg Leu 925 | Gln | Val | Asp |
Thr Asn Ile 930 | Ala Met | Ile His Ala Ala Asp 935 | Lys | Arg Val 940 | His | Arg | Ile |
Arg Glu Ala 945 | Tyr Leu | Pro Glu Leu Ser Val 950 | Ile 955 | Pro Gly | Val | Asn | Ala 960 |
Ala Ile Phe | Glu Glu 965 | Leu Glu Gly Arg Ile 970 | Phe | Thr Ala | Tyr | Ser 975 | Leu |
Tyr Asp Ala | Arg Asn 980 | Val Ile Lys Asn Gly 985 | Asp | Phe Asn | Asn 990 | Gly | Leu |
Leu Cys Trp 995 | Asn Val | Lys Gly His Val Asp 1000 | Val | Glu Glu Gln 1005 | Asn | Asn | |
His Arg Ser 1010 | Val Leu | Val Ile Pro Glu Trp 1015 | Glu | Ala Glu 1020 | Val | Ser | Gln |
Glu Val Arg 1025 | Val Cys | Pro Gly Arg Gly Tyr 1030 | Ile Leu Arg 1035 | Val | Thr | Ala 1040 | |
Tyr Lys Glu | Gly Tyr Gly Glu Gly Cys Val Thr 1045 1050 | Ile His | Glu | Ile Glu 1055 | |||
Asp Asn Thr | Asp Glu 1060 | Leu Lys Phe Ser Asn 1065 | Cys | Val Glu | Glu Glu 1070 | Val | |
Tyr Pro Asn Asn Thr 1075 | Val Thr Cys Asn Asn 1080 | Tyr | Thr Gly Thr 1085 | Gln | Glu | ||
Glu Tyr Glu 1090 | Gly Thr | Tyr Thr Ser Arg Asn 1095 | Gln | Gly Tyr 1100 | Asp | Glu | Ala |
Tyr Gly Asn 1105 | Asn Pro | Ser Val Pro Ala Asp 1110 | Tyr Ala Ser 1115 | Val | Tyr | Glu 1120 | |
Glu Lys Ser | Tyr Thr Asp Gly Arg Arg Glu Asn 1125 1130 | Pro Cys | Glu | Ser Asn 1135 | |||
Arg Gly Tyr | Gly Asp 1140 | Tyr Thr Pro Leu Pro 1145 | Ala | Gly Tyr | Val Thr 1150 | Lys | |
Asp Leu Glu Tyr Phe 1155 | Pro Glu Thr Asp Lys 1100 | Val | Trp Ile Glu 1165 | Ile | Gly | ||
Glu Thr Glu Gly Thr | Phe Ile Val Asp Ser | Val | Glu Leu | Leu | Leu | Met |
1170 1175 1180
Glu Glu 1185
181 408 (2) INFORMACJA O SEKWENCJI ID NR: 7:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 3579 par podstawowych (B) TYP: kwas nukleinowy (C) TYP ŁAŃCUCHA: pojedynczy (D) TOPOLOGIA: nieznana (ii) TYP CZĄSTECZKI: cDNA (iii) HIPOTETYCZNY: NIE (iii) ANTI-SENSE: NIE (vi) ŹRÓDŁO PIERWOTNE:
(A) ORGANIZM: Toksyna hybrydowa (ix) CECHA:
(A) NAZWA/KLUCZ: CDS (B) LOKALIZACJA: 1..3579 (xi) OPIS SEKWENCJI: SEKWENCJA ID NR: 7:
ATG Met 1 | GAT AAC | AAT CCG AAC ATC | AAT GAA TGC ATT CCT TAT AAT TGT TTA | 48 | ||||||||||||
Asp | Asn | Asn | Pro Asn 5 | Ile | Asn | Glu | Cys 10 | Ile | Pro | Tyr | Asn | Cys 15 | Leu | |||
AGT | AAC | CCT | GAA | GTA | GAA | GTA | TTA | GGT | GGA | GAA | AGA | ATA | GAA | ACT | GGT | 96 |
Ser | Asn | Pro | Glu | Val | Glu | Val | Leu | Gly | Gly | Glu | Arg | Ile | Glu | Thr | Gly | |
20 | 25 | 30 | ||||||||||||||
TAC | ACC | CCA | ATC | GAT | ATT | TCC | TTG | TCG | CTA | ACG | CAA | TTT | CTT | TTG | AGT | 144 |
Tyr | Thr | Pro | Ile | Asp | Ile | Ser | Leu | Ser | Leu | Thr | Gln | Phe | Leu | Leu | Ser | |
35 | 40 | 45 | ||||||||||||||
GAA | TTT | GTT | CCC | GGT | GCT | GGA | TTT | GTG | TTA | GGA | CTA | GTT | GAT | ATA | ATA | 192 |
Glu | Phe | Val | Pro | Gly | Ala | Gly | Phe | Val | Leu | Gly | Leu | Val | Asp | Ile | Ile | |
50 | 55 | 60 | ||||||||||||||
TGG | GGA | ATT | TTT | GGT | CCC | TCT | CAA | TGG | GAC | GCA | TTT | CTT | GTA | CAA | ATT | 240 |
Trp | Gly | Ile | Phe | Gly | Pro | Ser | Gln | Trp | Asp | Ala | Phe | Leu | Val | Gln | Ile | |
65 | 70 | 75 | 80 | |||||||||||||
GAA | CAG | TTA | ATT | AAC | CAA | AGA | ATA | GAA | GAA | TTC | GCT | AGG | AAC | CAA | GCC | 288 |
Glu | Gln | Leu | Ile | Asn | Gln | Arg | Ile | Glu | Glu | Phe | Ala | Arg | Asn | Gln | Ala | |
85 | 90 | 95 | ||||||||||||||
ATT | TCT | AGA | TTA | GAA | GGA | CTA | AGC | AAT | CTT | TAT | CAA | ATT | TAC | GCA | GAA | 336 |
Ile | Ser | Arg | Leu | Glu | Gly | Leu | Ser | Asn | Leu | Tyr | Gln | Ile | Tyr | Ala | Glu | |
100 | 105 | 110 | ||||||||||||||
TCT | TTT | AGA | GAG | TGG | GAA | GCA | GAT | CCT | ACT | AAT | CCA | GCA | TTA | AGA | GAA | 384 |
Ser | Phe | Arg | Glu | Trp | Glu | Ala | Asp | Pro | Thr | Asn | Pro | Ala | Leu | Arg | Glu | |
115 | 120 | 125 | ||||||||||||||
GAG | ATG | CGT | ATT | CAA | TTC | AAT | GAC | ATG | AAC | AGT | GCC | CTT | ACA | ACC | GCT | 432 |
Glu | Met | Arg | Ile | Gln | Phe | Asn | Asp | Met | Asn | Ser | Ala | Leu | Thr | Thr | Ala | |
130 | 135 | 140 | ||||||||||||||
ATT | CCT | CTT | TTT | GCA | GTT | CAA | AAT | TAT | CAA | GTT | CCT | CTT | TTA | TCA | GTA | 480 |
Ile | Pro | Leu | Phe | Ala | Val | Gln | Asn | Tyr | Gln | Val | Pro | Leu | Leu | Ser | Val | |
145 | 150 | 155 | 160 | |||||||||||||
TAT | GTT | CAA | GCT | GCA | AAT | TTA | CAT | TTA | TCA | GTT | TTG | AGA | GAT | GTT | TCA | 528 |
Tyr | Val | Gln | Ala | Ala | Asn | Leu | His | Leu | Ser | Val | Leu | Arg | Asp | Val | Ser | |
165 | 170 | 175 |
181 408
GTG Val | TTT GGA Phe Gly | CAA AGG TGG | GGA TTT GAT GCC GCG | ACT Thr | ATC Ile | AAT AGT CGT | 576 | |||||||||
Gln 180 | Arg Trp | Gly | Phe | Asp 185 | Ala | Ala | Asn 190 | Ser | Arg | |||||||
TAT | AAT | GAT | TTA | ACT | AGG | CTT | ATT | GGC | AAC | TAT | ACA | GAT | CAT | GCT | GTA | 624 |
Tyr | Asn | Asp | Leu | Thr | Arg | Leu | Ile | Gly | Asn | Tyr | Thr | Asp | His | Ala | Val | |
195 | 200 | 205 | ||||||||||||||
CGC | TGG | TAC | AAT | ACG | GGA | TTA | GAG | CGT | GTA | TGG | GGA | CCG | GAT | TCT | AGA | 672 |
Arg | Trp | Tyr | Asn | Thr | Gly | Leu | Glu | Arg | Val | Trp | Gly | Pro | Asp | Ser | Arg | |
210 | 215 | 220 | ||||||||||||||
GAT | TGG | ATA | AGA | TAT | AAT | CAA | TTT | AGA | AGA | GAA | TTA | ACA | CTA | ACT | GTA | 720 |
Asp | Trp | Ile | Arg | Tyr | Asn | Gln | Phe | Arg | Arg | Glu | Leu | Thr | Leu | Thr | Val | |
225 | 230 | 235 | 240 | |||||||||||||
TTA | GAT | ATC | GTT | TCT | CTA | TTT | CCG | AAC | TAT | GAT | AGT | AGA | ACG | TAT | CCA | 768 |
Leu | Asp | Ile | Val | Ser | Leu | Phe | Pro | Asn | Tyr | Asp | Ser | Arg | Thr | Tyr | Pro | |
245 | 250 | 255 | ||||||||||||||
ATT | CGA | ACA | GTT | TCC | CAA | TTA | ACA | AGA | GAA | ATT | TAT | ACA | AAC | CCA | GTA | 816 |
Ile | Arg | Thr | Val | Ser | Gln | Leu | Thr | Arg | Glu | Ile | Tyr | Thr | Asn | Pro | Val | |
260 | 265 | 270 | ||||||||||||||
TTA | GAA | AAT | TTT | GAT | GGT | AGT | TTT | CGA | GGC | TCG | GCT | CAG | CGC | ATA | GAA | 864 |
Leu | Glu | Asn | Phe | Asp | Gly | Ser | Phe | Arg | Gly | Ser | Ala | Gln | Gly | Ile | Glu | |
275 | 280 | 285 | ||||||||||||||
GGA | AGT | ATT | AGG | AGT | CCA | CAT | TTG | ATG | GAT | ATA | CTT | AAC | AGT | ATA | ACC | 912 |
Gly | Ser | Ile | Arg | Ser | Pro | His | Leu | Met | Asp | Ile | Leu | Asn | Ser | Ile | Thr | |
290 | 295 | 300 | ||||||||||||||
ATC | TAT | ACG | GAT | GCT | CAT | AGA | GGA | GAA | TAT | TAT | TGG | TCA | GGG | CAT | CAA | 960 |
Ile | Tyr | Thr | Asp | Ala | His | Arg | Gly | Glu | Tyr | Tyr | Trp | Ser | Gly | His | Gln | |
305 | 310 | 315 | 320 | |||||||||||||
ATA | ATG | GCT | TCT | CCT | GTA | GGG | TTT | TCG | GGG | CCA | GAA | TTC | ACT | TTT | CCG | 1008 |
Ile | Met | Ala | Ser | Pro | Val | Gly | Phe | Ser | Gly | Pro | Glu | Phe | Thr | Phe | Pro | |
325 | 330 | 335 | ||||||||||||||
CTA | TAT | GGA | ACT | ATG | GGA | AAT | GCA | GCT | CCA | CAA | CAA | CGT | ATT | GTT | GCT | 1056 |
Leu | Tyr | Gly | Thr | Met | Gly | Asn | Ala | Ala | Pro | Gln | Gln | Arg | Ile | Val | Ala | |
340 | 345 | 350 | ||||||||||||||
CAA | CTA | GGT | CAG | GGC | GTG | TAT | AGA | ACA | TTA | TCG | TCC | ACT | TTA | TAT | AGA | 1104 |
Gln | Leu | Gly | Gln | Gly | Val | Tyr | Arg | Thr | Leu | Ser | Ser | Thr | Leu | Tyr | Arg | |
355 | 360 | 365 | ||||||||||||||
AGA | CCT | TTT | AAT | ATA | GGG | ATA | AAT | AAT | CAA | CAA | CTA | TCT | GTT | CTT | GAC | 1152 |
Arg | Pro | Phe | Asn | Ile | Gly | Ile | Asn | Asn | Gln | Gln | Leu | Ser | Val | Leu | Asp | |
370 | 375 | 380 | ||||||||||||||
GGG | ACA | GAA | TTT | GCT | TAT | GGA | ACC | TCC | TCA | AAT | TTG | CCA | TCC | GCT | GTA | 1200 |
Gly | Thr | Glu | Phe | Ala | Tyr | Gly | Thr | Ser | Ser | Asn | Leu | Pro | Ser | Ala | Val | |
385 | 390 | 395 | 400 | |||||||||||||
TAC | AGA | AAA | AGC | GGA | ACG | GTA | GAT | TCG | CTG | GAT | GAA | ATA | CCG | CCA | CAG | 1248 |
Tyr | Arg | Lys | Ser | Gly | Thr | Val | Asp | Ser | Leu | Asp | Glu | Ile | Pro | Pro | Gln | |
405 | 410 | 415 | ||||||||||||||
AAT | AAC | AAC | GTG | CCA | CCT | AGG | CAA | GGA | TTT | AGT | CAT | CGA | TTA | AGC | CAT | 1296 |
Asn | Asn | Asn | Val | Pro | Pro | Arg | Gln | Gly | Phe | Ser | His | Arg | Leu | Ser | His | |
420 | 425 | 430 |
181 408
GTT TCA ATG | TTT CGT TCA GGC TTT AGT AAT AGT AGT GTA AGT ATA ATA | 1344 | ||||||||||||||
Val | Ser | Met 435 | Phe Arg | Ser Gly Phe 440 | Ser | Asn | Ser | Ser | Val 445 | Ser | Ile | Ile | ||||
AGA | GCT | CCT | ATG | TTC | TCT | TGG | ATA | CAT | CGT | AGT | GCA | ACT | CTT | ACA | AAT | 1392 |
Arg | Ala | Pro | Met | Phe | Ser | Trp | Ile | His | Arg | Ser | Ala | Thr | Leu | Thr | Asn | |
450 | 455 | 460 | ||||||||||||||
ACA | ATT | GAT | CCA | GAG | AGA | ATT | AAT | CAA | ATA | CCT | TTA | GTG | AAA | GGA | TTT | 1440 |
Thr | Ile | Asp | Pro | Glu | Arg | Ile | Asn | Gln | Ile | Pro | Leu | Val | Lys | Gly | Phe | |
465 | 470 | 475 | 480 | |||||||||||||
AGA | GTT | TGG | GGG | GGC | ACC | TCT | GTC | ATT | ACA | GGA | CCA | GGA | TTT | ACA | GGA | 1488 |
Arg | Val | Trp | Gly | Gly | Thr | Ser | Val | Ile | Thr | Gly | Pro | Gly | Phe | Thr | Gly | |
485 | 490 | 495 | ||||||||||||||
GGG | GAT | ATC | CTT | CGA | AGA | AAT | ACC | TTT | GGT | GAT | TTT | GTA | TCT | CTA | CAA | 1536 |
Gly | Asp | Ile | Leu | Arg | Arg | Asn | Thr | Phe | Gly | Asp | Phe | Val | Ser | Leu | Gln | |
500 | 505 | 510 | ||||||||||||||
GTC | AAT | ATT | AAT | TCA | CCA | ATT | ACC | CAA | AGA | TAC | CGT | TTA | AGA | TTT | CGT | 1584 |
Val | Asn | Ile | Asn | Ser | Pro | Ile | Thr | Gln | Arg | Tyr | Arg | Leu | Arg | Phe | Arg | |
515 | 520 | 525 | ||||||||||||||
TAC | GCT | TCC | AGT | AGG | GAT | GCA | CGA | GTT | ATA | GTA | TTA | ACA | GGA | GCG | GCA | 1632 |
Tyr | Ala | Ser | Ser | Arg | Asp | Ala | Arg | Val | Ile | Val | Leu | Thr | Gly | Ala | Ala | |
530 | 535 | 540 | ||||||||||||||
TCC | ACA | GGA | GTG | GGA | GGC | CAA | GTT | AGT | GTA | AAT | ATG | CCT | CTT | CAG | AAA | 1680 |
Ser | Thr | Gly | Val | Gly | Gly | Gln | Val | Ser | Val | Asn | Met | Pro | Leu | Gln | Lys | |
545 | 550 | 555 | 560 | |||||||||||||
ACT | ATG | GAA | ATA | GGG | GAG | AAC | TTA | ACA | TCT | AGA | ACA | TTT | AGA | TAT | ACC | 1728 |
Thr | Met | Glu | Ile | Gly | Glu | Asn | Leu | Thr | Ser | Arg | Thr | Phe | Arg | Tyr | Thr | |
565 | 570 | 575 | ||||||||||||||
GAT | TTT | AGT | AAT | CCT | TTT | TCA | TTT | AGA | GCT | AAT | CCA | GAT | ATA | ATT | GGG | 1776 |
Asp | Phe | Ser | Asn | Pro | Phe | Ser | Phe | Arg | Ala | Asn | Pro | Asp | Ile | Ile | Gly | |
580 | 585 | 590 | ||||||||||||||
ATA | AGT | GAA | CAA | CCT | CTA | TTT | GGT | GCA | GGT | TCT | ATT | AGT | AGC | GGT | GAA | 1824 |
Ile | Ser | Glu | Gln | Pro | Leu | Phe | Gly | Ala | Gly | Ser | Ile | Ser | Ser | Gly | Glu | |
595 | 600 | 605 | ||||||||||||||
CTT | TAT | ATA | GAT | AAA | ATT | GAA | ATT | ATT | CTA | GCA | GAT | GCA | ACA | TTT | GAA | 1872 |
Leu | Tyr | Ile | Asp | Lys | Ile | Glu | Iln | Ile | Leu | Ala | Asp | Ala | Thr | Phe | Glu | |
610 | 615 | 620 | ||||||||||||||
GCA | GAA | TCT | GAT | TTA | GAA | AGA | GCA | CAA | AAG | GCG | GTG | AAT | GCC | CTG | TTT | 1920 |
Ala | Glu | Ser | Asp | Leu | Glu | Arg | Ala | Gln | Lys | Ala | Val | Asn | Ala | Leu | Phe | |
625 | 630 | 635 | 640 | |||||||||||||
ACT | TCT | TCC | AAT | CAA | ATC | GGG | TTA | AAA | ACC | GAT | GTG | ACG | GAT | TAT | CAT | 1968 |
Thr | Ser | Ser | Asn | Gln | Ile | Gly | Leu | Lys | Thr | Asp | Val | Thr | Asp | Tyr | His | |
645 | 650 | 655 | ||||||||||||||
ATT | GAT | CAA | GTA | TCC | AAT | TTA | GTG | GAT | TGT | TTA | TCA | GAT | GAA | TTT | TGT | 2016 |
Ile | Asp | Gln | Val | Ser | Asn | Leu | Val | Asp | Cys | Leu | Ser | Asp | Glu | Phe | Cys | |
660 | 665 | 670 | ||||||||||||||
CTG | GAT | GAA | AAG | CGA | GAA | TTG | TCC | GAG | AAA | GTC | AAA | CAT | GCG | AAG | CGA | 2064 |
Leu | Asp | Glu | Lys | Arg | Glu | Leu | Ser | Glu | Lys | Val | Lys | His | Ala | Lys | Arg | |
675 | 680 | 685 |
181 408
CTC AGT GAT GAG CGG | AAT TTA CTT CAA GAT CCA AAC TTC AGA GGG ATC | 2112 | ||||||||||||||
Leu Ser Asp | Glu | Arg | Asn Leu 695 | Leu | Gln | Asp | Pro | Asn 700 | Phe | Arg | Gly | Ile | ||||
690 | ||||||||||||||||
AAT | AGA | CAA | CCA | GAC | CGT | GGC | TGG | AGA | GGA | AGT | ACA | GAT | ATT | ACC | ATC | 2160 |
Asn | Arg | Gln | Pro | Asp | Arg | Gly | Trp | Arg | Gly | Ser | Thr | Asp | Ile | Thr | Ile | |
705 | 710 | 715 | 720 | |||||||||||||
CAA | GGA | GGA | GAT | GAC | GTA | TTC | AAA | GAG | AAT | TAC | GTC | ACA | CTA | CCG | GGT | 2208 |
Gln | Gly | Gly | Asp | Asp | Val | Phe | Lys | Glu | Asn | Tyr | Val | Thr | Leu | Pro | Gly | |
725 | 730 | 735 | ||||||||||||||
ACC | GTT | GAT | GAG | TGC | TAT | CCA | ACG | TAT | TTA | TAT | CAG | AAA | ATA | GAT | GAG | 2256 |
Thr | Val | Asp | Glu | Cys | Tyr | Pro | Thr | Tyr | Leu | Tyr | Gln | Lys | Ile | Asp | Glu | |
740 | 745 | 750 | ||||||||||||||
TCG | AAA | TTA | AAA | GCT | TAT | ACC | CGT | TAT | GAA | TTA | AGA | GGG | TAT | ATC | GAA | 2304 |
Ser | Lys | Leu | Lys | Ala | Tyr | Thr | Arg | Tyr | Glu | Leu | Arg | Gly | Tyr | Ile | Glu | |
755 | 760 | 765 | ||||||||||||||
GAT | AGT | CAA | GAC | TTA | GAA | ATC | TAT | TTG | ATC | CGT | TAC | AAT | GCA | AAA | CAC | 2352 |
Asp | Ser | Gln | Asp | Leu | Glu | Ile | Tyr | Leu | Ile | Arg | Tyr | Asn | Ala | Lys | His | |
770 | 775 | 780 | ||||||||||||||
GAA | ATA | GTA | AAT | GTG | CCA | GGC | ACG | GGT | TCC | TTA | TGG | CCG | CTT | TCA | GCC | 2400 |
Glu | Ile | Val | Asn | Val | Pro | Gly | Thr | Gly | Ser | Leu | Trp | Pro | Leu | Ser | Ala | |
785 | 790 | 795 | 800 | |||||||||||||
CAA | AGT | CCA | ATC | GGA | AAG | TGT | GGA | GAA | CCG | AAT | CGA | TGC | GCG | CCA | CAC | 2448 |
Gln | Ser | Pro | Ile | Gly | Lys | Cys | Gly | Glu | Pro | Asn | Arg | Cys | Ala | Pro | His | |
805 | 810 | 815 | ||||||||||||||
CTT | GAA | TGG | AAT | CCT | GAT | CTA | GAT | TGT | TCC | TGC | AGA | GAC | GGG | GAA | AAA | 2496 |
Leu | Glu | Trp | Asn | Pro | Asp | Leu | Asp | Cys | Ser | Cys | Arg | Asp | Gly | Glu | Lys | |
820 | 825 | 830 | ||||||||||||||
TGT | GCA | CAT | CAT | TCC | CAT | CAT | TTC | ACC | TTG | GAT | ATT | GAT | GTT | GGA | TGT | 2544 |
Cys | Ala | His | His | Ser | His | His | Phe | Thr | Leu | Asp | Ile | Asp | Val | Gly | Cys | |
835 | 840 | 845 | ||||||||||||||
ACA | GAC | TTA | AAT | GAG | GAC | TTA | GGT | GTA | TGG | GTG | ATA | TTC | AAG | ATT | AAG | 2592 |
Thr | Asp | Leu | Asn | Glu | Asp | Leu | Gly | Val | Trp | Val | Ile | Phe | Lys | Ile | Lys | |
850 | 855 | 860 | ||||||||||||||
ACG | CAA | GAT | GGC | CAT | GCA | AGA | CTA | GGG | AAT | CTA | GAG | TTT | CTC | GAA | GAG | 2640 |
Thr | Gln | Asp | Gly | His | Ala | Arg | Leu | Gly | Asn | Leu | Glu | Phe | Leu | Glu | Glu | |
865 | 870 | 875 | 880 | |||||||||||||
AAA | CCA | TTA | TTA | GGG | GAA | GCA | CTA | GCT | CGT | GTG | AAA | AGA | GCG | GAG | AAG | 2688 |
Lys | Pro | Leu | Leu | Gly | Glu | Ala | Leu | Ala | Arg | Val | Lys | Arg | Ala | Glu | Lys | |
885 | 890 | 895 | ||||||||||||||
AAG | TGG | AGA | GAC | AAA | CGA | GAG | AAA | CTG | CAG | TTG | GAA | ACA | AAT | ATT | GTT | 2736 |
Lys | Trp | Arg | Asp | Lys | Arg | Glu | Lys | Leu | Gln | Leu | Glu | Thr | Asn | Ile | Val | |
900 | 905 | 910 | ||||||||||||||
TAT | AAA | GAG | GCA | AAA | GAA | TCT | GTA | GAT | GCT | TTA | TTT | GTA | AAC | TCT | CAA | 2784 |
Tyr | Lys | Glu | Ala | Lys | Glu | Ser | Val | Asp | Ala | Leu | Phe | Val | Asn | Ser | Gln | |
915 | 920 | 925 | ||||||||||||||
TAT | GAT | AGA | TTA | CAA | GTG | GAT | ACG | AAC | ATC | GCG | ATG | ATT | CAT | GCG | GCA | 2832 |
Tyr | Asp | Arg | Leu | Gln | Val | Asp | Thr | Asn | Ile | Ala | Met | Ile | His | Ala | Ala | |
930 | 935 | 940 |
181 408
GAT AAA CGC GTT CAT AGA ATC CGG GAA GCG TAT CTG CCA GAG TTG TCT | 2880 | |||||||||||
Asp Lys 945 | Arg | Val His Arg 950 | Ile | Arg | Glu Ala | Tyr 955 | Leu | Pro | Glu | Leu | Ser 960 | |
GTG ATT | CCA | GGT GTC AAT | GCG | GCC | ATT TTC | GAA | GAA | TTA | GAG | GGA | CGT | 2928 |
Val Ile | Pro | Gly Val Asn | Ala | Ala | Ile Phe | Glu | Glu | Leu | Glu | Gly | Arg | |
965 | 970 | 975 | ||||||||||
ATT TTT | ACA | GCG TAT TCC | TTA | TAT | GAT GCG | AGA | AAT | GTC | ATT | AAA | AAT | 2976 |
Ile Phe | Thr | Ala Tyr Ser | Leu | Tyr | Asp Ala | Arg | Asn | Val | Ile | Lys | Asn | |
980 | 985 | 990 | ||||||||||
GGC GAT | TTC | AAT AAT GGC | TTA | TTA | TGC TGG | AAC | GTG | AAA | GGT | CAT | GTA | 3024 |
Gly Asp | Phe | Asn Asn Gly | Leu | Leu | Cys Trp | Asn | Val | Lys | Gly | His | Val | |
995 | 1000 | 1005 | ||||||||||
GAT GTA | GAA | GAG CAA AAC | AAC | CAC | CGT TCG | GTC | CTT | GTT | ATC | CCA | GAA | 3072 |
Asp Val | Glu | Glu Gln Asn | Asn | His | Arg Ser | Val | Leu | Val | Ile | Pro | Glu | |
1010 | 1015 | 1020 | ||||||||||
TGG GAG | GCA | GAA GTG TCA | CAA | GAG | GTT CGT | GTC | TGT | CCA | GGT | CGT | GGC | 3120 |
Trp Glu | Ala | Glu Val Ser | Gln | Glu | Val Arg | Val | Cys | Pro | Gly | Arg | Gly | |
1025 | 1030 | 1035 | 1040 | |||||||||
TAT ATC | CTT | CGT GTC ACA | GCA | TAT | AAA GAG | GGA | TAT | GGA | GAG | GGC | TGC | 3168 |
Tyr Ile | Leu | Arg Val Thr | Ala | Tyr | Lys Glu | Gly | Tyr | Gly | Glu | Gly | Cys | |
1045 | 1050 | 1055 | ||||||||||
GTA ACG | ATC | CAT GAG ATC | GAA | GAC | AAT ACA | GAC | GAA | CTG | AAA | TTC | AGC | 3216 |
Val Thr | Ile | His Glu Ile | Glu | Asp | Asn Thr | Asp | Glu | Leu | Lys | Phe | Ser | |
1060 | 1065 | 1070 | ||||||||||
AAC TGT | GTA | GAA GAG GAA | GTA | TAT | CCA AAC | AAC | ACA | GTA | ACG | TGT | AAT | 3264 |
Asn Cys | Val | Glu Glu Glu | Val | Tyr | Pro Asn | Asn | Thr | Val | Thr | Cys | Asn | |
1075 | 1080 | 1085 | ||||||||||
AAT TAT | ACT | GGG ACT CAA | GAA | GAA | TAT GAG | GGT | ACG | TAC | ACT | TCT | CGT | 3312 |
Asn Tyr | Thr | Gly Thr Gln | Glu | Glu | Tyr Glu | Gly | Thr | Tyr | Thr | Ser | Arg | |
1090 | 1095 | 1100 | ||||||||||
AAT CAA | GGA | TAT GAC GAA | GCC | TAT | GGT AAT | AAC | CCT | TCC | GTA | CCA | GCT | 3360 |
Asn Gln | Gly | Tyr Asp Glu | Ala | Tyr | Gly Asn | Asn | Pro | Ser | Val | Pro | Ala | |
1105 | 1110 | 1115 | 1120 | |||||||||
GAT TAC | GCT | TCA GTC TAT | GAA | GAA | AAA TCG | TAT | ACA | GAT | GGA | CGA | AGA | 3408 |
Asp Tyr | Ala | Ser Val Tyr | Glu | Glu | Lys Ser | Tyr | Thr | Asp | Gly | Arg | Arg | |
1125 | 1130 | 1135 | ||||||||||
GAG AAT | CCT | TGT GAA TCT | AAC | AGA | GGC TAT | GGG | GAT | TAC | ACA | CCA | CTA | 3456 |
Glu Asn | Pro | Cys Glu Ser | Asn | Arg | Gly Tyr | Gly | Asp | Tyr | Thr | Pro | Leu | |
1140 | 1145 | 1150 | ||||||||||
CCG GCT | GGT | TAT GTA ACA | AAG | GAT | TTA GAG | TAC | TTC | CCA | GAG | ACC | GAT | 3504 |
Pro Ala | Gly | Tyr Val Thr | Lys | Asp | Leu Glu | Tyr | Phe | Pro | Glu | Thr | Asp | |
1155 | 1160 | 1165 | ||||||||||
AAG GTA | TGG | ATT GAG ATC | GGA | GAA | ACA GAA | GGA | ACA | TTC | ATC | GTG | GAT | 3552 |
Lys Val | Trp | Ile Glu Ile | Gly | Glu | Thr Glu | Gly | Thr | Phe | Ile | Val | Asp | |
1170 | 1175 | 1180 | ||||||||||
AGC GTG | GAA | TTA ATA ATT | ATG | GAG | AAA | 3579 | ||||||
Ser Val | Glu | Leu Leu Leu | Met | Glu | Glu |
1185 1190
181 408 (2) INFORMACJA O SEKWENCJI ID NR: 8:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 1193 aminokwasów (B) TYP: aminokwasowa (D) TOPOLOGIA: liniowa (ii) TYP CZĄSTECZKI: białko (xi) OPIS SEKWENCJI: SEKWENCJA ID NR: 8:
Met 1 | Asp | Asn | Asn | Pro 5 | Asn | Ile | Asn |
Ser | Asn | Pro | Glu 20 | Val | Glu | Val | Leu |
Tyr | Thr | Pro 35 | Ile | Asp | Ile | Ser | Leu 40 |
Glu | Phe 50 | Val | Pro | Gly | Ala | Gly 55 | Phe |
Trp 65 | Gly | Ile | Phe | Gly | Pro 70 | Ser | Gln |
Glu | Gln | Leu | Ile | Asn 85 | Gln | Arg | Ile |
Ile | Ser | Arg | Leu 100 | Glu | Gly | Leu | Ser |
Ser | Phe | Arg 115 | Glu | Trp | Glu | Ala | Asp 120 |
Glu | Met 130 | Arg | Ile | Gln | Phe | Asn 135 | Asp |
Ile 145 | Pro | Leu | Phe | Ala | Val 150 | Gln | Asn |
Tyr | Val | Gln | Ala | Ala 165 | Asn | Leu | His |
Val | Phe | Gly | Gln 180 | Arg | Trp | Gly | Phe |
Tyr | Asn | Asp 195 | Leu | Thr | Arg | Leu | Ile 200 |
Arg | Trp 210 | Tyr | Asn | Thr | Gly | Leu 215 | Glu |
Asp 225 | Trp | Ile | Arg | Tyr | Asn 230 | Gln | Phe |
Leu | Asp | Ile | Val | Ser 245 | Leu | Phe | Pro |
Ile | Arg | Thr | Val 260 | Ser | Gln | Leu | Thr |
Leu | Glu | Asn 275 | Phe | Asp | Gly | Ser | Phe 280 |
Gly | Ser 290 | Ile | Arg | Ser | Pro | His 295 | Leu |
Glu | Cys 10 | Ile | Pro | Tyr | Asn | Cys 15 | Leu |
Gly 25 | Gly | Glu | Arg | Ile | Glu 30 | Thr | Gly |
Ser | Leu | Thr | Gln | Phe 45 | Leu | Leu | Ser |
Val | Leu | Gly | Leu 60 | Val | Asp | Ile | Ile |
Trp | Asp | Ala 75 | Phe | Leu | Val | Gln | Ile 80 |
Glu | Glu 90 | Phe | Ala | Arg | Asn | Gln 95 | Ala |
Asn 105 | Leu | Tyr | Gln | Ile | Tyr 110 | Ala | Glu |
Pro | Thr | Asn | Pro | Ala 125 | Leu | Arg | Glu |
Met | Asn | Ser | Ala 140 | Leu | Thr | Thr | Ala |
Tyr | Gln | Val 155 | Pro | Leu | Leu | Ser | Val 160 |
Leu | Ser 170 | Val | Leu | Arg | Asp | Val 175 | Ser |
Asp 185 | Ala | Ala | Thr | Ile | Asn 190 | Ser | Arg |
Gly | Asn | Tyr | Thr | Asp 205 | His | Ala | Val |
Arg | Val | Trp | Gly 220 | Pro | Asp | Ser | Arg |
Arg | Arg | Glu 235 | Leu | Thr | Leu | Thr | Val 240 |
Asn | Tyr 250 | Asp | Ser | Arg | Thr | Tyr 255 | Pro |
Arg 265 | Glu | Ile | Tyr | Thr | Asn 270 | Pro | Val |
Arg | Gly | Ser | Ala | Gln 285 | Gly | Ile | Glu |
Met | Asp | Ile | Leu | Asn | Ser | Ile | Thr |
300
181 408
Ile | Tyr | Thr | Asp | Ala | His | Arg | Gly | Glu | Tyr | Tyr | Trp | Ser | Gly | His | Gln |
305 | 310 | 315 | 320 | ||||||||||||
Ile | Met | Ala | Ser | Pro | Val | Gly | Phe | Ser | Gly | Pro | Glu | Phe | Thr | Phe | Pro |
325 | 330 | 335 | |||||||||||||
Leu | Tyr | Gly | Thr | Met | Gly | Asn | Ala | Ala | Pro | Gln | Gln | Arg | Ile | Val | Ala |
340 | 345 | 350 | |||||||||||||
Gln | Leu | Gly | Gln | Gly | Val | Tyr | Arg | Thr | Leu | Ser | Ser | Thr | Leu | Tyr | Arg |
355 | 360 | 365 | |||||||||||||
Arg | Pro | Phe | Asn | Ile | Gly | Ile | Asn | Asn | Gln | Gln | Leu | Ser | Val | Leu | Asp |
370 | 375 | 380 | |||||||||||||
Gly | Thr | Glu | Phe | Ala | Tyr | Gly | Thr | Ser | Ser | Asn | Leu | Pro | Ser | Ala | Val |
385 | 390 | 395 | 400 | ||||||||||||
Tyr | Arg | Lys | Ser | Gly | Thr | Val | Asp | Ser | Leu | Asp | Glu | Ile | Pro | Pro | Gln |
405 | 410 | 415 | |||||||||||||
Asn | Asn | Asn | Val | Pro | Pro | Arg | Gln | Gly | Phe | Ser | His | Arg | Leu | Ser | His |
420 | 425 | 430 | |||||||||||||
Val | Ser | Met | Phe | Arg | Ser | Gly | Phe | Ser | Asn | Ser | Ser | Val | Ser | Ile | Ile |
435 | 440 | 445 | |||||||||||||
Arg | Ala | Pro | Met | Phe | Ser | Trp | Ile | His | Arg | Ser | Ala | Thr | Leu | Thr | Asn |
450 | 455 | 460 | |||||||||||||
Thr | Ile | Asp | Pro | Glu | Arg | Ile | Asn | Gln | Ile | Pro | Leu | Val | Lys | Gly | Phe |
465 | 470 | 475 | 480 | ||||||||||||
Arg | Val | Trp | Gly | Gly | Thr | Ser | Val | Ile | Thr | Gly | Pro | Gly | Phe | Thr | Gly |
485 | 490 | 495 | |||||||||||||
Gly | Asp | Ile | Leu | Arg | Arg | Asn | Thr | Phe | Gly | Asp | Phe | Val | Ser | Leu | Gln |
500 | 505 | 510 | |||||||||||||
Val | Asn | Ile | Asn | Ser | Pro | Ile | Thr | Gln | Arg | Tyr | Arg | Leu | Arg | Phe | Arg |
515 | 520 | 525 | |||||||||||||
Tyr | Ala | Ser | Ser | Arg | Asp | Ala | Arg | Val | Ile | Val | Leu | Thr | Gly | Ala | Ala |
530 | 535 | 540 | |||||||||||||
Ser | Thr | Gly | Val | Gly | Gly | Gln | Val | Ser | Val | Asn | Met | Pro | Leu | Gln | Lys |
545 | 550 | 555 | 560 | ||||||||||||
Thr | Met | Glu | Ile | Gly | Glu | Asn | Leu | Thr | Ser | Arg | Thr | Phe | Arg | Tyr | Thr |
565 | 570 | 575 | |||||||||||||
Asp | Phe | Ser | Asn | Pro | Phe | Ser | Phe | Arg | Ala | Asn | Pro | Asp | Ile | Ile | Gly |
580 | 585 | 590 | |||||||||||||
Ile | Ser | Glu | Gln | Pro | Leu | Phe | Gly | Ala | Gly | Ser | Ile | Ser | Ser | Gly | Glu |
595 | 600 | 605 | |||||||||||||
Leu | Tyr | Ile | Asp | Lys | Ile | Glu | Ile | Ile | Leu | Ala | Asp | Ala | Thr | Phe | Glu |
610 | 615 | 620 | |||||||||||||
Ala | Glu | Ser | Asp | Leu | Glu | Arg | Ala | Gln | Lys | Ala | Val | Asn | Ala | Leu | Phe |
625 | 630 | 635 | 640 | ||||||||||||
Thr | Ser | Ser | Asn | Gln | Ile | Gly | Leu | Lys | Thr | Asp | Val | Thr | Asp | Tyr | His |
645 | 650 | 655 | |||||||||||||
Ile | Asp | Gln | Val | Ser | Asn | Leu | Val | Asp | Cys | Leu | Ser | Asp | Glu | Phe | Cys |
660 | 655 | 670 |
181 408
Leu Asp Glu | Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg | ||
675 | 680 | 685 | |
Leu | Ser Asp 690 | Glu Arg Asn Leu Leu Gln 695 | Asp Pro Asn Phe Arg Gly Ile 700 |
Asn 705 | Arg Gln | Pro Asp Arg Gly Trp Arg 710 | Gly Ser Thr Asp Ile Thr Ile 715 720 |
Gln | Gly Gly Asp Asp Val Phe Lys Glu 725 | Asn Tyr Val Thr Leu Pro Gly 730 735 | |
Thr | Val Asp | Glu Cys Tyr Pro Thr Tyr 740 745 | Leu Tyr Gln Lys Ile Asp Glu 750 |
Ser | Lys Leu 755 | Lys Ala Tyr Thr Arg Tyr 760 | Glu Leu Arg Gly Tyr Ile Glu 765 |
Asp | Ser Gln 770 | Asp Leu Glu Ile Tyr Leu 775 | Ile Arg Tyr Asn Ala Lys His 780 |
Glu 785 | Ile Val | Asn Val Pro Gly Thr Gly 79C | Ser Leu Trp Pro Leu Ser Ala 795 800 |
Gln | Ser Pro | Ile Gly Lys Cys Gly Glu 805 | Pro Asn Arg Cys Ala Pro His 810 815 |
Leu | Glu Trp | Asn Pro Asp Leu Asp Cys 820 825 | Ser Cys Arg Asp Gly Glu Lys 830 |
Cys | Ala His 835 | His Ser His His Phe Thr 840 | Leu Asp Ile Asp Val Gly Cys 845 |
Thr | Asp Leu 850 | Asn Glu Asp Leu Gly Val 855 | Trp Val Ile Phe Lys Ile Lys 860 |
Thr 863 | Gln Asp | Gly His Ala Arg Leu Gly 870 | Asn Leu Glu Phe Leu Glu Glu 875 880 |
Lys | Pro Leu | Leu Gly Glu Ala Leu Ala 885 | Arg Val Lys Arg Ala Glu Lys 890 895 |
Lys | Trp Arg | Asp Lys Arg Glu Lys Leu 900 905 | Gln Leu Glu Thr Asn Ile Val 910 |
Tyr | Lys Glu 915 | Ala Lys Glu Ser Val Asp 920 | Ala Leu Phe Val Asn Ser Gln 925 |
Tyr | Asp Arg 930 | Leu Gln Val Asp Thr Asn 935 | Ile Ala Met Ile His Ala Ala 940 |
Asp 945 | Lys Arg | Val His Arg Ile Arg Glu 950 | Ala Tyr Leu Pro Glu Leu Ser 955 960 |
Val | Ile Pro | Gly Val Asn Ala Ala Ile 965 | Phe Glu Glu Leu Glu Gly Arg 970 975 |
Ile | Phe Thr | Ala Tyr Ser Leu Tyr Asp 980 985 | Ala Arg Asn Val Ile Lys Asn 990 |
Gly | Asp Phe 995 | Asn Asn Gly Leu Leu Cys 1000 | Trp Asn Val Lys Gly His Val 1005 |
Asp | Val Glu 1010 | Glu Gln Asn Asn His Arg 1015 | Ser Val Leu Val Ile Pro Glu 1020 |
Trp Glu Ala 1025 | Glu Val Ser Gln Glu Val 1030 | Arg Val Cys Pro Gly Arg Gly 1035 1040 |
181 408
Tyr | Ile | Leu | Arg | Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys | ||
1045 | 1050 | 1055 | ||||
Val | Thr | Ile | His Glu Ile Glu Asp Asn Thr Asp Glu Leu 1060 1065 | Lys Phe Ser 1070 | ||
Asn | Cys | Val Glu 1075 | Glu Glu Val Tyr Pro 1080 | Asn Asn Thr Val Thr Cys Asn 1085 | ||
Asn | Tyr Thr 1090 | Gly | Thr Gln Glu Glu Tyr 1095 | Glu Gly Thr Tyr 1100 | Thr Ser Arg | |
Asn Gln 1105 | Gly | Tyr | Asp Glu Ala Tyr Gly 1110 | Asn Asn Pro Ser 1115 | Val Pro Ala 1120 | |
Asp | Tyr | Ala | Ser | Val Tyr Glu Glu Lys 1125 | Ser Tyr Thr Asp 1130 | Gly Arg Arg 1135 |
Glu | Asn | Pro | Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr 1140 1145 | Thr Pro Leu 1150 | ||
Pro | Ala | Gly Tyr 1155 | Val Thr Lys Asp Leu 1160 | Glu Tyr Phe Pro Glu Thr Asp 1165 | ||
Lys Val Trp 1170 Ser Val Glu 1185 | Ile Leu | Glu Ile Gly Glu Thr 1175 Leu Leu Met Glu Glu 1190 | Glu Gly Thr Phe 1180 | Ile Val Asp |
181 408
CM es ł— cs es es cxJ es
u.
es
£ es
κ» es ffi —» U.I tf»
U*
FIG. 2
U >>
u,
U ώ
>>
u, u
£ &
« fr” 0 « « (fi » s es ►M
I §1 δ
I &
a o
t δ
s« e
(s «
tf» o
l·· 3- t/J | e • | |
es | u. | 0 |
v- | • | |
s — | es | 0 |
(fi | a | |
ł— | 0 | |
-i | 0 | |
(fi | ||
UJ | 0 | |
es | s | |
0 | ||
g | a | |
w- | 0 | |
a& | ! 8 | |
UJ | ||
e | ||
¢- | et, | |
ε | e | |
o | s | |
© | 0 | |
SC | 60 | |
W | S> | |
θ’ | s | |
es | 0 | |
| | CS | |
1 | 2S | |
1 | cs | |
| | t*» | |
1 | c/> | |
1 | cc | |
I | cc | |
CS | 1 | |
M | h- | |
c | -J | |
=> | 0 | |
t-“ | 0o« | |
es | • | |
« | 0 | |
o | 0 | |
es | 0 | |
(fi | 0 |
SO
X —>
V %»
i»·» »A»> | IA 09 |
© es | CM CM |
cm e\i | tA tA |
JT ·& | 'to* <W> |
<U* «Brf· | uj es |
uj es | M ha) |
t=ml | £> |
3-ł S>i | t. ł_ |
Ł. Ł. es es | es es |
ŁA © v” es « «9
ω a cs » U. t~ · X O SS » SC “ es es k«·
U. es a. es as t~ os
UJ
3- | (fi | |
UJ | 0 | |
UJ | β | |
UJ | e | |
V“ | u. | 0 |
CM | 0 | |
□Ξ —)> | <s | D |
Ω | 0 | |
CS | 0 |
uj
M · as >
o ° ·—I B
3- · »1 UJ -
es | (fi |
& | (fi |
>-< | B |
1 | (fi |
1 | es |
1 | <£ |
1 | es |
| | u. |
o. | _j |
_J | □_ |
UJ | o |
UJ | 0 |
181 408 *o esi flC to* ω a a. » β
• a
a
CO o
LL
J=} toto
U.
U i
U toto >>
to,
U
Q £
W >**<
g T * 4» ffi · US · ee s *kł <1
Ϊ3 fiJ al toLU
OLA
Lu
I i
i i
UJ us a:
O k=<
o u
es i => i es i
US i ffi I ee <x · o * oe · es ·
**x | » LA |
os es | CM CM |
CM CM | LA LA |
j? | kto» Sto |
w* **» | CS LU |
es lu | kto kto |
to* «X | =>> =A |
»> =>» | to to |
to to es es | es es |
es LA
1—
ts> | • -o | •o | ||
e: | • | to*» | ||
s- | 8 | |||
8 | ||||
Lu | se | a | ||
ee | a | ar | a | |
«j | a | a | 8 | |
cc | a | BS | a | |
> | a | LU | a | |
ee | • | «J | a | |
ar | 8 | O | a | |
to” | 9 | us | 3- | |
to* | 8 | UJ | 8 | |
CU | 8 | β | ω | |
es | 8 | LU | 8 | |
Z | 8 | LU | 8 | |
ka* | 9 | to- | 8 | |
Z | 8 | ffi | 8 | |
=> | 8 | O | 8 | |
es* | • | ffi | 8 | |
8 | xJ | 8 | ||
US | 8 | toto | 8 | |
s> | 9 | to* | ||
u. | 9 | LU | 1 | |
o | LU | kto | B | |
es | 9 | se | 8 | |
u. | M | to- | o | 8 |
►— | 8 | UJ —» | to* | 8 |
Z | 8 | 3- | 9 | |
oc | 8 | o_I | 9 | |
cc | 8 | LU | 9 | |
_J | 8 | es | 9 | |
toto | 8 | es | C3 | |
O | • | es | CC | |
es | 8 | to* | 9 | |
es | 8 | us | CU | |
ί— | 8 | es | ||
Lu | 8 | cc | ω | |
es | 8 | CS | 1 | |
CU | 8 | LU | 1 | |
es | 8 | tol | I | |
to- | se | CU | I | |
to* | 8 | cr | 1 | |
o | 9 | UJ | 9 | |
us | us | s | ||
1“ | 9 | to* | β | |
es | 9 | es | X | |
es | 9 | kto | 9 | |
39 | C3 | to* | a | |
£ | «ί | O | 9 | |
ee | 8 | a. | 9 | |
LU | 8 | z | 9 | |
es | 8 | ffi | a | |
se | 8 | oc | 8 |
181 408
FIG. 4
A IC*
181 408
Ncol
181 408
E.coll recA+
BamHI+Notl
Departament Wydawnictw UP RP. Nakład 70 egz.
Cena 6,00 zł.
Claims (4)
1. Fragment hybrydowej toksyny Bacillus thuringiensis mający sekwencję aminokwasów od aminokwasu 1 do aminokwasu 620 określoną w Sek. ID Nr 6 lub mający tę sekwencję z co najmniej jedną z następujących zmian:
Ile w pozycji 609 jest zastąpiona przez Leu,
Ala w pozycji 618 jest zastąpiona przez Glu,
Ser w pozycji 620 jest zastąpiona przez Tyr lub toksyna podobna w co najmniej 85% do niej, która ma podobną aktywność owadobójczą lub podobną zdolność wiązania w błonie jelita środkowego owada.
2. Fragment hybrydowej toksyny Bacillus thuringiensis mający sekwencję aminokwasów od aminokwasu 1 do aminokwasu 627, określoną w Sek. ID Nr 8 lub mający tę sekwencję z co najmniej jedną z następujących zmian:
Ile w pozycji 617 jest zastąpiona przez Leu,
Ala w pozycji 625 jest zastąpiona przez Glu,
Ser w pozycji 627 jest zastąpiona przez Tyr lub toksyna podobna w co najmniej 85% do nich, która ma podobną aktywność owadobójczą lub podobną zdolność wiązania w błonie jelita środkowego owada.
3. Rekombinant DNA kodujący fragment hybrydowej toksyny Bacillus thuringiensis mający sekwencję aminokwasów od aminokwasu 1 do aminokwasu 620 określoną w Sek ID Nr 6 lub mający tę sekwencję z co najmniej jedną z następujących zmian’
Ile w pozycji 609 jest zastąpiona przez Leu,
Ala w pozycji 618 jest zastąpiona przez Glu,
Ser w pozycji 620 jest zastąpiona przez Tyr lub kodujący fragment hybrydowej toksyny Bacillus thuringiensis mający sekwencję aminokwasów od aminokwasu około 1 do aminokwasu około 627 określoną w Sek. ID Nr 8 lub mający tę sekwencję z co najmniej jedną z następujących zmian:
Ile w pozycji 617 jest zastąpiona przez Leu,
Ala w pozycji 625 jest zastąpiona przez Glu,
Ser w pozycji 627 jest zastąpiona przez Tyr lub toksynę podobną w co najmniej 85% do nich, która ma podobną aktywność owadobójczą lub podobną zdolność wiązania w błonie jelita środkowego owada.
4. Rekombinant DNA według zastrz. 3, znamienny tym, ze zawiera sekwencję od nukleotydu 1 do nukleotydu 1860 określoną w Sek. ID Nr 5 lub sekwencję od nukleotydu 1 do nukleotydu 1881 w Sek ID Nr 7.
* * *
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB939318207A GB9318207D0 (en) | 1993-09-02 | 1993-09-02 | Improvements in or relating to organic compounds |
PCT/EP1994/002909 WO1995006730A1 (en) | 1993-09-02 | 1994-09-01 | Hybrid toxin |
Publications (2)
Publication Number | Publication Date |
---|---|
PL313317A1 PL313317A1 (en) | 1996-06-24 |
PL181408B1 true PL181408B1 (pl) | 2001-07-31 |
Family
ID=10741404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PL94313317A PL181408B1 (pl) | 1993-09-02 | 1994-09-01 | Fragment hybrydowej toksyny Bacillus thuringiensis i rekombinant DNA kodujacy fragment hybrydowej toksyny Bacillus thuringiensis PL PL PL PL PL PL PL PL PL |
Country Status (18)
Country | Link |
---|---|
US (2) | US5736131A (pl) |
EP (1) | EP0719335B1 (pl) |
JP (1) | JPH09502343A (pl) |
KR (1) | KR100360918B1 (pl) |
AT (1) | ATE329033T1 (pl) |
AU (1) | AU691522B2 (pl) |
BR (1) | BR9407377A (pl) |
CA (1) | CA2168011C (pl) |
DE (1) | DE69434758T2 (pl) |
ES (1) | ES2262136T3 (pl) |
GB (1) | GB9318207D0 (pl) |
IL (1) | IL110829A (pl) |
PL (1) | PL181408B1 (pl) |
RU (1) | RU2210593C2 (pl) |
TW (1) | TW430669B (pl) |
UA (1) | UA57698C2 (pl) |
WO (1) | WO1995006730A1 (pl) |
ZA (1) | ZA946770B (pl) |
Families Citing this family (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0413019B1 (en) * | 1989-02-24 | 2001-10-04 | Monsanto Technology LLC | Synthetic plant genes and method for preparation |
GB9318207D0 (en) | 1993-09-02 | 1993-10-20 | Sandoz Ltd | Improvements in or relating to organic compounds |
US6780408B1 (en) | 1993-09-02 | 2004-08-24 | Syngenta Participations Ag | Genes encoding hybrid bacillus thuringiensis toxins |
US5593881A (en) * | 1994-05-06 | 1997-01-14 | Mycogen Corporation | Bacillus thuringiensis delta-endotoxin |
US6063756A (en) | 1996-09-24 | 2000-05-16 | Monsanto Company | Bacillus thuringiensis cryET33 and cryET34 compositions and uses therefor |
CA2272843C (en) * | 1996-11-20 | 2009-11-10 | Ecogen, Inc. | Broad-spectrum delta-endotoxins |
US6713063B1 (en) | 1996-11-20 | 2004-03-30 | Monsanto Technology, Llc | Broad-spectrum δ-endotoxins |
US6017534A (en) | 1996-11-20 | 2000-01-25 | Ecogen, Inc. | Hybrid Bacillus thuringiensis δ-endotoxins with novel broad-spectrum insecticidal activity |
US5942664A (en) * | 1996-11-27 | 1999-08-24 | Ecogen, Inc. | Bacillus thuringiensis Cry1C compositions toxic to lepidopteran insects and methods for making Cry1C mutants |
US6121436A (en) * | 1996-12-13 | 2000-09-19 | Monsanto Company | Antifungal polypeptide and methods for controlling plant pathogenic fungi |
EP1555319A3 (en) * | 1997-10-20 | 2006-03-15 | GTC Biotherapeutics, Inc. | Modified nucleic acid sequences and method to increasing mRNA levels and protein expression in cell systems |
US6218188B1 (en) | 1997-11-12 | 2001-04-17 | Mycogen Corporation | Plant-optimized genes encoding pesticidal toxins |
AU774176B2 (en) * | 1997-11-12 | 2004-06-17 | Mycogen Corporation | Plant-optimised genes encoding pesticidal toxins |
US6121521A (en) * | 1998-04-01 | 2000-09-19 | Novartis Ag | Chimeric insecticidal protein and DNA coding therefor |
EP1099760A1 (en) * | 1999-11-09 | 2001-05-16 | Centrum Voor Plantenveredelings- En Reproduktieonderzoek (Cpro) | Bacillus thuringiensis Cry1Ia-Cry1Ba hybrid toxins |
ES2243543T3 (es) * | 2000-08-25 | 2005-12-01 | Syngenta Participations Ag | Hibridos de proteinas cristalinas de bacillus thurigiensis. |
CA2446215A1 (en) * | 2001-05-04 | 2002-11-14 | North Carolina State University | Polymer conjugates of insecticidal peptides or nucleic acids and methods of use thereof |
US20030108585A1 (en) * | 2001-05-04 | 2003-06-12 | Roe R. Michael | Polymer conjugates of insecticidal peptides or nucleic acids or insecticides and methods of use thereof |
US20060009409A1 (en) | 2002-02-01 | 2006-01-12 | Woolf Tod M | Double-stranded oligonucleotides |
WO2003064621A2 (en) * | 2002-02-01 | 2003-08-07 | Ambion, Inc. | HIGH POTENCY siRNAS FOR REDUCING THE EXPRESSION OF TARGET GENES |
ATE508188T1 (de) * | 2002-02-01 | 2011-05-15 | Life Technologies Corp | Oligonukleotid-zusammensetzungen mit verbesserter wirksamkeit |
US7557186B2 (en) * | 2002-03-27 | 2009-07-07 | Council Of Scientific & Industrial Research | Chimeric CrylE δ endotoxin and methods of controlling insects |
US7053266B2 (en) * | 2002-03-27 | 2006-05-30 | Council Of Scientfic And Industrial Research | Chimeric cry1E δendotoxin and methods of controlling insects |
US20040029275A1 (en) * | 2002-08-10 | 2004-02-12 | David Brown | Methods and compositions for reducing target gene expression using cocktails of siRNAs or constructs expressing siRNAs |
US7393922B2 (en) * | 2003-08-29 | 2008-07-01 | The Ohio State University Research Foundation | Insecticidal Cry4Ba proteins with enhanced toxicity |
CA2771677A1 (en) | 2005-08-31 | 2007-03-08 | Monsanto Technology Llc | Nucleotide sequences encoding insecticidal proteins |
CN100510081C (zh) | 2005-10-17 | 2009-07-08 | 华中农业大学 | 苏云金芽胞杆菌的杀虫晶体蛋白基因cry7Bal |
AU2007228981B2 (en) * | 2006-03-21 | 2012-10-04 | BASF Agricultural Solutions Seed US LLC | Novel genes encoding insecticidal proteins |
EP2021476B1 (en) | 2006-05-26 | 2014-07-09 | Monsanto Technology, LLC | Corn plant and seed corresponding to transgenic event mon89034 and methods for detection and use thereof |
US9522937B2 (en) | 2007-03-28 | 2016-12-20 | Syngenta Participations Ag | Insecticidal proteins |
BRPI0809352B1 (pt) * | 2007-03-28 | 2017-03-28 | Syngenta Participations Ag | proteína inseticida híbrida projetada, molécula de ácido nucleico codificadora da dita proteína,cassete de expressão, vetor recombinante, célula hospedeira transgênica, composição inseticida, métodos de produção da dita proteína e de uma planta transgênica resistente a insetos e método de controle de insetos". |
WO2008145406A1 (en) * | 2007-06-01 | 2008-12-04 | Bayer Bioscience N.V. | Novel genes encoding insecticidal proteins |
MX348698B (es) | 2008-12-16 | 2017-06-26 | Syngenta Participations Ag | Evento 5307 del maiz. |
AU2010221135A1 (en) | 2009-03-05 | 2011-09-29 | Metabolix, Inc. | Propagation of transgenic plants |
DK2419441T3 (en) | 2009-04-17 | 2015-04-27 | Dow Agrosciences Llc | Insecticidal dig-3-cry toxins |
BR112012009381A2 (pt) | 2009-10-02 | 2017-03-01 | Syngenta Participations Ag | "proteínas inseticidas" |
KR20120115316A (ko) * | 2009-12-16 | 2012-10-17 | 다우 아그로사이언시즈 엘엘씨 | 밤나방 및 유럽 옥수수 천공충을 방제하기 위한 살곤충성 단백질 조합, 및 곤충 내성 관리 방법 |
JP5969921B2 (ja) * | 2009-12-16 | 2016-08-17 | ダウ アグロサイエンシィズ エルエルシー | 抵抗性昆虫の対応のためのCry1Beと組み合わせたCry1Daの使用 |
AR079500A1 (es) * | 2009-12-16 | 2012-02-01 | Dow Agrosciences Llc | Uso combinado de proteinas cry1ca y cry1fa para el manejo de la resistencia de insectos |
WO2011084622A1 (en) * | 2009-12-16 | 2011-07-14 | Dow Agrosciences Llc | Combined use of cry1ca and cry1ab proteins for insect resistance management |
JP5907892B2 (ja) * | 2009-12-16 | 2016-04-26 | ダウ アグロサイエンシィズ エルエルシー | 抵抗性昆虫の対応のためのCry1Beと組み合わせたCry1Abの使用 |
US20120317682A1 (en) * | 2009-12-16 | 2012-12-13 | Dow Agrosciences Llc | Combined use of vip3ab and cry1fa for management of resistant insects |
AR079505A1 (es) * | 2009-12-16 | 2012-02-01 | Dow Agrosciences Llc | Uso de cry1da en combinacion con cry1ca para el manejo de insectos resistentes |
NZ601096A (en) * | 2009-12-16 | 2014-10-31 | Dow Agrosciences Llc | Combined use of cry1da and cry1fa proteins for insect resistance management |
CA2782554A1 (en) | 2009-12-16 | 2011-07-14 | Dow Agrosciences Llc | Modified cry1ca insecticidal cry proteins |
CA3049609C (en) * | 2010-02-18 | 2024-02-13 | Athenix Corp. | Axmi221z, axmi222z, axmi223z, axmi224z, and axmi225z delta-endotoxin genes and methods for their use |
US8735560B1 (en) * | 2010-03-02 | 2014-05-27 | Monsanto Technology Llc | Multiple domain lepidopteran active toxin proteins |
WO2011133892A1 (en) * | 2010-04-23 | 2011-10-27 | Dow Agrosciences Llc | Combinations including cry34ab/35ab and cry3ba proteins to prevent development of resistance in corn rootworms (diabrotica spp.) |
US9234208B1 (en) | 2010-05-10 | 2016-01-12 | Dow Agrosciences Llc | DIG-13 insecticidal cry toxins |
UA111592C2 (uk) * | 2010-07-07 | 2016-05-25 | Сінгента Партісіпейшнс Аг | Спосіб контролю над твердокрилими комахами-шкідниками |
WO2012083219A1 (en) * | 2010-12-16 | 2012-06-21 | Dow Agrosciences Llc | Combined use of vip3ab and cry1ab for management of resistance insects |
WO2012131619A1 (en) * | 2011-03-30 | 2012-10-04 | Metahelix Life Sciences Limited | A nucleotide sequence, expression cassette, transgenic events, cells and methods thereof |
US10119149B2 (en) | 2011-08-05 | 2018-11-06 | Dow Agrosciences Llc | Use of DIG3 insecticidal crystal protein in combination with cry1Ab for management of resistance in european cornborer |
MX2014001456A (es) * | 2011-08-05 | 2014-02-27 | Dow Agrosciences Llc | Uso de proteina cristalina insecticida dig3 en combinacion con cry1ab. |
CN103923204B (zh) * | 2014-04-04 | 2016-06-08 | 湖北省生物农药工程研究中心 | 杀南方根结线虫的苏云金芽胞杆菌的活性物质及其应用 |
SG10201913870RA (en) | 2014-10-16 | 2020-03-30 | Monsanto Technology Llc | Novel chimeric insecticidal proteins toxic or inhibitory to lepidopteran pests |
US10487123B2 (en) | 2014-10-16 | 2019-11-26 | Monsanto Technology Llc | Chimeric insecticidal proteins toxic or inhibitory to lepidopteran pests |
TW201615095A (zh) | 2014-10-31 | 2016-05-01 | 陶氏農業科學公司 | Dig-303殺蟲cry毒素 |
CN114213510A (zh) | 2014-12-30 | 2022-03-22 | 美国陶氏益农公司 | 可用于控制昆虫害虫的修饰的Cry1Ca毒素 |
CN109952024B (zh) * | 2016-10-10 | 2023-11-03 | 孟山都技术公司 | 新型昆虫抑制蛋白 |
US11692013B2 (en) | 2016-10-19 | 2023-07-04 | Pioneer Hi-Bred International, Inc. | Broad spectrum insecticidal polypeptide against lepidopteran pests and methods of use thereof |
CA3037371A1 (en) * | 2016-10-19 | 2018-04-26 | Pioneer Hi-Bred International, Inc. | Broad spectrum insecticidal polypeptide against lepidopteran pests and methods of use thereof |
CN111465406A (zh) | 2017-12-15 | 2020-07-28 | 先正达参股股份有限公司 | 用于检测靶蛋白的非抗体配体 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1341092C (en) | 1985-12-12 | 2000-09-05 | David L. Edwards | Process for altering the host range of bacillus thuringiensis toxins, and novel toxins produced thereby |
IT1231157B (it) * | 1989-07-20 | 1991-11-19 | Crc Ricerca Chim | Nuovi geni ibridi funzionali di bacillus thuringiensis ottenuti mediante ricombinazione in vivo. |
HU220773B1 (hu) * | 1990-01-22 | 2002-05-28 | Dekalb Genetics Corporation | Eljárás termő transzgenikus kukoricanövények előállítására |
GB9318207D0 (en) | 1993-09-02 | 1993-10-20 | Sandoz Ltd | Improvements in or relating to organic compounds |
US5593881A (en) * | 1994-05-06 | 1997-01-14 | Mycogen Corporation | Bacillus thuringiensis delta-endotoxin |
US5527883A (en) | 1994-05-06 | 1996-06-18 | Mycogen Corporation | Delta-endotoxin expression in pseudomonas fluorescens |
US5508264A (en) | 1994-12-06 | 1996-04-16 | Mycogen Corporation | Pesticidal compositions |
-
1993
- 1993-09-02 GB GB939318207A patent/GB9318207D0/en active Pending
-
1994
- 1994-01-09 UA UA96010346A patent/UA57698C2/uk unknown
- 1994-08-31 IL IL110829A patent/IL110829A/en not_active IP Right Cessation
- 1994-09-01 AU AU76932/94A patent/AU691522B2/en not_active Expired
- 1994-09-01 JP JP7507955A patent/JPH09502343A/ja active Pending
- 1994-09-01 ES ES94927535T patent/ES2262136T3/es not_active Expired - Lifetime
- 1994-09-01 PL PL94313317A patent/PL181408B1/pl not_active IP Right Cessation
- 1994-09-01 RU RU96107260/13A patent/RU2210593C2/ru active
- 1994-09-01 WO PCT/EP1994/002909 patent/WO1995006730A1/en active IP Right Grant
- 1994-09-01 US US08/602,737 patent/US5736131A/en not_active Expired - Lifetime
- 1994-09-01 DE DE69434758T patent/DE69434758T2/de not_active Expired - Lifetime
- 1994-09-01 AT AT94927535T patent/ATE329033T1/de not_active IP Right Cessation
- 1994-09-01 BR BR9407377A patent/BR9407377A/pt not_active Application Discontinuation
- 1994-09-01 EP EP94927535A patent/EP0719335B1/en not_active Expired - Lifetime
- 1994-09-01 CA CA002168011A patent/CA2168011C/en not_active Expired - Lifetime
- 1994-09-01 KR KR1019960700973A patent/KR100360918B1/ko not_active IP Right Cessation
- 1994-09-02 ZA ZA946770A patent/ZA946770B/xx unknown
- 1994-09-06 TW TW083108194A patent/TW430669B/zh not_active IP Right Cessation
-
1997
- 1997-12-31 US US09/001,982 patent/US6204246B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
IL110829A0 (en) | 1994-11-11 |
PL313317A1 (en) | 1996-06-24 |
DE69434758T2 (de) | 2006-11-09 |
RU2210593C2 (ru) | 2003-08-20 |
DE69434758D1 (de) | 2006-07-20 |
UA57698C2 (uk) | 2003-07-15 |
ZA946770B (en) | 1996-03-04 |
BR9407377A (pt) | 1996-07-16 |
CA2168011C (en) | 2007-11-06 |
CA2168011A1 (en) | 1995-03-09 |
EP0719335A1 (en) | 1996-07-03 |
EP0719335B1 (en) | 2006-06-07 |
TW430669B (en) | 2001-04-21 |
KR100360918B1 (ko) | 2005-01-15 |
ES2262136T3 (es) | 2006-11-16 |
GB9318207D0 (en) | 1993-10-20 |
WO1995006730A1 (en) | 1995-03-09 |
AU691522B2 (en) | 1998-05-21 |
US6204246B1 (en) | 2001-03-20 |
ATE329033T1 (de) | 2006-06-15 |
IL110829A (en) | 2006-08-20 |
JPH09502343A (ja) | 1997-03-11 |
US5736131A (en) | 1998-04-07 |
AU7693294A (en) | 1995-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
PL181408B1 (pl) | Fragment hybrydowej toksyny Bacillus thuringiensis i rekombinant DNA kodujacy fragment hybrydowej toksyny Bacillus thuringiensis PL PL PL PL PL PL PL PL PL | |
US5932209A (en) | Bacillus thuringiensis δ-endotoxin | |
EP0758385B1 (en) | Chimeric delta-endotoxin expression in pseudomonas fluorescens | |
US8796026B2 (en) | Insecticidal proteins secreted from Bacillus thuringiensis and uses therefor | |
US5338544A (en) | CryIIB protein, insecticidal compositions and methods of use thereof | |
CA1341388C (en) | Hybrid pesticidal toxins | |
EP0871736B1 (en) | PESTICIDAL COMPOSITION COMPRISING CryIF CHIMERIC AND CryIA(c) CHIMERIC BACILLUS THURINGIENSIS DELTA-ENDOTOXIN | |
WO1999024581A2 (en) | Plant-optimized genes encoding pesticidal toxins | |
CA2117270A1 (en) | Use of bacillus thuringiensis isolates for controlling pests in the family aphididae | |
US6780408B1 (en) | Genes encoding hybrid bacillus thuringiensis toxins | |
AU686213B2 (en) | Materials and methods for the control of calliphoridae pests | |
US5731194A (en) | Insecticide protein and gene | |
US6051556A (en) | Hybrid pesticidal toxins | |
JPH08510637A (ja) | バチルス・チュリンゲンシスの新菌株及びその殺虫性タンパク質 | |
Je et al. | Expression of a Recombinant Bacillus thuringiensis $\delta $-Endotoxin Fused with Enhanced Green Fluorescent Protein in Escherichia coli |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Decisions on the lapse of the protection rights |
Effective date: 20060901 |