JP2023162366A - エラストマータンパク質 - Google Patents
エラストマータンパク質 Download PDFInfo
- Publication number
- JP2023162366A JP2023162366A JP2023140621A JP2023140621A JP2023162366A JP 2023162366 A JP2023162366 A JP 2023162366A JP 2023140621 A JP2023140621 A JP 2023140621A JP 2023140621 A JP2023140621 A JP 2023140621A JP 2023162366 A JP2023162366 A JP 2023162366A
- Authority
- JP
- Japan
- Prior art keywords
- gly
- ser
- pro
- asn
- tyr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 99
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 95
- 108010019116 resilin Proteins 0.000 claims abstract description 522
- 229920002781 resilin Polymers 0.000 claims abstract description 467
- 239000013598 vector Substances 0.000 claims abstract description 100
- 238000000034 method Methods 0.000 claims abstract description 97
- 239000000203 mixture Substances 0.000 claims abstract description 85
- 108091026890 Coding region Proteins 0.000 claims abstract description 68
- 238000012258 culturing Methods 0.000 claims abstract description 9
- 210000004027 cell Anatomy 0.000 claims description 271
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 67
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 66
- 239000008188 pellet Substances 0.000 claims description 61
- 229920001184 polypeptide Polymers 0.000 claims description 55
- 238000000855 fermentation Methods 0.000 claims description 45
- 230000004151 fermentation Effects 0.000 claims description 45
- 238000004132 cross linking Methods 0.000 claims description 41
- 239000000047 product Substances 0.000 claims description 30
- 230000028327 secretion Effects 0.000 claims description 25
- 125000000539 amino acid group Chemical group 0.000 claims description 20
- 239000012134 supernatant fraction Substances 0.000 claims description 18
- 210000005253 yeast cell Anatomy 0.000 claims description 18
- 241000256844 Apis mellifera Species 0.000 claims description 16
- 241000235648 Pichia Species 0.000 claims description 16
- 239000001963 growth medium Substances 0.000 claims description 14
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 13
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 13
- 241000258924 Ctenocephalides felis Species 0.000 claims description 10
- SBKVPJHMSUXZTA-MEJXFZFPSA-N (2S)-2-[[(2S)-2-[[(2S)-1-[(2S)-5-amino-2-[[2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-3-(1H-indol-3-yl)propanoyl]amino]-3-(1H-imidazol-4-yl)propanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-4-methylpentanoyl]amino]-5-oxopentanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]acetyl]amino]-5-oxopentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylsulfanylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 SBKVPJHMSUXZTA-MEJXFZFPSA-N 0.000 claims description 9
- 108010038049 Mating Factor Proteins 0.000 claims description 9
- 241000255588 Tephritidae Species 0.000 claims description 9
- 230000002255 enzymatic effect Effects 0.000 claims description 9
- 241000235015 Yarrowia lipolytica Species 0.000 claims description 8
- 241000253994 Acyrthosiphon pisum Species 0.000 claims description 7
- 241000256182 Anopheles gambiae Species 0.000 claims description 7
- 241000726102 Atta cephalotes Species 0.000 claims description 7
- 241000320412 Ogataea angusta Species 0.000 claims description 7
- 241001452677 Ogataea methanolica Species 0.000 claims description 7
- 241000255317 Drosophila sechellia Species 0.000 claims description 6
- 241000257323 Glossina morsitans Species 0.000 claims description 6
- 241001138401 Kluyveromyces lactis Species 0.000 claims description 6
- 241000254113 Tribolium castaneum Species 0.000 claims description 6
- 241001136529 Zeugodacus cucurbitae Species 0.000 claims description 6
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 230000003248 secreting effect Effects 0.000 claims description 6
- 238000006467 substitution reaction Methods 0.000 claims description 6
- 241001476404 Acromyrmex echinatior Species 0.000 claims description 5
- 241000726128 Aeshna Species 0.000 claims description 5
- 241000167896 Anopheles darlingi Species 0.000 claims description 5
- 229920002101 Chitin Polymers 0.000 claims description 5
- 241000257232 Haematobia irritans Species 0.000 claims description 5
- 241000256810 Nasonia vitripennis Species 0.000 claims description 5
- 230000001939 inductive effect Effects 0.000 claims description 5
- 241000894007 species Species 0.000 claims description 5
- 241001415255 Bombus terrestris Species 0.000 claims description 4
- 241000255604 Drosophila erecta Species 0.000 claims description 4
- 241000255352 Drosophila virilis Species 0.000 claims description 4
- 241000255634 Lutzomyia longipalpis Species 0.000 claims description 4
- 241000517306 Pediculus humanus corporis Species 0.000 claims description 4
- 241000256118 Aedes aegypti Species 0.000 claims description 3
- 241000680806 Blastobotrys adeninivorans Species 0.000 claims description 3
- 241000254173 Coleoptera Species 0.000 claims description 3
- 241001099157 Komagataella Species 0.000 claims description 3
- 241000517307 Pediculus humanus Species 0.000 claims description 3
- 108010089430 Phosphoproteins Proteins 0.000 claims description 3
- 102000007982 Phosphoproteins Human genes 0.000 claims description 3
- 241001097374 Pselliopus cinctus Species 0.000 claims description 3
- 241000722249 Rhodnius prolixus Species 0.000 claims description 3
- 241000311449 Scheffersomyces Species 0.000 claims description 3
- 241000517830 Solenopsis geminata Species 0.000 claims description 3
- 241000256618 Trichogramma Species 0.000 claims description 3
- 241000256619 Trichogramma pretiosum Species 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 239000011347 resin Substances 0.000 claims description 3
- 229920005989 resin Polymers 0.000 claims description 3
- 239000004576 sand Substances 0.000 claims description 3
- 241001425390 Aphis fabae Species 0.000 claims description 2
- 241000736128 Solenopsis invicta Species 0.000 claims description 2
- 244000075511 Sterculia apetala Species 0.000 claims description 2
- 235000015442 Sterculia apetala Nutrition 0.000 claims description 2
- 230000014509 gene expression Effects 0.000 abstract description 12
- 238000000746 purification Methods 0.000 abstract description 12
- 238000004519 manufacturing process Methods 0.000 abstract description 9
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 292
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 205
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 156
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 122
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 99
- 108010079364 N-glycylalanine Proteins 0.000 description 98
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 95
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 93
- 108010031719 prolyl-serine Proteins 0.000 description 90
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 88
- 235000018102 proteins Nutrition 0.000 description 86
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 79
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 71
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 65
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 64
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 64
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 63
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 61
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 61
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 61
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 59
- 108010078144 glutaminyl-glycine Proteins 0.000 description 57
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 54
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 51
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 50
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 49
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 48
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 46
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 45
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 42
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 42
- 108010029020 prolylglycine Proteins 0.000 description 42
- 239000006228 supernatant Substances 0.000 description 41
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 40
- 235000001014 amino acid Nutrition 0.000 description 39
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 37
- 229940024606 amino acid Drugs 0.000 description 37
- 150000001413 amino acids Chemical class 0.000 description 35
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 34
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 33
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 33
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 32
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 31
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 30
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 30
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 28
- 229920001971 elastomer Polymers 0.000 description 28
- HXUVTXPOZRFMOY-NSHDSACASA-N 2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 HXUVTXPOZRFMOY-NSHDSACASA-N 0.000 description 27
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 27
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 26
- 108010077515 glycylproline Proteins 0.000 description 26
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 26
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 25
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 24
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 24
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 24
- 230000006835 compression Effects 0.000 description 24
- 238000007906 compression Methods 0.000 description 24
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 24
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 23
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 23
- 239000000806 elastomer Substances 0.000 description 23
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 23
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 22
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 21
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 21
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 20
- 150000007523 nucleic acids Chemical class 0.000 description 20
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 19
- 108010044940 alanylglutamine Proteins 0.000 description 19
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 18
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 18
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 18
- 108020004707 nucleic acids Proteins 0.000 description 18
- 102000039446 nucleic acids Human genes 0.000 description 18
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 17
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 17
- 108010047857 aspartylglycine Proteins 0.000 description 17
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 17
- 108010087823 glycyltyrosine Proteins 0.000 description 17
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 16
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 16
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 16
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 16
- 108010047495 alanylglycine Proteins 0.000 description 16
- 108010087924 alanylproline Proteins 0.000 description 16
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 16
- 239000000463 material Substances 0.000 description 16
- 241000235058 Komagataella pastoris Species 0.000 description 15
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 15
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 15
- 108010010147 glycylglutamine Proteins 0.000 description 15
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 14
- 239000004471 Glycine Substances 0.000 description 14
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 14
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 14
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 14
- 108010060035 arginylproline Proteins 0.000 description 14
- 108010050848 glycylleucine Proteins 0.000 description 14
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 13
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 13
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 13
- 108010081551 glycylphenylalanine Proteins 0.000 description 13
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 12
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 12
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 12
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 12
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 12
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 12
- 239000000499 gel Substances 0.000 description 12
- 238000005259 measurement Methods 0.000 description 12
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 11
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 11
- 108010047562 NGR peptide Proteins 0.000 description 11
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 11
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 11
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 11
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 11
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 11
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 11
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 10
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 10
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 10
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 10
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 10
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 10
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 10
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 10
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 10
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 10
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 10
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 10
- 239000002953 phosphate buffered saline Substances 0.000 description 10
- XJFPXLWGZWAWRQ-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O XJFPXLWGZWAWRQ-UHFFFAOYSA-N 0.000 description 9
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 9
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 9
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 9
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 9
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 9
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 9
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 9
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 9
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 9
- 108010038633 aspartylglutamate Proteins 0.000 description 9
- 238000005119 centrifugation Methods 0.000 description 9
- 238000005354 coacervation Methods 0.000 description 9
- ZJYYHGLJYGJLLN-UHFFFAOYSA-N guanidinium thiocyanate Chemical compound SC#N.NC(N)=N ZJYYHGLJYGJLLN-UHFFFAOYSA-N 0.000 description 9
- 239000007787 solid Substances 0.000 description 9
- PEZMQPADLFXCJJ-ZETCQYMHSA-N 2-[[2-[[(2s)-1-(2-aminoacetyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]acetic acid Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)NCC(O)=O PEZMQPADLFXCJJ-ZETCQYMHSA-N 0.000 description 8
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 8
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 8
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 8
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 8
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 8
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 8
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 8
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 8
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 8
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 8
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 8
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 8
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 8
- 125000003275 alpha amino acid group Chemical group 0.000 description 8
- 108010043293 glycyl-prolyl-glycyl-glycine Proteins 0.000 description 8
- 108010037850 glycylvaline Proteins 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 125000003729 nucleotide group Chemical group 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- XWTNPSHCJMZAHQ-QMMMGPOBSA-N 2-[[2-[[2-[[(2s)-2-amino-4-methylpentanoyl]amino]acetyl]amino]acetyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(=O)NCC(O)=O XWTNPSHCJMZAHQ-QMMMGPOBSA-N 0.000 description 7
- 241000255601 Drosophila melanogaster Species 0.000 description 7
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 7
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 7
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 7
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 7
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 7
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 7
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 7
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 7
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 7
- 108010089804 glycyl-threonine Proteins 0.000 description 7
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 7
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 7
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 108010051242 phenylalanylserine Proteins 0.000 description 7
- 108010026333 seryl-proline Proteins 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 230000008685 targeting Effects 0.000 description 7
- 108010061238 threonyl-glycine Proteins 0.000 description 7
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 6
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 6
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 6
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 6
- 108091035707 Consensus sequence Proteins 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 6
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 6
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 6
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 6
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 6
- GNPVTZJUUBPZKW-WDSKDSINSA-N Gly-Gln-Ser Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GNPVTZJUUBPZKW-WDSKDSINSA-N 0.000 description 6
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 6
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 6
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 6
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 6
- 241000235070 Saccharomyces Species 0.000 description 6
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 6
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 6
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 6
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 6
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 6
- 108010062796 arginyllysine Proteins 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 6
- 108010015792 glycyllysine Proteins 0.000 description 6
- 238000005191 phase separation Methods 0.000 description 6
- 238000007655 standard test method Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 5
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 5
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 5
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 5
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 5
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 5
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 5
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 5
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 5
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 5
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 5
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 5
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 5
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 5
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 5
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 5
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 5
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 5
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 5
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 5
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 5
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 5
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 5
- 244000057717 Streptococcus lactis Species 0.000 description 5
- 235000014897 Streptococcus lactis Nutrition 0.000 description 5
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 5
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 5
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 5
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 5
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 5
- 235000011130 ammonium sulphate Nutrition 0.000 description 5
- 235000009582 asparagine Nutrition 0.000 description 5
- 229960001230 asparagine Drugs 0.000 description 5
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 5
- 108010054666 glycyl-leucyl-glycyl-glycine Proteins 0.000 description 5
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- -1 poly(NANP) Polymers 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 239000005060 rubber Substances 0.000 description 5
- 230000001131 transforming effect Effects 0.000 description 5
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 5
- OTEWWRBKGONZBW-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]-4-methylpentanoyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NC(CC(C)C)C(=O)NCC(=O)NCC(O)=O OTEWWRBKGONZBW-UHFFFAOYSA-N 0.000 description 4
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 4
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 4
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 4
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 4
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 4
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 4
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 4
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 4
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 4
- 206010059866 Drug resistance Diseases 0.000 description 4
- 238000002965 ELISA Methods 0.000 description 4
- JOYRKODLDBILNP-UHFFFAOYSA-N Ethyl urethane Chemical compound CCOC(N)=O JOYRKODLDBILNP-UHFFFAOYSA-N 0.000 description 4
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 4
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 4
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 4
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 4
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 4
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 4
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 4
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 4
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 4
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 4
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 4
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 4
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 4
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 4
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 4
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 4
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 4
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 4
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 4
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 4
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- 239000004202 carbamide Substances 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 238000001816 cooling Methods 0.000 description 4
- 239000007857 degradation product Substances 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 108010009297 diglycyl-histidine Proteins 0.000 description 4
- 239000006260 foam Substances 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 108010048818 seryl-histidine Proteins 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical group OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- DLZKEQQWXODGGZ-KCJUWKMLSA-N 2-[[(2r)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]propanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KCJUWKMLSA-N 0.000 description 3
- UKPGFKQVRITNFM-KBPBESRZSA-N 2-[[2-[[(2s)-1-[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carbonyl]amino]acetyl]amino]acetic acid Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)NCC(O)=O)C1=CC=C(O)C=C1 UKPGFKQVRITNFM-KBPBESRZSA-N 0.000 description 3
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 3
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 3
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 3
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 3
- 241000256186 Anopheles <genus> Species 0.000 description 3
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 3
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 3
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 3
- 240000002900 Arthrospira platensis Species 0.000 description 3
- 235000016425 Arthrospira platensis Nutrition 0.000 description 3
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 3
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 3
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 3
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 3
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 3
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 3
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 3
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 3
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 3
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 3
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 3
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 3
- RXJFSLQVMGYQEL-IHRRRGAJSA-N Glu-Tyr-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 RXJFSLQVMGYQEL-IHRRRGAJSA-N 0.000 description 3
- 102000005720 Glutathione transferase Human genes 0.000 description 3
- 108010070675 Glutathione transferase Proteins 0.000 description 3
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 3
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 3
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 3
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 3
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 3
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 3
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 3
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 3
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 3
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 3
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 3
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 3
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 3
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 3
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 3
- XEXSSIBQYNKFBX-KBPBESRZSA-N Phe-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 XEXSSIBQYNKFBX-KBPBESRZSA-N 0.000 description 3
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 3
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 3
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 3
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- 241000235403 Rhizomucor miehei Species 0.000 description 3
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 3
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 3
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 3
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 3
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 3
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 3
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 3
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 3
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 3
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 3
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 3
- HDSKHCBAVVWPCQ-FHWLQOOXSA-N Tyr-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HDSKHCBAVVWPCQ-FHWLQOOXSA-N 0.000 description 3
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 3
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 3
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 3
- 238000013019 agitation Methods 0.000 description 3
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 3
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 3
- 238000007373 indentation Methods 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 239000004636 vulcanized rubber Substances 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 2
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 2
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 2
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 2
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 2
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 2
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 2
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- 102100036826 Aldehyde oxidase Human genes 0.000 description 2
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 2
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 2
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 2
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 2
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 2
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 2
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 2
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 2
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 2
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 2
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 2
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 2
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 2
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 2
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 2
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 2
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 2
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 2
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 2
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 2
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 2
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 108700036993 Drosophila resilin Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 2
- XOKGKOQWADCLFQ-GARJFASQSA-N Gln-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XOKGKOQWADCLFQ-GARJFASQSA-N 0.000 description 2
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 2
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 2
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 2
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 2
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 2
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 2
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 2
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 2
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 2
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 2
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 2
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 2
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 2
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 2
- DUYYPIRFTLOAJQ-YUMQZZPRSA-N Gly-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN DUYYPIRFTLOAJQ-YUMQZZPRSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 2
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 2
- LLXVQPKEQQCISF-YUMQZZPRSA-N Gly-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN LLXVQPKEQQCISF-YUMQZZPRSA-N 0.000 description 2
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 2
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 2
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 2
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 2
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 2
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 2
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 2
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 2
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 2
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 2
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 2
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 2
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 2
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 101150007068 HSP81-1 gene Proteins 0.000 description 2
- 101150087422 HSP82 gene Proteins 0.000 description 2
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 2
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 2
- DQZCEKQPSOBNMJ-NKIYYHGXSA-N His-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DQZCEKQPSOBNMJ-NKIYYHGXSA-N 0.000 description 2
- 101000928314 Homo sapiens Aldehyde oxidase Proteins 0.000 description 2
- 101150028525 Hsp83 gene Proteins 0.000 description 2
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 description 2
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 2
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 2
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 2
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 2
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 2
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 2
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 2
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 2
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 2
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 2
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 2
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 2
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 2
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 2
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 2
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 2
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 2
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 244000253911 Saccharomyces fragilis Species 0.000 description 2
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 2
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 2
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 2
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 2
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 2
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 2
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 2
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 2
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 2
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 2
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 2
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 102000002933 Thioredoxin Human genes 0.000 description 2
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 2
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 2
- JVTHIXKSVYEWNI-JRQIVUDYSA-N Thr-Asn-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JVTHIXKSVYEWNI-JRQIVUDYSA-N 0.000 description 2
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 2
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 2
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 2
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 2
- FJKXUIJOMUWCDD-FHWLQOOXSA-N Tyr-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N)O FJKXUIJOMUWCDD-FHWLQOOXSA-N 0.000 description 2
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 2
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 2
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 2
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 2
- AAOPYWQQBXHINJ-DZKIICNBSA-N Val-Gln-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AAOPYWQQBXHINJ-DZKIICNBSA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 2
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 2
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 2
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 2
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 238000005299 abrasion Methods 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- ROOXNKNUYICQNP-UHFFFAOYSA-N ammonium peroxydisulfate Substances [NH4+].[NH4+].[O-]S(=O)(=O)OOS([O-])(=O)=O ROOXNKNUYICQNP-UHFFFAOYSA-N 0.000 description 2
- 229910001870 ammonium persulfate Inorganic materials 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 2
- 229940011019 arthrospira platensis Drugs 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 238000004630 atomic force microscopy Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- 229920001400 block copolymer Polymers 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 229930182830 galactose Natural products 0.000 description 2
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 2
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 230000007154 intracellular accumulation Effects 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 108091005573 modified proteins Proteins 0.000 description 2
- 102000035118 modified proteins Human genes 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- MXHCPCSDRGLRER-UHFFFAOYSA-N pentaglycine Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O MXHCPCSDRGLRER-UHFFFAOYSA-N 0.000 description 2
- 239000003208 petroleum Substances 0.000 description 2
- QKFJKGMPGYROCL-UHFFFAOYSA-N phenyl isothiocyanate Chemical compound S=C=NC1=CC=CC=C1 QKFJKGMPGYROCL-UHFFFAOYSA-N 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108700004896 tripeptide FEG Proteins 0.000 description 2
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 239000003190 viscoelastic substance Substances 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- FJPHHBGPPJXISY-KBPBESRZSA-N (2s)-2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CNC(=O)CN)CC1=CC=C(O)C=C1 FJPHHBGPPJXISY-KBPBESRZSA-N 0.000 description 1
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- 108010030147 Abductin Proteins 0.000 description 1
- 240000006409 Acacia auriculiformis Species 0.000 description 1
- 244000235858 Acetobacter xylinum Species 0.000 description 1
- 235000002837 Acetobacter xylinum Nutrition 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 241000187844 Actinoplanes Species 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 1
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 1
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- GMGWOTQMUKYZIE-UBHSHLNASA-N Ala-Pro-Phe Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GMGWOTQMUKYZIE-UBHSHLNASA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 1
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 1
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 241001124076 Aphididae Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 1
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 1
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 1
- 241000620196 Arthrospira maxima Species 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- DNYRZPOWBTYFAF-IHRRRGAJSA-N Asn-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)O DNYRZPOWBTYFAF-IHRRRGAJSA-N 0.000 description 1
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 1
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 1
- HJRBIWRXULGMOA-ACZMJKKPSA-N Asn-Gln-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJRBIWRXULGMOA-ACZMJKKPSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- COUZKSSMBFADSB-AVGNSLFASA-N Asn-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N COUZKSSMBFADSB-AVGNSLFASA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 1
- VXLBDJWTONZHJN-YUMQZZPRSA-N Asn-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N VXLBDJWTONZHJN-YUMQZZPRSA-N 0.000 description 1
- WQLJRNRLHWJIRW-KKUMJFAQSA-N Asn-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)O WQLJRNRLHWJIRW-KKUMJFAQSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 1
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 1
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- FRSGNOZCTWDVFZ-ACZMJKKPSA-N Asp-Asp-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRSGNOZCTWDVFZ-ACZMJKKPSA-N 0.000 description 1
- RSMIHCFQDCVVBR-CIUDSAMLSA-N Asp-Gln-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RSMIHCFQDCVVBR-CIUDSAMLSA-N 0.000 description 1
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 1
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 1
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- 241001513093 Aspergillus awamori Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 241000193755 Bacillus cereus Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- ROFVEXUMMXZLPA-UHFFFAOYSA-N Bipyridyl Chemical compound N1=CC=CC=C1C1=CC=CC=N1 ROFVEXUMMXZLPA-UHFFFAOYSA-N 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 101800001415 Bri23 peptide Proteins 0.000 description 1
- 101800000655 C-terminal peptide Proteins 0.000 description 1
- 102400000107 C-terminal peptide Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 244000206911 Candida holmii Species 0.000 description 1
- 235000002965 Candida holmii Nutrition 0.000 description 1
- 241001123652 Candida versatilis Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241000221756 Cryphonectria parasitica Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000256057 Culex quinquefasciatus Species 0.000 description 1
- 241000235646 Cyberlindnera jadinii Species 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- ODKSFYDXXFIFQN-SCSAIBSYSA-N D-arginine Chemical compound OC(=O)[C@H](N)CCCNC(N)=N ODKSFYDXXFIFQN-SCSAIBSYSA-N 0.000 description 1
- CKLJMWTZIZZHCS-UWTATZPHSA-N D-aspartic acid Chemical compound OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 241000235036 Debaryomyces hansenii Species 0.000 description 1
- 101100166522 Dictyostelium discoideum cycB gene Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 102000016942 Elastin Human genes 0.000 description 1
- 108010014258 Elastin Proteins 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241001465321 Eremothecium Species 0.000 description 1
- 101001091269 Escherichia coli Hygromycin-B 4-O-kinase Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108091006010 FLAG-tagged proteins Proteins 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 241000233732 Fusarium verticillioides Species 0.000 description 1
- 101150094690 GAL1 gene Proteins 0.000 description 1
- 102100028501 Galanin peptides Human genes 0.000 description 1
- 102100028652 Gamma-enolase Human genes 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- RRYLMJWPWBJFPZ-ACZMJKKPSA-N Gln-Asn-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RRYLMJWPWBJFPZ-ACZMJKKPSA-N 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 1
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 1
- JHPFPROFOAJRFN-IHRRRGAJSA-N Gln-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O JHPFPROFOAJRFN-IHRRRGAJSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- NSNUZSPSADIMJQ-WDSKDSINSA-N Gln-Gly-Asp Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NSNUZSPSADIMJQ-WDSKDSINSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 1
- ICDIMQAMJGDHSE-GUBZILKMSA-N Gln-His-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O ICDIMQAMJGDHSE-GUBZILKMSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- DQLVHRFFBQOWFL-JYJNAYRXSA-N Gln-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)O DQLVHRFFBQOWFL-JYJNAYRXSA-N 0.000 description 1
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 1
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 1
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 1
- KVQOVQVGVKDZNW-GUBZILKMSA-N Gln-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KVQOVQVGVKDZNW-GUBZILKMSA-N 0.000 description 1
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- 241000257324 Glossina <genus> Species 0.000 description 1
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 1
- DRLVXRQFROIYTD-GUBZILKMSA-N Glu-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DRLVXRQFROIYTD-GUBZILKMSA-N 0.000 description 1
- UERORLSAFUHDGU-AVGNSLFASA-N Glu-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UERORLSAFUHDGU-AVGNSLFASA-N 0.000 description 1
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 1
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 1
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- 241000589232 Gluconobacter oxydans Species 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 1
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 1
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 1
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 1
- ZKLYPEGLWFVRGF-IUCAKERBSA-N Gly-His-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZKLYPEGLWFVRGF-IUCAKERBSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 1
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 1
- YYXJFBMCOUSYSF-RYUDHWBXSA-N Gly-Phe-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYXJFBMCOUSYSF-RYUDHWBXSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- SCJJPCQUJYPHRZ-BQBZGAKWSA-N Gly-Pro-Asn Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O SCJJPCQUJYPHRZ-BQBZGAKWSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 1
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- NOQPTNXSGNPJNS-YUMQZZPRSA-N His-Asn-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O NOQPTNXSGNPJNS-YUMQZZPRSA-N 0.000 description 1
- ZZLWLWSUIBSMNP-CIUDSAMLSA-N His-Asp-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZZLWLWSUIBSMNP-CIUDSAMLSA-N 0.000 description 1
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 1
- BSVLMPMIXPQNKC-KBPBESRZSA-N His-Phe-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O BSVLMPMIXPQNKC-KBPBESRZSA-N 0.000 description 1
- CWSZWFILCNSNEX-CIUDSAMLSA-N His-Ser-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CWSZWFILCNSNEX-CIUDSAMLSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 1
- 101001058231 Homo sapiens Gamma-enolase Proteins 0.000 description 1
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 description 1
- 101000951145 Homo sapiens Succinate dehydrogenase [ubiquinone] cytochrome b small subunit, mitochondrial Proteins 0.000 description 1
- 101000795074 Homo sapiens Tryptase alpha/beta-1 Proteins 0.000 description 1
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- 241000512931 Kazachstania humilis Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 244000285963 Kluyveromyces fragilis Species 0.000 description 1
- 241001099156 Komagataella phaffii Species 0.000 description 1
- ZQISRDCJNBUVMM-UHFFFAOYSA-N L-Histidinol Natural products OCC(N)CC1=CN=CN1 ZQISRDCJNBUVMM-UHFFFAOYSA-N 0.000 description 1
- ZQISRDCJNBUVMM-YFKPBYRVSA-N L-histidinol Chemical compound OC[C@@H](N)CC1=CNC=N1 ZQISRDCJNBUVMM-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 1
- 241000481961 Lachancea thermotolerans Species 0.000 description 1
- 240000001046 Lactobacillus acidophilus Species 0.000 description 1
- 235000013956 Lactobacillus acidophilus Nutrition 0.000 description 1
- 244000199885 Lactobacillus bulgaricus Species 0.000 description 1
- 235000013960 Lactobacillus bulgaricus Nutrition 0.000 description 1
- 241000186604 Lactobacillus reuteri Species 0.000 description 1
- 241000194034 Lactococcus lactis subsp. cremoris Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000254158 Lampyridae Species 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 1
- 241000192132 Leuconostoc Species 0.000 description 1
- 241000192130 Leuconostoc mesenteroides Species 0.000 description 1
- 241001468194 Leuconostoc mesenteroides subsp. dextranicum Species 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- 108010003266 Lys-Leu-Tyr-Asp Proteins 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- AWOMRHGUWFBDNU-ZPFDUUQYSA-N Met-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N AWOMRHGUWFBDNU-ZPFDUUQYSA-N 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241000235048 Meyerozyma guilliermondii Species 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 241000191938 Micrococcus luteus Species 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 241000238413 Octopus Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- KJWZYMMLVHIVSU-IYCNHOCDSA-N PGK1 Chemical compound CCCCC[C@H](O)\C=C\[C@@H]1[C@@H](CCCCCCC(O)=O)C(=O)CC1=O KJWZYMMLVHIVSU-IYCNHOCDSA-N 0.000 description 1
- 101150012394 PHO5 gene Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 241000845082 Panama Species 0.000 description 1
- 240000000064 Penicillium roqueforti Species 0.000 description 1
- 235000002233 Penicillium roqueforti Nutrition 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 1
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 1
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 101100124346 Photorhabdus laumondii subsp. laumondii (strain DSM 15139 / CIP 105565 / TT01) hisCD gene Proteins 0.000 description 1
- 101000662819 Physarum polycephalum Terpene synthase 1 Proteins 0.000 description 1
- 108010047620 Phytohemagglutinins Proteins 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 241001600434 Plectroglyphidodon lacrymatus Species 0.000 description 1
- 108010020346 Polyglutamic Acid Proteins 0.000 description 1
- 241001085205 Prenanthella exigua Species 0.000 description 1
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 1
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 1
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 1
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 1
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 1
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- MUPFEKGTMRGPLJ-RMMQSMQOSA-N Raffinose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 MUPFEKGTMRGPLJ-RMMQSMQOSA-N 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 241000235525 Rhizomucor pusillus Species 0.000 description 1
- 241000235545 Rhizopus niveus Species 0.000 description 1
- 241000223252 Rhodotorula Species 0.000 description 1
- 101150014136 SUC2 gene Proteins 0.000 description 1
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 1
- 241000235072 Saccharomyces bayanus Species 0.000 description 1
- 101100439280 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CLB1 gene Proteins 0.000 description 1
- 101100507956 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) HXT7 gene Proteins 0.000 description 1
- 101100069498 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MGE1 gene Proteins 0.000 description 1
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 1
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 1
- 241000877399 Saccharomyces chevalieri Species 0.000 description 1
- 241000877401 Saccharomyces ellipsoideus Species 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 241000582914 Saccharomyces uvarum Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- VAIZFHMTBFYJIA-ACZMJKKPSA-N Ser-Asp-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O VAIZFHMTBFYJIA-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 1
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 1
- GWMXFEMMBHOKDX-AVGNSLFASA-N Ser-Gln-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GWMXFEMMBHOKDX-AVGNSLFASA-N 0.000 description 1
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 1
- AXOHAHIUJHCLQR-IHRRRGAJSA-N Ser-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CO)N AXOHAHIUJHCLQR-IHRRRGAJSA-N 0.000 description 1
- FZEUTKVQGMVGHW-AVGNSLFASA-N Ser-Phe-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZEUTKVQGMVGHW-AVGNSLFASA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 1
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 1
- 241001492664 Solenopsis <angiosperm> Species 0.000 description 1
- 241000228393 Sporidiobolus salmonicolor Species 0.000 description 1
- 241000228390 Sporobolomyces johnsonii Species 0.000 description 1
- 241000123675 Sporobolomyces roseus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 235000014962 Streptococcus cremoris Nutrition 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000936794 Streptomyces chattanoogensis Species 0.000 description 1
- 241000187392 Streptomyces griseus Species 0.000 description 1
- 101001091268 Streptomyces hygroscopicus Hygromycin-B 7''-O-kinase Proteins 0.000 description 1
- 241000970906 Streptomyces natalensis Species 0.000 description 1
- 241000218589 Streptomyces olivaceus Species 0.000 description 1
- 241000187134 Streptomyces olivochromogenes Species 0.000 description 1
- 241000187417 Streptomyces rubiginosus Species 0.000 description 1
- 102100038014 Succinate dehydrogenase [ubiquinone] cytochrome b small subunit, mitochondrial Human genes 0.000 description 1
- 101150001810 TEAD1 gene Proteins 0.000 description 1
- 101150074253 TEF1 gene Proteins 0.000 description 1
- 108010076818 TEV protease Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 1
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 1
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- UDNVOQMPQBEITB-MEYUZBJRSA-N Thr-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UDNVOQMPQBEITB-MEYUZBJRSA-N 0.000 description 1
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 1
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 102100029898 Transcriptional enhancer factor TEF-1 Human genes 0.000 description 1
- 108060008539 Transglutaminase Proteins 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- JVTHMUDOKPQBOT-NSHDSACASA-N Trp-Gly-Gly Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O)=CNC2=C1 JVTHMUDOKPQBOT-NSHDSACASA-N 0.000 description 1
- 102100029639 Tryptase alpha/beta-1 Human genes 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 1
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 1
- CKKFTIQYURNSEI-IHRRRGAJSA-N Tyr-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CKKFTIQYURNSEI-IHRRRGAJSA-N 0.000 description 1
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 1
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 1
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 1
- TZXFLDNBYYGLKA-BZSNNMDCSA-N Tyr-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 TZXFLDNBYYGLKA-BZSNNMDCSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 1
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- KGSDLCMCDFETHU-YESZJQIVSA-N Tyr-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O KGSDLCMCDFETHU-YESZJQIVSA-N 0.000 description 1
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 1
- MDXLPNRXCFOBTL-BZSNNMDCSA-N Tyr-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MDXLPNRXCFOBTL-BZSNNMDCSA-N 0.000 description 1
- MUPFEKGTMRGPLJ-UHFFFAOYSA-N UNPD196149 Natural products OC1C(O)C(CO)OC1(CO)OC1C(O)C(O)C(O)C(COC2C(C(O)C(O)C(CO)O2)O)O1 MUPFEKGTMRGPLJ-UHFFFAOYSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- 108010027570 Xanthine phosphoribosyltransferase Proteins 0.000 description 1
- 241000589636 Xanthomonas campestris Species 0.000 description 1
- 241000222057 Xanthophyllomyces dendrorhous Species 0.000 description 1
- 241000235033 Zygosaccharomyces rouxii Species 0.000 description 1
- 241000192393 [Candida] etchellsii Species 0.000 description 1
- 239000005092 [Ru (Bpy)3]2+ Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- VAZSKTXWXKYQJF-UHFFFAOYSA-N ammonium persulfate Chemical compound [NH4+].[NH4+].[O-]S(=O)OOS([O-])=O VAZSKTXWXKYQJF-UHFFFAOYSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000006287 biotinylation Effects 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 108010083912 bleomycin N-acetyltransferase Proteins 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229920002549 elastin Polymers 0.000 description 1
- 239000013536 elastomeric material Substances 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 108010014507 erythroagglutinating phytohemagglutinin Proteins 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010065713 glycyl-glycyl-tyrosyl-arginine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 238000007542 hardness measurement Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 101150113423 hisD gene Proteins 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 239000000017 hydrogel Substances 0.000 description 1
- 230000002706 hydrostatic effect Effects 0.000 description 1
- 238000000530 impalefection Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 229940039695 lactobacillus acidophilus Drugs 0.000 description 1
- 229940004208 lactobacillus bulgaricus Drugs 0.000 description 1
- 229940001882 lactobacillus reuteri Drugs 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000011326 mechanical measurement Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000012666 negative regulation of transcription by glucose Effects 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000021715 photosynthesis, light harvesting Effects 0.000 description 1
- 230000001885 phytohemagglutinin Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920002643 polyglutamic acid Polymers 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 238000000247 postprecipitation Methods 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000030788 protein refolding Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 238000000575 proteomic method Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- MUPFEKGTMRGPLJ-ZQSKZDJDSA-N raffinose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)O1 MUPFEKGTMRGPLJ-ZQSKZDJDSA-N 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000007320 rich medium Substances 0.000 description 1
- YAYGSLOSTXKUBW-UHFFFAOYSA-N ruthenium(2+) Chemical compound [Ru+2] YAYGSLOSTXKUBW-UHFFFAOYSA-N 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 230000003381 solubilizing effect Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 229940082787 spirulina Drugs 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
- 238000004154 testing of material Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229920001169 thermoplastic Polymers 0.000 description 1
- 229920002725 thermoplastic elastomer Polymers 0.000 description 1
- 239000004416 thermosoftening plastic Substances 0.000 description 1
- 235000019157 thiamine Nutrition 0.000 description 1
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- 239000011721 thiamine Substances 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 102000003601 transglutaminase Human genes 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010032276 tyrosyl-glutamyl-tyrosyl-glutamic acid Proteins 0.000 description 1
- 108010037335 tyrosyl-prolyl-glycyl-glycine Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
- C07K14/43577—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from flies
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
- C07K14/43577—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from flies
- C07K14/43581—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from flies from Drosophila
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
- C07K14/4359—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from fleas
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Insects & Arthropods (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Microbiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
【課題】細胞外部分からエラストマータンパク質を回収するための方法を含む、組換えエラストマータンパク質の発現および精製のための改善された方法を提供する。【解決手段】組換えレジリンタンパク質を含む組成物を作製するための方法は、発酵物中で組換え宿主細胞の集団を培養する工程であって、組換え宿主細胞が、分泌型レジリンコード配列を含むベクターを含み、かつ組換え宿主細胞が、分泌型レジリンコード配列によってコードされた組換えレジリンタンパク質を分泌する、工程;および発酵物から組換えレジリンタンパク質を精製する工程を含む。【選択図】図3
Description
関連出願の相互参照
本願は、開示全体が全ての目的のため全体として参照によって本明細書に組み入れられる、2017年1月13日に出願された米国特許仮出願第62/446,230号の恩典を主張する。
本願は、開示全体が全ての目的のため全体として参照によって本明細書に組み入れられる、2017年1月13日に出願された米国特許仮出願第62/446,230号の恩典を主張する。
技術分野
本開示は、一般に、エラストマータンパク質およびエラストマータンパク質作製に関する。具体的には、本開示は、エラストマータンパク質配列、発現構築物、宿主細胞、および固体に関する。
本開示は、一般に、エラストマータンパク質およびエラストマータンパク質作製に関する。具体的には、本開示は、エラストマータンパク質配列、発現構築物、宿主細胞、および固体に関する。
背景
エラストマータンパク質は、粘弾性の機械特性を示すポリペプチドであり、かつ、エラスチン、レジリン、アブダクチン(abductin)、およびタコ動脈エラストマーを含む。レジリンは、負荷中および除荷中にほとんどエネルギーが散逸しないため、特に興味深いエラストマータンパク質である。レジリンは、多くの昆虫に見出され、その低いエネルギー散逸が、多くの昆虫種の、極めて効率的に跳ぶかまたは羽ばたく並外れた能力を可能にしている。レジリンは、その独特の特性のため、多くの産業的適用を有し得る興味深いエラストマー材料である。しかしながら、レジリンは、天然には極めて少量にしか存在せず、従って、昆虫の飼育によって、高い費用効果では入手することはできない。
エラストマータンパク質は、粘弾性の機械特性を示すポリペプチドであり、かつ、エラスチン、レジリン、アブダクチン(abductin)、およびタコ動脈エラストマーを含む。レジリンは、負荷中および除荷中にほとんどエネルギーが散逸しないため、特に興味深いエラストマータンパク質である。レジリンは、多くの昆虫に見出され、その低いエネルギー散逸が、多くの昆虫種の、極めて効率的に跳ぶかまたは羽ばたく並外れた能力を可能にしている。レジリンは、その独特の特性のため、多くの産業的適用を有し得る興味深いエラストマー材料である。しかしながら、レジリンは、天然には極めて少量にしか存在せず、従って、昆虫の飼育によって、高い費用効果では入手することはできない。
天然レジリンおよびレジリン様タンパク質(レジリン配列に基づく)の変種は、多数のグループによって、大腸菌(E.coli)培養物中で組換え作製されており、組換え発現されたタンパク質を抽出するために細胞を溶解し、精製するためにアフィニティクロマトグラフィー技術を使用することによって単離されている(Elvin et al.,2005;Charati et al.;2009、McGann et al.,2013)。組換え作製されたレジリンおよびレジリン様タンパク質は、天然レジリンにおいても架橋を形成するチロシン残基を標的として架橋された(例えば、Elvin et al.,2005;Qin et al.,2011を参照すること)。組換え作製されたレジリンは、リジン残基(Li et al.,2011)またはシステイン残基(McGann et al.,2013)を標的としても架橋されている。架橋された組換え作製されたレジリンおよびレジリン様タンパク質は、天然レジリンと類似した機械特性を示し、90%より高い弾性エネルギー値を有していた(Elvin et al.,2005、Qin et al.,2011、Li et al.,2011)。
ある研究において、大腸菌培養物1リットル当たり70~80mgの組換えレジリン様タンパク質が産生され、Ni-NTAアフィニティクロマトグラフィーによってレジリン様タンパク質が精製された(Charati et al.,2009)。より効率的な発現システムが開発され、それは、大腸菌宿主細胞から300~450mg/Lの組換えレジリン様タンパク質を産生した(Lyons,et al.,2009)。塩沈殿後の加熱に基づき、溶解された大腸菌宿主細胞からレジリン様タンパク質を精製する、より効率的な方法も開発されている(Qin et al.,2011;Lyons et al.,2009)。しかしながら、より大きい産生量を有する、エラストマータンパク質(例えば、レジリンおよびレジリン様タンパク質)を発現させ精製するための改善されたシステムが、より大規模でより効率的なタンパク質作製を提供することが望まれている。
細胞溶解後の単純な沈殿に基づく精製技術によって、発現されたタンパク質を回収することの少なくとも一つの欠点は、溶解された細胞に由来する細胞タンパク質の標的タンパク質への混入のため、得られるタンパク質が低い純度を有する傾向があるという点である。低い純度は、低い弾性エネルギーを含む多様な生成物の欠陥をもたらし得る。さらに、タンパク質の細胞内蓄積は、毒性をもたらし、従って、組換えエラストマータンパク質の産生の効率の減少をもたらし得る。従って、必要とされているのは、細胞外部分からエラストマータンパク質を回収するための方法を含む、組換えエラストマータンパク質の発現および精製のための改善された方法である。また、より大きい産生効率を有する、組換えエラストマータンパク質(例えば、レジリンおよびレジリン様タンパク質)の発現および精製のための改善された方法も、必要とされている。
いくつかの態様によると、組換えレジリンタンパク質を含む組成物を作製するための方法が、本明細書に提供され、本方法は、発酵物中で組換え宿主細胞の集団を培養する工程であって、組換え宿主細胞が、分泌型レジリンコード配列を含むベクターを含み、かつ組換え宿主細胞が、分泌型レジリンコード配列によってコードされた組換えレジリンタンパク質を分泌する、工程;および発酵物から組換えレジリンタンパク質を精製する工程を含む。
いくつかの態様において、組換えレジリンタンパク質は、全長または短縮型のネイティブレジリンである。いくつかの態様において、ネイティブレジリンは、セイシェルショウジョウバエ(Drosophila sechellia)、パナマハキリアリ(Acromyrmex echinatior)、ヤンマ(Aeshna)、ノサシバエ(Haematobia irritans)、ネコノミ(Ctenocephalides felis)、セイヨウオオマルハナバチ(Bombus terrestris)、コクヌストモドキ(Tribolium castaneum)、ミツバチ(Apis mellifera)、キョウソヤドリコバチ(Nasonia vitripennis)、コロモジラミ(Pediculus humanus corporis)、ガンビアハマダラカ(Anopheles gambiae)、グロッシーナ・モーシタンス(Glossina morsitans)、アッタ・セファロテス(Atta cephalotes)、アノフェレス・ダーリンジ(Anopheles darlingi)、エンドウヒゲナガアブラムシ(Acyrthosiphon pisum)、クロショウジョウバエ(Drosophila virilis)、キリシマキノコショウジョウバエ(Drosophila erecta)、スナバエ(Lutzomyia longipalpis)、オオサシガメ(Rhodnius prolixus)、ヒアリ(Solenopsis invicta)、ネッタイイエカ(Culex quinquefasciatus)、ウリミバエ(Bactrocera cucurbitae)、およびトリコグラムマ・プレチオスム(Trichogramma pretiosum)からなる群より選択される生物に由来する。いくつかの態様において、組換えレジリンタンパク質は、SEQ ID NO:1を含む。いくつかの態様において、組換えレジリンタンパク質は、SEQ ID NO:4を含む。
いくつかの態様において、組換えレジリンタンパク質は、α接合因子分泌シグナルを含む。いくつかの態様において、組換えレジリンタンパク質は、FLAGタグを含む。いくつかの態様において、ベクターは、複数の分泌型レジリンコード配列を含む。
いくつかの態様において、組換え宿主細胞は、酵母細胞である。いくつかの態様において、酵母細胞は、メチロトローフ酵母細胞である。いくつかの態様において、組換え宿主細胞は、ピキア(コマガテラ)パストリス(Pichia (Komagataella) pastoris)、ハンゼヌラ・ポリモルファ(Hansenula polymorpha)、アークスラ・アデニニボランス(Arxula adeninivorans)、ヤロウイア・リポリチカ(Yarrowia lipolytica)、ピキア(シェフェルソミセス)スチピチス(Pichia (Scheffersomyces) stipitis)、ピキア・メタノリカ(Pichia methanolica)、サッカロミセス・セレビシエ(Saccharomyces cerevisiae)、およびクルイベロミセス・ラクチス(Kluyveromyces lactis)からなる群より選択される種である。
いくつかの態様において、組換え宿主細胞は、2mg レジリン/g乾燥細胞重量/時間を上回る速度で組換えレジリンを産生する。いくつかの態様において、組換え宿主細胞は組換えレジリンの分泌型画分を産生し、該分泌型画分は、組換え宿主細胞によって発現された組換えレジリン全タンパク質と比較して50%超である。いくつかの態様において、組換え宿主細胞は、2mg レジリン/g乾燥細胞重量/時間を上回る速度で組換えレジリンを分泌する。いくつかの態様において、80%超の組換えレジリンは、発酵物中の組換え宿主細胞の外部に存在する。いくつかの態様において、発酵物は1L当たり少なくとも2gの組換えレジリンを含む。
いくつかの態様において、組換えレジリンタンパク質を精製する工程は、発酵物を遠心分離することによって、第1のペレット画分および第1の上清画分を生成すること;ならびに第1のペレット画分から組換えレジリンタンパク質を単離することを含む。いくつかの態様において、組換えレジリンタンパク質を精製する工程は、組換えレジリンタンパク質が可溶である溶液を生成するために、第1のペレット画分にカオトロープを添加すること;カオトロープを含む第1のペレット画分を遠心分離することによって、第2の上清画分および第2のペレット画分を生成すること;ならびに第2の上清画分から可溶性全長レジリンを単離することをさらに含む。
いくつかの態様において、分泌型レジリンコード配列を含むベクターが、本明細書中に提供される。いくつかの態様において、分泌型レジリンコード配列は、全長または短縮型のネイティブレジリンをコードする。いくつかの態様において、分泌型レジリンコード配列は、改変された全長または短縮型のネイティブレジリンをコードする。いくつかの態様において、改変されたレジリンは、アミノ酸残基の付加を含むか、アミノ酸残基の削除を含むか、アミノ酸残基の置換を含むか、またはアミノ酸残基の位置の変更を含み、このアミノ酸残基は別のレジリンと架橋することができる。
いくつかの態様において、全長または短縮型のネイティブレジリンは、セイシェルショウジョウバエ、パナマハキリアリ、ヤンマ、ノサシバエ、ネコノミ、セイヨウオオマルハナバチ、コクヌストモドキ、ミツバチ、キョウソヤドリコバチ、コロモジラミ、ガンビアハマダラカ、グロッシーナ・モーシタンス、アッタ・セファロテス、アノフェレス・ダーリンジ、エンドウヒゲナガアブラムシ、クロショウジョウバエ、キリシマキノコショウジョウバエ、スナバエ、オオサシガメ、ヒアリ、ネッタイイエカ、ウリミバエ、およびトリコグラムマ・プレチオスムからなる群より選択される生物に由来する。
いくつかの態様において、分泌型レジリンコード配列は、SEQ ID NO:1を含むポリペプチドをコードする。いくつかの態様において、分泌型レジリンコード配列は、SEQ ID NO:4を含むポリペプチドをコードする。いくつかの態様において、分泌型レジリンコード配列は、1つまたは複数のAリピートまたは準Aリピートを含む組換えレジリンをコードする。いくつかの態様において、分泌型レジリンコード配列は、1つまたは複数のBリピートまたは準Bリピートを含む組換えレジリンをコードする。いくつかの態様において、分泌型レジリンコード配列は組換えレジリンをコードし、該組換えレジリンは、1つもしくは複数のAリピートもしくは準Aリピート、または1つもしくは複数のBリピートもしくは準Bリピートのいずれか一方のみを含む。いくつかの態様において、分泌型レジリンコード配列は、1つまたは複数のAリピートまたは準Aリピートと1つまたは複数のBリピートまたは準Bリピートとを含む組換えレジリンをコードする。
いくつかの態様において、組換えレジリンは、キチン結合ドメインをさらに含む。いくつかの態様において、分泌型レジリンコード配列は、α接合因子分泌シグナルを含むポリペプチドをコードする。いくつかの態様において、分泌型レジリンコード配列は、FLAGタグを含む。
いくつかの態様において、ベクターは、複数の分泌型レジリンコード配列を含む。いくつかの態様において、ベクターは、3つの分泌型レジリンコード配列を含む。いくつかの態様において、分泌型レジリンコード配列は、構成性または誘導性のプロモーターに機能的に連結されている。
いくつかの態様によると、分泌型レジリンコード配列を含むベクターを1つまたは複数含む組換え宿主細胞も、本明細書中に提供される。いくつかの態様において、組換え宿主細胞は、酵母細胞である。いくつかの態様において、酵母細胞は、メチロトローフ酵母細胞である。いくつかの態様において、組換え宿主細胞は、ピキア(コマガテラ)パストリス、ハンゼヌラ・ポリモルファ、アークスラ・アデニニボランス、ヤロウイア・リポリチカ、ピキア(シェフェルソミセス)スチピチス、ピキア・メタノリカ、サッカロミセス・セレビシエ、およびクルイベロミセス・ラクチスからなる群より選択される種である。
いくつかの態様において、組換え宿主細胞は、分泌型レジリンコード配列を含むベクターを3つ含む。
いくつかの態様において、組換え宿主細胞は、2mg レジリン/g乾燥細胞重量/時間を上回る速度で組換えレジリンを産生する。いくつかの態様において、組換え宿主細胞は組換えレジリンの分泌型画分を有し、該分泌型画分は50%超である。いくつかの態様において、組換え宿主細胞は、2mg レジリン/g乾燥細胞重量/時間を上回る速度でレジリンを分泌する。
いくつかの態様によると、分泌型レジリンコード配列を含む1つまたは複数のベクターを含む組換え宿主細胞と、組換え宿主細胞を増殖させるのに適した培養用培地とを含む、発酵物も、本明細書中に提供される。
いくつかの態様において、発酵物は、1L当たり少なくとも2gの組換えレジリンを含む。
発酵物のいくつかの態様において、80%超の組換えレジリンが、組換え宿主細胞の外部に存在する。
発酵物のいくつかの態様において、組換えレジリンは、全長組換えレジリンである。
いくつかの態様によると、分泌型レジリンコード配列を含むベクターを1つまたは複数含む組換え宿主細胞を含む発酵物から得られた組換えレジリンと、組換え宿主細胞を増殖させるのに適した培養用培地とを含む、組成物も、本明細書中に提供される。いくつかの態様において、組成物は、少なくとも60重量%の組換えレジリンを含む。
いくつかの態様において、組成物は、ほぼ同じ量のネイティブレジリンを含む組成物と比較して類似した特性を有する。いくつかの態様において、組成物は、ほぼ同じ量のネイティブレジリンを含む組成物と比較して異なる特性を有する。
いくつかの態様において、組成物は、50%超の弾性エネルギーを含む。いくつかの態様において、組成物は、10MPa未満の圧縮弾性率を有する。いくつかの態様において、組成物は、10MPa未満の引張弾性率を有する。いくつかの態様において、組成物は、1MPa未満の剪断弾性率を有する。いくつかの態様において、組成物は、1%超の破断伸び(extension to break)を有する。いくつかの態様において、組成物は、0.1kPa超の最大引張強さを有する。いくつかの態様において、組成物は、90未満のショア00硬度を有する。いくつかの態様において、組成物は、全長レジリンを含む。
いくつかの態様によると、組換えレジリンを含む組成物を作製するための方法も、本明細書中に提供され、本方法は、組換え宿主細胞からの組換えレジリンの分泌を促進する条件下で発酵物を作製するために、分泌型レジリンコード配列を含むベクターを1つまたは複数含む組換え宿主細胞を培養する工程を含む。
いくつかの態様において、組換えレジリンを含む組成物を作製するための方法は、全長ネイティブレジリンを作製するために組換えレジリンを精製する工程をさらに含む。いくつかの態様において、全長ネイティブレジリンを作製するために組換えレジリンを精製する工程は、発酵物を遠心分離することによって、第1のペレット画分および第1の上清画分を生成すること;ならびに第1のペレット画分から組換えレジリンタンパク質を単離することを含む。いくつかの態様において、第1のペレット画分から組換えレジリンタンパク質を単離することは、組換えレジリンタンパク質が可溶である溶液を生成するために、第1のペレット画分にカオトロープを添加すること;カオトロープを含む第1のペレット画分を遠心分離することによって、第2の上清画分および第2のペレット画分を生成すること;ならびに第2の上清画分から組換えレジリンタンパク質を単離することを含む。
いくつかの態様において、組換えレジリンを含む組成物を作製するための方法は、複数の組換えレジリンを架橋する工程をさらに含む。いくつかの態様において、架橋は、酵素的架橋である。いくつかの態様において、架橋は、光化学的架橋である。いくつかの態様において、組換えレジリンタンパク質は、全長レジリンタンパク質を含む。
いくつかの態様によると、培養用培地と組換え宿主細胞とを含む発酵物も本明細書中に提供され、組換え宿主細胞はベクターを含み、ベクターは分泌型レジリンコード配列を含み、かつ組換え宿主細胞は少なくとも2mg/g乾燥細胞重量/時間の速度で組換えレジリンを分泌する。
[本発明1001]
発酵物中で組換え宿主細胞の集団を培養する工程であって、該組換え宿主細胞が、分泌型レジリンコード配列を含むベクターを含み、かつ該組換え宿主細胞が、該分泌型レジリンコード配列によってコードされた組換えレジリンタンパク質を分泌する、該工程;および
該発酵物から該組換えレジリンタンパク質を精製する工程
を含む、組換えレジリンタンパク質を含む組成物を作製するための方法。
[本発明1002]
前記組換えレジリンタンパク質が、全長または短縮型のネイティブレジリンである、本発明1001の方法。
[本発明1003]
前記ネイティブレジリンが、セイシェルショウジョウバエ(Drosophila sechellia)、パナマハキリアリ(Acromyrmex echinatior)、ヤンマ(Aeshna)、ノサシバエ(Haematobia irritans)、ネコノミ(Ctenocephalides felis)、セイヨウオオマルハナバチ(Bombus terrestris)、コクヌストモドキ(Tribolium castaneum)、ミツバチ(Apis mellifera)、キョウソヤドリコバチ(Nasonia vitripennis)、コロモジラミ(Pediculus humanus corporis)、ガンビアハマダラカ(Anopheles gambiae)、グロッシーナ・モーシタンス(Glossina morsitans)、アッタ・セファロテス(Atta cephalotes)、アノフェレス・ダーリンジ(Anopheles darlingi)、エンドウヒゲナガアブラムシ(Acyrthosiphon pisum)、クロショウジョウバエ(Drosophila virilis)、キリシマキノコショウジョウバエ(Drosophila erecta)、スナバエ(Lutzomyia longipalpis)、オオサシガメ(Rhodnius prolixus)、ヒアリ(Solenopsis invicta)、ネッタイイエカ(Culex quinquefasciatus)、ウリミバエ(Bactrocera cucurbitae)、およびトリコグラムマ・プレチオスム(Trichogramma pretiosum)からなる群より選択される生物に由来する、本発明1001の方法。
[本発明1004]
前記組換えレジリンタンパク質がSEQ ID NO:1を含む、本発明1001の方法。
[本発明1005]
前記組換えレジリンタンパク質がSEQ ID NO:4を含む、本発明1001の方法。
[本発明1006]
前記組換えレジリンタンパク質がα接合因子分泌シグナルを含む、本発明1001の方法。
[本発明1007]
前記組換えレジリンタンパク質がFLAGタグを含む、本発明1001の方法。
[本発明1008]
前記ベクターが、複数の分泌型レジリンコード配列を含む、本発明1001の方法。
[本発明1009]
前記組換え宿主細胞が酵母細胞である、本発明1001の方法。
[本発明1010]
前記酵母細胞がメチロトローフ酵母細胞である、本発明1009の方法。
[本発明1011]
前記組換え宿主細胞が、ピキア(コマガテラ)パストリス(Pichia (Komagataella) pastoris)、ハンゼヌラ・ポリモルファ(Hansenula polymorpha)、アークスラ・アデニニボランス(Arxula adeninivorans)、ヤロウイア・リポリチカ(Yarrowia lipolytica)、ピキア(シェフェルソミセス)スチピチス(Pichia (Scheffersomyces) stipitis)、ピキア・メタノリカ(Pichia methanolica)、サッカロミセス・セレビシエ(Saccharomyces cerevisiae)、およびクルイベロミセス・ラクチス(Kluyveromyces lactis)からなる群より選択される種である、本発明1001の方法。
[本発明1012]
前記組換え宿主細胞が、2mg レジリン/g乾燥細胞重量/時間を上回る速度で前記組換えレジリンを産生する、本発明1001の方法。
[本発明1013]
前記組換え宿主細胞が前記組換えレジリンの分泌型画分を産生し、該分泌型画分が、該組換え宿主細胞によって発現された組換えレジリン全タンパク質と比較して50%超である、本発明1001の方法。
[本発明1014]
前記組換え宿主細胞が、2mg レジリン/g乾燥細胞重量/時間を上回る速度で前記組換えレジリンを分泌する、本発明1001の方法。
[本発明1015]
80%超の前記組換えレジリンが、前記発酵物中の前記組換え宿主細胞の外部に存在する、本発明1001の方法。
[本発明1016]
前記発酵物が、1L当たり少なくとも2gの組換えレジリンを含む、本発明1001の方法。
[本発明1017]
前記組換えレジリンタンパク質を精製する工程が、
前記発酵物を遠心分離することによって、第1のペレット画分および第1の上清画分を生成すること;ならびに
該第1のペレット画分から該組換えレジリンタンパク質を単離すること
を含む、本発明1001の方法。
[本発明1018]
前記組換えレジリンタンパク質を精製する工程が、
該組換えレジリンタンパク質が可溶である溶液を生成するために、前記第1のペレット画分にカオトロープを添加すること;
該カオトロープを含む該第1のペレット画分を遠心分離することによって、第2の上清画分および第2のペレット画分を生成すること;ならびに
該第2の上清画分から可溶性全長レジリンを単離すること
をさらに含む、本発明1017の方法。
[本発明1019]
分泌型レジリンコード配列を含むベクター。
[本発明1020]
前記分泌型レジリンコード配列が、全長または短縮型のネイティブレジリンをコードする、本発明1019のベクター。
[本発明1021]
前記分泌型レジリンコード配列が、改変された全長または短縮型のネイティブレジリンをコードする、本発明1019のベクター。
[本発明1022]
前記改変されたレジリンが、アミノ酸残基の付加を含むか、アミノ酸残基の削除を含むか、アミノ酸残基の置換を含むか、またはアミノ酸残基の位置の変更を含み、該アミノ酸残基が別のレジリンと架橋することができる、本発明1021のベクター。
[本発明1023]
前記全長または短縮型のネイティブレジリンが、セイシェルショウジョウバエ、パナマハキリアリ、ヤンマ、ノサシバエ、ネコノミ、セイヨウオオマルハナバチ、コクヌストモドキ、ミツバチ、キョウソヤドリコバチ、コロモジラミ、ガンビアハマダラカ、グロッシーナ・モーシタンス、アッタ・セファロテス、アノフェレス・ダーリンジ、エンドウヒゲナガアブラムシ、クロショウジョウバエ、キリシマキノコショウジョウバエ、スナバエ、オオサシガメ、ヒアリ、ネッタイイエカ、ウリミバエ、およびトリコグラムマ・プレチオスムからなる群より選択される生物に由来する、本発明1020~1022のいずれかのベクター。
[本発明1024]
前記分泌型レジリンコード配列が、SEQ ID NO:1を含むポリペプチドをコードする、本発明1023のベクター。
[本発明1025]
前記分泌型レジリンコード配列が、SEQ ID NO:4を含むポリペプチドをコードする、本発明1023のベクター。
[本発明1026]
前記分泌型レジリンコード配列が、1つまたは複数のAリピートまたは準Aリピートを含む組換えレジリンをコードする、本発明1019のベクター。
[本発明1027]
前記分泌型レジリンコード配列が、1つまたは複数のBリピートまたは準Bリピートを含む組換えレジリンをコードする、本発明1019のベクター。
[本発明1028]
前記分泌型レジリンコード配列が組換えレジリンをコードし、該組換えレジリンが、1つもしくは複数のAリピートもしくは準Aリピート、または1つもしくは複数のBリピートもしくは準Bリピートのいずれか一方のみを含む、本発明1019のベクター。
[本発明1029]
前記分泌型レジリンコード配列が、1つまたは複数のAリピートまたは準Aリピートと1つまたは複数のBリピートまたは準Bリピートとを含む組換えレジリンをコードする、本発明1019のベクター。
[本発明1030]
前記組換えレジリンがキチン結合ドメインをさらに含む、本発明1026~1029のいずれかのベクター。
[本発明1031]
前記分泌型レジリンコード配列が、α接合因子分泌シグナルを含むポリペプチドをコードする、本発明1019~1030のいずれかのベクター。
[本発明1032]
前記分泌型レジリンコード配列がFLAGタグを含む、本発明1019~1030のいずれかのベクター。
[本発明1033]
複数の分泌型レジリンコード配列を含む、本発明1019~1032のいずれかのベクター。
[本発明1034]
3つの分泌型レジリンコード配列を含む、本発明1033のベクター。
[本発明1035]
前記分泌型レジリンコード配列が、構成性または誘導性のプロモーターに機能的に連結されている、本発明1019~1034のいずれかのベクター。
[本発明1036]
本発明1019~1035のいずれかのベクターを1つまたは複数含む、組換え宿主細胞。
[本発明1037]
酵母細胞である、本発明1036の組換え宿主細胞。
[本発明1038]
前記酵母細胞がメチロトローフ酵母細胞である、本発明1037の組換え宿主細胞。
[本発明1039]
ピキア(コマガテラ)パストリス、ハンゼヌラ・ポリモルファ、アークスラ・アデニニボランス、ヤロウイア・リポリチカ、ピキア(シェフェルソミセス)スチピチス、ピキア・メタノリカ、サッカロミセス・セレビシエ、およびクルイベロミセス・ラクチスからなる群より選択される種である、本発明1038の組換え宿主細胞。
[本発明1040]
本発明1019~1035のいずれかのベクターを3つ含む、本発明1036の組換え宿主細胞。
[本発明1041]
2mg レジリン/g乾燥細胞重量/時間を上回る速度で組換えレジリンを産生する、本発明1036~1040のいずれかの組換え宿主細胞。
[本発明1042]
前記組換え宿主細胞が組換えレジリンの分泌型画分を有し、該分泌型画分が50%超である、本発明1036~1041のいずれかの組換え宿主細胞。
[本発明1043]
2mg レジリン/g乾燥細胞重量/時間を上回る速度でレジリンを分泌する、本発明1036~1042のいずれかの組換え宿主細胞。
[本発明1044]
本発明1036~1043のいずれかの組換え宿主細胞と該組換え宿主細胞を増殖させるのに適した培養用培地とを含む、発酵物。
[本発明1045]
1L当たり少なくとも2gの組換えレジリンを含む、本発明1044の発酵物。
[本発明1046]
80%超の組換えレジリンが、前記組換え宿主細胞の外部に存在する、本発明1044の発酵物。
[本発明1047]
前記組換えレジリンが全長組換えレジリンである、本発明1044~1046のいずれかの発酵物。
[本発明1048]
本発明1044~1047のいずれかの発酵物から得られた組換えレジリンを含む、組成物。
[本発明1049]
少なくとも60重量%の組換えレジリンを含む、本発明1048の組成物。
[本発明1050]
ほぼ同じ量のネイティブレジリンを含む組成物と比較して類似した特性を有する、本発明1048の組成物。
[本発明1051]
ほぼ同じ量のネイティブレジリンを含む組成物と比較して異なる特性を有する、本発明1048の組成物。
[本発明1052]
50%超の弾性エネルギーを有する、本発明1048の組成物。
[本発明1053]
10MPa未満の圧縮弾性率を有する、本発明1048の組成物。
[本発明1054]
10MPa未満の引張弾性率を有する、本発明1048の組成物。
[本発明1055]
1MPa未満の剪断弾性率を有する、本発明1048の組成物。
[本発明1056]
1%超の破断伸び(extension to break)を有する、本発明1048の組成物。
[本発明1057]
0.1kPa超の最大引張強さを有する、本発明1048の組成物。
[本発明1058]
90未満のショア00硬度を有する、本発明1048の組成物。
[本発明1059]
全長レジリンを含む、本発明1048の組成物。
[本発明1060]
組換えレジリンの分泌を促進する条件下で発酵物を作製するために本発明1036~1042のいずれかの組換え宿主細胞を培養する工程を含む、本発明1048~1059のいずれかの組成物を作製するための方法。
[本発明1061]
全長ネイティブレジリンを作製するために前記組換えレジリンを精製する工程をさらに含む、本発明1060の方法。
[本発明1062]
全長ネイティブレジリンを作製するために前記組換えレジリンを精製する工程が、
前記発酵物を遠心分離することによって、第1のペレット画分および第1の上清画分を生成すること;ならびに
該第1のペレット画分から組換えレジリンタンパク質を単離すること
を含む、本発明1061の方法。
[本発明1063]
前記第1のペレット画分から前記組換えレジリンタンパク質を単離することが、
該組換えレジリンタンパク質が可溶である溶液を生成するために、該第1のペレット画分にカオトロープを添加すること;
該カオトロープを含む該第1のペレット画分を遠心分離することによって、第2の上清画分および第2のペレット画分を生成すること;ならびに
該第2の上清画分から該組換えレジリンタンパク質を単離すること
を含む、本発明1062の方法。
[本発明1064]
複数の前記組換えレジリンを架橋する工程をさらに含む、本発明1060~1063のいずれかの方法。
[本発明1065]
前記架橋が酵素的架橋である、本発明1064の方法。
[本発明1066]
前記架橋が光化学的架橋である、本発明1064の方法。
[本発明1067]
前記組換えレジリンタンパク質が全長レジリンタンパク質を含む、本発明1060~1066のいずれかの方法。
[本発明1068]
培養用培地と組換え宿主細胞とを含む発酵物であって、
該組換え宿主細胞がベクターを含み、該ベクターが分泌型レジリンコード配列を含み、かつ該組換え宿主細胞が、少なくとも2mg/g乾燥細胞重量/時間の速度で組換えレジリンを分泌する、該発酵物。
[本発明1001]
発酵物中で組換え宿主細胞の集団を培養する工程であって、該組換え宿主細胞が、分泌型レジリンコード配列を含むベクターを含み、かつ該組換え宿主細胞が、該分泌型レジリンコード配列によってコードされた組換えレジリンタンパク質を分泌する、該工程;および
該発酵物から該組換えレジリンタンパク質を精製する工程
を含む、組換えレジリンタンパク質を含む組成物を作製するための方法。
[本発明1002]
前記組換えレジリンタンパク質が、全長または短縮型のネイティブレジリンである、本発明1001の方法。
[本発明1003]
前記ネイティブレジリンが、セイシェルショウジョウバエ(Drosophila sechellia)、パナマハキリアリ(Acromyrmex echinatior)、ヤンマ(Aeshna)、ノサシバエ(Haematobia irritans)、ネコノミ(Ctenocephalides felis)、セイヨウオオマルハナバチ(Bombus terrestris)、コクヌストモドキ(Tribolium castaneum)、ミツバチ(Apis mellifera)、キョウソヤドリコバチ(Nasonia vitripennis)、コロモジラミ(Pediculus humanus corporis)、ガンビアハマダラカ(Anopheles gambiae)、グロッシーナ・モーシタンス(Glossina morsitans)、アッタ・セファロテス(Atta cephalotes)、アノフェレス・ダーリンジ(Anopheles darlingi)、エンドウヒゲナガアブラムシ(Acyrthosiphon pisum)、クロショウジョウバエ(Drosophila virilis)、キリシマキノコショウジョウバエ(Drosophila erecta)、スナバエ(Lutzomyia longipalpis)、オオサシガメ(Rhodnius prolixus)、ヒアリ(Solenopsis invicta)、ネッタイイエカ(Culex quinquefasciatus)、ウリミバエ(Bactrocera cucurbitae)、およびトリコグラムマ・プレチオスム(Trichogramma pretiosum)からなる群より選択される生物に由来する、本発明1001の方法。
[本発明1004]
前記組換えレジリンタンパク質がSEQ ID NO:1を含む、本発明1001の方法。
[本発明1005]
前記組換えレジリンタンパク質がSEQ ID NO:4を含む、本発明1001の方法。
[本発明1006]
前記組換えレジリンタンパク質がα接合因子分泌シグナルを含む、本発明1001の方法。
[本発明1007]
前記組換えレジリンタンパク質がFLAGタグを含む、本発明1001の方法。
[本発明1008]
前記ベクターが、複数の分泌型レジリンコード配列を含む、本発明1001の方法。
[本発明1009]
前記組換え宿主細胞が酵母細胞である、本発明1001の方法。
[本発明1010]
前記酵母細胞がメチロトローフ酵母細胞である、本発明1009の方法。
[本発明1011]
前記組換え宿主細胞が、ピキア(コマガテラ)パストリス(Pichia (Komagataella) pastoris)、ハンゼヌラ・ポリモルファ(Hansenula polymorpha)、アークスラ・アデニニボランス(Arxula adeninivorans)、ヤロウイア・リポリチカ(Yarrowia lipolytica)、ピキア(シェフェルソミセス)スチピチス(Pichia (Scheffersomyces) stipitis)、ピキア・メタノリカ(Pichia methanolica)、サッカロミセス・セレビシエ(Saccharomyces cerevisiae)、およびクルイベロミセス・ラクチス(Kluyveromyces lactis)からなる群より選択される種である、本発明1001の方法。
[本発明1012]
前記組換え宿主細胞が、2mg レジリン/g乾燥細胞重量/時間を上回る速度で前記組換えレジリンを産生する、本発明1001の方法。
[本発明1013]
前記組換え宿主細胞が前記組換えレジリンの分泌型画分を産生し、該分泌型画分が、該組換え宿主細胞によって発現された組換えレジリン全タンパク質と比較して50%超である、本発明1001の方法。
[本発明1014]
前記組換え宿主細胞が、2mg レジリン/g乾燥細胞重量/時間を上回る速度で前記組換えレジリンを分泌する、本発明1001の方法。
[本発明1015]
80%超の前記組換えレジリンが、前記発酵物中の前記組換え宿主細胞の外部に存在する、本発明1001の方法。
[本発明1016]
前記発酵物が、1L当たり少なくとも2gの組換えレジリンを含む、本発明1001の方法。
[本発明1017]
前記組換えレジリンタンパク質を精製する工程が、
前記発酵物を遠心分離することによって、第1のペレット画分および第1の上清画分を生成すること;ならびに
該第1のペレット画分から該組換えレジリンタンパク質を単離すること
を含む、本発明1001の方法。
[本発明1018]
前記組換えレジリンタンパク質を精製する工程が、
該組換えレジリンタンパク質が可溶である溶液を生成するために、前記第1のペレット画分にカオトロープを添加すること;
該カオトロープを含む該第1のペレット画分を遠心分離することによって、第2の上清画分および第2のペレット画分を生成すること;ならびに
該第2の上清画分から可溶性全長レジリンを単離すること
をさらに含む、本発明1017の方法。
[本発明1019]
分泌型レジリンコード配列を含むベクター。
[本発明1020]
前記分泌型レジリンコード配列が、全長または短縮型のネイティブレジリンをコードする、本発明1019のベクター。
[本発明1021]
前記分泌型レジリンコード配列が、改変された全長または短縮型のネイティブレジリンをコードする、本発明1019のベクター。
[本発明1022]
前記改変されたレジリンが、アミノ酸残基の付加を含むか、アミノ酸残基の削除を含むか、アミノ酸残基の置換を含むか、またはアミノ酸残基の位置の変更を含み、該アミノ酸残基が別のレジリンと架橋することができる、本発明1021のベクター。
[本発明1023]
前記全長または短縮型のネイティブレジリンが、セイシェルショウジョウバエ、パナマハキリアリ、ヤンマ、ノサシバエ、ネコノミ、セイヨウオオマルハナバチ、コクヌストモドキ、ミツバチ、キョウソヤドリコバチ、コロモジラミ、ガンビアハマダラカ、グロッシーナ・モーシタンス、アッタ・セファロテス、アノフェレス・ダーリンジ、エンドウヒゲナガアブラムシ、クロショウジョウバエ、キリシマキノコショウジョウバエ、スナバエ、オオサシガメ、ヒアリ、ネッタイイエカ、ウリミバエ、およびトリコグラムマ・プレチオスムからなる群より選択される生物に由来する、本発明1020~1022のいずれかのベクター。
[本発明1024]
前記分泌型レジリンコード配列が、SEQ ID NO:1を含むポリペプチドをコードする、本発明1023のベクター。
[本発明1025]
前記分泌型レジリンコード配列が、SEQ ID NO:4を含むポリペプチドをコードする、本発明1023のベクター。
[本発明1026]
前記分泌型レジリンコード配列が、1つまたは複数のAリピートまたは準Aリピートを含む組換えレジリンをコードする、本発明1019のベクター。
[本発明1027]
前記分泌型レジリンコード配列が、1つまたは複数のBリピートまたは準Bリピートを含む組換えレジリンをコードする、本発明1019のベクター。
[本発明1028]
前記分泌型レジリンコード配列が組換えレジリンをコードし、該組換えレジリンが、1つもしくは複数のAリピートもしくは準Aリピート、または1つもしくは複数のBリピートもしくは準Bリピートのいずれか一方のみを含む、本発明1019のベクター。
[本発明1029]
前記分泌型レジリンコード配列が、1つまたは複数のAリピートまたは準Aリピートと1つまたは複数のBリピートまたは準Bリピートとを含む組換えレジリンをコードする、本発明1019のベクター。
[本発明1030]
前記組換えレジリンがキチン結合ドメインをさらに含む、本発明1026~1029のいずれかのベクター。
[本発明1031]
前記分泌型レジリンコード配列が、α接合因子分泌シグナルを含むポリペプチドをコードする、本発明1019~1030のいずれかのベクター。
[本発明1032]
前記分泌型レジリンコード配列がFLAGタグを含む、本発明1019~1030のいずれかのベクター。
[本発明1033]
複数の分泌型レジリンコード配列を含む、本発明1019~1032のいずれかのベクター。
[本発明1034]
3つの分泌型レジリンコード配列を含む、本発明1033のベクター。
[本発明1035]
前記分泌型レジリンコード配列が、構成性または誘導性のプロモーターに機能的に連結されている、本発明1019~1034のいずれかのベクター。
[本発明1036]
本発明1019~1035のいずれかのベクターを1つまたは複数含む、組換え宿主細胞。
[本発明1037]
酵母細胞である、本発明1036の組換え宿主細胞。
[本発明1038]
前記酵母細胞がメチロトローフ酵母細胞である、本発明1037の組換え宿主細胞。
[本発明1039]
ピキア(コマガテラ)パストリス、ハンゼヌラ・ポリモルファ、アークスラ・アデニニボランス、ヤロウイア・リポリチカ、ピキア(シェフェルソミセス)スチピチス、ピキア・メタノリカ、サッカロミセス・セレビシエ、およびクルイベロミセス・ラクチスからなる群より選択される種である、本発明1038の組換え宿主細胞。
[本発明1040]
本発明1019~1035のいずれかのベクターを3つ含む、本発明1036の組換え宿主細胞。
[本発明1041]
2mg レジリン/g乾燥細胞重量/時間を上回る速度で組換えレジリンを産生する、本発明1036~1040のいずれかの組換え宿主細胞。
[本発明1042]
前記組換え宿主細胞が組換えレジリンの分泌型画分を有し、該分泌型画分が50%超である、本発明1036~1041のいずれかの組換え宿主細胞。
[本発明1043]
2mg レジリン/g乾燥細胞重量/時間を上回る速度でレジリンを分泌する、本発明1036~1042のいずれかの組換え宿主細胞。
[本発明1044]
本発明1036~1043のいずれかの組換え宿主細胞と該組換え宿主細胞を増殖させるのに適した培養用培地とを含む、発酵物。
[本発明1045]
1L当たり少なくとも2gの組換えレジリンを含む、本発明1044の発酵物。
[本発明1046]
80%超の組換えレジリンが、前記組換え宿主細胞の外部に存在する、本発明1044の発酵物。
[本発明1047]
前記組換えレジリンが全長組換えレジリンである、本発明1044~1046のいずれかの発酵物。
[本発明1048]
本発明1044~1047のいずれかの発酵物から得られた組換えレジリンを含む、組成物。
[本発明1049]
少なくとも60重量%の組換えレジリンを含む、本発明1048の組成物。
[本発明1050]
ほぼ同じ量のネイティブレジリンを含む組成物と比較して類似した特性を有する、本発明1048の組成物。
[本発明1051]
ほぼ同じ量のネイティブレジリンを含む組成物と比較して異なる特性を有する、本発明1048の組成物。
[本発明1052]
50%超の弾性エネルギーを有する、本発明1048の組成物。
[本発明1053]
10MPa未満の圧縮弾性率を有する、本発明1048の組成物。
[本発明1054]
10MPa未満の引張弾性率を有する、本発明1048の組成物。
[本発明1055]
1MPa未満の剪断弾性率を有する、本発明1048の組成物。
[本発明1056]
1%超の破断伸び(extension to break)を有する、本発明1048の組成物。
[本発明1057]
0.1kPa超の最大引張強さを有する、本発明1048の組成物。
[本発明1058]
90未満のショア00硬度を有する、本発明1048の組成物。
[本発明1059]
全長レジリンを含む、本発明1048の組成物。
[本発明1060]
組換えレジリンの分泌を促進する条件下で発酵物を作製するために本発明1036~1042のいずれかの組換え宿主細胞を培養する工程を含む、本発明1048~1059のいずれかの組成物を作製するための方法。
[本発明1061]
全長ネイティブレジリンを作製するために前記組換えレジリンを精製する工程をさらに含む、本発明1060の方法。
[本発明1062]
全長ネイティブレジリンを作製するために前記組換えレジリンを精製する工程が、
前記発酵物を遠心分離することによって、第1のペレット画分および第1の上清画分を生成すること;ならびに
該第1のペレット画分から組換えレジリンタンパク質を単離すること
を含む、本発明1061の方法。
[本発明1063]
前記第1のペレット画分から前記組換えレジリンタンパク質を単離することが、
該組換えレジリンタンパク質が可溶である溶液を生成するために、該第1のペレット画分にカオトロープを添加すること;
該カオトロープを含む該第1のペレット画分を遠心分離することによって、第2の上清画分および第2のペレット画分を生成すること;ならびに
該第2の上清画分から該組換えレジリンタンパク質を単離すること
を含む、本発明1062の方法。
[本発明1064]
複数の前記組換えレジリンを架橋する工程をさらに含む、本発明1060~1063のいずれかの方法。
[本発明1065]
前記架橋が酵素的架橋である、本発明1064の方法。
[本発明1066]
前記架橋が光化学的架橋である、本発明1064の方法。
[本発明1067]
前記組換えレジリンタンパク質が全長レジリンタンパク質を含む、本発明1060~1066のいずれかの方法。
[本発明1068]
培養用培地と組換え宿主細胞とを含む発酵物であって、
該組換え宿主細胞がベクターを含み、該ベクターが分泌型レジリンコード配列を含み、かつ該組換え宿主細胞が、少なくとも2mg/g乾燥細胞重量/時間の速度で組換えレジリンを分泌する、該発酵物。
図面は、例示の目的のためにのみ、本開示の様々な態様を示す。当業者は、本明細書中に記載された原理から逸脱することなく、本明細書中に例示された構造および方法の代替的な態様が用いられ得ることを、以下の考察から容易に認識するであろう。
定義
他に定義されない限り、本明細書中で使用される技術用語および科学用語は、全て、本開示が関係する技術分野の当業者によって一般的に理解されるのと同一の意味を有する。
他に定義されない限り、本明細書中で使用される技術用語および科学用語は、全て、本開示が関係する技術分野の当業者によって一般的に理解されるのと同一の意味を有する。
「1つの(a)」および「1つの(an)」および「その(the)」という用語ならびに類似の指示対象は、本明細書中で使用されるように、本明細書中に他に示されるかまたは前後関係によって明白に否定されない限り、単数および複数の両方をさす。
「約」、「およそ」、または「と類似した/ほぼ同じ」という用語は、当業者によって決定される特定の値について許容される誤差の範囲内を意味し、それは、その値が測定されるかもしくは決定される方法、または測定システムの限界に、一部分、依存し得る。下記の範囲および量は、全て、近似値であり、本発明を限定するためのものではないことが理解されるべきである。範囲および数が使用される場合、これらは、統計的な範囲または測定の誤差もしくは変動を含む近似的なものであり得る。いくつかの態様において、例えば、測定は、±10%であり得る。
アミノ酸は、1文字コードまたは3文字コードによって言及され得る。1文字コード、アミノ酸名、および3文字コードは、以下の通りである:G - グリシン(Gly)、P - プロリン(Pro)、A - アラニン(Ala)、V - バリン(Val)、L - ロイシン(Leu)、I - イソロイシン(Ile)、M - メチオニン(Met)、C - システイン(Cys)、F - フェニルアラニン(Phe)、Y - チロシン(Tyr)、W - トリプトファン(Trp)、H - ヒスチジン(His)、K - リジン(Lys)、R - アルギニン(Arg)、Q - グルタミン(Gln)、N - アスパラギン(Asn)、E - グルタミン酸(Glu)、D - アスパラギン酸(Asp)、S - セリン(Ser)、T - トレオニン(Thr)。
「を含む(including)」、「を含む(includes)」、「を有する(having)」、「を有する(has)」、「を有する(with)」という用語、またはそれらの変化形は、「を含む(comprising)」という用語と同様に、包括的であるものとする。
「微生物」という用語は、本明細書中で使用されるように、微生物をさし、単細胞生物をさす。本明細書中で使用されるように、その用語には、全ての細菌、全ての古細菌、単細胞原生生物、単細胞動物、単細胞植物、単細胞真菌、単細胞藻類、全ての原虫、および全てのクロミスタが含まれる。
「ネイティブ」という用語は、本明細書中で使用されるように、天然の改変されていない状態で天然に見出される組成物をさす。
「任意の」または「任意で」という用語は、特色もしくは構造が存在してもよいもしくは存在しなくてもよいこと、またはイベントもしくは状況が起こってもよいもしくは起こらなくてもよいことを意味し、その記載が、詳細な特色もしくは構造が存在する場合および特色もしくは構造が存在しない場合、またはイベントもしくは状況が起こる場合およびイベントもしくは状況が起こらない場合を含むことを意味する。
「分泌型画分」という用語は、本明細書中で使用されるように、細胞によって産生される全レジリンと比較した、細胞から分泌される組換えレジリンの画分をさす。
「分泌シグナル」という用語は、本明細書中で使用されるように、ポリペプチドと融合した時に、そのポリペプチドの細胞からの分泌を媒介する短いペプチドをさす。
「分泌型レジリンコード配列」という用語は、本明細書中で使用されるように、N末端で分泌シグナルと融合しておりかつ任意でC末端でタグペプチドまたはタグポリペプチドと融合している本明細書中に提供されるレジリンをコードするヌクレオチド配列をさす。
「組換え」という用語は、ポリペプチド(例えば、レジリン)に関して、本明細書中で使用されるように、組換え宿主細胞において産生されるポリペプチド、または組換え核酸から合成されるポリペプチドをさす。
「組換え宿主細胞」という用語は、本明細書中で使用されるように、組換え核酸を含む宿主細胞をさす。
「組換え核酸」という用語は、本明細書中で使用されるように、その天然に存在する環境から取り出された核酸、または天然に見出された場合にその核酸に隣接しているかもしくは近位にある核酸の全部もしくは一部と会合していない核酸、または天然には連結されていない核酸と機能的に連結された核酸、または天然には存在しない核酸、または天然にはその核酸に見出されない改変(例えば、人為的に、例えば、ヒトの介入によって導入された挿入、欠失、もしくは点変異)を含有している核酸、または異種の部位において染色体に組み込まれた核酸をさす。その用語には、クローニングされたDNA単離物、および化学合成されたヌクレオチド類似体を含む核酸が含まれる。
「ベクター」という用語は、本明細書中で使用されるように、連結された別の核酸を輸送することができる核酸分子をさす。ベクターの一つの型は、「プラスミド」であり、それは、一般に、付加的なDNAセグメントがライゲートされ得る環状二本鎖DNAループをさすが、ポリメラーゼ連鎖反応(PCR)による増幅または制限酵素による環状プラスミドの処理によって得られるもののような直鎖状二本鎖分子も含む。他のベクターには、バクテリオファージ、コスミド、細菌人工染色体(BAC)、および酵母人工染色体(YAC)が含まれる。ベクターの別の型は、付加的なDNAセグメントがウイルスゲノムにライゲートされ得るウイルスベクターである。ある種のベクターは、それらが導入された細胞において自律複製することができる(例えば、細胞において機能する複製開始点を有するベクター)。他のベクターは、細胞への導入時に細胞のゲノムに組み込まれ得、それによって、細胞ゲノムと共に複製される。
「リピート」という用語は、アミノ酸または核酸の配列に関して、本明細書中で使用されるように、ポリヌクレオチドまたはポリペプチド(例えば、連鎖状の配列)内に2回以上存在する部分配列をさす。ポリヌクレオチドまたはポリペプチドは、介在配列を含まないリピート配列の直接反復を有していてもよいか、または介在配列を含むリピート配列の不連続反復を有していてもよい。「準リピート」という用語は、アミノ酸または核酸の配列に関して、本明細書中で使用されるように、ポリヌクレオチドまたはポリペプチドにおいて不正確に繰り返される(即ち、準リピート部分配列のいくつかの部分が準リピート間で可変性である)部分配列である。繰り返されるポリペプチドおよびDNA分子(またはポリペプチドまたはDNA分子の一部分)は、リピート部分配列(即ち、正確なリピート)または準リピート部分配列(即ち、不正確なリピート)のいずれかから構成されていてよい。
「ネイティブレジリン」という用語は、本明細書中で使用されるように、昆虫によって産生されたエラストマーのポリペプチドまたはタンパク質をさす。ネイティブレジリンの非限定的な例のGenBankアクセッション番号には、以下のNCBI配列番号が含まれる:NP 995860(キイロショウジョウバエ(Drosophila melanogaster))、NP 611157(キイロショウジョウバエ)、Q9V7U0(キイロショウジョウバエ)、AAS64829、AAF57953(キイロショウジョウバエ)、XP 001817028(コクヌストモドキ)、およびXP001947408(エンドウヒゲナガアブラムシ)。
「改変された」という用語は、本明細書中で使用されるように、機能的特性がネイティブタンパク質またはネイティブポリペプチドの特性の10%以内に保存されている、ネイティブタンパク質またはネイティブポリペプチドの配列と組成が異なるタンパク質またはポリペプチドの配列をさす。いくつかの態様において、改変されたタンパク質または改変されたポリペプチドと、ネイティブタンパク質またはネイティブポリペプチドとの間の違いは、一次配列(例えば、1つもしくは複数のアミノ酸が除去されているか、挿入されているか、もしくは置換されている)または翻訳後修飾(例えば、グリコシル化、リン酸化)にあり得る。アミノ酸欠失とは、タンパク質からの1つまたは複数のアミノ酸の除去をさす。アミノ酸挿入とは、1つまたは複数のアミノ酸残基がタンパク質またはポリペプチドに導入されることをさす。アミノ酸挿入には、単一または複数のアミノ酸の、N末端および/またはC末端における融合、ならびに配列内挿入が含まれ得る。アミノ酸置換には、非保守的または保存的な置換が含まれ、保存的アミノ酸置換の表は、当技術分野において周知である(例えば、Creighton(1984)Proteins.W.H.Freeman and Company(Eds)を参照すること)。いくつかの態様において、改変されたタンパク質または改変されたポリペプチドとネイティブタンパク質またはネイティブポリペプチドとのアミノ酸配列またはヌクレオチド配列の同一性は、アミノ酸またはヌクレオチド塩基の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも98%である。
「短縮型」という用語は、本明細書中で使用されるように、ネイティブタンパク質またはネイティブポリペプチドより長さが短いタンパク質またはポリペプチドの配列をさす。いくつかの態様において、短縮型タンパク質または短縮型ポリペプチドは、ネイティブタンパク質またはネイティブポリペプチドの長さの10%超または20%超または30%超または40%超または50%超または60%超または70%超または80%超または90%超であり得る。
「相同体」または「実質的類似性」という用語は、ポリペプチド、核酸、またはそれらの断片をさす時、本明細書中で使用されるように、適切なアミノ酸またはヌクレオチドの挿入または欠失によって、別のアミノ酸もしくは核酸(またはその相補鎖)と最適に整列化された時、前述のようなFASTA、BLAST、またはGapのような配列同一性の周知のアルゴリズムによって測定されるように、アミノ酸またはヌクレオチド塩基の少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも98%において、アミノ酸配列またはヌクレオチド配列の同一性が存在することを示す。
「レジリン」という用語は、本明細書中で使用されるように、架橋されてエラストマーを形成することができるタンパク質またはポリペプチドをさし、ここで、タンパク質またはポリペプチドは、ネイティブレジリン、改変されているネイティブレジリン、または短縮させられたネイティブレジリンである。本発明のレジリンは、好ましくは、組換えレジリンである。いくつかの態様において、組換えレジリンには、宿主細胞から異種性に発現され分泌された、(例えば、昆虫から単離された)レジリンまたはレジリン断片をコードする天然のまたは改変された(例えば、短縮型もしくは連鎖状)ヌクレオチド配列が含まれる。好ましい態様において、分泌型組換えレジリンタンパク質は、宿主細胞の細胞外の溶液から収集される。
本明細書中で使用されるように、「エラストマー」という用語は、粘弾性および(存在する場合、共有結合性の分子間架橋を除けば)典型的には弱い分子間力を有するポリマーをさす。粘弾性とは、変形を受けた時に粘性特徴および弾性特徴の両方を示し、従って、時間依存的なひずみを示す材料の特性である。弾性は、秩序正しい固体における結晶面に沿った結合伸縮に関連しており、粘性は、非結晶材料内の原子または分子の拡散の結果である。従って、粘弾性であるエラストマーは、一般に、他の材料と比較して低いヤング率および高い破壊ひずみを有する。材料の粘性成分のため、負荷が適用され、次いで除去された場合、粘弾性材料のエネルギーは散逸する。この現象は、粘弾性材料の応力ひずみ曲線においてヒステリシスとして観察される。負荷が適用される時、特定の応力ひずみ曲線が存在し、負荷が除去される時、除荷時の応力ひずみ曲線は、負荷中の曲線とは異なる。散逸するエネルギーは、負荷曲線と除荷曲線との間の面積である。
本明細書中での値の範囲の列挙は、本明細書中に他に示されない限り、その範囲内に包括的に含まれる別々の各値を個々にさすための略記法として役立つものに過ぎず、別々の各値は、本明細書中に個々に列挙されたかのごとく、本明細書中に組み入れられる。
詳細な説明
組換えレジリンを含む組成物およびその作製の方法が、本明細書中に提供される。
組換えレジリンを含む組成物およびその作製の方法が、本明細書中に提供される。
レジリンは、石油に基づくエラストマーと比較して、多くの独特の特性を有する。最も顕著には、レジリンは、極めて高い弾性効率を有し、変形のために入力されたエネルギーが、ほとんど熱として失われない。レジリンの他の望ましい特性には、例えば、望ましい弾性エネルギー、圧縮弾性率、引張弾性率、剪断弾性率、破断伸び、最大引張強さ、硬度、反発、および圧縮永久ひずみが含まれる。さらに、レジリンは、タンパク質であり、従って、生分解され得、そのため、石油に基づくポリマーより環境にやさしい。また、レジリンは、生体適合性であり、従って、ヒトまたは動物との接触を含む適用において使用され得る。最後に、具体的な適用の分野のために設計されたエラストマーを作製するために、タンパク質配列、タンパク質構造、分子間架橋の量、および作業変数を変動させることによって、組換えレジリンの機械特性を調整することが可能である。
いくつかの態様において、本明細書中に提供される方法および組成物は、大量の組換えレジリンを作製するための効率的な手段を提供する。いくつかの態様において、大量のレジリンおよびレジリン様ポリペプチドは、分泌経路を介して組換えレジリンを分泌する組換え宿主細胞を使用して得られる。組換えレジリンのそのような分泌は、(a)組換えレジリンの細胞内蓄積からの毒性を回避し、(b)細胞破壊またはタンパク質再折り畳みの過程を排除することによって精製を単純化し、(c)組換えレジリンの特性をモジュレートし得る翻訳後イベント(例えば、タンパク質分解による成熟、グリコシル化、ジスルフィド結合形成)の機会を提供する。
組換えレジリンを含む組成物
いくつかの態様において、本明細書中に提供される組成物は、組換えレジリンを含む。
いくつかの態様において、本明細書中に提供される組成物は、組換えレジリンを含む。
図1は、Xが任意のアミノ酸であるコンセンサスアミノ酸配列YGXPを含むリピート単位(「Aリピート」)を複数含むN末端Aドメインと;キチン結合型RR-2(C)ドメイン(PfamリファレンスPF00379;Rebers JE & Willis,JH.A conserved domain in anthropod cuticular proteins binds chitin.Insect Biochem Mol Biol 31:1083-1093)と;Uがグリシンまたはセリンであり;Zがセリン、グリシン、アルギニン、またはプロリンであり;かつXが任意のアミノ酸であるコンセンサスアミノ酸配列UYZXZを含むリピート単位(「Bリピート」)を複数含むC末端Bドメインとを含有する、ネイティブレジリンの一例を例示する。全ての天然に存在するレジリンが、Aドメイン、Cドメイン、およびBドメインを有するとは限らない。様々な昆虫によって産生されるネイティブレジリンは、典型的には、準リピート間のいくつかのアミノ酸変動を有する不正確なリピート(即ち、準リピート)をAドメイン内および/またはBドメイン内に有する。
いくつかの態様において、本明細書中に提供される組換えレジリンは、1つまたは複数のAリピートを含む。いくつかの態様において、組換えレジリンは、コンセンサス配列SXXYGXPを各々が有するAリピートおよび/または準Aリピートのアミノ酸部分配列のブロックを複数含む、N末端Aドメインを含み、Sはセリンであり、Xはアミノ酸であり、Yはチロシンであり、Gはグリシンであり、かつPはプロリンである。
いくつかの態様において、本明細書中に提供される組換えレジリンは、1つまたは複数のBリピートを含む。いくつかの態様において、組換えレジリンは、コンセンサス配列GYZXZZXおよび/またはSYZXZZXを各々が有するBリピートおよび/または準Bリピートのアミノ酸部分配列のブロックを複数含む、C末端Bドメインを含み、Gはグリシンであり;Yはチロシンであり;Zはセリン、グリシン、プロリン、またはアルギニンであり;Sはセリンであり;かつXは任意のアミノ酸である。
いくつかの態様において、本明細書中に提供される組換えレジリンは、1つまたは複数のAリピートを含む。いくつかのそのような態様において、組換えレジリンは、1~100個のAリピートまたは2~50個のAリピートまたは5~50個のAリピートまたは5~20個のAリピートを含む。
いくつかの態様において、組換えレジリンは、式:
(X1-X2-X3-X4)n (1)
によって記載されるコンセンサス配列を1つまたは複数含み、
式中、括弧はコンセンサス配列のリピートまたは準リピートの境界を示し;
nはAリピートまたは準Aリピートの数を記載し、1~100または2~50または5~50または5~20であり;
X1は4アミノ酸長のモチーフであり、X1の最初のアミノ酸はYであり、X1の残りのアミノ酸はGAP、GLP、GPP、GTP、またはGVPであり;
X2は3~20アミノ酸長のモチーフであり;
X2はGGG、GGGG、N、NG、NN、NGN、NGNG、GQGG、GQGN、GQGQ、GQGQG、もしくは3つもしくはそれ以上のグリシン残基を含むか、またはX2の残基の50%もしくはそれ以上がグリシンもしくはアスパラギンのいずれかであるか、またはX2の残基の60%もしくはそれ以上がグリシンもしくはアスパラギンのいずれかであるか、またはX2の残基の70%もしくはそれ以上がグリシンもしくはアスパラギンのいずれかであるか、またはX2の残基の80%もしくはそれ以上がグリシンもしくはアスパラギンのいずれかであり;
X3は2~6アミノ酸長のモチーフであり、X3はGG、LS、APS、GAG、GGG、KPS、RPS、またはGGGGであり;かつ
X4は1~2アミノ酸長のモチーフであり、X4はS、D、T、N、L、DS、DT、LS、SS、ST、TN、またはTSである。
(X1-X2-X3-X4)n (1)
によって記載されるコンセンサス配列を1つまたは複数含み、
式中、括弧はコンセンサス配列のリピートまたは準リピートの境界を示し;
nはAリピートまたは準Aリピートの数を記載し、1~100または2~50または5~50または5~20であり;
X1は4アミノ酸長のモチーフであり、X1の最初のアミノ酸はYであり、X1の残りのアミノ酸はGAP、GLP、GPP、GTP、またはGVPであり;
X2は3~20アミノ酸長のモチーフであり;
X2はGGG、GGGG、N、NG、NN、NGN、NGNG、GQGG、GQGN、GQGQ、GQGQG、もしくは3つもしくはそれ以上のグリシン残基を含むか、またはX2の残基の50%もしくはそれ以上がグリシンもしくはアスパラギンのいずれかであるか、またはX2の残基の60%もしくはそれ以上がグリシンもしくはアスパラギンのいずれかであるか、またはX2の残基の70%もしくはそれ以上がグリシンもしくはアスパラギンのいずれかであるか、またはX2の残基の80%もしくはそれ以上がグリシンもしくはアスパラギンのいずれかであり;
X3は2~6アミノ酸長のモチーフであり、X3はGG、LS、APS、GAG、GGG、KPS、RPS、またはGGGGであり;かつ
X4は1~2アミノ酸長のモチーフであり、X4はS、D、T、N、L、DS、DT、LS、SS、ST、TN、またはTSである。
いくつかのそのような態様において、組換えレジリンは、モチーフX1、X2、X3、およびX4を含み、他の態様において、組換えレジリンは、モチーフX1、X2、X3、もしくはX4、またはそれらの組み合わせを含む。
いくつかの態様において、本明細書中に提供される組換えレジリンは、1つまたは複数のBリピートを含む。いくつかのそのような態様において、組換えレジリンは、1~100個のBリピートまたは2~50個のAリピートまたは5~50個のAリピートまたは5~20個のAリピートを含む。
いくつかの態様において、組換えレジリンは、式:
(X11-X12-X13)m (2)
によって記載されたコンセンサス配列を1つまたは複数含み、
式中、括弧はコンセンサス配列のリピートまたは準リピートの境界を示し;
mはBリピートまたは準Bリピートの数を記載し、1~100であり;
X11は1~5アミノ酸長のモチーフであり、最初のアミノ酸はYであり、残りのアミノ酸はGAP、GPP、SSG、またはSGGを含んでいてよく;
X12は2~5アミノ酸長のモチーフであり、GQ、GN、RPG、RPGGQ、RPGGN、SSS、SKG、またはSNを含み;かつ
X13は4~30アミノ酸長のモチーフであり、GG、DLG、GFG、GGG、RDG、SGG、SSS、GGSF、GNGG、GGAGG、または3つもしくはそれ以上のグリシン残基を含むか、または残基の30%もしくはそれ以上がグリシンであるか、または残基の40%もしくはそれ以上がグリシンであるか、または残基の50%もしくはそれ以上がグリシンであるか、または残基の60%もしくはそれ以上がグリシンである。
(X11-X12-X13)m (2)
によって記載されたコンセンサス配列を1つまたは複数含み、
式中、括弧はコンセンサス配列のリピートまたは準リピートの境界を示し;
mはBリピートまたは準Bリピートの数を記載し、1~100であり;
X11は1~5アミノ酸長のモチーフであり、最初のアミノ酸はYであり、残りのアミノ酸はGAP、GPP、SSG、またはSGGを含んでいてよく;
X12は2~5アミノ酸長のモチーフであり、GQ、GN、RPG、RPGGQ、RPGGN、SSS、SKG、またはSNを含み;かつ
X13は4~30アミノ酸長のモチーフであり、GG、DLG、GFG、GGG、RDG、SGG、SSS、GGSF、GNGG、GGAGG、または3つもしくはそれ以上のグリシン残基を含むか、または残基の30%もしくはそれ以上がグリシンであるか、または残基の40%もしくはそれ以上がグリシンであるか、または残基の50%もしくはそれ以上がグリシンであるか、または残基の60%もしくはそれ以上がグリシンである。
いくつかのそのような態様において、組換えレジリンは、モチーフX11、X12、およびX13を含み、他のそのような態様において、組換えレジリンは、モチーフX11、X12、もしくはX13、またはそれらの組み合わせを含む。
いくつかの態様において、本明細書中に提供される組換えレジリンは、1つまたは複数のAリピート、1つまたは複数のBリピート、および/または1つまたは複数のCドメインを含む。いくつかの態様において、組換えレジリンは、1つもしくは複数のAリピート、または1つもしくは複数のBリピートの一方のみを含む。いくつかの態様において、組換えレジリンは、1つまたは複数のAリピートを含み、BリピートもCドメインも含まない。いくつかの態様において、組換えレジリンは、1つまたは複数のBリピートを含み、AリピートもCドメインも含まない。組換えレジリンがCドメインを含む態様において、Cドメインは、AリピートもしくはBリピートのN末端側もしくはC末端側に置かれていてもよいか、またはAリピートとBリピートとの間に置かれていてもよい。
いくつかの態様において、組換えレジリンは、Xが任意のアミノ酸である配列XXEPPVSYLPPSをさらに含む。いくつかのそのような態様において、配列は、AリピートまたはBリピートのN末端側に位置する。
いくつかの態様において、組換えレジリンは、非ネイティブ環境において発現した全長ネイティブレジリンである。いくつかの態様において、組換えレジリンは、ネイティブレジリンの短縮バージョンを含む。いくつかの態様において、短縮型ネイティブレジリンは、少なくとも1つのAリピートを含む。いくつかの態様において、短縮型ネイティブレジリンは、少なくとも1つのBリピートを含む。全長ネイティブレジリンおよび短縮型ネイティブレジリンの非限定的な例は、SEQ ID NO:1~44として提供される。いくつかの態様において、組換えレジリンは、全長セイシェルショウジョウバエレジリン(SEQ ID NO:1)である。いくつかの態様において、組換えレジリンは、短縮型パナマハキリアリレジリン(SEQ ID NO:4)である。いくつかの態様において、組換えレジリンは、非ネイティブの様式(例えば、より少ないかまたはより多い架橋、異なるアミノ酸残基を介した架橋)で架橋された全長ネイティブレジリンまたは短縮型ネイティブレジリンである。
いくつかの態様において、組換えレジリンは、改変された全長または短縮型のネイティブレジリンである。いくつかの態様において、組換えレジリンは、全長ネイティブレジリンまたは短縮型ネイティブレジリンと少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも98%同一である。いくつかの態様において、組換えレジリンは、全長セイシェルショウジョウバエレジリン(SEQ ID NO:1)と少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも98%同一である。いくつかの態様において、組換えレジリンは、短縮型パナマハキリアリレジリン(SEQ ID NO:4)と少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも98%同一である。
ヌクレオチド配列またはタンパク質配列の同一性を測定するために使用され得る多数の異なるアルゴリズムが、当技術分野において公知である。例えば、ポリヌクレオチド配列は、Wisconsin Package Version 10.0(Genetics Computer Group(GCG),Madison,Wis)内のプログラムであるFASTA、Gap、またはBestfitを使用して比較され得る。FASTAは、クエリー配列とサーチ配列との間の最適なオーバーラップの領域のアライメントおよびパーセント配列同一性を提供する。例えば、(参照によってその全体が本明細書に組み入れられる)Pearson,Methods Enzymol.183:63-98,1990を参照すること。例えば、核酸配列間のパーセント配列同一性は、そのデフォルトパラメータ(6のワードサイズおよびスコアリングマトリックスのためのNOPAMファクター)でFASTAを使用するか、または参照によって本明細書中に組み入れられるGCGバージョン6.1に提供されるデフォルトパラメータでGapを使用して、決定され得る。あるいは、配列は、コンピュータプログラムBLAST(Altschul et al.,J.Mol.Biol.215:403-410,1990;Gish and States,Nature Genet.3:266-272,1993;Madden et al.,Meth.Enzymol.266:131-141,1996;Altschul et al.,Nucleic Acids Res.25:3389-3402,1997;Zhang and Madden,Genome Res.7:649-656,1997)、特に、blastpまたはtblastn(Altschul et al.,Nucleic Acids Res.25:3389-3402,1997)を使用して比較されてもよい。
いくつかの態様において、改変されたレジリンは、全長ネイティブレジリンまたは短縮型ネイティブレジリンと異なる位置および/または異なる量および/または異なる型の翻訳後修飾を1つまたは複数有するよう、翻訳後修飾(例えば、リン酸化、グリコシル化)を受けたアミノ酸残基において全長ネイティブレジリンまたは短縮型ネイティブレジリンと異なる。いくつかの態様において、改変されたレジリンは、全長ネイティブレジリンまたは短縮型ネイティブレジリンと異なる位置および/または異なる量および/または異なる型の、架橋に関与するアミノ酸を1つまたは複数有するよう、架橋に関与するアミノ酸残基において全長ネイティブレジリンまたは短縮型ネイティブレジリンと異なる。いくつかのそのような態様において、改変されたレジリンは、1つまたは複数の付加的なまたはより少ないチロシン残基、1つまたは複数の付加的なまたはより少ないリジン残基、および/または1つまたは複数の付加的なまたはより少ないシステイン残基を含むという点で、全長ネイティブレジリンまたは短縮型ネイティブレジリンと異なる。
いくつかの態様において、組換えレジリンは、連鎖状のネイティブレジリンもしくは短縮型ネイティブレジリンまたは連鎖状の改変されたレジリンを含む。いくつかの態様において、連鎖状のネイティブレジリンもしくは短縮型ネイティブレジリンまたは連鎖状の改変されたレジリンは、少なくとも2個(例えば、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれ以上)のAリピートを含む。いくつかの態様において、連鎖状の短縮型ネイティブレジリンまたは連鎖状の改変されたレジリンは、少なくとも2個(例えば、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれ以上)のBリピートを含む。
本明細書中に提供される組成物は、重量で少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%;10%~100%、90%、80%、70%、60%、50%、40%、30%、もしくは20%;20%~100%、90%、80%、70%、60%、50%、40%、もしくは30%;30%~100%、90%、80%、70%、60%、50%、もしくは40%;40%~100%、90%、80%、70%、60%、もしくは50%;50%~100%、90%、80%、70%、もしくは60%;60%~100%、90%、80%、もしくは70%;70%~100%、90%、もしくは80%;80%~100%もしくは90%;または90%~100%の組換えレジリンを含む。組換えレジリンは、同一の組換えレジリンであってもよいか、または少なくとも2種類の異なるアミノ酸配列を有する組換えレジリンの混合物であってもよい。
いくつかの態様において、本明細書中に提供される組成物は、ネイティブレジリンを含む組成物と比較して類似した特性を有する。他の態様において、本明細書中に提供される組成物は、ネイティブレジリンを含む組成物と比較して異なる特性を有する。そのような特性の非限定的な例には、弾性エネルギー、圧縮弾性率、引張弾性率、剪断弾性率、破断伸び、最大引張強さ、硬度、反発、および圧縮永久ひずみが含まれる。特定の機械特性を有する組成物を得るために改変され得るパラメータには、例えば、組換えレジリンの長さおよび/もしくは配列、組換えレジリンの翻訳後修飾の程度および/もしくは型、ならびに/または組換えレジリンの架橋の程度および/もしくは型が含まれる。
いくつかの態様において、最大引張強さ、圧縮弾性率、引張弾性率、剪断弾性率、破断伸び、および弾性エネルギーのような機械特性は、エラストマー試料に対して応力ひずみ測定を実施する様々な型の引張システムおよび圧縮システムを使用して測定され得る。ヒステリシスを有する曲線を含む得られた応力ひずみ曲線は、引張または圧縮において測定され得る。いくつかの態様において、引張試験システムおよび圧縮試験システムは、試料にひずみを適用し、得られた力をロードセルを使用して測定することができる。いくつかの態様において、機械特性は、(例えば、巨視的圧縮試験機を使用して)巨視的スケールで測定されてもよいか、微視的スケールで測定されてもよいか、または(例えば、原子間力顕微鏡法(AFM)もしくはナノインデンテーション測定を使用して)ナノスケールで測定されてもよい。いくつかの態様において、エラストマーの圧縮機械特性は、標準的なASTM D575-91(2012)圧縮におけるゴム特性の標準試験方法(Standard Test Methods for Rubber Properties in Compression)によって測定され得る。引張におけるエラストマーの機械的測定は、ASTM D412-15a 加硫ゴムおよび熱可塑性エラストマーの引張における標準試験方法(Standard Test Methods for Vulcanized Rubber and Thermoplastic Elastomers-Tension)を使用して実施され得る。いくつかの態様において、エラストマーの引裂強さは、ASTM D624-00 通常の加硫ゴムおよび熱可塑性エラストマーの引裂強さの標準試験方法(Standard Test Method for Tear Strength of Conventional Vulcanized Rubber and Thermoplastic Elastomers)を使用して実施され得る。いくつかの態様において、スラブエラストマー、接合されたエラストマー、および成型されたエラストマーの機械特性は、ASTM D3574-11 柔軟性のある細胞材料-スラブウレタンフォーム、接合されたウレタンフォーム、および成型されたウレタンフォームの標準試験方法(Standard Test Methods for Flexible Cellular Materials-Slab,Bonded,and Molded Urethane Foams)を使用して実施され得る。いくつかの態様において、エラストマーの機械特性は、ASTM D5992-96(2011)振動法を使用した加硫ゴムおよびゴム様材料の動的試験のための標準ガイド(Standard Guide for Dynamic Testing of Vulcanized Rubber and Rubber-Like Materials Using Vibratory Methods)を使用して測定され得る。
いくつかの態様において、本明細書中に提供される組成物は、50%超、60%超、70%超、80%超、90%超、もしくは95%超;50%~100%、90%、80%、70%、もしくは60%;60%~100%、90%、80%、もしくは70%;70%~100%、90%、もしくは80%;80%~100%もしくは90%;90%~100%;95%~100%、90%~99%、または95%~99%の弾性エネルギーを有する。
いくつかの態様において、本明細書中に提供される組成物は、10MPa未満、7MPa未満、5MPa未満、2MPa未満、1MPa未満、0.5MPa未満、もしくは0.1MPa未満;0.01MPa~10MPa、7MPa、5MPa、2MPa、1MPa、0.5MPa、もしくは0.1MPa;0.1MPa~10MPa、7MPa、5MPa、2MPa、1MPa、もしくは0.5MPa;0.5MPa~10MPa、7MPa、5MPa、2MPa、もしくは1MPa;1MPa~10MPa、7MPa、5MPa、もしくは2MPa;2MPa~10MPa、7MPa、もしくは5MPa;5MPa~10MPaもしくは7MPa;または7MPa~10MPaの圧縮弾性率を有する。いくつかの態様において、組成物の圧縮弾性率は、ASTM D575-91(2012)圧縮におけるゴム特性の標準試験方法によって定義されるように測定され得る。
いくつかの態様において、本明細書中に提供される組成物は、10MPa未満、7MPa未満、5MPa未満、2MPa未満、1MPa未満、0.5MPa未満、もしくは0.1MPa未満;0.01MPa~10MPa、7MPa、5MPa、2MPa、1MPa、もしくは0.5MPa;0.5MPa~10MPa、7MPa、5MPa、2MPa、もしくは1MPa;1MPa~10MPa、7MPa、5MPa、もしくは2MPa;2MPa~10MPa、7MPa、もしくは5MPa;5MPa~10MPaもしくは7MPa;または7MPa~10MPaの引張弾性率を有する。
いくつかの態様において、本明細書中に提供される組成物は、1MPa未満、100kPa未満、50kPa未満、20kPa未満、10kPa未満、もしくは1kPa未満;0.1kPa~1MPa、100kPa、50kPa、20kPa、10kPa、もしくは1kPa;1kPa~1MPa、100kPa、50kPa、20kPa、もしくは10kPa;10kPa~1MPa、100kPa、50kPa、もしくは20kPa;20kPa~1MPa、100kPa、もしくは50kPa;50kPa~1MPaもしくは100kPa;または100kPa~1MPaの剪断弾性率を有する。
いくつかの態様において、本明細書中に提供される組成物は、1%超、10%超、50%超、100%超、300%超、もしくは500%超;1%~500%、300%、100%、50%、もしくは10%;10%~500%、300%、100%、もしくは50%;50%~500%、300%、もしくは100%;100%~500%もしくは300%;または300%~500%の、破断伸びを有する。
いくつかの態様において、本明細書中に提供される組成物は、0.1kPa超、1kPa超、2kPa超、5kPa超、もしくは10kPa超;0.1kPa~100kPa、10kPa、5kPa、2kPa、もしくは1kPa;1kPa~100kPa、10kPa、5kPa、もしくは2kPa;2kPa~100kPa、10kPa、もしくは5kPa;5kPa~100kPaもしくは10kPa;または10kPa~100kPaの最大引張強さを有する。
いくつかの態様において、硬度および圧縮弾性率のような機械特性は、インデンテーション測定システムおよびナノインデンテーション測定システムを使用して測定され得る。いくつかの態様において、所定の量のひずみまで試料に押し込むために圧子を用いるインデンテーション測定が、レジリンの硬度および圧縮弾性率を測定するために使用され、得られた力が、ロードセルを使用して測定される。いくつかの態様において、ビッカース形圧子およびバーコビッチ形圧子を含む種々の圧子形が使用され得る。いくつかの態様において、インデンテーション技術によって測定された硬度は、硬度=(ピークフォース)/(接触面積)という関係を特徴とする。
いくつかの態様において、ポリマー、エラストマー、およびゴムの硬度は、デュロメータを使用して測定され得る。いくつかの態様において、エラストマーの硬度は、特定のスプリングの力およびインデンターの形状の組み合わせを使用した12種類の異なるデュロメータスケールを認識する標準的なASTM D2240を使用して測定され得る。最も一般的なスケールは、ショアOO、A、およびD硬度スケールである。硬度スケールは0~100の範囲であり、0がより柔軟な材料であり、100がより硬い材料である。
いくつかの態様において、本明細書中に提供される組成物は、90未満、80未満、70未満、60未満、50未満、40未満、30未満、もしくは20未満;10~90、80、70、60、50、40、30、もしくは20;20~90、80、70、60、50、40、もしくは30;30~90、80、70、60、50、もしくは40;40~90、80、70、60、もしくは50;50~90、80、70、もしくは60;60~90、80、もしくは70;70~90もしくは80;または80~90のショア00硬度を有する。いくつかの態様において、レジリンの硬度測定は、ASTM D2240によって実施される。
本明細書中で使用されるように、「反発」という用語は、弾性エネルギーの詳細な尺度をさす。いくつかの態様において、反発は、ペンデュラムツールおよびドロップボール(dropped ball)を含む多数の異なるツールによって測定され得る。ペンデュラム型測定においては、反発率と一般的に呼ばれるRBが、式:
から求められる。反発弾性エネルギーは、
として算出され得、ここで、h=反発の頂点高さ、およびH=初期高さである。反発弾性エネルギーは、反発の角度の測定によっても決定され得る。エラストマーの反発を決定する試験方法のいくつかの例は、ASTM D2632-15およびASTM D7121-05(2012)である。
から求められる。反発弾性エネルギーは、
として算出され得、ここで、h=反発の頂点高さ、およびH=初期高さである。反発弾性エネルギーは、反発の角度の測定によっても決定され得る。エラストマーの反発を決定する試験方法のいくつかの例は、ASTM D2632-15およびASTM D7121-05(2012)である。
いくつかの態様において、本明細書中に提供される組成物は、50%超、60%超、70%超、80%超、90%超、もしくは95%超;50%~100%、90%、80%、70%、もしくは60%;60%~100%、90%、80%、もしくは70%;70%~100%、90%、もしくは80%;80%~100%もしく90%;90%~100%;95%~100%、90%~99%、または95%~99%の反発を有する。いくつかの態様において、レジリンの反発測定は、ASTM D2632-15、またはASTM D7121-05(2012)によって実施される。
本明細書中で使用されるように、「圧縮永久ひずみ」という用語は、応力が除去された後に残存する永久変形の尺度をさす。いくつかの態様において、圧縮永久ひずみは、(圧縮永久ひずみAと呼ばれる)空気中での一定の力による圧縮永久ひずみ、(圧縮永久ひずみBと呼ばれる)空気中での一定のたわみによる圧縮永久ひずみ、および(圧縮永久ひずみCと呼ばれる)材料の硬さを考慮した空気中での一定のたわみによる圧縮永久ひずみを含む異なる方式で測定され得る。圧縮永久ひずみA(CA)は、以下の式:CA=[(t0-ti)/t0]×100によって算出され、ここで、t0は最初の標本の厚さであり、かつtiは試験後の標本の厚さである。圧縮永久ひずみB(CB)は、CB=[(t0-ti)/(t0-tn)]×100によって与えられ、ここで、t0は最初の標本の厚さであり、tiは試験後の標本の厚さであり、かつtnは試験中のスペーサーの厚さまたは標本の厚さである。エラストマーの圧縮永久ひずみを決定する試験方法のいくつかの例は、ASTM D3574-11およびASTM D395-16である。
いくつかの態様において、本明細書中に提供される組成物は、50%超、60%超、70%超、80%超、90%超、もしくは95%超;50%~100%、90%、80%、70%、もしくは60%;60%~100%、90%、80%、もしくは70%;70%~100%、90%、もしくは80%;80%~100%もしくは90%;90%~100%;95%~100%、90%~99%、または95%~99%の圧縮永久ひずみAまたは圧縮永久ひずみBを有する。いくつかの態様において、レジリンの圧縮永久ひずみ測定は、ASTM D3574-11およびASTM D395-16によって実施される。
レジリンの製品への加工および成形は、種々の適用のための多くの形態をとることができる。従って、本明細書中に提供される組成物は、ゲル、多孔性スポンジ、フィルム、可削性固体、鋳造された形態、成型された形態、および合成物を含むが、これらに限定されるわけではない、任意の形および形態を有し得る。
本明細書中に提供される組成物は、とりわけ、航空宇宙、自動車、スポーツ用品、振動絶縁、フットウェア、および衣類における適用を含むが、これらに限定されるわけではない、多数の使用を有する。これらのカテゴリーからのいくつかの適用が、非限定的な例としてリストされる。望ましい弾性効率のため、レジリンは、力学的エネルギーの貯蔵および回収のためのエネルギー貯蔵装置(例えば、ゴムバンド)として使用され得る。高速で隆起および陥没を越えた場合のタイヤの道路との接触をより多く維持するための、レジリンブッシングの適用によって、自動車サスペンションシステムを改善することができる。さらに、ゴルフボールのコア、テニスラケットグリップ、ゴルフクラブグリップ、および卓球ラケットを含む、異なって調整された機械特性を有するレジリンの多数のスポーツ用品適用が存在する。
本明細書中に提供されるレジリン組成物の独特の特性のため、特に関心対象の適用は、フットウェアである。インソールまたはミッドソールとして、レジリンは、接地を緩和し、接地からのエネルギーをより多く前方への推進力として回収することによって、靴の履き心地および生物学的効率を改善することができる。ミッドソールとして、レジリンは、ミッドソール全体を構成していてもよいか、またはその特性を補完するための別の材料(例えば、摩損もしくは摩耗に対して抵抗性の材料、もしくはトラクションのために調整された材料)の内部に埋め込まれていてもよい。レジリンミッドソールは、増強された性能(例えば、より柔軟な踵接地エリアおよびより堅いアーチサポート)を提供するために協調的に作用する、異なって調整された機械特性を有する複数のレジリン材料を含有していてもよい。
本明細書中で使用されるように、「密度」という用語は、試料の質量を体積で割ったものをさす。いくつかの態様において、エラストマーの密度は、気泡を排除するために水の代わりにアルコールを含む比重瓶を使用して決定され得る。いくつかの態様において、エラストマーの密度は、静水学的方法を使用して決定され得る。本明細書中で使用されるように、「圧縮体積密度」とは、試料の圧縮体積に対する試料の質量の比をさし、ここで、「圧縮体積」という用語は、ピストンシリンダテストチャンバーエンクロージャーの周囲の形に完全に一致するまで流動するよう十分な圧縮力に供された時、エラストマー試料が到達した最終平衡体積として定義される。いくつかの態様において、エラストマーの圧縮体積密度は、圧縮体積密度計を使用して決定され得る。
いくつかの態様において、本明細書中に提供される組成物は、0.5mg/cm3~2.0mg/cm3または1.0mg/cm3~1.5mg/cm3または1.1mg/cm3~1.4mg/cm3または1.2mg/cm3~1.35mg/cm3の密度または圧縮体積密度を有する。いくつかの態様において、エラストマーの密度または圧縮体積密度の決定は、ASTM D297-15 ゴム製品の化学分析のための標準試験方法(Standard Test Methods for Rubber Products-Chemical Analysis)を使用して実施され得る。
組換えレジリンベクター、組換え宿主細胞、および発酵物
組換えレジリンをコードするベクター、そのようなベクターを含む組換え宿主細胞、およびそのような組換え宿主細胞および組換えレジリンを含む発酵物が、本明細書中にさらに提供される。
組換えレジリンをコードするベクター、そのようなベクターを含む組換え宿主細胞、およびそのような組換え宿主細胞および組換えレジリンを含む発酵物が、本明細書中にさらに提供される。
いくつかの態様において、本明細書中に提供されるベクターは、N末端で分泌シグナルと融合しており、任意で、C末端でタグペプチドまたはタグポリペプチドと融合しているレジリンポリペプチドをコードする分泌型レジリンコード配列を含む。いくつかの態様において、ベクターは、特定の宿主細胞における発現のためにコドン最適化された分泌型レジリンコード配列を含む。
適切な分泌シグナルは、本明細書中に提供される組換え宿主細胞におけるポリペプチドの分泌を媒介する分泌シグナルである。適切な分泌シグナルの非限定的な例は、サッカロミセス・セレビシエのα接合因子(αMF)、ピキア・パストリスの酸性ホスファターゼ(PHO1)、および一般的なマメであるインゲンマメ(Phaseolus vulgaris)に由来するフィトヘマグルチニン(PHA-E)の分泌シグナルである。付加的な分泌シグナルは、当技術分野において公知であるか、または宿主細胞によって分泌されたタンパク質の同定、その後の分泌型タンパク質のゲノム分析および非翻訳N末端配列の同定によって同定されてもよい(例えば、Huang et al.A proteomic analysis of the Pichia pastoris secretome in methanol-induced cultures.Appl Microbiol Biotechnol.2011 Apr;90(1):235-47を参照すること)。
分泌型レジリンコード配列によってコードされたレジリンは、タグペプチドまたはタグポリペプチドとさらに融合していてもよい。タグペプチドまたはタグポリペプチドの非限定的な例には、アフィニティタグ(即ち、ある種の剤もしくはマトリックスに結合するペプチドもしくはポリペプチド)、可溶化タグ(即ち、タンパク質の適切な折り畳みを支援し、沈殿を防止するペプチドもしくはポリペプチド)、クロマトグラフィータグ(即ち、特定の分離技術の間で異なる分割を与えるためにタンパク質のクロマトグラフィー特性を変化させるペプチドもしくはポリペプチド)、エピトープタグ(即ち、抗体が結合するペプチドもしくはポリペプチド)、蛍光タグ(即ち、短波長の光によって励起された時、高波長の光を放射するペプチドもしくはポリペプチド)、発色タグ(即ち、可視光スペクトルの特定のセグメントを吸収するペプチドもしくはポリペプチド)、酵素基質タグ(即ち、特定の酵素反応の基質であるペプチドもしくはポリペプチド)、化学的基質タグ(即ち、特定の化学修飾の基質であるペプチドもしくはポリペプチド)、またはそれらの組み合わせが含まれる。適切なアフィニティタグの非限定的な例には、マルトース結合タンパク質(MBP)、グルタチオン-S-トランスフェラーゼ(GST)、ポリ(His)タグ、SBPタグ、Strepタグ、およびカルモジュリンタグが含まれる。適切な可溶性タグの非限定的な例には、チオレドキシン(TRX)、ポリ(NANP)、MBP、およびGSTが含まれる。クロマトグラフィータグの非限定的な例には、ポリ陰イオン性アミノ酸(例えば、
)およびポリグルタミン酸タグが含まれる。エピトープタグの非限定的な例には、V5タグ、VSVタグ、Mycタグ、HAタグ、Eタグ、NEタグ、およびFLAGタグが含まれる。蛍光タグの非限定的な例には、緑色蛍光タンパク質(GFP)、青色蛍光タンパク質(BFP)、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、オレンジ色蛍光タンパク質(OFP)、赤色蛍光タンパク質(RFP)、およびそれらの誘導体が含まれる。発色タグの非限定的な例には、GFP様タンパク質ファミリーの非蛍光メンバー(例えば、BlitzenBlue、DonnerMagenta;DNA2.0,Neward,CA)が含まれる。酵素基質タグの非限定的な例には、ビオチン化に適したリジンを配列内に含むペプチドまたはポリペプチド(例えば、AviTag、ビオチンカルボキシルキャリアータンパク質[BCCP])が含まれる。化学的基質タグの非限定的な例には、FIAsH-EDT2との反応に適した基質が含まれる。C末端のペプチドまたはポリペプチドのレジリンとの融合は、(例えば、TEVプロテアーゼ、トロンビン、第Xa因子、もしくはエンテロペプチダーゼによって)切断可能であってもよいか、または非切断可能であってもよい。
)およびポリグルタミン酸タグが含まれる。エピトープタグの非限定的な例には、V5タグ、VSVタグ、Mycタグ、HAタグ、Eタグ、NEタグ、およびFLAGタグが含まれる。蛍光タグの非限定的な例には、緑色蛍光タンパク質(GFP)、青色蛍光タンパク質(BFP)、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、オレンジ色蛍光タンパク質(OFP)、赤色蛍光タンパク質(RFP)、およびそれらの誘導体が含まれる。発色タグの非限定的な例には、GFP様タンパク質ファミリーの非蛍光メンバー(例えば、BlitzenBlue、DonnerMagenta;DNA2.0,Neward,CA)が含まれる。酵素基質タグの非限定的な例には、ビオチン化に適したリジンを配列内に含むペプチドまたはポリペプチド(例えば、AviTag、ビオチンカルボキシルキャリアータンパク質[BCCP])が含まれる。化学的基質タグの非限定的な例には、FIAsH-EDT2との反応に適した基質が含まれる。C末端のペプチドまたはポリペプチドのレジリンとの融合は、(例えば、TEVプロテアーゼ、トロンビン、第Xa因子、もしくはエンテロペプチダーゼによって)切断可能であってもよいか、または非切断可能であってもよい。
いくつかの態様において、ベクターは、1つの分泌型レジリンコード配列を含む。他の態様において、ベクターは、2つまたはそれ以上(例えば、3つ、4つ、または5つ)の分泌型レジリンコード配列を含む。いくつかのそのような態様において、分泌型レジリンコード配列は、同一である。他のそのような態様において、分泌型レジリンコード配列のうちの少なくとも2つは、同一でない。分泌型レジリンコード配列のうちの少なくとも2つが同一でない態様において、少なくとも2つの分泌型レジリンコード配列は、それらがコードするレジリンおよび/または分泌シグナルおよび/または任意のタグペプチドもしくはタグポリペプチドにおいて相互に異なっていてよい。
いくつかの態様において、ベクターは、分泌型レジリンコード配列の発現を駆動するよう、分泌型レジリンコード配列に機能的に連結されたプロモーターを含む。プロモーターは、構成性プロモーターまたは誘導性プロモーターであり得る。いくつかの態様において、誘導性プロモーターの誘導は、グルコース抑制、ガラクトース誘導、ショ糖誘導、リン酸抑制、チアミン抑制、またはメタノール誘導を介して起こる。適切なプロモーターには、本明細書中に提供される組換え宿主細胞においてタンパク質の発現を媒介するプロモーターが含まれる。適切なプロモーターの非限定的な例には、AOX1プロモーター、GAPプロモーター、LAC4-PBIプロモーター、T7プロモーター、TACプロモーター、GCW14プロモーター、GAL1プロモーター、λPLプロモーター、λPRプロモーター、βラクタマーゼプロモーター、spaプロモーター、CYC1プロモーター、TDH3プロモーター、GPDプロモーター、TEF1プロモーター、ENO2プロモーター、PGL1プロモーター、SUC2プロモーター、ADH1プロモーター、ADH2プロモーター、HXT7プロモーター、PHO5プロモーター、およびCLB1プロモーターが含まれる。分泌型レジリンコード配列の発現を容易にするために使用され得る付加的なプロモーターは、当技術分野において公知である。
いくつかの態様において、ベクターは、分泌型レジリンコード配列の転写の終結をもたらすよう、分泌型レジリンコード配列に機能的に連結されたターミネーターを含む。適切なターミネーターには、本明細書中に提供される組換え宿主細胞において転写を終結させるターミネーターが含まれる。適切なターミネーターの非限定的な例には、AOX1ターミネーター、PGK1ターミネーター、およびTPS1ターミネーターが含まれる。分泌型レジリンコード配列の転写の終結をもたらす付加的なターミネーターは、当技術分野において公知である。
ベクターが2つもしくはそれ以上のレジリンコード配列を含む態様において、2つもしくはそれ以上のレジリンコード配列は、同一のプロモーターおよび/もしくはターミネーターに機能的に連結されていてもよいか、または2種類もしくはそれ以上の異なるプロモーターおよび/もしくはターミネーターに機能的に連結されていてもよい。
本明細書中に提供されるベクターは、組換え宿主細胞におけるベクターの繁殖に適した要素をさらに含んでいてよい。そのような要素の非限定的な例には、細菌複製開始点および選択マーカー(例えば、抗生物質耐性遺伝子、栄養要求性マーカー)が含まれる。細菌複製開始点および選択マーカーは、当技術分野において公知である。いくつかの態様において、選択マーカーは、薬物耐性マーカーである。薬物耐性マーカーは、そうでなければ細胞を死滅させるであろう外因的に添加された薬物を細胞が解毒することを可能にする。薬物耐性マーカーの例示的な例には、アンピシリン、テトラサイクリン、カナマイシン、ブレオマイシン、ストレプトマイシン、ハイグロマイシン、ネオマイシン、Zeocin(商標)等のような抗生物質に対する耐性に関するものが含まれるが、これらに限定されるわけではない。いくつかの態様において、選択マーカーは、栄養要求性マーカーである。栄養要求性マーカーは、必須成分を欠く培地において増殖させられる間、細胞がその必須成分(一般的には、アミノ酸)を合成することを可能にする。選択可能な栄養要求性遺伝子配列には、例えば、ヒスチジノールの存在下でヒスチジンを含まない培地における増殖を可能にするhisDが含まれる。本発明のベクターに適した他の選択マーカーには、ブレオマイシン耐性遺伝子、メタロチオネイン遺伝子、ハイグロマイシンBホスホトランスフェラーゼ遺伝子、AURI遺伝子、アデノシンデアミナーゼ遺伝子、アミノグリコシドホスホトランスフェラーゼ遺伝子、ジヒドロ葉酸還元酵素遺伝子、チミジンキナーゼ遺伝子、およびキサンチングアニンホスホリボシルトランスフェラーゼ遺伝子が含まれる。
本発明のベクターは、宿主細胞のゲノム内の特定の位置への分泌型レジリンコード配列の組み込みを指示するターゲティング配列をさらに含んでいてよい。そのようなターゲティング配列の非限定的な例には、宿主細胞のゲノムに存在するヌクレオチド配列と同一のヌクレオチド配列が含まれる。いくつかの態様において、ターゲティング配列は、宿主細胞のゲノム内の反復要素と同一である。いくつかの態様において、ターゲティング配列は、宿主細胞のゲノム内の転位要素と同一である。
いくつかの態様において、本明細書中に記載されたベクターを含む組換え宿主細胞が、本明細書中に提供される。いくつかの態様において、ベクターは、例えば、相同組換えまたは標的組込みを介して、組換え宿主細胞のゲノム(例えば、染色体)内に安定的に組み込まれる。ゲノム組み込みのために適した部位の非限定的な例には、サッカロミセス・セレビシエゲノム内のTy1遺伝子座、ピキア・パストリスゲノム内のrDNA遺伝子座およびHSP82遺伝子座、ならびに組換え宿主細胞のゲノム全体に散在するコピーを有する転位要素が含まれる。他の態様において、ベクターは、組換え宿主細胞のゲノム内に安定的に組み込まれず、染色体外に存在する。
組換え宿主細胞は、哺乳類、植物、藻類、真菌、または微生物を起源とするものであり得る。適切な真菌の非限定的な例には、メチロトローフ酵母、糸状酵母、アークスラ・アデニニボランス、クロコウジカビ(Aspergillus niger)、アワモリコウジカビ(Aspergillus niger var.awamori)、コウジカビ(Aspergillus oryzae)、カンジダ・エチェルシー(Candida etchellsii)、カンジダ・ギリエルモンディ(Candida guilliermondii)、カンジダ・フミリス(Candida humilis)、カンジダ・リポリチカ、カンジダ・プソイドトロピカリス(Candida pseudotropicalis)、トルラ酵母(Candida utilis)、カンジダ・バーサティリス(Candida versatilis)、デバリオミセス・ハンゼニー(Debaryomyces hansenii)、クリ胴枯病菌(Endothia parasitica)、エレモテシウム・アシュビー(Eremothecium ashbyii)、フザリウム・モニリフォルメ(Fusarium moniliforme)、ハンゼヌラ・ポリモルファ、クルイベロミセス・ラクチス、クルイベロミセス・マルキシアヌス(Kluyveromyces marxianus)、クルイベロミセス・サーモトレランス(Kluyveromyces thermotolerans)、モルテイレラ・ビナソー・ラフィノセウチライザー変種(Morteirella vinaceae var.raffinoseutilizer)、ムコール・ミエヘイ(Mucor miehei)、ムコール・ミエヘイ・クーニー・エト・エマーソン変種(Mucor miehei var. Cooney et Emerson)、ムコール・プシルス・リンツ(Mucor pusillus Lindt)、ペニシリウム・ロックフォルティ(Penicillium roquefortii)、ピキア・メタノリカ、ピキア・パストリス(コマガテラ・ファフィー)、ピキア(シェフェルソミセス)スチピチス、リゾプス・ニベウス(Rhizopus niveus)、ロドトルラ属(Rhodotorula)、サッカロミセス・バヤヌス(Saccharomyces bayanus)、サッカロミセス・ベティカス(Saccharomyces beticus)、サッカロミセス・セレビシエ、サッカロミセス・ケバリエリ(Saccharomyces chevalieri)、サッカロミセス・ジアスタティカス(Saccharomyces diastaticus)、サッカロミセス・エリプソイデウス(Saccharomyces ellipsoideus)、サッカロミセス・エクシグース(Saccharomyces exiguus)、サッカロミセス・フロレンティヌス(Saccharomyces florentinus)、サッカロミセス・フラギリス(Saccharomyces fragilis)、サッカロミセス・パストリアヌス(Saccharomyces pastorianus)、サッカロミセス・ポンベ(Saccharomyces pombe)、サッカロミセス・サケ(Saccharomyces sake)、サッカロミセス・ウバルム(Saccharomyces uvarum)、スポリジオボラス・ジョンソニー(Sporidiobolus johnsonii)、スポリジオボラス・サルモニカラー(Sporidiobolus salmonicolor)、スポロボロミセス・ロゼウス(Sporobolomyces roseus)、トリコデルマ・リーゼイ(Trichoderma reesi)、キサントフィロミセス・デンドロロウス(Xanthophyllomyces dendrorhous)、ヤロウイア・リポリチカ、ザイゴサッカロミセス・ロウキシー(Zygosaccharomyces rouxii)、ならびにそれらの誘導体および交雑種が含まれる。
適切な微生物の非限定的な例には、アセトバクター・スボキシダンス(Acetobacter suboxydans)、アセトバクター・キシリナム(Acetobacter xylinum)、アクチノプラネス・ミズーリエンシス(Actinoplane missouriensis)、アースロスピラ・プラテンシス(Arthrospira platensis)、アースロスピラ・マキシマ(Arthrospira maxima)、バチルス・セレウス(Bacillus cereus)、バチルス・コアグランス(Bacillus coagulans)、バチルス・リケニフォルミス(Bacillus licheniformis)、バチルス・ステアロサーモフィルス(Bacillus stearothermophilus)、バチルス・スブチリス(Bacillus subtilis)、大腸菌(Escherichia coli)、ラクトバチルス・アシドフィルス(Lactobacillus acidophilus)、ラクトバチルス・ブルガリクス(Lactobacillus bulgaricus)、ラクトバチルス・ロイテリ(Lactobacillus reuteri)、ラクトコッカス・ラクチス(Lactococcus lactis)、ラクトコッカス・ラクチス・ランセフィールド(Lactococcus lactis Lancefield)N群、ロイコノストック・シトロボルム(Leuconostoc citrovorum)、ロイコノストック・デキストラニカム(Leuconostoc dextranicum)、ロイコノストック・メセンテロイデス(Leuconostoc mesenteroides)NRRL B-512(F)株、ミクロコッカス・リゾデイクティカス(Micrococcus lysodeikticus)、スピルリナ(Spirulina)、ストレプトコッカス・クレモリス(Streptococcus cremoris)、ストレプトコッカス・ラクチス(Streptococcus lactis)、ストレプトコッカス・ラクチス亜種ジアセチラクチス(Streptococcus lactis subspecies diacetylactis)、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)、ストレプトマイセス・チャッタノオゲンシス(Streptomyces chattanoogensis)、ストレプトマイセス・グリセウス(Streptomyces griseus)、ストレプトマイセス・ナタレンシス(Streptomyces natalensis)、ストレプトマイセス・オリバセウス(Streptomyces olivaceus)、ストレプトマイセス・オリボクロモゲネス(Streptomyces olivochromogenes)、ストレプトマイセス・ルビギノサス(Streptomyces rubiginosus)、キサントモナス・カンペストリス(Xanthomonas campestris)、ならびにそれらの誘導体および交雑種が含まれる。組換え宿主細胞として使用され得る追加の株は、当技術分野において公知である。「組換え宿主細胞」という用語は、特定の主細胞のみならず、そのような細胞の子孫もさすものであることが理解されるべきである。変異または環境影響のいずれかのため、ある種の改変が後続世代において起こり得るため、そのような子孫は、実際には、親細胞と同一でない可能性があるが、それでも本明細書中で使用されるように「組換え宿主細胞」という用語の範囲内に含まれる。
いくつかの態様において、組換え宿主細胞は、本明細書中に提供される組換えレジリンの産生を改善する遺伝子改変を含む。そのような遺伝子改変の非限定的な例には、変化したプロモーター、変化したキナーゼ活性、変化したタンパク質折り畳み活性、変化したタンパク質分泌活性、変化した遺伝子発現誘導経路、および変化したプロテアーゼ活性が含まれる。
本明細書中に提供される組換え宿主細胞は、本明細書中に提供されるベクターを用いて適切な起源の細胞を形質転換することによって生成される。そのような形質転換のためのベクターは、環状であってもよいかまたは直鎖状であってもよい。ベクターを含む組換え宿主細胞形質転換体は、例えば、細胞の増殖の可否による選択を可能にする、ベクターによってコードされた薬物耐性マーカーもしくは栄養要求性マーカーを発現させることによって、またはその他の手段(例えば、ベクターに含まれる発光ペプチドの検出、例えば、制限酵素マッピング、PCR増幅、もしくは単離された染色体外ベクターもしくは染色体組み込み部位の配列分析による個々の組換え宿主細胞コロニーの分子的分析)によって容易に同定され得る。
いくつかの態様において、本明細書中に提供される組換え宿主細胞は、高力価の本明細書中に提供される組換えレジリンを産生することができる。いくつかのそのような態様において、組換え宿主細胞は、2mg レジリン/g乾燥細胞重量/時間、4mg レジリン/g乾燥細胞重量/時間、6mg レジリン/g乾燥細胞重量/時間、8mg レジリン/g乾燥細胞重量/時間、10mg レジリン/g乾燥細胞重量/時間、12mg レジリン/g乾燥細胞重量/時間、14mg レジリン/g乾燥細胞重量/時間、16mg レジリン/g乾燥細胞重量/時間、18mg レジリン/g乾燥細胞重量/時間、20mg レジリン/g乾燥細胞重量/時間、25mg レジリン/g乾燥細胞重量/時間、もしくは30mg レジリン/g乾燥細胞重量/時間を上回るか;2~40、30、20、10、もしくは5mg レジリン/g乾燥細胞重量/時間;5~40、30、20、もしくは10mg レジリン/g乾燥細胞重量/時間;10~40、30、もしくは20mg レジリン/g乾燥細胞重量/時間;20~40もしくは30mg レジリン/g乾燥細胞重量/時間;または30~40mg レジリン/g乾燥細胞重量/時間の速度で組換えレジリンを産生する。他のそのような態様において、組換え宿主細胞は、2mg レジリン/g乾燥細胞重量/時間、4mg レジリン/g乾燥細胞重量/時間、6mg レジリン/g乾燥細胞重量/時間、8mg レジリン/g乾燥細胞重量/時間、10mg レジリン/g乾燥細胞重量/時間、12mg レジリン/g乾燥細胞重量/時間、14mg レジリン/g乾燥細胞重量/時間、16mg レジリン/g乾燥細胞重量/時間、18mg レジリン/g乾燥細胞重量/時間、20mg レジリン/g乾燥細胞重量/時間、25mg レジリン/g乾燥細胞重量/時間、もしくは30mg レジリン/g乾燥細胞重量/時間を上回るか;2~40、30、20、10、もしくは5mg レジリン/g乾燥細胞重量/時間;5~40、30、20、もしくは10mg レジリン/g乾燥細胞重量/時間;10~40、30、もしくは20mg レジリン/g乾燥細胞重量/時間;20~40もしくは30mg レジリン/g乾燥細胞重量/時間;または30~40mg レジリン/g乾燥細胞重量/時間の速度で組換えレジリンを分泌する。産生された組換えレジリンの同一性は、HPLC定量化、ウエスタンブロット分析、ポリアクリルアミドゲル電気泳動、二次元質量分析(2D-MS/MS)配列同定によって確認され得る。
いくつかの態様において、本明細書中に提供される組換え宿主細胞は、本明細書中に提供される組換えレジリンの高い分泌型画分を有する。いくつかのそのような態様において、組換え宿主細胞は、組換えレジリンの分泌画分を有し、該分泌画分が、50%超、60%超、70%超、80%超、もしくは90%超であるか;50%~100%、90%、80%、70%、もしくは60%;60%~100%、90%、80%、もしくは70%;70%~100%、90%、もしくは80%;90%~100%もしくは90%;または90%~100%である。
組換えレジリンの産生および分泌は、組換え宿主細胞に含まれる分泌型レジリンコード配列のコピーの数および/または組換え宿主細胞に含まれる分泌型レジリンコード配列の転写の速度によって影響され得る。いくつかの態様において、組換え宿主細胞は、1つの分泌型レジリンコード配列を含む。他の態様において、組換え宿主細胞は、2つまたはそれ以上(例えば、3つ、4つ、5つ、またはそれ以上)の分泌型レジリンコード配列を含む。いくつかの態様において、組換え宿主細胞は、強力なプロモーターに機能的に連結された分泌型レジリンコード配列を含む。強力なプロモーターの非限定的な例には、ピキア・パストリスのpGCW14プロモーターが含まれる。いくつかの態様において、組換え宿主細胞は、中程度のプロモーターに機能的に連結された分泌型レジリンコード配列を含む。そのような中程度のプロモーターの非限定的な例には、ピキア・パストリスのpGAPプロモーターが含まれる。いくつかの態様において、組換え宿主細胞は、弱いプロモーターの調節下でレジリンをコードするコード配列を含む。
本明細書中に提供される発酵物は、本明細書中に記載された組換え宿主細胞と、組換え宿主細胞を増殖させるのに適した培養用培地とを含む。
前記発酵物は、細胞の生存および/または増殖ならびに組換えレジリンの分泌のために組換え宿主細胞が必要とする栄養素を提供する培養用培地において、組換え宿主細胞を培養することによって得られる。そのような培養用培地は、典型的には、過剰の炭素源を含有している。適切な炭素源の非限定的な例には、単糖、二糖、多糖、およびそれらの組み合わせが含まれる。適切な単糖の非限定的な例には、グルコース、ガラクトース、マンノース、フルクトース、リボース、キシロース、アラビノース、リボース、およびそれらの組み合わせが含まれる。適切な二糖の非限定的な例には、ショ糖、ラクトース、マルトース、トレハロース、セロビオース、およびそれらの組み合わせが含まれる。適切な多糖の非限定的な例には、ラフィノース、デンプン、グリコーゲン、グリカン、セルロース、キチン、およびそれらの組み合わせが含まれる。
いくつかの態様において、発酵物は、重量で全発酵物の少なくとも1%、5%、10%、20%、もしくは30%;1%~100%、90%、80%、70%、60%、50%、40%、30%、20%、もしくは10%;10%~100%、90%、80%、70%、60%、50%、40%、30%、もしくは20%;20%~100%、90%、80%、70%、60%、50%、40%、もしくは30%;30%~100%、90%、80%、70%、60%、50%、もしくは40%;40%~100%、90%、80%、70%、60%、もしくは50%;50%~100%、90%、80%、70%、もしくは60%;60%~100%、90%、80%、もしくは70%;70%~100%、90%、もしくは80%;80%~100%もしくは90%;または90%~100%の量の組換えレジリンを含む。
いくつかの態様において、発酵物は、少なくとも2g/L、5g/L、10g/L、15g/L、20g/L、25g/L、もしくは30g/L;2g/L~300g/L、200g/L、100g/L、90g/L、80g/L、70g/L、60g/L、50g/L、40g/L、30g/L、20g/L、もしくは10g/L;10g/L~300g/L、200g/L、100g/L、90g/L、80g/L、70g/L、60g/L、50g/L、40g/L、30g/L、もしくは20g/L;20g/L~300g/L、200g/L、100g/L、90g/L、80g/L、70g/L、60g/L、50g/L、40g/L、もしくは30g/L;30g/L~300g/L、200g/L、100g/L、90g/L、80g/L、70g/L、60g/L、50g/L、もしくは40g/L;40g/L~300g/L、200g/L、100g/L、90g/L、80g/L、70g/L、60g/L、もしくは50g/L;50g/L~300g/L、200g/L、100g/L、90g/L、80g/L、70g/L、もしくは60g/L;60g/L~300g/L、200g/L、100g/L、90g/L、80g/L、もしくは70g/L;70g/L~300g/L、200g/L、100g/L、90g/L、もしくは80g/L;80g/L~300g/L、200g/L、100g/L、もしくは90g/L;90g/L~300g/L、200g/L、もしくは100g/L;100g/L~300g/Lもしくは200g/L;または200g/L~300g/Lの量の組換えレジリンを含む。
方法
本明細書中に記載された組換えレジリンの作製の方法が、さらに本明細書中に提供される。
本明細書中に記載された組換えレジリンの作製の方法が、さらに本明細書中に提供される。
前記方法は、一般に、他に示されない限り、当技術分野において周知の従来の方法によって、本明細書全体に引用され記述される様々な一般的な参照およびより具体的な参照に記載されたように実施される。例えば、Sambrook et al.,Molecular Cloning:A Laboratory Manual,2d ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989;Ausubel et al.,Current Protocols in Molecular Biology,Greene Publishing Associates,1992,and Supplements to 2002);Harlow and Lane,Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1990;Taylor and Drickamer,Introduction to Glycobiology,Oxford Univ.Press,2003;Worthington Enzyme Manual,Worthington Biochemical Corp.,Freehold,N.J.;Handbook of Biochemistry:Section A Proteins,Vol I,CRC Press,1976;Handbook of Biochemistry:Section A Proteins,Vol II,CRC Press,1976;Essentials of Glycobiology,Cold Spring Harbor Laboratory Press,1999を参照すること。
いくつかの態様において、宿主細胞から細胞外にレジリンを分泌するために新規の方法が用いられる。いくつかの態様において、方法は、分泌型レジリンコード配列を含むベクターを構築する工程(図2の工程1001)、ベクターを宿主細胞中で形質転換する工程(図2の工程1002)、および、次いで、レジリンを細胞外に分泌するよう組換え宿主細胞を培養する工程(図2の工程1003)を含む。いくつかの態様において、方法は、2mg レジリン/g乾燥細胞重量/時間、4mg レジリン/g乾燥細胞重量/時間、6mg レジリン/g乾燥細胞重量/時間、8mg レジリン/g乾燥細胞重量/時間、10mg レジリン/g乾燥細胞重量/時間、12mg レジリン/g乾燥細胞重量/時間、14mg レジリン/g乾燥細胞重量/時間、16mg レジリン/g乾燥細胞重量/時間、18mg レジリン/g乾燥細胞重量/時間、20mg レジリン/g乾燥細胞重量/時間、25mg レジリン/g乾燥細胞重量/時間、もしくは30mg レジリン/g乾燥細胞重量/時間を上回るか;2~40、30、20、10、もしくは5mg レジリン/g乾燥細胞重量/時間;5~40、30、20、もしくは10mg レジリン/g乾燥細胞重量/時間;10~40、30、もしくは20mg レジリン/g乾燥細胞重量/時間;20~40もしくは30mg レジリン/g乾燥細胞重量/時間;または30~40mg レジリン/g乾燥細胞重量/時間の速度でレジリンを細胞外に分泌させることを含む。いくつかの態様において、次いで、分泌型レジリンが精製され(図2の工程1004)、精製されたレジリンがエラストマーを形成するよう架橋される(図2の工程1005)。いくつかの態様において、本明細書中に提供される方法は、本明細書中に提供される組換え宿主細胞を得るために、本明細書中に提供されるベクターを用いて細胞を形質転換する工程(図2の工程1002)を含む。ベクターを用いて細胞を形質転換するための方法は、当技術分野において周知である。そのような方法の非限定的な例には、リン酸カルシウムトランスフェクション、デンドリマートランスフェクション、リポソームトランスフェクション(例えば、カチオン性リポソームトランスフェクション)、カチオン性ポリマートランスフェクション、電気穿孔、セルスクイージング(cell squeezing)、ソノポレーション(sonoporation)、光学(optical)トランスフェクション、プロトプラスト融合、インペールフェクション(impalefection)、水力学的送達、遺伝子銃、マグネトフェクション(magnetofection)、およびウイルス形質導入が含まれる。当業者は、ベクターを導入するためのある種の技術が、ある種の型の細胞のためによりよく機能するという当技術分野における知識に基づき、本明細書中に提供されるベクターを用いて細胞を形質転換するために適した1種類または複数種類の方法を選択することができる。
いくつかの態様において、方法は、本明細書中に提供される発酵物を得るのに適した条件下で、本明細書中に提供される組換え宿主細胞を培養用培地中で培養する工程(図2の工程1003)をさらに含む。いくつかの態様において、条件および培養用培地は、組換え宿主細胞からの組換えタンパク質の培養用培地中への分泌を容易にするのに適したものである。これらの方法における使用に適した培養用培地は、当技術分野において公知であり、適切な培養条件も同様である。酵母宿主細胞の培養の例示的な詳細は、Idiris et al.,Appl.Microbiol.Biotechnol.86:403-417,2010;Zhang et al.,Biotechnol.Bioprocess.Eng.5:275-287,2000;Zhu,Biotechnol.Adv.30:1158-1170,2012;Li et al.,MAbs 2:466-477,2010に記載されている。
いくつかの態様において、方法は、本明細書中に提供される組換えレジリンを得るために、本明細書中に提供される発酵物から、分泌型組換えレジリンを精製する工程(図2の工程1004)をさらに含む。精製は、発酵物から分泌型タンパク質を精製するための当技術分野において公知の多様な方法によって行われ得る。そのような方法における一般的な工程には、(細胞を除去するための)遠心分離、その後の沈殿剤またはその他の適切なコスモトロープ(cosmotropes)(例えば、硫酸アンモニウム)を使用したタンパク質の沈殿が含まれる。次いで、沈殿したタンパク質を、遠心分離によって上清から分離し、溶媒(例えば、リン酸緩衝生理食塩水[PBS])に再懸濁させることができる。溶解した塩を除去するために、懸濁したタンパク質を透析することができる。さらに、透析されたタンパク質を、他のタンパク質を変性させるために加熱することができ、変性タンパク質を遠心分離によって除去することができる。任意で、精製された組換えレジリンをコアセルベート(coacervated)することができる。
様々な態様において、発酵物から分泌型組換えタンパク質を精製する方法は、尿素またはチオシアン酸グアニジンのような公知のカオトロープによって、細胞ブロス全体または細胞ペレットにおいてタンパク質を可溶化する工程と共に、様々な遠心分離工程を含み得る。
いくつかの態様において、本明細書中に提供される方法は、本明細書中に提供される組換えレジリン組成物を得るために組換えレジリンを架橋する工程(図2の工程1005)をさらに含む。タンパク質を架橋するための方法は、当技術分野において公知である。いくつかの態様において、架橋は、(例えば、西洋ワサビペルオキシダーゼを使用した)酵素的架橋を介して達成される。他の態様において、架橋は、光化学的架橋を介して達成される(例えば、Elvin CM,Carr AG,Huson MG,Maxwell JM,Pearson RD,Vuocolo T,Liyou NE,Wong DCC,Merritt DJ,Dixon NE.Nature 2005,437,999-1002;Whittaker JL,Dutta NK,Elvin CM,Choudhury NR.Journal of Materials Chemistry B 2015,3,6576-79;Degtyar E,Mlynarczyk B,Fratzl P,Harrington MJ.Polymer 2015,69,255-63を参照すること)。いくつかの態様において、架橋は、化学的架橋を介して達成される(例えば、Renner JN,Cherry KM,Su RSC,Liu JC.Biomacromolecules 2012,13,3678-85;Charanti,MB,Ifkovits,JL,Burdick,JA,Linhardt JG,Kiick,KL.Soft Matter 2009,5,3412-16;Li LQ,Tong ZX,Jia XQ,Kiick KL.Soft Matter 2013,9,665-73;Li L,Mahara A,Tong Z,Levenson EA,McGann CL,Jia X,Yamaoka T,Kiick KL.Advanced Healthcare Materials 2016,5,266-75を参照すること)。いくつかの態様において、架橋は、チロシン残基を介して達成される。他の態様において、架橋は、リジン残基を介して達成される。いくつかの態様において、架橋は、システイン残基を介して達成される。いくつかの態様において、架橋は、トランスグルタミナーゼを用いる(例えば、Kim Y,Gill EE,Liu JC.Enzymatic Cross-Linking of Resilin-Based Proteins for Vascular Tissue Engineering Applications.Biomacromolecules.17(8):2530-9を参照すること)。いくつかの態様において、架橋は、ポリ(エチレングリコール)(PEG)を用いる(McGann CL,Levenson EA,Kiick KL.Macromol.Chem.Phys.2013,214,203-13;McGann CL,Akins RE,Kiick KL.Resilin-PEG Hybrid Hydrogels Yield Degradable Elastomeric Scaffolds with Heterogeneous Microstructure.Biomacromolecules.2016;17(1):128-40)。いくつかの態様において、架橋は、得られた組換えレジリン組成物が特定の形または形態を有するよう、容器または金型において行われる。
実施例1:組換えレジリンを分泌するピキア・パストリス組換え宿主細胞の生成
分泌型レジリンコード配列を含むベクターを用いてGS115(NRRL Y15851)ピキア・パストリス(コマガテラ・ファフィー)のHIS+誘導体を形質転換することによって、組換えレジリンを分泌するピキア・パストリス組換え宿主細胞を生成した。
分泌型レジリンコード配列を含むベクターを用いてGS115(NRRL Y15851)ピキア・パストリス(コマガテラ・ファフィー)のHIS+誘導体を形質転換することによって、組換えレジリンを分泌するピキア・パストリス組換え宿主細胞を生成した。
前記ベクターは各々、N末端分泌シグナル(α接合因子リーダー配列およびプロ配列)とインフレームで融合している3つのレジリンコード配列を含み、いくつかの場合において、C末端3×FLAGタグ(SEQ ID NO:45)を含んでいた(図3を参照すること)。分泌型レジリンコード配列の各々には、プロモーター(pGCW14)およびターミネーター(tAOX1 pAシグナル)が隣接していた。ベクターは、ピキア・パストリスゲノムのHSP82遺伝子座への3つの分泌型レジリンコード配列の組み込みを指示することができるターゲティング領域、細菌および酵母の形質転換体の選択のための優性耐性マーカー、ならびに細菌複製開始点をさらに含んでいた。
レジリンコード配列は、科学文献および公の配列データベースの検索から得られた。ヌクレオチド配列をアミノ酸配列へ翻訳し、次いで、コドン最適化した。全長レジリン配列および短縮型レジリン配列の両方を選択した。選択された分泌型レジリンコード配列は、表1にリストされる。
組み込まれた各分泌型レジリンコード配列の3コピーを含む宿主株を生成するために、電気穿孔を使用してベクターをピキア・パストリス中で形質転換した。形質転換体を、抗生物質が補足されたYPD寒天プレートに播種し、30℃で48時間インキュベートした。
各最終形質転換由来のクローンを96穴ブロックにおいて400μLの緩衝グリセロール複合培地(BMGY)に接種し、1,000rpmで撹拌しながら30℃で24時間インキュベートした。試料を取り出し、遠心分離を介して組換え宿主細胞をペレット化し、上清を回収し、クーマシーゲルを介したレジリン含量の分析および(3×FLAGタグを含むポリペプチドについての)ウエスタンブロット分析のため、SDS-PAGEゲル上で実行した。FLAGタグ付きタンパク質については、残りの培養物を、ELISA測定のため、デュプリケートで最少培地培養物に接種するために使用した。1デュプリケートをペレット化し、上清を直接測定した。第2のデュプリケートをチオシアン酸グアニジンによって抽出し、細胞内画分および細胞外画分の両方を測定した。
図4Bおよび図4Cに示されるように、多数の種に由来する組換えレジリンが、ピキア・パストリス組換え宿主細胞において成功裡に発現された(注:いくつかのタンパク質は塩基性残基をほとんど有しておらず、従って、クーマシーによって検出するのは困難であるが、ウエスタンにおいてはシグナルを有する)。図4Aに示されるように、組換え宿主細胞は、産生された組換えレジリンを90%も分泌した。
実施例2:組換えレジリンを発現および分泌するピキア・パストリス組換え宿主細胞の産生量の測定
産生量を測定するために、各組換え宿主細胞の3つのクローンを、96穴スクエアウェルブロックにおいて400μLのBMGYに接種し、1,000rpmで撹拌しながら30℃で48時間インキュベートした。48時間のインキュベーションの後、4μLの各培養物を、96穴スクエアウェルブロックにおいて400μLの最少培地に接種するために使用し、次いで、それを1,000rpmで撹拌しながら30℃で48時間インキュベートした。400uLの5Mチオシアン酸グアニジンを培養物に添加し、混合物を遠心分離によってペレット化した。上清を保存し、ペレットを800μLの2.5Mチオシアン酸グアニジンに再懸濁させた。再懸濁した細胞をビーズを使用して物理的に溶解し、溶解された細胞混合物を、遠心分離によってペレット化し、上清を保存した。各画分のレジリンの濃度を、3×FLAGエピトープを定量化する直接酵素結合免疫吸着アッセイ(ELISA)分析によって決定した(図5Aおよび図5B)。
産生量を測定するために、各組換え宿主細胞の3つのクローンを、96穴スクエアウェルブロックにおいて400μLのBMGYに接種し、1,000rpmで撹拌しながら30℃で48時間インキュベートした。48時間のインキュベーションの後、4μLの各培養物を、96穴スクエアウェルブロックにおいて400μLの最少培地に接種するために使用し、次いで、それを1,000rpmで撹拌しながら30℃で48時間インキュベートした。400uLの5Mチオシアン酸グアニジンを培養物に添加し、混合物を遠心分離によってペレット化した。上清を保存し、ペレットを800μLの2.5Mチオシアン酸グアニジンに再懸濁させた。再懸濁した細胞をビーズを使用して物理的に溶解し、溶解された細胞混合物を、遠心分離によってペレット化し、上清を保存した。各画分のレジリンの濃度を、3×FLAGエピトープを定量化する直接酵素結合免疫吸着アッセイ(ELISA)分析によって決定した(図5Aおよび図5B)。
実施例3:組換えレジリンの精製
非FLAGタグ付きのDs_ACBポリペプチドおよびAe_Aポリペプチドを、精製および架橋のために選択した。(Ds_ACBを発現する)RMs1221株および(Ae_Aを発現する)RMs1224株を、300rpmで撹拌しながら、30℃で48時間、フラスコにおいて500mLのBMGYにおいて増殖させた。
非FLAGタグ付きのDs_ACBポリペプチドおよびAe_Aポリペプチドを、精製および架橋のために選択した。(Ds_ACBを発現する)RMs1221株および(Ae_Aを発現する)RMs1224株を、300rpmで撹拌しながら、30℃で48時間、フラスコにおいて500mLのBMGYにおいて増殖させた。
精製のためのプロトコールは、Lyons et al.(2007)から改作された。遠心分離によって細胞をペレット化し、上清を収集した。硫酸アンモニウムの添加によって、タンパク質を沈殿させた。沈殿したタンパク質を、少量のリン酸緩衝生理食塩水(PBS)に再懸濁させ、再懸濁した試料をPBSに対して透析して塩を除去した。次いで、透析された試料を、ネイティブタンパク質を変性させるために加熱し、変性タンパク質を遠心分離によって除去した。保持された上清は、精製されたレジリンポリペプチドを含有していた。任意で、保持された上清を冷却して、濃縮された下相および希薄な上相をもたらすコアセルベーションを引き起こした。
図6に示されるように、Ae_Aは、比較的純粋な形態で得られ、Ds_ACBは、70kDa、50kDa、および25kDaの3本のバンドを生じた。
実施例4:精製され分泌された組換えレジリンの架橋
濃縮されたDs_ACBレジリンを、2種類の方法:(Elvin et al.2005から改作された)光架橋および(Qin et al.2009から改作された)酵素的架橋のうちの1種類を介して架橋した。
濃縮されたDs_ACBレジリンを、2種類の方法:(Elvin et al.2005から改作された)光架橋および(Qin et al.2009から改作された)酵素的架橋のうちの1種類を介して架橋した。
光架橋のため、レジリンタンパク質を、過硫酸アンモニウムおよびトリス(ビピリジン)ルテニウム(II)([Ru(bpy)3]2+)と混合した。混合物を明るい白色光に曝すと、その後、混合物はゴム状固体を形成した。
酵素的架橋のため、レジリンタンパク質を西洋ワサビペルオキシダーゼ(HRP)および過酸化水素と混合した。混合物を37℃でインキュベートすると、その後、混合物はゴム状固体を形成した。
実施例5:組換えレジリンのブロックの作製
(Ds_ACBレジリンを発現する)RMs1221株を、より大量のタンパク質を作製するために、2つの2L発酵槽において実行した。
(Ds_ACBレジリンを発現する)RMs1221株を、より大量のタンパク質を作製するために、2つの2L発酵槽において実行した。
1VVMの気流および700rpmの最小撹拌で、30℃に調節された撹拌発酵容器において、出発供給材料としての15g/Lのグルコースおよび1g/L L81消泡剤を含む最少基礎塩培地において、株を増殖させた。水酸化アンモニウムのオンデマンドの添加によって、発酵物のpHを5に調節した。バッチグルコースが枯渇すると、酸素取り込み速度120mモル/L/時間を維持するために設計されたプログラムされた供給レシピを介して、グルコースを添加し、温度を25℃に減少させ、溶存酸素を20%に維持した。約700~800 ODの細胞密度で、70時間後、発酵物を採集した。
前記タンパク質を、実施例3に記載されたように精製し、実施例4に記載されたように酵素的架橋のための試薬と組み合わせた。架橋混合物を、小型の円筒形、長方形、球状、および靴形の金型に充填し、37℃で最終的にインキュベートした。得られた組換えレジリン固体は、図7に示される。
実施例6:レジリン固体の材料試験
実施例5に記載されたようにして作製されたレジリンシリンダを、レオメータを使用した圧縮試験に供した。組換えレジリンシリンダは、破壊されることなく、7.3mmの初期高さ(平均幅5.4mm)から0.66mm未満に圧縮され得た。図8に示されるように、シリンダは、圧縮加重の開放によって、6.7mmの高さ(平均幅5.6mm)に復帰した。
実施例5に記載されたようにして作製されたレジリンシリンダを、レオメータを使用した圧縮試験に供した。組換えレジリンシリンダは、破壊されることなく、7.3mmの初期高さ(平均幅5.4mm)から0.66mm未満に圧縮され得た。図8に示されるように、シリンダは、圧縮加重の開放によって、6.7mmの高さ(平均幅5.6mm)に復帰した。
実施例7:細胞ブロス全体から全長組換えレジリンを回収するための方法
前記の実施例1に従って、3×FLAGタグを有する株(RMs1209)および3×FLAGタグを有さない株(RMs1221)において作製されたDs_ACB(SEQ ID NO:1)を精製するために、様々な回収および分離の技術を使用した。
前記の実施例1に従って、3×FLAGタグを有する株(RMs1209)および3×FLAGタグを有さない株(RMs1221)において作製されたDs_ACB(SEQ ID NO:1)を精製するために、様々な回収および分離の技術を使用した。
第1の試料のセットは、第1の細胞のペレットおよび第1の上清を作製するために、細胞ブロス全体を遠心分離し、透明な細胞ブロスを作製するために、第1の上清を抽出することによって調製された。次いで、第1の上清を、硫酸アンモニウムを使用して沈殿させ、第2のペレットおよび第2の上清を作製するために、遠心分離し、第2の上清を廃棄した。次いで、第2のペレットを、透析のため、PBSに再懸濁させた。次いで、高温で安定しているDs_ACB以外のタンパク質を変性させるために、透析された溶液を高温に供した。透析された変性した溶液を遠心分離することによって、変性タンパク質を除去し、第3のペレットおよび第3の上清を作製した。変性した溶液からの第3の上清を保持し、次いで、Ds_ACBを含有している密な下層および上層への相分離を誘導するために、第3の上清を冷却することによってコアセルベートした。これらの試料は、下記表2および本明細書中で「CCB」試料と呼ばれる。いくつかのCCB試料においては、下層を保持し、さらなる相分離を誘導するために、下層を低温でインキュベートすることによって、複数回のコアセルベーションを実施した。これらのCCB試料は、それぞれ、下記表2および本明細書中で「第1のコアセルベーション」試料および「第2のコアセルベーション」試料と呼ばれる。
第2の試料のセットは、細胞および細胞に近位の(例えば、細胞に接着している、細胞の表面上にある)タンパク質および/または不溶性タンパク質(例えば、タンパク質凝集物)の第1のペレットと、第1の上清とを作製するために、細胞ブロス全体を遠心分離し、次いで、第1のペレットを得るために、第1の上清を廃棄することによって調製された。第1のペレットを、Ds_ACBを可溶化するために、チオシアン酸グアニジンに再懸濁させた。再懸濁物を再び遠心分離して、第2のペレットおよび第2の上清を作製した。次いで、第2の上清をPBSに対して透析し、Ds_ACB以外のタンパク質を変性させるために、高温に供し、第3のペレットおよび第3の上清を作製するために、遠心分離した。第3の上清を、Ds_ACBを含有している密な下層および上層への相分離を与えるための冷却によるコアセルベーションに供した。これらの試料は、下記表2および本明細書中で「ゲル層」試料と呼ばれる。いくつかのゲル層試料においては、下層を保持し、さらなる相分離を誘導するために、より低い温度で下層をインキュベートすることによって、複数回のコアセルベーションを実施した。これらのゲル層試料は、下記表2および本明細書中で「第1のコアセルベーション」試料および「第2のコアセルベーション」試料と呼ばれる。
第3の試料のセットは、ペレットおよび上清を作製するために細胞ブロス全体を遠心分離し、次いで、細胞および細胞に近位の(例えば、細胞に接着している、細胞の表面上にある)タンパク質および/または不溶性タンパク質(例えば、タンパク質凝集物)のペレットを得るために、上清を廃棄することによって調製された。細胞に近位のタンパク質を可溶化するために、細胞のペレットを、チオシアン酸グアニジンに再懸濁させた。再懸濁物を再び遠心分離して、第2の細胞のペレットおよび第2の上清を作製した。次いで、第2の上清を硫酸アンモニウムによって沈殿させ、第3のペレットおよび第3の上清を作製するために、遠心分離した。第3のペレットをチオシアン酸グアニジンに懸濁させ、次いで、PBSに対して透析し、Ds_ACB以外のタンパク質を変性させるために、高温に供し、第4の上清および第4のペレットを作製するために、遠心分離した。次いで、第4の上清を、相分離を与えるための冷却によるコアセルベーションに供した。これらの試料は、下記表2および本明細書中で「沈殿ゲル層」試料と呼ばれる。
単一の試料は、タンパク質を可溶化するために、細胞ブロス全体に尿素を添加し、次いで、第1のペレットおよび第1の上清を作製するために、細胞ブロス全体を遠心分離することによって作製された。次いで、第1の上清を、硫酸アンモニウムを使用して沈殿させ、第2のペレットおよび第2の上清を作製するために、遠心分離した。第2の上清を廃棄し、次いで、第2のペレットをチオシアン酸グアニジンに再懸濁させ、PBSに対して透析し、次いで、Ds_ACB以外のタンパク質を変性させるために、高温に供し、第3のペレットおよび第3の上清を作製するために、再び遠心分離した。次いで、Ds_ACBを含有している密な下層および上層への相分離を誘導するために、第3の上清を冷却することによって、第3の上清をコアセルベートした。この試料は、下記表2および本明細書中で「尿素WCBE」試料と呼ばれる。
別の単一の試料は、第1のペレットおよび第1の上清を作製するために、細胞ブロス全体を遠心分離し、次いで、細胞および細胞に近位の(例えば、細胞に接着している、細胞の表面上にある)タンパク質および/または不溶性タンパク質(例えば、タンパク質凝集物)の第1のペレットを得るために、第1の上清を廃棄することによって調製された。細胞の第1のペレットを、タンパク質を可溶化するために、チオシアン酸グアニジンに再懸濁させた。再懸濁物を、第2の細胞のペレットおよび第2の上清を作製するために、再び遠心分離した。次いで、第2の上清をPBSに対して透析し、次いで、タンパク質の重い相、上清の軽い相、および軽い相から重い相を分離するフィルムを作製するために、遠心分離した。次いで、軽い相およびフィルムを廃棄することによって、タンパク質の重い相を単離した。この試料は、下記表2および本明細書中で「高密度層」試料と呼ばれる。
表2(下記)は、図9に示されたゲルにおいて見られた分解の相対量と共に、株および回収技術の様々な組み合わせをリストする。図9に示されるように、試料E、F、G、K、およびLは、およそ110kDaにバンドを示し、より低い分子量に最小のまたは弱いバンドを示した(表2中で「最小」と表記された)。試料A、B、C、D、G、I、およびJは、およそ90kDa、30kDa、22kDa、17kDa、および12kDaのバンドに対応する分解生成物を有していた(表2中で「実質的」と表記された)。これらのうち、試料AおよびIは、全長レジリンの存在を示す、およそ110kDaのバンドも示した。従って、「ゲル層」試料は、全長レジリンを作製したが、CCB試料は、時には、全長レジリンに加えて(例えば、試料A)または全長レジリンなしで(例えば、試料CおよびD)、分解生成物を作製した。尿素WCBE試料は、分解生成物のみを作製した。CCB/沈殿ゲル層は、CCB精製方法およびゲル層精製方法の両方からの単離された材料の組み合わせを示す。
試料A、I、E、F、G、K、およびLにおいて示された110kDaバンドが全長レジリン(SEQ ID NO:1)に相当することを確証するために、(図9中で矢印によって示された)試料Hの110kDaバンドを切り出し、エドマン分解によるN末端配列決定に送った。エドマン分解は、アミノ酸残基が1つずつ切断され、クロマトグラフィーによって同定される、周期的な手法である。周期的な手法の中に、三つの工程が存在する。工程1において、アルカリ性条件下で、PITC試薬がN末端アミノ基にカップリングされる。工程2において、N末端残基が酸性媒体において切断される。工程3において、PITCとカップリングした残基が、フラスコに移され、PTH残基に変換され、HPLCクロマトグラフィーによって同定される。次いで、次のN末端残基の同定のため、次のサイクルが開始される。エドマン分解分析は、Shimadazu PPSQ-33配列決定機およびPVDF膜において実施された。
図10は、後に切断されるシグナル配列と共に発現する全長セイシェルショウジョウバエレジリン配列(Ds_ACB)を示す。最初の配列(イタリック体)は、シグナルペプチターゼによって転写後に2回切断され、その後、Kex2によって切断されるα接合因子前駆体タンパク質シグナル配列(SEQ ID NO:46)である。2番目の配列(太字)は、Ste13によって切断されるEAEAリピート(SEQ ID NO:47)である。3番目の配列(小文字)は、セイシェルショウジョウバエ全長レジリン(SEQ ID NO:1)に相当する。4番目の配列(太字イタリック体)は、リンカー配列(SEQ ID NO:46)に相当する。5番目の配列(下線)は、3×FLAGタグ(SEQ ID NO:45)に相当する。
エドマン配列決定は、およそ110kDaのバンドのタンパク質配列のN末端が、全長セイシェルショウジョウバエレジリン配列に相当することを確認した。具体的には、N末端配列決定は、N末端が、EAEAリピートを含む全長セイシェルショウジョウバエレジリン配列「EAEA」またはEAEAリピートを含まない全長セイシェルショウジョウバエレジリン配列「GRPE」のいずれかに相当することを示した。
実施例8:架橋したレジリンの安定性の定量化
変動するレベルの分解生成物および全長レジリンを含む、実施例7に記載された方法によって生成されたレジリン試料を、前記の実施例4に関して記載されたような酵素的架橋に供した。毎日の観察を通して、各架橋した試料が固体であり続ける持続期間を決定することによって、架橋した試料の安定性を経時的に査定した。表3は、各架橋した試料についての固体としての期間を示す。表3に示されるように、全長レジリンを含む試料は、全長レジリンを含まない試料より長い安定性持続時間を有していた。
変動するレベルの分解生成物および全長レジリンを含む、実施例7に記載された方法によって生成されたレジリン試料を、前記の実施例4に関して記載されたような酵素的架橋に供した。毎日の観察を通して、各架橋した試料が固体であり続ける持続期間を決定することによって、架橋した試料の安定性を経時的に査定した。表3は、各架橋した試料についての固体としての期間を示す。表3に示されるように、全長レジリンを含む試料は、全長レジリンを含まない試料より長い安定性持続時間を有していた。
追加の考察
本開示の態様の上記の説明は、例示の目的のために提示されており;網羅的なものではなく、開示された正確な形態に特許請求の範囲を限定するためのものでもない。関連技術分野の当業者は、前記の開示を考慮すれば多くの改変および変動が可能であることを理解することができる。
本開示の態様の上記の説明は、例示の目的のために提示されており;網羅的なものではなく、開示された正確な形態に特許請求の範囲を限定するためのものでもない。関連技術分野の当業者は、前記の開示を考慮すれば多くの改変および変動が可能であることを理解することができる。
本明細書中で使用された言語は、読みやすさおよび教示の目的のために主に選択されており、本発明の主題の境界を示すかまたは制限するために選択されていない。従って、本開示の範囲は、この詳細な説明によってではなく、本開示に基づく適用に関して発行される特許請求の範囲によって限定されるものとする。従って、態様の開示は、例示的であり、特許請求の範囲において示される本発明の範囲を限定するためのものではない。
配列情報
SEQUENCE LISTING
<110> BOLT THREADS, INC.
<120> ELASTOMERIC PROTEINS
<150> US 62/446,230
<151> 2017-01-13
<160> 63
<170> PatentIn version 3.5
<210> 1
<211> 606
<212> PRT
<213> Drosophila sechellia
<400> 1
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Asp Ser Tyr
1 5 10 15
Gly Ala Pro Gly Gln Ser Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr
20 25 30
Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly
35 40 45
Ala Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly
50 55 60
Gly Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn
65 70 75 80
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly
85 90 95
Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
100 105 110
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn
115 120 125
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly
130 135 140
Asn Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly
145 150 155 160
Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly
165 170 175
Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn
180 185 190
Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn
195 200 205
Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly
210 215 220
Asn Gly Ser Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln
225 230 235 240
Gly Gln Gly Gly Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro
245 250 255
Gly Gln Asn Gln Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly
260 265 270
Asn Gly Ser Ala Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser
275 280 285
Gly Pro Gly Gly Arg Pro Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly
290 295 300
Ser Gly Ala Gly Gly Ala Gly Gly Ser Gly Pro Gly Gly Ala Asp Tyr
305 310 315 320
Asp Asn Asp Glu Pro Ala Lys Tyr Glu Phe Asn Tyr Gln Val Glu Asp
325 330 335
Ala Pro Ser Gly Leu Ser Phe Gly His Ser Glu Met Arg Asp Gly Asp
340 345 350
Phe Thr Thr Gly Gln Tyr Asn Val Leu Leu Pro Asp Gly Arg Lys Gln
355 360 365
Ile Val Glu Tyr Glu Ala Asp Gln Gln Gly Tyr Arg Pro Gln Ile Arg
370 375 380
Tyr Glu Gly Asp Ala Asn Asp Gly Ser Gly Pro Ser Gly Pro Ser Gly
385 390 395 400
Pro Gly Gly Pro Gly Gly Gln Asn Leu Gly Ala Asp Gly Tyr Ser Ser
405 410 415
Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly Tyr Ser Ser
420 425 430
Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr Ser Gly Gly
435 440 445
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser Asn Val Lys
450 455 460
Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly Gly Arg Pro
465 470 475 480
Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly Arg Pro Gly
485 490 495
Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg Pro Gly Gly
500 505 510
Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile Gly Gly Arg
515 520 525
Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser Gly Gly Arg
530 535 540
Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser Gly Arg Pro
545 550 555 560
Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp Gly Gln Gly
565 570 575
Tyr Ser Ser Gly Arg Pro Gly Gln Gly Gly Arg Asn Gly Phe Gly Pro
580 585 590
Gly Gly Gln Asn Gly Asp Asn Asp Gly Ser Gly Tyr Arg Tyr
595 600 605
<210> 2
<211> 304
<212> PRT
<213> Drosophila sechellia
<400> 2
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Asp Ser Tyr
1 5 10 15
Gly Ala Pro Gly Gln Ser Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr
20 25 30
Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly
35 40 45
Ala Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly
50 55 60
Gly Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn
65 70 75 80
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly
85 90 95
Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
100 105 110
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn
115 120 125
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly
130 135 140
Asn Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly
145 150 155 160
Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly
165 170 175
Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn
180 185 190
Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn
195 200 205
Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly
210 215 220
Asn Gly Ser Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln
225 230 235 240
Gly Gln Gly Gly Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro
245 250 255
Gly Gln Asn Gln Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly
260 265 270
Asn Gly Ser Ala Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser
275 280 285
Gly Pro Gly Gly Arg Pro Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly
290 295 300
<210> 3
<211> 211
<212> PRT
<213> Drosophila sechellia
<400> 3
Gly Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn
1 5 10 15
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly
20 25 30
Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
35 40 45
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn
50 55 60
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly
65 70 75 80
Asn Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly
85 90 95
Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly
100 105 110
Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn
115 120 125
Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn
130 135 140
Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly
145 150 155 160
Asn Gly Ser Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln
165 170 175
Gly Gln Gly Gly Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro
180 185 190
Gly Gln Asn Gln Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly
195 200 205
Asn Gly Ser
210
<210> 4
<211> 175
<212> PRT
<213> Acromyrmex echinatior
<400> 4
Phe Gly Glu Asn Arg Gly Asn Gly Gly Lys Pro Ser Thr Ser Tyr Gly
1 5 10 15
Val Pro Asp Ser Asn Gly Asn Asn Arg Gly Gly Phe Gly Asn Gly Gly
20 25 30
Ser Glu Gly Arg Pro Ser Thr Ser Tyr Gly Leu Pro Asp Ala Ser Arg
35 40 45
Asn Asn Gly Asn Gly Phe Gly Asn Val Gly Asn Glu Asp Lys Pro Ser
50 55 60
Thr Asn Tyr Gly Ile Pro Ala Asn Gly Asn Lys Val Ser Gly Phe Gly
65 70 75 80
Asn Val Gly Ser Glu Gly Arg Pro Ser Thr Ser Tyr Gly Val Pro Gly
85 90 95
Ala Asn Gly Asn Gln Gly Phe Gly Ser Gly Gly Ile Gly Gly Arg Pro
100 105 110
Ser Thr Ser Tyr Gly Val Pro Gly Val Asn Gly Asn Asn Gly Gly Gly
115 120 125
Phe Glu Asn Val Gly Arg Pro Ser Thr Ser Tyr Gly Thr Pro Asp Ala
130 135 140
Arg Gly Asn Asn Gly Gly Ser Phe Arg Asn Gly Asp Ile Gly Gly Arg
145 150 155 160
Pro Ser Thr Asn Tyr Gly Ile Pro Gly Ala Asn Gly Asn His Gly
165 170 175
<210> 5
<211> 158
<212> PRT
<213> Aeshna sp.
<400> 5
Ala Pro Ser Arg Gly Gly Gly His Gly Gly Gly Ser Ile Ser Ser Ser
1 5 10 15
Tyr Gly Ala Pro Ser Lys Gly Ser Gly Gly Phe Gly Gly Gly Ser Ile
20 25 30
Ser Ser Ser Tyr Gly Ala Pro Ser Lys Gly Ser Val Gly Gly Gly Val
35 40 45
Ser Ser Ser Tyr Gly Ala Pro Ala Ile Gly Gly Gly Ser Phe Gly Gly
50 55 60
Gly Ser Phe Gly Gly Gly Ser Phe Gly Gly Gly Ser Phe Gly Gly Gly
65 70 75 80
Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ser Ser Tyr Ser Ala Pro
85 90 95
Ser Ser Ser Tyr Gly Ala Pro Ser Lys Gly Ser Gly Gly Phe Gly Ser
100 105 110
Ser Gly Gly Phe Ser Ser Phe Ser Ser Ala Pro Ser Ser Ser Tyr Gly
115 120 125
Ala Pro Ser Ala Ser Tyr Ser Thr Pro Ser Ser Ser Tyr Gly Ala Pro
130 135 140
Ser Ser Gly Gly Phe Gly Ala Gly Gly Gly Phe Ser Ser Gly
145 150 155
<210> 6
<211> 457
<212> PRT
<213> Aeshna sp.
<400> 6
Glu Pro Pro Val Gly Gly Ser Gln Ser Tyr Leu Pro Pro Ser Ser Ser
1 5 10 15
Tyr Gly Ala Pro Ser Ala Gly Thr Gly Phe Gly His Gly Gly Gly Ser
20 25 30
Pro Ser Gln Ser Tyr Gly Ala Pro Ser Phe Gly Gly Gly Ser Val Gly
35 40 45
Gly Gly Ser His Phe Gly Gly Gly Ser His Ser Gly Gly Gly Gly Gly
50 55 60
Gly Tyr Pro Ser Gln Ser Tyr Gly Ala Pro Ser Arg Pro Ser Gly Ser
65 70 75 80
Ser Phe Gln Ala Phe Gly Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro
85 90 95
Ser Ser Gln Tyr Gly Ala Pro Ser Gly Gly Gly Gly Ser Tyr Ala Ile
100 105 110
Gln Gly Gly Ser Phe Ser Ser Gly Gly Ser Arg Ala Pro Ser Gln Ala
115 120 125
Tyr Gly Ala Pro Ser Asn Asn Ala Gly Leu Ser His Gln Ser Gln Ser
130 135 140
Phe Gly Gly Gly Leu Ser Ser Ser Tyr Gly Ala Pro Ser Ala Gly Phe
145 150 155 160
Gly Gly Gln Ser His Gly Gly Gly Tyr Ser Gln Gly Gly Asn Gly Gly
165 170 175
Gly His Gly Gly Ser Ser Gly Gly Gly Tyr Ser Tyr Gln Ser Phe Gly
180 185 190
Gly Gly Asn Gly Gly Gly His Gly Gly Ser Arg Pro Ser Ser Ser Tyr
195 200 205
Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ser Gly Gly Lys Gly Val
210 215 220
Ser Gly Gly Phe Val Ser Gln Pro Ser Gly Ser Tyr Gly Ala Pro Ser
225 230 235 240
Gln Ser Tyr Gly Ala Pro Ser Arg Gly Gly Gly His Gly Gly Gly Ser
245 250 255
Ile Ser Ser Ser Tyr Gly Ala Pro Ser Lys Gly Ser Gly Gly Phe Gly
260 265 270
Gly Gly Ser Ile Ser Ser Ser Tyr Gly Ala Pro Ser Lys Gly Ser Val
275 280 285
Gly Gly Gly Val Ser Ser Ser Tyr Gly Ala Pro Ala Ile Gly Gly Gly
290 295 300
Ser Phe Gly Gly Gly Ser Phe Gly Gly Gly Ser Phe Gly Gly Gly Ser
305 310 315 320
Phe Gly Gly Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ser Ser
325 330 335
Tyr Ser Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ser Lys Gly Ser Gly
340 345 350
Gly Phe Gly Ser Ser Gly Gly Phe Ser Ser Phe Ser Ser Ala Pro Ser
355 360 365
Ser Ser Tyr Gly Ala Pro Ser Ala Ser Tyr Ser Thr Pro Ser Ser Ser
370 375 380
Tyr Gly Ala Pro Ser Ser Gly Gly Phe Gly Ala Gly Gly Gly Phe Ser
385 390 395 400
Ser Gly Gly Tyr Ser Gly Gly Gly Gly Gly Tyr Ser Ser Gly Gly Ser
405 410 415
Gly Gly Phe Gly Gly His Gly Gly Ser Gly Gly Ala Gly Gly Tyr Ser
420 425 430
Gly Gly Gly Gly Tyr Ser Gly Gly Gly Ser Gly Gly Gly Gln Lys Tyr
435 440 445
Asp Ser Asn Gly Gly Tyr Val Tyr Ser
450 455
<210> 7
<211> 162
<212> PRT
<213> Haematobia irritans
<400> 7
Ala Gly Gly Gly Asn Gly Gly Gly Gly Thr Gly Gly Thr Pro Ser Ser
1 5 10 15
Ser Tyr Gly Ala Pro Ser Asn Gly Gly Gly Ser Asn Gly Asn Gly Phe
20 25 30
Gly Ser Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Gly Ser Asn
35 40 45
Gly Asn Gly Gly Gly Arg Pro Ser Leu Ser Tyr Gly Ala Pro Gly Ser
50 55 60
Gly Gly Ser Asn Gly Asn Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly
65 70 75 80
Ala Pro Gly Ala Gly Gly Ser Asn Gly Asn Gly Gly Gly Arg Pro Ser
85 90 95
Ser Ser Tyr Gly Ala Pro Gly Ala Gly Gly Ser Asn Gly Asn Gly Gly
100 105 110
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala Gly Gly Ser Asn
115 120 125
Gly Asn Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala
130 135 140
Gly Gly Ser Asn Gly Asn Gly Gly Ser Arg Pro Ser Ser Thr Tyr Gly
145 150 155 160
Ala Pro
<210> 8
<211> 580
<212> PRT
<213> Haematobia irritans
<400> 8
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Pro Leu Asn Asn
1 5 10 15
Tyr Gly Ala Pro Gly Ala Gly Gly Gly Ser Ser Asp Gly Ser Pro Leu
20 25 30
Ala Pro Ser Asp Ala Tyr Gly Ala Pro Asp Leu Gly Gly Gly Ser Gly
35 40 45
Gly Ser Gly Gln Gly Pro Ser Ser Ser Tyr Gly Ala Pro Gly Leu Gly
50 55 60
Gly Gly Asn Gly Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro Gly Leu
65 70 75 80
Gly Gly Gly Asn Gly Gly Ser Arg Arg Pro Ser Ser Ser Tyr Gly Ala
85 90 95
Pro Gly Ala Gly Gly Gly Asn Gly Gly Gly Gly Thr Gly Gly Thr Pro
100 105 110
Ser Ser Ser Tyr Gly Ala Pro Ser Asn Gly Gly Gly Ser Asn Gly Asn
115 120 125
Gly Phe Gly Ser Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Gly
130 135 140
Ser Asn Gly Asn Gly Gly Gly Arg Pro Ser Leu Ser Tyr Gly Ala Pro
145 150 155 160
Gly Ser Gly Gly Ser Asn Gly Asn Gly Gly Gly Arg Pro Ser Ser Ser
165 170 175
Tyr Gly Ala Pro Gly Ala Gly Gly Ser Asn Gly Asn Gly Gly Gly Arg
180 185 190
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala Gly Gly Ser Asn Gly Asn
195 200 205
Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala Gly Gly
210 215 220
Ser Asn Gly Asn Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro
225 230 235 240
Gly Ala Gly Gly Ser Asn Gly Asn Gly Gly Ser Arg Pro Ser Ser Thr
245 250 255
Tyr Gly Ala Pro Gly Ala Gly Gly Ser Asn Gly Asn Gly Cys Gly Asn
260 265 270
Lys Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ala Gly Ser Asn Gly Asn
275 280 285
Gly Gly Ser Glu Gln Gly Ser Ser Gly Ser Pro Ser Asp Ser Tyr Gly
290 295 300
Pro Pro Ala Ser Gly Thr Gly Arg Gly Arg Asn Gly Gly Gly Gly Gly
305 310 315 320
Ala Gly Gly Gly Arg Arg Gly Gln Pro Asn Gln Glu Tyr Leu Pro Pro
325 330 335
Asn Gln Gly Asp Asn Gly Asn Asn Gly Gly Ser Gly Gly Asp Asp Gly
340 345 350
Tyr Asp Tyr Ser Gln Ser Gly Asp Gly Gly Gly Gln Gly Gly Ser Gly
355 360 365
Gly Ser Gly Asn Gly Gly Asp Asp Gly Ser Asn Ile Val Glu Tyr Glu
370 375 380
Ala Gly Gln Glu Gly Tyr Arg Pro Gln Ile Arg Tyr Glu Gly Glu Ala
385 390 395 400
Asn Glu Gly Gly Gln Gly Ser Gly Gly Ala Gly Gly Ser Asp Gly Thr
405 410 415
Asp Gly Tyr Glu Tyr Glu Gln Asn Gly Gly Asp Gly Gly Ala Gly Gly
420 425 430
Ser Gly Gly Pro Gly Thr Gly Gln Asp Leu Gly Glu Asn Gly Tyr Ser
435 440 445
Ser Gly Arg Pro Gly Gly Asp Asn Gly Gly Gly Gly Gly Tyr Ser Asn
450 455 460
Gly Asn Gly Gln Gly Asp Gly Gly Gln Asp Leu Gly Ser Asn Gly Tyr
465 470 475 480
Ser Ser Gly Ala Pro Asn Gly Gln Asn Gly Gly Arg Arg Asn Gly Gly
485 490 495
Gly Gln Asn Asn Asn Gly Gln Gly Tyr Ser Ser Gly Arg Pro Asn Gly
500 505 510
Asn Gly Ser Gly Gly Arg Asn Gly Asn Gly Gly Arg Gly Asn Gly Gly
515 520 525
Gly Tyr Arg Asn Gly Asn Gly Asn Gly Gly Gly Asn Gly Asn Gly Ser
530 535 540
Gly Ser Gly Ser Gly Asn Asn Gly Tyr Asn Tyr Asp Gln Gln Gly Ser
545 550 555 560
Asn Gly Phe Gly Ala Gly Gly Gln Asn Gly Glu Asn Asp Gly Ser Gly
565 570 575
Tyr Arg Tyr Ser
580
<210> 9
<211> 256
<212> PRT
<213> Ctenocephalides felis
<400> 9
Ala Asn Gly Asn Gly Phe Glu Gly Ala Ser Asn Gly Leu Ser Ala Thr
1 5 10 15
Tyr Gly Ala Pro Asn Gly Gly Gly Phe Gly Gly Asn Gly Asn Gly Gly
20 25 30
Ala Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala Gly Asn Gly Gly Asn
35 40 45
Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala Gly Gly
50 55 60
Ser Gly Asn Gly Phe Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro
65 70 75 80
Gly Asn Gly Asn Gly Ala Asn Gly Gly Arg Gly Gly Arg Pro Ser Ser
85 90 95
Arg Tyr Gly Ala Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly
100 105 110
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Asn Gly Asn Gly
115 120 125
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Asn Gly Phe
130 135 140
Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala
145 150 155 160
Asn Gly Asn Gly Asn Gly Gly Ala Ile Gly Gln Pro Ser Ser Ser Tyr
165 170 175
Gly Ala Pro Gly Gln Asn Gly Asn Gly Gly Gly Leu Ser Ser Thr Tyr
180 185 190
Gly Ala Pro Gly Ala Gly Asn Gly Gly Phe Gly Gly Asn Gly Gly Gly
195 200 205
Leu Ser Ser Thr Tyr Gly Ala Pro Gly Ser Gly Asn Gly Gly Phe Gly
210 215 220
Gly Asn Gly Leu Ser Ser Thr Tyr Gly Ala Pro Gly Ser Gly Asn Gly
225 230 235 240
Gly Phe Gly Gly Asn Gly Gly Gly Leu Ser Ser Thr Tyr Gly Ala Pro
245 250 255
<210> 10
<211> 146
<212> PRT
<213> Ctenocephalides felis
<400> 10
Pro Gly Gly Ala Gly Gly Ala Gly Gly Tyr Pro Gly Gly Ala Gly Gly
1 5 10 15
Ala Gly Gly Ala Gly Gly Tyr Pro Gly Gly Ser Ala Gly Gly Ala Gly
20 25 30
Gly Tyr Pro Gly Gly Ser Gly Ser Gly Val Gly Gly Tyr Pro Gly Gly
35 40 45
Ser Asn Gly Gly Ala Gly Gly Tyr Pro Gly Gly Ser Asn Gly Gly Ala
50 55 60
Gly Gly Tyr Pro Gly Gly Ser Asn Gly Gly Ala Gly Gly Tyr Pro Gly
65 70 75 80
Gly Ser Asn Gly Gly Ala Gly Gly Tyr Pro Gly Gly Ser Asn Gly Asn
85 90 95
Gly Gly Tyr Ser Asn Gly Gly Ser Asn Gly Gly Gly Ala Gly Gly Tyr
100 105 110
Pro Gly Gly Ser Asn Gly Asn Gly Gly Tyr Pro Gly Ser Gly Ser Asn
115 120 125
Gly Gly Ala Gly Gly Tyr Pro Gly Gly Ser Asn Gly Asn Gly Gly Tyr
130 135 140
Pro Gly
145
<210> 11
<211> 201
<212> PRT
<213> Bombus terrestris
<400> 11
Phe Asp Gly Gln Asn Gly Ile Gly Gly Gly Asp Ser Gly Arg Asn Gly
1 5 10 15
Leu Ser Asn Ser Tyr Gly Val Pro Gly Ser Asn Gly Gly Arg Asn Gly
20 25 30
Asn Gly Arg Gly Asn Gly Phe Gly Gly Gly Gln Pro Ser Ser Ser Tyr
35 40 45
Gly Ala Pro Ser Asn Gly Leu Gly Gly Asn Gly Gly Ser Gly Ala Gly
50 55 60
Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Phe Gly
65 70 75 80
Gly Gly Gln Pro Ser Ser Ser Tyr Gly Ala Pro Ser Asn Gly Leu Gly
85 90 95
Gly Asn Gly Ala Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly
100 105 110
Gly Asn Gly Phe Gly Gly Gly Ser Asn Gly Ala Gly Lys Asn Gly Phe
115 120 125
Gly Gly Ala Pro Ser Asn Ser Tyr Gly Pro Pro Glu Asn Gly Asn Gly
130 135 140
Phe Gly Gly Gly Asn Gly Gly Gly Ser Pro Ser Gly Leu Tyr Gly Pro
145 150 155 160
Pro Gly Arg Asn Gly Gly Asn Gly Gly Asn Gly Gly Asn Gly Gly Asn
165 170 175
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Thr Pro Glu Arg Asn Gly Gly
180 185 190
Arg Pro Ser Gly Leu Tyr Gly Pro Pro
195 200
<210> 12
<211> 183
<212> PRT
<213> Tribolium castaneum
<400> 12
Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Arg Leu Ser Ser Thr Tyr
1 5 10 15
Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly
20 25 30
Gly Arg Pro Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly
35 40 45
Phe Gly Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser Thr Tyr Gly Pro
50 55 60
Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Arg
65 70 75 80
Pro Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly
85 90 95
Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser Thr Tyr Gly Pro Pro Gly
100 105 110
Gln Gly Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Arg Pro Ser
115 120 125
Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly Gly
130 135 140
Gln Asn Gly Gly Lys Pro Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly
145 150 155 160
Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser Thr
165 170 175
Tyr Gly Pro Pro Gly Gln Gly
180
<210> 13
<211> 551
<212> PRT
<213> Tribolium castaneum
<400> 13
Arg Ala Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Gln Asn Gly
1 5 10 15
Gly Pro Ser Ser Thr Tyr Gly Pro Pro Gly Phe Gln Pro Gly Thr Pro
20 25 30
Leu Gly Gly Gly Gly Asn Gly Gly His Pro Pro Ser Gln Gly Gly Asn
35 40 45
Gly Gly Phe Gly Gly Arg His Pro Asp Ser Asp Gln Arg Pro Gly Thr
50 55 60
Ser Tyr Leu Pro Pro Gly Gln Asn Gly Gly Ala Gly Arg Pro Gly Val
65 70 75 80
Thr Tyr Gly Pro Pro Gly Gln Gly Gly Gly Gln Asn Gly Gly Gly Pro
85 90 95
Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly
100 105 110
Gly Gln Asn Gly Gly Arg Leu Ser Ser Thr Tyr Gly Pro Pro Gly Gln
115 120 125
Gly Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser
130 135 140
Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly Gly Gln
145 150 155 160
Asn Gly Gly Arg Pro Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly
165 170 175
Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser Thr Tyr
180 185 190
Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly
195 200 205
Gly Arg Pro Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly
210 215 220
Phe Gly Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser Thr Tyr Gly Pro
225 230 235 240
Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Lys
245 250 255
Pro Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly
260 265 270
Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser Thr Tyr Gly Pro Pro Gly
275 280 285
Gln Gly Gly Asn Gly Asn Gly Gly Gly His Asn Gly Gln Arg Pro Gly
290 295 300
Gly Ser Tyr Leu Pro Pro Ser Gln Gly Gly Asn Gly Gly Tyr Pro Ser
305 310 315 320
Gly Gly Pro Gly Gly Tyr Pro Ser Gly Gly Pro Gly Gly Asn Gly Gly
325 330 335
Tyr Gly Gly Glu Glu Glu Ser Thr Glu Pro Ala Lys Tyr Glu Phe Glu
340 345 350
Tyr Gln Val Asp Asp Asp Glu His Asn Thr His Phe Gly His Gln Glu
355 360 365
Ser Arg Asp Gly Asp Lys Ala Thr Gly Glu Tyr Asn Val Leu Leu Pro
370 375 380
Asp Gly Arg Lys Gln Val Val Gln Tyr Glu Ala Asp Ser Glu Gly Tyr
385 390 395 400
Lys Pro Lys Ile Ser Tyr Glu Gly Gly Asn Gly Asn Gly Gly Tyr Pro
405 410 415
Ser Gly Gly Pro Gly Gly Ala Gly Asn Gly Gly Tyr Pro Ser Gly Gly
420 425 430
Pro Gln Gly Gly Asn Gly Gly Tyr Pro Ser Gly Gly Pro Gln Gly Gly
435 440 445
Asn Gly Gly Tyr Pro Ser Gly Gly Pro Gln Gly Gly Asn Gly Gly Tyr
450 455 460
Pro Ser Gly Gly Pro Gln Gly Gly Asn Gly Gly Tyr Pro Ser Gly Gly
465 470 475 480
Pro Gln Gly Gly Asn Gly Gly Tyr Pro Ser Gly Gly Pro Gln Gly Gly
485 490 495
Asn Gly Gly Tyr Pro Ser Gly Gly Pro Gln Gly Gly Asn Gly Gly Tyr
500 505 510
Pro Ser Gly Gly Pro Gln Gly Gly Asn Gly Gly Tyr Thr Ser Gly Gly
515 520 525
Pro Gln Gly Gly Asn Gly Gly Tyr Pro Ser Gly Gly Pro Gln Gly Gly
530 535 540
Asn Gly Gly Ser Gly Pro Tyr
545 550
<210> 14
<211> 444
<212> PRT
<213> Tribolium castaneum
<400> 14
Gln Leu Thr Lys Arg Asp Ala Pro Leu Ser Gly Gly Tyr Pro Ser Gly
1 5 10 15
Gly Pro Ala Asn Ser Tyr Leu Pro Pro Gly Gly Ala Ser Gln Pro Ser
20 25 30
Gly Asn Tyr Gly Ala Pro Ser Gly Gly Phe Gly Gly Lys Ser Gly Gly
35 40 45
Phe Gly Gly Ser Gly Gly Phe Gly Gly Ala Pro Ser Gln Ser Tyr Gly
50 55 60
Ala Pro Ser Gly Gly Phe Gly Gly Ser Ser Ser Phe Gly Lys Ser Gly
65 70 75 80
Gly Phe Gly Gly Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Gly Gly
85 90 95
Phe Gly Gly Ser Ser Ser Phe Gly Lys Ser Ser Gly Gly Phe Gly Gly
100 105 110
Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Gly Gly Phe Gly Gly Ser
115 120 125
Ser Ser Phe Gly Lys Ser Gly Gly Phe Gly Gly Ala Pro Ser Gln Ser
130 135 140
Tyr Gly Ala Pro Ser Gly Gly Phe Gly Gly Ser Ser Ser Phe Gly Lys
145 150 155 160
Ser Gly Gly Phe Gly Gly Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser
165 170 175
Gly Gly Phe Gly Gly Lys Ser Ser Ser Phe Ser Ser Ala Pro Ser Gln
180 185 190
Ser Tyr Gly Ala Pro Ser Gly Gly Phe Gly Gly Lys Ser Gly Gly Phe
195 200 205
Gly Gly Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Gly Gly Phe Gly
210 215 220
Gly Lys Ser Gly Gly Phe Gly Gly Ala Pro Ser Gln Ser Tyr Gly Ala
225 230 235 240
Pro Ser Gly Gly Phe Gly Gly Ser Ser Ser Phe Gly Lys Ser Gly Gly
245 250 255
Phe Gly Gly Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Gly Gly Phe
260 265 270
Gly Gly Ser Ser Ser Phe Gly Lys Ser Ser Gly Phe Gly His Gly Ser
275 280 285
Gly Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Arg Ser Gln Pro Gln
290 295 300
Ser Asn Tyr Leu Pro Pro Ser Thr Ser Tyr Gly Thr Pro Val Ser Ser
305 310 315 320
Ala Lys Ser Ser Gly Ser Phe Gly Gly Ala Pro Ser Gln Ser Tyr Gly
325 330 335
Ala Pro Ser Gln Ser His Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser
340 345 350
Arg Ser Phe Ser Gln Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Gln
355 360 365
Gly His Ala Pro Ala Pro Gln Gln Ser Tyr Ser Ala Pro Ser Gln Ser
370 375 380
Tyr Gly Ala Pro Ser Gly Gly Phe Gly Gly Gly His Gly Gly Phe Gly
385 390 395 400
Gly Gln Gly Gln Gly Phe Gly Gly Gly Arg Ser Gln Pro Ser Gln Ser
405 410 415
Tyr Gly Ala Pro Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Ala Gly
420 425 430
Gly Gln Gln Tyr Ala Ser Asn Gly Gly Tyr Ser Tyr
435 440
<210> 15
<211> 426
<212> PRT
<213> Apis mellifera
<400> 15
Arg Ser Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Gly Asn Gly
1 5 10 15
Asn Gly Gly Gly Gly Gly Gly Ser Ser Asn Val Tyr Gly Pro Pro Gly
20 25 30
Phe Asp Gly Gln Asn Gly Ile Gly Glu Gly Asp Asn Gly Arg Asn Gly
35 40 45
Ile Ser Asn Ser Tyr Gly Val Pro Thr Gly Gly Asn Gly Tyr Asn Gly
50 55 60
Asp Ser Ser Gly Asn Gly Arg Pro Gly Thr Asn Gly Gly Arg Asn Gly
65 70 75 80
Asn Gly Asn Gly Arg Gly Asn Gly Tyr Gly Gly Gly Gln Pro Ser Asn
85 90 95
Ser Tyr Gly Pro Pro Ser Asn Gly His Gly Gly Asn Gly Ala Gly Arg
100 105 110
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Phe Ala Gly
115 120 125
Gly Ser Asn Gly Lys Asn Gly Phe Gly Gly Gly Pro Ser Ser Ser Tyr
130 135 140
Gly Pro Pro Glu Asn Gly Asn Gly Phe Asn Gly Gly Asn Gly Gly Pro
145 150 155 160
Ser Gly Leu Tyr Gly Pro Pro Gly Arg Asn Gly Gly Asn Gly Gly Asn
165 170 175
Gly Gly Asn Gly Gly Arg Pro Ser Gly Ser Tyr Gly Thr Pro Glu Arg
180 185 190
Asn Gly Gly Arg Leu Gly Gly Leu Tyr Gly Ala Pro Gly Arg Asn Gly
195 200 205
Asn Asn Gly Gly Asn Gly Tyr Pro Ser Gly Gly Leu Asn Gly Gly Asn
210 215 220
Gly Gly Tyr Pro Ser Gly Gly Pro Gly Asn Gly Gly Ala Asn Gly Gly
225 230 235 240
Tyr Pro Ser Gly Gly Ser Asn Gly Asp Asn Gly Gly Tyr Pro Ser Gly
245 250 255
Gly Pro Asn Gly Asn Gly Asn Gly Asn Gly Gly Tyr Gly Gln Asp Glu
260 265 270
Asn Asn Glu Pro Ala Lys Tyr Glu Phe Ser Tyr Glu Val Lys Asp Glu
275 280 285
Gln Ser Gly Ala Asp Tyr Gly His Thr Glu Ser Arg Asp Gly Asp Arg
290 295 300
Ala Gln Gly Glu Phe Asn Val Leu Leu Pro Asp Gly Arg Lys Gln Ile
305 310 315 320
Val Glu Tyr Glu Ala Asp Gln Asp Gly Phe Lys Pro Gln Ile Arg Tyr
325 330 335
Glu Gly Glu Ala Asn Ser Gln Gly Tyr Gly Ser Gly Gly Pro Gly Gly
340 345 350
Asn Gly Gly Asp Asn Gly Tyr Pro Ser Gly Gly Pro Gly Gly Asn Gly
355 360 365
Tyr Ser Ser Gly Arg Pro Asn Gly Gly Ser Asp Phe Ser Asp Gly Gly
370 375 380
Tyr Pro Ser Thr Arg Pro Gly Gly Glu Asn Gly Gly Tyr Arg Asn Gly
385 390 395 400
Asn Asn Gly Gly Asn Gly Asn Gly Gly Tyr Pro Ser Gly Asn Gly Gly
405 410 415
Asp Ala Ala Ala Asn Gly Gly Tyr Gln Tyr
420 425
<210> 16
<211> 318
<212> PRT
<213> Apis mellifera
<400> 16
Asp Ala Pro Ile Ser Gly Ser Tyr Leu Pro Pro Ser Thr Ser Tyr Gly
1 5 10 15
Thr Pro Asn Leu Gly Gly Gly Gly Pro Ser Ser Thr Tyr Gly Ala Pro
20 25 30
Ser Gly Gly Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ser
35 40 45
Ser Thr Tyr Gly Ala Pro Ser Ser Thr Tyr Gly Ala Pro Ser Asn Gly
50 55 60
Gly Gly Arg Pro Ser Ser Thr Tyr Gly Ala Pro Ser Asn Gly Gly Gly
65 70 75 80
Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro
85 90 95
Ser Ser Thr Tyr Gly Ala Pro Ser Asn Gly Gly Gly Arg Pro Ser Ser
100 105 110
Ser Tyr Gly Ala Pro Ser Phe Gly Gly Gly Gly Gly Phe Gly Gly Gly
115 120 125
Asn Gly Leu Ser Thr Ser Tyr Gly Ala Pro Ser Arg Gly Gly Gly Gly
130 135 140
Gly Gly Gly Ser Ile Ser Ser Ser Tyr Gly Ala Pro Thr Gly Gly Gly
145 150 155 160
Gly Gly Gly Pro Ser Thr Thr Tyr Gly Ala Pro Asn Gly Gly Gly Asn
165 170 175
Gly Tyr Ser Arg Pro Ser Ser Thr Tyr Gly Thr Pro Ser Thr Gly Gly
180 185 190
Gly Ser Phe Gly Gly Ser Gly Gly Tyr Ser Gly Gly Gly Gly Gly Tyr
195 200 205
Ser Gly Gly Gly Asn Gly Tyr Ser Gly Gly Gly Gly Gly Gly Tyr Ser
210 215 220
Gly Gly Asn Gly Gly Gly Tyr Ser Gly Gly Gly Asn Gly Gly Gly Tyr
225 230 235 240
Ser Gly Gly Asn Gly Gly Gly Tyr Ser Gly Gly Gly Gly Gly Gly Tyr
245 250 255
Ser Gly Gly Gly Gly Gly Gly Tyr Ser Gly Gly Gly Asn Gly Tyr Ser
260 265 270
Gly Gly Gly Gly Gly Gly Tyr Ser Gly Gly Asn Gly Gly Tyr Ser Gly
275 280 285
Gly Asn Gly Gly Tyr Ser Gly Gly Gly Gly Gly Tyr Ser Gly Gly Gly
290 295 300
Gly Gly Gly Gln Ser Tyr Ala Ser Asn Gly Gly Tyr Gln Tyr
305 310 315
<210> 17
<211> 747
<212> PRT
<213> Nasonia vitripennis
<400> 17
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Gly Gln Gly Gly
1 5 10 15
Gly Phe Gly Gly Gly Arg Pro Ser Gly Ala Ser Pro Ser Asp Gln Tyr
20 25 30
Gly Pro Pro Asp Phe Gln Gly Ala Gly Gly Arg Gly Gly Gln Ala Ala
35 40 45
Gly Gly Asn Phe Gly Gly Gly Gly Asn Gly Phe Gly Gly Ala Pro Ser
50 55 60
Ser Ser Tyr Gly Pro Pro Gly Phe Gly Ser Asn Glu Pro Asn Lys Phe
65 70 75 80
Ser Gly Ala Gly Gly Gly Gly Ala Gly Arg Pro Gln Asp Ser Tyr Gly
85 90 95
Pro Pro Ala Gly Gly Asn Gly Phe Ala Gly Ser Ala Gly Ala Gly Asn
100 105 110
Ser Gly Arg Pro Gly Gly Ala Ala Ala Gly Gly Arg Pro Ser Asp Ser
115 120 125
Tyr Gly Pro Pro Gln Gly Gly Gly Ser Gly Phe Gly Gly Gly Asn Ala
130 135 140
Gly Arg Pro Ser Asp Ser Tyr Gly Pro Pro Ser Ala Gly Gly Gly Gly
145 150 155 160
Phe Gly Gly Gly Ser Pro Gly Gly Gly Phe Gly Gly Gly Ser Pro Gly
165 170 175
Gly Gly Phe Gly Gly Gly Asn Gln Gly Ala Pro Gln Ser Ser Tyr Gly
180 185 190
Pro Pro Ala Ser Gly Phe Gly Gly Gln Gly Gly Ala Gly Gln Gly Arg
195 200 205
Pro Ser Asp Ser Tyr Gly Pro Pro Gly Gly Gly Ser Gly Gly Arg Pro
210 215 220
Ser Gln Gly Gly Asn Gly Phe Gly Gly Gly Asn Ala Gly Arg Pro Ser
225 230 235 240
Asp Ser Tyr Gly Pro Pro Ala Ala Gly Gly Gly Gly Phe Gly Gly Asn
245 250 255
Ala Gly Gly Asn Gly Gly Gly Asn Gly Phe Gly Gly Gly Arg Pro Ser
260 265 270
Gly Ser Pro Gly Gly Phe Gly Gly Gln Gly Gly Gly Gly Arg Pro Ser
275 280 285
Asp Ser Tyr Leu Pro Pro Ser Gly Gly Ser Gly Phe Gly Gly Gly Asn
290 295 300
Gly Arg Gln Pro Gly Gly Phe Gly Gln Gln Gly Gly Asn Gly Ala Gly
305 310 315 320
Gln Gln Asn Gly Gly Gly Gly Ala Gly Arg Pro Ser Ser Ser Tyr Gly
325 330 335
Pro Pro Ser Asn Gly Asn Gly Gly Gly Phe Ser Gly Gln Asn Gly Gly
340 345 350
Arg Gly Ser Pro Ser Ser Gly Gly Gly Phe Gly Gly Ala Gly Gly Ser
355 360 365
Pro Ser Ser Ser Tyr Gly Pro Pro Ala Gly Gly Ser Gly Phe Gly Asn
370 375 380
Asn Gly Gly Ala Gly Gly Arg Pro Ser Ser Ser Tyr Gly Pro Pro Ser
385 390 395 400
Ser Gly Gly Asn Gly Phe Gly Ser Gly Gly Gln Gly Gly Gln Gly Gly
405 410 415
Gln Gly Gly Gln Gly Gly Arg Pro Ser Ser Ser Tyr Gly Pro Pro Ser
420 425 430
Asn Gly Asn Gly Gly Phe Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser
435 440 445
Asn Gly Tyr Pro Gln Gly Gln Gly Asn Gly Asn Gly Gly Phe Gly Gly
450 455 460
Gln Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Pro Pro Gly
465 470 475 480
Gly Asp Ser Gly Tyr Pro Ser Gly Gly Pro Ser Gly Asn Phe Gly Gly
485 490 495
Ser Asn Ala Gly Gly Gly Gly Gly Gly Phe Gly Gly Gln Val Gln Asp
500 505 510
Ser Tyr Gly Pro Pro Pro Ser Gly Ala Val Asn Gly Asn Gly Asn Gly
515 520 525
Tyr Ser Ser Gly Gly Pro Gly Gly Asn Gly Leu Asp Glu Gly Asn Asp
530 535 540
Glu Pro Ala Lys Tyr Glu Phe Ser Tyr Glu Val Lys Asp Asp Gln Ser
545 550 555 560
Asp Gly Arg Lys Gln Ile Val Glu Tyr Glu Ala Asp Gln Asp Gly Phe
565 570 575
Lys Pro Gln Ile Arg Tyr Glu Gly Glu Ala Asn Thr Gly Ala Gly Gly
580 585 590
Ala Gly Gly Tyr Pro Ser Gly Gly Gly Gly Asp Ser Gly Tyr Pro Ser
595 600 605
Gly Pro Ser Gly Ala Gly Gly Asn Ala Gly Tyr Pro Ser Gly Gly Gly
610 615 620
Gly Gly Ala Gly Gly Phe Gly Gly Asn Gly Gly Gly Ser Asn Gly Tyr
625 630 635 640
Pro Ser Gly Gly Pro Ser Gly Gly Gln Gly Gln Phe Gly Gly Gln Gln
645 650 655
Gly Gly Asn Gly Gly Tyr Pro Ser Gly Pro Gln Gly Gly Ser Gly Phe
660 665 670
Gly Gly Gly Ser Gln Gly Ser Gly Ser Gly Gly Tyr Pro Ser Gly Gly
675 680 685
Pro Gly Gly Asn Gly Gly Asn Asn Asn Phe Gly Gly Gly Asn Ala Gly
690 695 700
Tyr Pro Ser Gly Gly Pro Ser Gly Gly Asn Gly Phe Asn Gln Gly Gly
705 710 715 720
Gln Asn Gln Gly Gly Ser Gly Gly Gly Tyr Pro Ser Gly Ser Gly Gly
725 730 735
Asp Ala Ala Ala Asn Gly Gly Tyr Gln Tyr Ser
740 745
<210> 18
<211> 419
<212> PRT
<213> Nasonia vitripennis
<400> 18
Arg Ala Glu Ala Pro Ile Ser Gly Asn Tyr Leu Pro Pro Ser Thr Ser
1 5 10 15
Tyr Gly Thr Pro Asn Leu Gly Gly Gly Gly Gly Gly Gly Gly Gly Phe
20 25 30
Gly Gly Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ser Gly Gly
35 40 45
Gly Phe Gly Gly Ser Phe Gly Gly Gly Ala Pro Ser Ser Ser Tyr Gly
50 55 60
Ala Pro Ser Thr Gly Gly Ser Phe Gly Gly Gly Ala Pro Ser Ser Ser
65 70 75 80
Tyr Gly Ala Pro Ser Ser Gly Gly Ser Phe Gly Gly Ser Phe Gly Gly
85 90 95
Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ser Phe Gly Gly Asn Ala
100 105 110
Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ala Gly Gly Ser Phe Gly Gly
115 120 125
Gly Ala Pro Ser Asn Ser Tyr Gly Pro Pro Ser Ser Ser Tyr Gly Ala
130 135 140
Pro Ser Ala Gly Gly Ser Phe Gly Gly Ser Ser Gly Gly Ser Phe Gly
145 150 155 160
Gly Ser Phe Gly Gly Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ala
165 170 175
Pro Ser Arg Pro Ser Ser Asn Tyr Gly Ala Pro Ser Arg Pro Ser Ser
180 185 190
Asn Tyr Gly Ala Pro Ser Ser Gly Gly Ser Gly Phe Gly Gly Gly Ser
195 200 205
Gly Phe Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ser
210 215 220
Gly Ser Phe Gly Gly Gly Phe Gly Gly Gly Ala Pro Ser Ser Ser Tyr
225 230 235 240
Gly Ala Pro Ala Pro Ser Arg Pro Ser Ser Asn Tyr Gly Ala Pro Ala
245 250 255
Pro Ser Arg Pro Ser Ser Asn Tyr Gly Ala Pro Ala Pro Ser Arg Pro
260 265 270
Ser Ser Ser Tyr Gly Ala Pro Ser Arg Pro Ser Ser Asn Tyr Gly Ala
275 280 285
Pro Ser Arg Pro Ser Ser Asn Tyr Gly Ala Pro Ser Ser Gly Gly Ser
290 295 300
Gly Phe Gly Gly Gly Ser Gly Phe Gly Gly Gly Arg Pro Ser Ser Ser
305 310 315 320
Tyr Gly Ala Pro Ser Ser Gly Ser Phe Gly Gly Gly Phe Gly Gly Gly
325 330 335
Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ala Pro Ser Arg Pro Ser Ser
340 345 350
Asn Tyr Gly Pro Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ser Gly Gly
355 360 365
Ser Gly Gly Phe Gly Gly Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro
370 375 380
Ser Phe Gly Gly Ser Ser Asn Ala Val Ser Arg Pro Ser Ser Ser Tyr
385 390 395 400
Gly Ala Pro Ser Ser Gly Gly Gly Gln Ser Tyr Ala Ser Asn Gly Gly
405 410 415
Tyr Gln Tyr
<210> 19
<211> 396
<212> PRT
<213> Pediculus humanus corporis
<400> 19
Glu Pro Pro Val Lys Thr Ser Tyr Leu Pro Pro Ser Ala Ser Arg Ser
1 5 10 15
Leu Asn Ser Gln Tyr Gly Ala Pro Ala Phe Thr Asp Ser Asn Glu Leu
20 25 30
Val Ala Pro Ser Pro Asn Ser Asn Phe His Asp Ser Tyr Asn Gln Gln
35 40 45
Gln Gln Ser Phe Asp Leu Ser Asn Gly Leu Ser Val Pro Ser Ala Ala
50 55 60
Gly Arg Leu Ser Asn Thr Tyr Gly Val Pro Ser Ala Gln Gly Ala Asn
65 70 75 80
Val Pro Ser Phe Asp Ser Ser Asp Ser Ile Ala Val Asp Ala Ala Gly
85 90 95
Arg Ser Gly Asn Ser Phe Ser Ser His Val Pro Ser Ser Thr Tyr Gly
100 105 110
Ala Pro Gly Asn Gly Phe Gly Gly Gly Ser Arg Ser Ser Gln Ser Gly
115 120 125
Ala Pro Ser Ser Val Tyr Gly Pro Pro Gln Ala Arg Asn Asn Asn Phe
130 135 140
Gly Asn Gly Ala Ala Pro Ser Ser Val Tyr Gly Pro Pro Gln Ala Arg
145 150 155 160
Asn Asn Asn Phe Gly Asn Gly Gly Ala Pro Ser Gln Val Tyr Gly Pro
165 170 175
Pro Lys Ala Arg Asn Asn Asn Phe Gly Asn Gly Ala Ala Pro Ser Ser
180 185 190
Val Tyr Gly Pro Pro Gln Ala Arg Asn Asn Asn Phe Gly Asn Gly Ala
195 200 205
Ala Pro Ser Ser Val Tyr Gly Pro Pro Gln Ala Arg Asn Asn Asn Phe
210 215 220
Ala Asn Ser Ala Ala Pro Ser Gln Val Tyr Gly Pro Pro Gln Ala Arg
225 230 235 240
Asn Asn Asn Phe Gly Asn Gly Ala Ala Pro Ser Ser Val Tyr Gly Pro
245 250 255
Pro Gln Ser Ser Ser Phe Ser Ser Pro Ser Gly Arg Ser Gly Gln Leu
260 265 270
Pro Ser Ala Thr Tyr Gly Ala Pro Phe Glu Arg Asn Gly Phe Gly Ser
275 280 285
Gln Gly Ser Ser Gly Phe Gln Gly Tyr Glu Pro Ser Lys Arg Ser Gln
290 295 300
Thr Thr Glu Asp Pro Phe Ala Glu Pro Ala Lys Tyr Glu Tyr Asp Tyr
305 310 315 320
Lys Val Gln Ala Ser Asp Glu Thr Gly Thr Glu Phe Gly His Lys Glu
325 330 335
Ser Arg Glu Asn Glu Ser Ala Arg Gly Ala Tyr His Val Leu Leu Pro
340 345 350
Asp Gly Arg Met Gln Ile Val Gln Tyr Glu Ala Asp Glu Thr Gly Tyr
355 360 365
Arg Pro Gln Ile Arg Tyr Glu Asp Thr Gly Tyr Pro Ser Ala Ala Ser
370 375 380
Ser Arg Ser Asn Asn Gly Phe Asn Gly Tyr Gln Tyr
385 390 395
<210> 20
<211> 573
<212> PRT
<213> Anopheles gambiae
<400> 20
Lys Arg Glu Ala Pro Leu Pro Pro Ser Gly Ser Tyr Leu Pro Pro Ser
1 5 10 15
Gly Gly Ala Gly Gly Tyr Pro Ala Ala Gln Thr Pro Ser Ser Ser Tyr
20 25 30
Gly Ala Pro Thr Gly Gly Ala Gly Ser Trp Gly Gly Asn Gly Gly Asn
35 40 45
Gly Gly Arg Gly His Ser Asn Gly Gly Gly Ser Ser Phe Gly Gly Ser
50 55 60
Ala Pro Ser Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Phe Gly Gly
65 70 75 80
Gln Ser Ser Gly Gly Phe Gly Gly His Ser Ser Gly Gly Phe Gly Gly
85 90 95
His Ser Ser Gly Gly His Gly Gly Asn Gly Asn Gly Asn Gly Asn Gly
100 105 110
Tyr Ser Ser Gly Arg Pro Ser Ser Gln Tyr Gly Pro Pro Gln Gln Gln
115 120 125
Gln Gln Gln Gln Ser Phe Arg Pro Pro Ser Thr Ser Tyr Gly Val Pro
130 135 140
Ala Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ala Gln Gln His Ser Asn
145 150 155 160
Gly Gly Asn Gly Gly Tyr Ser Ser Gly Arg Pro Ser Thr Gln Tyr Gly
165 170 175
Ala Pro Ala Gln Ser Asn Gly Asn Gly Phe Gly Asn Gly Arg Pro Ser
180 185 190
Ser Ser Tyr Gly Ala Pro Ala Arg Pro Ser Thr Gln Tyr Gly Ala Pro
195 200 205
Ser Ala Gly Asn Gly Asn Gly Tyr Ala Gly Asn Gly Asn Gly Arg Ser
210 215 220
Tyr Ser Asn Gly Asn Gly Asn Gly His Gly Asn Gly His Ser Asn Gly
225 230 235 240
Asn Gly Asn Asn Gly Tyr Ser Arg Gly Pro Ala Arg Gln Pro Ser Gln
245 250 255
Gln Tyr Gly Pro Pro Ala Gln Ala Pro Ser Ser Gln Tyr Gly Ala Pro
260 265 270
Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser
275 280 285
Ser Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala
290 295 300
Pro Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro Ala Pro Ser Arg
305 310 315 320
Pro Ser Gln Gln Tyr Gly Ala Pro Ala Pro Ser Arg Pro Ser Gln Gln
325 330 335
Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro Ala
340 345 350
Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser
355 360 365
Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro
370 375 380
Ala Gln Gln Pro Ser Ser Gln Tyr Gly Ala Pro Ala Pro Ser Arg Pro
385 390 395 400
Ser Gln Gln Tyr Gly Ala Pro Ala Gln Gln Pro Ser Ala Gln Tyr Gly
405 410 415
Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro Ala Pro Ser
420 425 430
Arg Pro Ser Gln Gln Tyr Gly Ala Pro Ala Gln Ala Pro Ser Ser Gln
435 440 445
Tyr Gly Ala Pro Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Gln
450 455 460
Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr
465 470 475 480
Gly Ala Pro Ser Phe Gly Pro Thr Gly Gly Ala Ser Phe Ser Ser Gly
485 490 495
Asn Gly Asn Val Gly Gly Ser Tyr Gln Val Ser Ser Thr Gly Asn Gly
500 505 510
Phe Ser Gln Ala Ser Phe Ser Ala Ser Ser Phe Ser Pro Asn Gly Arg
515 520 525
Thr Ser Leu Ser Ala Gly Gly Phe Ser Ser Gly Ala Pro Ser Ala Gln
530 535 540
Ser Ala Gly Gly Tyr Ser Ser Gly Gly Pro Ser Gln Val Pro Ala Thr
545 550 555 560
Leu Pro Gln Ser Tyr Ser Ser Asn Gly Gly Tyr Asn Tyr
565 570
<210> 21
<211> 513
<212> PRT
<213> Glossina morsitans
<400> 21
Arg Pro Glu Pro Pro Val Asn Thr Tyr Leu Pro Pro Ser Ala Gly Gly
1 5 10 15
Gly Ser Gly Gly Gly Ser Pro Leu Ala Pro Ser Asp Thr Tyr Gly Ala
20 25 30
Pro Gly Val Asn Gly Gly Gly Gly Gly Gly Gly Gly Pro Ser Ser Thr
35 40 45
Tyr Gly Ala Pro Gly Ser Gly Gly Gly Asn Gly Asn Gly Gly Gly Gly
50 55 60
Phe Gly Lys Pro Ser Ser Thr Tyr Gly Ala Pro Gly Leu Gly Gly Gly
65 70 75 80
Gly Asn Gly Gly Gly Arg Pro Ser Glu Thr Tyr Gly Ala Pro Ser Gly
85 90 95
Gly Gly Gly Asn Gly Phe Gly Lys Pro Ser Ser Thr Tyr Gly Ala Pro
100 105 110
Asn Gly Gly Gly Gly Asn Gly Gly Pro Gly Arg Pro Ser Ser Thr Tyr
115 120 125
Gly Ala Pro Gly Ser Gly Gly Gly Asn Gly Gly Ser Gly Arg Pro Ser
130 135 140
Ser Thr Tyr Gly Ala Pro Gly Leu Gly Gly Gly Asn Gly Gly Ser Gly
145 150 155 160
Arg Pro Ser Ser Met Tyr Gly Ala Pro Gly Leu Gly Gly Gly Asn Gly
165 170 175
Gly Ser Gly Arg Pro Ser Ser Thr Tyr Gly Ala Pro Gly Ser Gly Gly
180 185 190
Gly Asn Gly Gly Ser Gly Arg Pro Ser Ser Thr Tyr Gly Ala Pro Gly
195 200 205
Ser Gly Gly Gly Asn Gly Gly Ser Gly Arg Pro Ser Ser Thr Tyr Gly
210 215 220
Ala Pro Gly Asn Gly Asn Gly Gly Asn Gly Phe Gly Arg Pro Ser Ser
225 230 235 240
Thr Tyr Gly Ala Pro Gly Ser Gly Gly Ser Asn Gly Asn Gly Lys Pro
245 250 255
Ser Ser Thr Tyr Gly Ala Pro Gly Ser Gly Gly Gly Gly Gly Arg Pro
260 265 270
Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly Asn Gly Gly Arg Asn Gly
275 280 285
Asn Gly Asn Gly Gln Ser Gln Glu Tyr Leu Pro Pro Gly Gln Ser Gly
290 295 300
Ser Gly Gly Gly Gly Gly Tyr Gly Gly Gly Ser Gly Ser Gly Gly Ser
305 310 315 320
Gly Gly Gly Gly Gly Gly Gly Tyr Gly Gly Asp Gln Asp Asn Asn Val
325 330 335
Val Glu Tyr Glu Ala Asp Gln Glu Gly Tyr Arg Pro Gln Ile Arg Tyr
340 345 350
Glu Gly Asp Gly Ser Gln Gly Gly Phe Gly Gly Asp Gly Asp Gly Tyr
355 360 365
Ser Tyr Glu Gln Asn Gly Val Gly Gly Asp Gly Gly Gly Ala Gly Gly
370 375 380
Ala Gly Gly Tyr Ser Asn Gly Gln Asn Leu Gly Ala Asn Gly Tyr Ser
385 390 395 400
Ser Gly Arg Pro Asn Gly Gly Asn Gly Gly Gly Arg Arg Gly Gly Gly
405 410 415
Gly Gly Gly Gly Gly Ser Gly Gly Gly Gln Asn Leu Gly Ser Asn Gly
420 425 430
Tyr Ser Ser Gly Ala Pro Asn Gly Phe Gly Gly Gly Asn Gly Gln Gly
435 440 445
Tyr Ser Gly Gly Arg Ser Asn Gly Asn Gly Gly Gly Gly Gly Gly Arg
450 455 460
Asn Gly Gly Arg Tyr Arg Asn Gly Gly Gly Gly Gly Gly Gly Arg Asn
465 470 475 480
Gly Gly Gly Ser Asn Gly Tyr Asn Tyr Asp Gln Pro Gly Ser Asn Gly
485 490 495
Phe Gly Arg Gly Gly Gly Asn Gly Glu Asn Asp Gly Ser Gly Tyr His
500 505 510
Tyr
<210> 22
<211> 506
<212> PRT
<213> Atta cephalotes
<400> 22
Arg Ser Glu Pro Pro Val Asn Ser Tyr Leu His Pro Gly Ser Asp Thr
1 5 10 15
Ser Gly Thr Asn Gly Gly Arg Thr Asp Leu Ser Thr Gln Tyr Gly Ala
20 25 30
Pro Asp Phe Asn Asn Arg Gly Asn Gly Asn Ser Gly Ala Thr Ser Phe
35 40 45
Gly Gly Ser Gly Ala Gly Asn Gly Pro Ser Lys Leu Tyr Asp Val Pro
50 55 60
Ile Arg Gly Asn Thr Gly Gly Asn Gly Leu Gly Gln Phe Arg Gly Asn
65 70 75 80
Gly Phe Glu Ser Gly Gln Pro Ser Ser Ser Tyr Gly Ala Pro Lys Gly
85 90 95
Gly Phe Gly Glu Asn Arg Gly Asn Arg Gly Arg Pro Ser Thr Ser Tyr
100 105 110
Gly Val Pro Asp Ser Asn Arg Asn Asn Arg Gly Gly Phe Gly Asn Gly
115 120 125
Gly Ser Glu Ala Arg Pro Ser Thr Ser Tyr Gly Val Pro Gly Ala Asn
130 135 140
Gly Asn Gln Gly Gly Phe Gly Ser Gly Ser Ile Gly Gly Arg Pro Ser
145 150 155 160
Thr Ser Tyr Gly Val Pro Gly Ala Asn Gly Asn Asn Gly Asp Ser Phe
165 170 175
Arg Asn Gly Asp Ile Gly Gly Arg Pro Ser Thr Asn Tyr Gly Ala Pro
180 185 190
Gly Ala Asn Gly Asn His Gly Gly Gly Asn Gly Gly Asn Gly Arg Pro
195 200 205
Ser Asn Asn Tyr Gly Val Pro Gly Ala Asn Gly Asn Thr Asn Gly Lys
210 215 220
Gly Arg Leu Asn Gly Asn Ser Gly Gly Gly Pro Ser Asn Asn Tyr Gly
225 230 235 240
Ser Pro Asn Gly Phe Gly Lys Gly Leu Ser Thr Ser Tyr Gly Ser Pro
245 250 255
Asn Arg Gly Gly Asn Asp Asn His Tyr Pro Ser Arg Gly Ser Phe Ile
260 265 270
Asn Gly Gly Ile Asn Gly Tyr Ser Ser Gly Ser Pro Asn Gly Asn Ala
275 280 285
Gly Asn Phe Gly His Gly Asp Glu Ser Phe Gly Arg Gly Gly Gly Glu
290 295 300
Gly Glu Asn Thr Gly Glu Gly Tyr Asn Ala Asn Ala Gln Glu Glu Ser
305 310 315 320
Thr Glu Pro Ala Lys Tyr Glu Phe Ser Tyr Lys Val Lys Asp Gln Gln
325 330 335
Thr Gly Ser Asp Tyr Ser His Thr Glu Thr Arg Asp Gly Asp His Ala
340 345 350
Gln Gly Glu Phe Asn Val Leu Leu Pro Asp Gly Arg Lys Gln Ile Val
355 360 365
Glu Tyr Glu Ala Asp Gln Asp Gly Phe Lys Pro Gln Ile Arg Tyr Glu
370 375 380
Gly Glu Ala Asn Ala Asp Gly Gly Tyr Gly Ser Gly Leu Asn Asp Asn
385 390 395 400
Asn Asp Gly Tyr Ser Ser Gly Arg Pro Asp Ser Glu Ser Gly Gly Phe
405 410 415
Ala Asn Ser Gly Phe Asn Gly Gly Ser Ser Asn Gly Gly Tyr Pro Asn
420 425 430
Gly Gly Pro Gly Glu Arg Lys Leu Gly Gly Phe Asn Asn Gly Gly Ser
435 440 445
Ser Gly Tyr Gln Ser Gly Arg Ser Ala Gly Gln Ser Phe Gly Arg Asp
450 455 460
Asn Ala Gly Asp Leu Asn Asn Asp Ile Gly Gly Tyr Phe Ser Asn Ser
465 470 475 480
Pro Asn Asn Ile Gly Asp Ser Asp Asn Ala Asn Val Gly Ser Asn Arg
485 490 495
Gln Asn Asp Gly Asn Ser Gly Tyr Gln Tyr
500 505
<210> 23
<211> 550
<212> PRT
<213> Anopheles darlingi
<400> 23
Lys Arg Glu Ala Pro Leu Pro Pro Ser Gly Ser Tyr Leu Pro Pro Ser
1 5 10 15
Gly Gly Gly Gly Gly Gly Gly Gly Tyr Pro Ala Ala Gln Thr Pro Ser
20 25 30
Ser Ser Tyr Gly Ala Pro Ala Gly Gly Ala Gly Gly Trp Gly Gly Asn
35 40 45
Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly Arg Gly Gly Tyr Ser Asn
50 55 60
Gly Gly Gly His Ser Gly Ser Ala Pro Ser Gln Ser Tyr Gly Ala Pro
65 70 75 80
Ser Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Gln Ser Tyr Gly Ala
85 90 95
Pro Ala Ala Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Phe Gly Gly
100 105 110
Asn Gly Gly Gly Ala Ser His Gly Ser Gly Gly Phe Thr Gly Gly His
115 120 125
Gly Gly Asn Gly Asn Gly Asn Gly Tyr Ser Ser Gly Arg Pro Ser Ser
130 135 140
Gln Tyr Gly Pro Pro Gln Gln Gln Gln Gln Pro Gln Gln Gln Ser Phe
145 150 155 160
Arg Pro Pro Ser Thr Ser Tyr Gly Val Pro Ala Ala Pro Ser Ser Ser
165 170 175
Tyr Gly Ala Pro Ser Ala Asn Gly Phe Ser Asn Gly Gly Arg Pro Ser
180 185 190
Ser Gln Tyr Gly Ala Pro Ala Pro Gln Ser Asn Gly Asn Glu Phe Gly
195 200 205
Ala Pro Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ser Arg Pro Ser Thr
210 215 220
Gln Tyr Gly Ala Pro Ser Asn Gly Asn Gly Asn Gly Tyr Ala Gly His
225 230 235 240
Gly Asn Gly Asn Gly His Gly Asn Gly Asn Gly His Ser Asn Gly Asn
245 250 255
Gly Asn Gly Tyr Asn Arg Gly Pro Ala Arg Gln Pro Ser Ser Gln Tyr
260 265 270
Gly Pro Pro Ser Gln Gly Pro Pro Ser Ser Gln Tyr Gly Pro Pro Ser
275 280 285
Gln Tyr Gly Pro Pro Ser Ser Gly Thr Ser Phe Ile Ala Tyr Gly Pro
290 295 300
Pro Ser Gln Gly Pro Pro Ser Ser Gln Tyr Gly Ala Pro Ala Pro Ser
305 310 315 320
Arg Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln
325 330 335
Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr Gly Pro Pro Arg
340 345 350
Gln Ser Ser Pro Gln Phe Gly Ala Pro Ala Pro Arg Pro Pro Ser Ser
355 360 365
Gln Tyr Gly Ala Pro Ala Gln Ala Pro Ser Ser Gln Tyr Gly Ala Pro
370 375 380
Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Ala Pro Ser
385 390 395 400
Ser Gln Tyr Gly Ala Pro Ala Pro Ser Arg Pro Ser Ser Gln Tyr Gly
405 410 415
Val Pro Ala Gln Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Ala
420 425 430
Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr
435 440 445
Gly Ala Pro Ser Phe Gly Ser Thr Gly Gly Ser Ser Phe Gly Gly Asn
450 455 460
Gly Gly Val Gly Gly Ser Tyr Gln Thr Ala Ser Ser Gly Asn Gly Phe
465 470 475 480
Ser Gln Ala Ser Phe Ser Ala Ser Ser Phe Ser Ser Asn Gly Arg Ser
485 490 495
Ser Gln Ser Ala Gly Gly Tyr Ser Ser Gly Gly Pro Ser Gln Val Pro
500 505 510
Ala Thr Ile Pro Gln Gln Tyr Ser Ser Gly Gly Gly Ser Tyr Ser Ser
515 520 525
Gly Gly His Ser Gln Val Pro Ala Thr Leu Pro Gln Gln Tyr Ser Ser
530 535 540
Asn Gly Gly Tyr Asn Tyr
545 550
<210> 24
<211> 585
<212> PRT
<213> Acromyrmex echinatior
<400> 24
Arg Ser Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Gly Pro Gly Thr
1 5 10 15
Ser Gly Ala Asn Gly Gly Gln Thr Asp Leu Ser Ile Gln Tyr Arg Ala
20 25 30
Ser Asp Phe Asn Asn Arg Gly Asn Val Asn Gly Asn Ser Gly Ala Thr
35 40 45
Ser Phe Gly Gly Pro Gly Ala Ser Asn Gly Pro Ser Lys Leu Tyr Asp
50 55 60
Val Pro Ile Gly Gly Asn Ala Gly Gly Asn Gly Leu Gly Gln Phe Arg
65 70 75 80
Gly Asn Gly Phe Glu Gly Gly Gln Pro Ser Ser Ser Tyr Gly Ala Pro
85 90 95
Asn Gly Gly Phe Gly Glu Asn Arg Gly Asn Gly Gly Lys Pro Ser Thr
100 105 110
Ser Tyr Gly Val Pro Asp Ser Asn Gly Asn Asn Arg Gly Gly Phe Gly
115 120 125
Asn Gly Gly Ser Glu Gly Arg Pro Ser Thr Ser Tyr Gly Leu Pro Asp
130 135 140
Ala Ser Arg Asn Asn Gly Asn Gly Phe Gly Asn Val Gly Asn Glu Asp
145 150 155 160
Lys Pro Ser Thr Asn Tyr Gly Ile Pro Ala Asn Gly Asn Lys Val Ser
165 170 175
Gly Phe Gly Asn Val Gly Ser Glu Gly Arg Pro Ser Thr Ser Tyr Gly
180 185 190
Val Pro Gly Ala Asn Gly Asn Gln Gly Phe Gly Ser Gly Gly Ile Gly
195 200 205
Gly Arg Pro Ser Thr Ser Tyr Gly Val Pro Gly Val Asn Gly Asn Asn
210 215 220
Gly Gly Gly Phe Glu Asn Val Gly Arg Pro Ser Thr Ser Tyr Gly Thr
225 230 235 240
Pro Asp Ala Arg Gly Asn Asn Gly Gly Ser Phe Arg Asn Gly Asp Ile
245 250 255
Gly Gly Arg Pro Ser Thr Asn Tyr Gly Ile Pro Gly Ala Asn Gly Asn
260 265 270
His Gly Gly Gly Asn Gly Gly Asn Gly Arg Pro Ser Ser Asn Tyr Gly
275 280 285
Val Pro Gly Gly Asn Gly Asn Thr Asn Gly Lys Gly Arg Phe Asn Gly
290 295 300
Asn Ser Gly Gly Arg Pro Ser Asn Ser Tyr Gly Ser Pro Asn Gly Phe
305 310 315 320
Gly Lys Gly Leu Ser Thr Ser Tyr Ser Pro Ser Asn Arg Asp Gly Asn
325 330 335
Gly Asn His Tyr Pro Ser Gly Asp Ser Asn Arg Gly Ser Phe Val Asn
340 345 350
Gly Gly Ile Asn Gly Tyr Pro Ser Gly Ser Pro Asn Gly Asn Ala Gly
355 360 365
Asn Phe Arg His Gly Asp Glu Ser Phe Gly Arg Gly Gly Glu Gly Gly
370 375 380
Gly Arg Ser Thr Gly Glu Gly Tyr Asn Ala Asn Ala Gln Glu Glu Ser
385 390 395 400
Thr Glu Pro Ala Lys Tyr Glu Phe Ser Tyr Lys Val Lys Asp Gln Gln
405 410 415
Thr Gly Ser Asp Tyr Ser His Thr Glu Thr Arg Asp Gly Asp His Ala
420 425 430
Gln Gly Glu Phe Asn Val Leu Leu Pro Asp Gly Arg Lys Gln Ile Val
435 440 445
Glu Tyr Glu Ala Asp Gln Asp Gly Phe Lys Pro Gln Ile Arg Tyr Glu
450 455 460
Gly Glu Ala Asn Ala Asp Gly Glu Tyr Asp Ser Gly Gly Leu Asn Asp
465 470 475 480
Asn Asn Asp Gly Tyr Ser Ser Gly Arg Pro Gly Ser Glu Ser Gly Gly
485 490 495
Phe Ala Asn Asn Ser Gly Phe Asn Gly Gly Ser Ser Asn Gly Gly Tyr
500 505 510
Pro Ser Gly Gly Ser Gly Glu Gly Lys Leu Gly Phe Asn Ser Gly Gly
515 520 525
Asn Ser Gly Tyr Gln Ser Gly Arg Pro Ala Gly Gln Ser Phe Gly Arg
530 535 540
Asp Asn Ala Gly Asp Leu Ser Asn Asp Ile Gly Gly Phe Ser Asn Ser
545 550 555 560
Pro Asn Asn Ile Gly Gly Asp Asn Ala Asn Val Gly Ser Asn Arg Gln
565 570 575
Asn Gly Gly Asn Ser Gly Tyr Gln Tyr
580 585
<210> 25
<211> 748
<212> PRT
<213> Acyrthosiphon pisum
<400> 25
Glu Ser Pro Tyr Gly Gly Gly Ser Ser Asn Ser Asn Gly Asn Gly Arg
1 5 10 15
Asn Gly Gly Tyr Gly Gly Lys Gly Gln Tyr Gly Gly Gly Asn Gly Gly
20 25 30
Gly Val Gly Ser Ser Ser Ala Ser Pro Phe Phe Ser Gly Ala Asn Gln
35 40 45
Tyr Gly Ser Gln Ser Gly Leu Ser Gly Ala Ala Asn Asn Arg Tyr Pro
50 55 60
Ser Phe Gly Ser Lys Phe Gly Gly Asn Lys Gly Ser Tyr Gly Gly Ser
65 70 75 80
Ser Ser Arg Asn Asn Gly Arg Tyr Gly Ser Gly Ser Ala Ser Gly Tyr
85 90 95
Gly Ser Gly Ser Ser Gly Gly Leu Gly Ser Thr Gly Arg Ser Thr Gly
100 105 110
Gly Tyr Gly Gly Gly Ser Ser Gly Ser Tyr Gly Ser Gly Ser Ser Gly
115 120 125
Ser Leu Gly Ser Ser Thr Gly Ser Asn Gly Ile Tyr Gly Ala Gly Ser
130 135 140
Ser Gly Gly Phe Gly Ser Gly Ser Ser Gly Ser Tyr Gly Gly Gly Ser
145 150 155 160
Ser Gly Gly Phe Gly Ser Gly Ser Ser Gly Ser Tyr Gly Gly Gly Ser
165 170 175
Ser Gly Gly Phe Gly Ser Gly Ser Ser Gly Ser Tyr Gly Gly Gly Ser
180 185 190
Ser Gly Gly Phe Gly Ser Gly Ser Ser Gly Ser Tyr Gly Gly Gly Ser
195 200 205
Ser Gly Gly Phe Gly Ser Gly Ser Ser Gly Asn Tyr Gly Ser Gly Ser
210 215 220
Ser Gly Ser Tyr Gly Ser Gly Gly Gly Gly Leu Gly Gly Ala Ser Ser
225 230 235 240
Gly Asn Asn Asp Gly Tyr Gly Ala Gly Gly Ser Gly Ser Tyr Asp Gln
245 250 255
Leu Gly Gly Ala Asn Gly Asn Gly Leu Gly Gly Ser Gly Asn Asp Pro
260 265 270
Leu Ser Glu Pro Ala Asn Tyr Glu Phe Ser Tyr Glu Val Asn Ala Pro
275 280 285
Glu Ser Gly Ala Ile Phe Gly His Lys Glu Ser Arg Gln Gly Glu Glu
290 295 300
Ala Thr Gly Val Tyr His Val Leu Leu Pro Asp Gly Arg Thr Gln Ile
305 310 315 320
Val Glu Tyr Glu Ala Asp Glu Asp Gly Tyr Lys Pro Lys Ile Thr Tyr
325 330 335
Thr Asp Pro Val Gly Gly Tyr Ala Gly Asp Arg Gln Ser Gly Asn Ser
340 345 350
Tyr Gly Gly Asn Gly Gly Phe Gly Gly Ser Gly Ser Leu Gly Gly Ser
355 360 365
Gly Gly Asn Leu Gly Gly Leu Tyr Asn Gly Gly Gly Ser Ser Asn Asn
370 375 380
Gly Ala Gly Tyr Gly Gly Ser Ser Ser Ser Leu Gly Ser Arg Tyr Gly
385 390 395 400
Gly Ser Gly Gly Ser Ser Gly Ser Gly Val Gly Gly Gly Tyr Gly Gly
405 410 415
Ser Gly Ser Ser Ser Gly Gly Ile Gly Ser Ser Tyr Gly Gly Ser Gly
420 425 430
Ser Leu Ser Gly Gly Leu Gly Gly Gly Tyr Gly Gly Ser Gly Ser Ser
435 440 445
Ser Gly Gly Leu Gly Gly Gly Tyr Gly Gly Ser Gly Gly Ser Ser Gly
450 455 460
Gly Gly Phe Gly Gly Leu Gly Gly Ser Gly Gly Ser Ser Gly Ser Gly
465 470 475 480
Tyr Gly Gly Ser Gly Ser Ser Ser Gly Gly Leu Gly Asn Ser Tyr Gly
485 490 495
Gly Ser Gly Ser Ser Asn Gly Gly Leu Gly Gly Gly Tyr Ser Gly Ser
500 505 510
Gly Gly Ser Ser Gly Gly Leu Gly Gly Gly Tyr Gly Ala Ser Ser Gly
515 520 525
Ser Ser Gly Ser Gly Leu Gly Gly Gly Tyr Gly Gly Ser Gly Ser Ser
530 535 540
Ser Gly Gly Leu Gly Ser Gly Tyr Gly Gly Leu Gly Ser Ser Ser Gly
545 550 555 560
Gly Leu Gly Gly Gly Tyr Gly Gly Ser Gly Ser Ser Ser Gly Gly Leu
565 570 575
Gly Gly Gly Tyr Gly Gly Ser Gly Ser Ser Asn Gly Gly Ile Gly Gly
580 585 590
Gly Tyr Gly Gly Ser Ser Gly Ser Ser Gly Gly Leu Gly Gly Gly Tyr
595 600 605
Gly Gly Ser Gly Ser Ser Ser Gly Gly Leu Gly Gly Gly Tyr Gly Gly
610 615 620
Ser Gly Gly Ser Asn Ser Gly Leu Gly Ser Ser Tyr Gly Gly Ser Gly
625 630 635 640
Ser Thr Asn Gly Gly Leu Gly Gly Gly Tyr Gly Gly Leu Gly Ser Ser
645 650 655
Ser Gly Gly Leu Gly Gly Gly Tyr Gly Gly Ser Gly Gly Ser Asn Gly
660 665 670
Gly Ile Gly Gly Gly Tyr Gly Gly Ser Ser Gly Ser Gly Gly Ser Gln
675 680 685
Gly Ser Ala Tyr Gly Gly Ser Gly Ser Ser Ser Gly Ser Gln Gly Gly
690 695 700
Gly Tyr Gly Gly Ser Gly Ser Ser Ser Gly Gly Leu Gly Gly Gly Tyr
705 710 715 720
Gly Ser Ser Ser Gly Ser Ser Ser Gly Leu Gly Gly Ser Tyr Gly Ser
725 730 735
Asn Arg Asn Gly Leu Gly Ser Gly Ser Ser Tyr Ser
740 745
<210> 26
<211> 616
<212> PRT
<213> Drosophila virilis
<400> 26
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Pro Gly Asp
1 5 10 15
Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Phe
20 25 30
Gly Gly Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ala Gly Asn Gly
35 40 45
Asn Gly Asn Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly
50 55 60
Gln Gly Gln Gly Gly Phe Gly Gly Lys Pro Ser Asp Ser Tyr Gly Ala
65 70 75 80
Pro Gly Ala Gly Asn Gly Asn Gly Asn Gly Arg Pro Ser Ser Ser Tyr
85 90 95
Gly Ala Pro Gly Gln Gly Gln Gly Gln Gly Gly Phe Gly Gly Arg Pro
100 105 110
Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Gly Phe Gly Gly
115 120 125
Lys Pro Ser Asp Thr Tyr Gly Ala Pro Gly Ala Gly Asn Gly Asn Gly
130 135 140
Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Gly Ile
145 150 155 160
Gly Gly Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ala Gly Asn Gly
165 170 175
Asn Gly Asn Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly
180 185 190
Gln Gly Gly Phe Gly Gly Lys Pro Ser Asp Thr Tyr Gly Ala Pro Gly
195 200 205
Ala Gly Asn Gly Asn Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly
210 215 220
Gln Gly Gln Gly Gly Phe Gly Gly Lys Pro Ser Asp Thr Tyr Gly Ala
225 230 235 240
Pro Gly Ala Gly Asn Gly Asn Gly Asn Gly Arg Pro Ser Ser Ser Tyr
245 250 255
Gly Ala Pro Gly Gln Gly Gln Gly Gly Phe Gly Gly Lys Pro Ser Asp
260 265 270
Thr Tyr Gly Ala Pro Gly Ala Gly Asn Gly Asn Gly Arg Pro Ser Ser
275 280 285
Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Gln Gly Gly Phe Gly Gly
290 295 300
Lys Pro Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly Ala Gly Ala Gly
305 310 315 320
Gly Ala Gly Gly Pro Gly Ala Gly Gly Gly Gly Asp Tyr Asp Asn Asp
325 330 335
Glu Pro Ala Lys Tyr Glu Phe Asn Tyr Gln Val Glu Asp Ala Pro Ser
340 345 350
Gly Leu Ser Phe Gly His Ser Glu Met Arg Asp Gly Asp Phe Thr Thr
355 360 365
Gly Gln Tyr Asn Val Leu Leu Pro Asp Gly Arg Lys Gln Ile Val Glu
370 375 380
Tyr Glu Ala Asp Gln Gln Gly Tyr Arg Pro Gln Val Arg Tyr Glu Gly
385 390 395 400
Asp Ala Asn Gly Asn Gly Gly Pro Gly Gly Ala Gly Gly Pro Gly Gly
405 410 415
Gln Asp Leu Gly Gln Asn Gly Tyr Ser Ser Gly Arg Pro Gly Gly Gln
420 425 430
Asp Leu Gly Gln Gly Gly Tyr Ser Asn Gly Arg Pro Gly Gly Gln Asp
435 440 445
Leu Gly Gln Asn Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu
450 455 460
Gly Gln Asn Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly
465 470 475 480
Gln Asn Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Gln
485 490 495
Asn Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Gln Asn
500 505 510
Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Gln Asn Gly
515 520 525
Tyr Ser Gly Gly Arg Pro Gly Gly Asn Gly Gly Ser Asp Gly Gly Arg
530 535 540
Val Ile Ile Gly Gly Arg Val Ile Gly Gln Asp Gly Gly Asp Gly Gln
545 550 555 560
Gly Tyr Ser Ser Gly Arg Pro Asn Gly Gln Asp Gly Gly Phe Gly Gln
565 570 575
Asp Asn Thr Asp Gly Arg Gly Tyr Ser Ser Gly Lys Pro Gly Gln Gly
580 585 590
Arg Asn Gly Asn Gly Asn Ser Phe Gly Pro Gly Gly Gln Asn Gly Asp
595 600 605
Asn Asp Gly Ser Gly Tyr Arg Tyr
610 615
<210> 27
<211> 557
<212> PRT
<213> Drosophila erecta
<400> 27
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Asp Ser Tyr
1 5 10 15
Gly Ala Pro Gly Gln Ser Gly Pro Gly Gly Arg Pro Ser Asp Ser Tyr
20 25 30
Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly
35 40 45
Ala Pro Gly Leu Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly
50 55 60
Phe Gly Gly Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ala Gly Asn
65 70 75 80
Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala Gly
85 90 95
Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Ser
100 105 110
Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly
115 120 125
Asn Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln
130 135 140
Gly Gln Gly Asn Gly Asn Ser Gly Arg Pro Ser Ser Ser Tyr Gly Ala
145 150 155 160
Pro Gly Ala Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro
165 170 175
Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly
180 185 190
Ala Gly Asn Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala
195 200 205
Pro Gly Gly Gly Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly Ser Gly
210 215 220
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Gly
225 230 235 240
Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Asn Gln
245 250 255
Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly Ser Gly Ser Gly
260 265 270
Asn Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser
275 280 285
Gly Pro Gly Gly Arg Pro Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly
290 295 300
Ser Gly Ala Gly Gly Ala Gly Gly Ser Gly Pro Gly Gly Ala Asp Tyr
305 310 315 320
Asp Asn Asp Ile Val Glu Tyr Glu Ala Asp Gln Gln Gly Tyr Arg Pro
325 330 335
Gln Ile Arg Tyr Glu Gly Asp Ala Asn Asp Gly Ser Gly Pro Ser Gly
340 345 350
Pro Gly Gly Gln Asn Leu Gly Ala Asp Gly Tyr Ser Ser Gly Arg Pro
355 360 365
Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly Tyr Ser Gly Gly Arg Pro
370 375 380
Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr Ser Gly Gly Arg Pro Gly
385 390 395 400
Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser Asn Gly Arg Pro Gly Gly
405 410 415
Gln Asp Leu Gly Pro Ser Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln
420 425 430
Asp Leu Gly Pro Ser Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp
435 440 445
Leu Gly Ala Gly Gly Tyr Ser Asn Gly Arg Pro Gly Gly Asn Gly Asn
450 455 460
Gly Asn Gly Gly Ala Asp Gly Gly Arg Val Ile Ile Gly Gly Arg Val
465 470 475 480
Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser Gly Gly Arg Pro
485 490 495
Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser Gly Arg Pro Gly
500 505 510
Gly Arg Pro Gly Ala Asn Gly Gln Asp Asn Gln Asp Gly Gln Gly Tyr
515 520 525
Ser Ser Gly Arg Ser Gly Lys Gly Gly Arg Asn Ser Phe Gly Pro Gly
530 535 540
Gly Gln Asn Gly Asp Asn Asp Gly Ser Gly Tyr Arg Tyr
545 550 555
<210> 28
<211> 796
<212> PRT
<213> Lutzomyia longipalpis
<400> 28
Arg Pro Glu Pro Pro Ala Asn Thr Tyr Leu Pro Pro Ser Ser Ser Tyr
1 5 10 15
Ala Ala Pro Gly Gln Gln Gly Gly Ser Gly Phe Gly Gly Gly Gly Gly
20 25 30
Ser Gly Gly Ser Gly Gly Phe Gly Gln Pro Gly Ala Phe Gly Arg Pro
35 40 45
Ser Ser Ser Tyr Gly Pro Pro Ser Gln Gly Gly Ala Gly Gly Gly Phe
50 55 60
Gly Ser Asp Ser Gln Phe Gly Gly Gly Phe Gly Gly Gly Ala Gly Gly
65 70 75 80
Phe Gly Ser Gly Gly Ser Gly Ala Pro Gly Ala Ser Gln Arg Pro Ser
85 90 95
Ser Ser Tyr Gly Pro Pro Gly Gln Thr Gly Gly Gly Gly Phe Gly Ala
100 105 110
Gln Gly Ala Pro Gly Ser Ser Phe Gly Pro Gly Gly Gly Phe Gly Gly
115 120 125
Gly Ser Pro Gly Gln Ala Gly Ser Pro Gly Phe Gln Arg Pro Ser Ser
130 135 140
Ser Tyr Gly Pro Pro Gly Gln Ser Pro Gly Gly Gly Phe Ser Gln Gln
145 150 155 160
Gly Gly Ala Pro Gly Ala Ser Gln Arg Pro Ser Ser Thr Tyr Gly Ala
165 170 175
Pro Gly Gln Gly Ala Gly Gly Phe Gly Gln Gly Gly Ser Gly Gly Phe
180 185 190
Gly Gly Thr Gly Gly Ser Val Ala Ile Gly Gly Arg Pro Ser Ser Ser
195 200 205
Tyr Gly Ala Pro Gly Gln Gly Ser Ser Gly Gly Phe Gly Gly Gly Ser
210 215 220
Gly Gly Phe Gly Ser Gln Ala Pro Ser Thr Ser Tyr Gly Ala Pro Gly
225 230 235 240
Gln Gly Ser Pro Gly Gly Gly Phe Gly Ser Gln Gly Gly Pro Gly Gly
245 250 255
Gln Pro Gly Ser Pro Gly Phe Gly Gly Ser Gln Arg Pro Ser Ser Ser
260 265 270
Tyr Gly Pro Pro Gly Gln Gly Gly Ala Pro Gly Gln Gly Gly Ser Pro
275 280 285
Gly Phe Gly Ala Ser Ser Arg Ser Gly Gly Ala Gly Gly Phe Gly Ala
290 295 300
Ser Gln Gln Pro Ser Ser Ser Tyr Gly Pro Pro Gly Gln Gly Ala Gly
305 310 315 320
Ser Gly Phe Gln Gly Thr Gly Gly Gly Phe Gly Gly Pro Gly Gln Arg
325 330 335
Pro Gly Phe Gly Gly Ser Gln Thr Pro Ala Thr Ser Tyr Gly Ala Pro
340 345 350
Gly Gln Ala Gly Gly Ala Ser Gly Gly Phe Gly Gly Ala Gly Ala Gln
355 360 365
Arg Pro Ser Ser Ser Tyr Gly Pro Pro Gly Gln Ala Ser Gly Phe Gly
370 375 380
Gly Gly Ser Ser Gly Gly Gly Phe Gly Gly Gly Ser Ser Gly Gly Phe
385 390 395 400
Gly Gly Asn Gln Gly Gly Phe Gly Gly Asn Gln Gly Gly Phe Gly Gly
405 410 415
Ser Gln Thr Pro Ser Ser Ser Tyr Gly Ala Pro Ser Phe Gly Ser Gly
420 425 430
Gly Ser Pro Gly Ala Ala Gly Gly Ala Gly Gly Phe Gly Gln Gly Gly
435 440 445
Val Gly Gly Ser Gly Gln Pro Gly Gly Phe Gly Gly Gly Asp Gln Gly
450 455 460
Tyr Pro Pro Arg Gly Gly Pro Gly Gly Phe Gly Pro Gly Ser Gly Gly
465 470 475 480
Ser Gly Ala Gly Gly Pro Ile Ala Gly Gly Ser Gly Ser Gly Tyr Pro
485 490 495
Gly Gly Ser Asp Ser Gly Ser Asn Glu Pro Ala Lys Tyr Asp Phe Ser
500 505 510
Tyr Gln Val Asp Asp Pro Ala Ser Gly Thr Ser Phe Gly His Ser Glu
515 520 525
Gln Arg Asp Gly Asp Tyr Thr Ser Gly Gln Tyr Asn Val Leu Leu Pro
530 535 540
Asp Gly Arg Lys Gln Ile Val Glu Tyr Glu Ala Asp Leu Gly Gly Tyr
545 550 555 560
Arg Pro Gln Ile Lys Tyr Glu Gly Gly Ser Ser Gly Gly Ala Gly Gly
565 570 575
Tyr Pro Ser Gly Gly Pro Gly Ser Gln Gly Gly Ala Gly Gly Tyr Pro
580 585 590
Ser Gly Gly Pro Gly Gly Pro Gly Ser Pro Gly Gly Ala Gly Gly Tyr
595 600 605
Gln Ser Gly Ala Ala Gly Gly Ala Gly Gly Tyr Pro Ser Gly Gly Pro
610 615 620
Gly Gly Pro Gly Ala Gly Gly Tyr Pro Ser Gly Gly Pro Gly Gly Pro
625 630 635 640
Gly Ser Gln Ala Gly Gly Phe Ser Gly Gly Phe Gly Gly Gly Ser Asp
645 650 655
Gly Ala Phe Gly Gly Ala Gly Gly Phe Ser Gln Gly Gly Ala Gly Gly
660 665 670
Gly Asp Ala Gly Tyr Pro Arg Gly Gly Pro Gly Gly Phe Gly Gly Ala
675 680 685
Gly Ser Pro Gly Phe Gly Gly Ser Gly Ser Pro Gly Phe Gly Gly Ser
690 695 700
Gly Ser Pro Gly Ala Gln Gly Ser Ser Gly Phe Gly Gly Thr Gly Gly
705 710 715 720
Gly Phe Gly Gly Gly Ala Asp Gly Tyr Pro Arg Gly Gly Pro Gly Ala
725 730 735
Gly Gln Ser Gly Phe Gln Asp Gly Arg Gly Ala Thr Gly Gly Ala Gly
740 745 750
Gln Pro Gly Gly Arg Gly Ser Phe Gly Arg Pro Gly Ser Ala Arg Gly
755 760 765
Gly Ser Ser Ser Asn Gly Tyr Ala Asn Gly Gly Ala Glu Gly Tyr Pro
770 775 780
Arg Asp Asn Pro Gln Asn Arg Gly Ser Gly Tyr Ser
785 790 795
<210> 29
<211> 1051
<212> PRT
<213> Rhodnius prolixus
<400> 29
Lys Arg Asp Asp Pro Leu Arg Arg Phe Leu Ala Pro Leu Val Gly Gly
1 5 10 15
Gly Asn Gly Ser Gly Gly Gly Gly Gly Gly Tyr Asn Tyr Asn Lys Pro
20 25 30
Ala Asn Gly Leu Ser Leu Pro Gly Gly Gly Gly Ala Leu Pro Pro Ala
35 40 45
Thr Ser Tyr Gly Val Pro Asp Arg Pro Ala Pro Val Pro Ser Ser Pro
50 55 60
Pro Ser Ser Ser Tyr Gly Ala Pro Gln Pro Ser Pro Asn Tyr Gly Ala
65 70 75 80
Pro Ser Ser Ser Tyr Gly Ala Pro Ser Gln Gln Pro Ser Arg Ser Tyr
85 90 95
Gly Ala Pro Ser Gln Gly Pro Ser Thr Ser Tyr Ser Gln Arg Pro Ser
100 105 110
Ser Ser Tyr Gly Ala Pro Ala Pro Gln Thr Pro Ser Ser Ser Tyr Gly
115 120 125
Ala Pro Ala Gln Gln Pro Ser Gly Ser Tyr Gly Ala Pro Ser Gly Gly
130 135 140
Gly Gly Ser Ser Gly Tyr Thr Gly Gly Ala Gln Arg Pro Ser Gly Ser
145 150 155 160
Tyr Gly Ala Pro Ser Gln Gly Gly Pro Ser Gly Asn Tyr Gly Pro Pro
165 170 175
Ser Gln Gln Pro Ser Ser Asn Tyr Gly Ala Pro Ser Gln Thr Pro Ser
180 185 190
Ser Asn Tyr Gly Ala Pro Ala Gln Arg Pro Ser Thr Ser Tyr Gly Ala
195 200 205
Pro Ser Gln Pro Pro Ser Ser Ser Tyr Gly Ser Pro Pro Gln Arg Ala
210 215 220
Ser Gly Tyr Pro Ser Ser Ser Ser Gly Pro Ser Asn Gly Tyr Ser Pro
225 230 235 240
Pro Ala Gln Arg Pro Ser Ser Ser Tyr Gly Pro Pro Ser Gln Gln Pro
245 250 255
Ala Ser Ser Tyr Gly Ala Pro Ser Gln Thr Pro Ser Ser Asn Tyr Gly
260 265 270
Pro Pro Ala Pro Ile Pro Ser Ser Asn Tyr Gly Ala Pro Ser Gln Pro
275 280 285
Pro Ser Lys Pro Ser Ala Pro Ser Ser Ser Tyr Gly Thr Pro Ser Gln
290 295 300
Thr Pro Ser Thr Ser Tyr Gly Ala Pro Ser Gln Ala Pro Ser Ser Ser
305 310 315 320
Tyr Gly Ala Pro Ser Arg Pro Ser Pro Pro Ser Ser Ser Tyr Gly Ala
325 330 335
Pro Ser Gln Gly Pro Ser Ser Ser Tyr Gly Pro Pro Ser Arg Pro Ser
340 345 350
Gln Pro Ser Ser Pro Ser Ser Gly Tyr Gly Ala Pro Ser Gln Gly Pro
355 360 365
Ser Ser Ser Tyr Gly Ala Pro Ser Arg Pro Ser Ser Pro Ser Ser Ser
370 375 380
Tyr Gly Ala Pro Pro Ser Ser Ser Tyr Gly Ala Pro Ser Arg Pro Ser
385 390 395 400
Pro Pro Ser Ser Ser Tyr Gly Ala Pro Ser Gln Gly Pro Ser Ser Ser
405 410 415
Tyr Gly Pro Pro Ser Arg Pro Ser Gln Pro Ser Ser Pro Ser Ser Gly
420 425 430
Tyr Gly Ala Pro Ser Gln Gly Pro Ser Ser Ser Tyr Gly Ala Pro Ser
435 440 445
Arg Pro Ser Ser Pro Ser Ser Ser Tyr Gly Ala Pro Pro Ser Ser Ser
450 455 460
Tyr Gly Ala Pro Ser Arg Pro Ser Pro Pro Ser Ser Ser Tyr Gly Ala
465 470 475 480
Pro Ser Gln Gly Pro Ser Ser Ser Tyr Gly Pro Pro Ser Arg Pro Ser
485 490 495
Gln Pro Ser Ser Pro Ser Ser Ser Tyr Gly Ala Pro Ser Gln Gly Pro
500 505 510
Ser Ser Ser Tyr Gly Ala Pro Ser Arg Pro Ser Pro Pro Ser Ser Ser
515 520 525
Tyr Gly Ala Pro Ser Gln Gly Pro Ser Ser Ser Tyr Gly Pro Pro Ser
530 535 540
Arg Pro Ser Gln Pro Ser Ser Thr Tyr Gly Val Pro Ser Gly Gly Arg
545 550 555 560
Pro Ser Thr Pro Ser Ser Ser Tyr Gly Ala Pro Pro Gln Ala Leu Ser
565 570 575
Ser Thr Tyr Gly Ala Pro Ser Gly Arg Pro Gly Ala Pro Ser Gln Lys
580 585 590
Pro Ser Ser Ser Tyr Gly Ala Pro Ser Leu Gly Gly Asn Ala Ser Arg
595 600 605
Gly Pro Lys Ser Ser Pro Pro Ser Ser Ser Tyr Gly Ala Pro Ser Val
610 615 620
Gly Thr Ser Val Ser Ser Tyr Ala Pro Ser Gln Gly Gly Ala Gly Gly
625 630 635 640
Phe Gln Ser Ser Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ser Thr Gly
645 650 655
Pro Ser Ser Thr Tyr Gly Pro Pro Ser Gln Pro Pro Ser Ser Ser Tyr
660 665 670
Gly Val Pro Ser Gln Pro Pro Ser Ser Asn Tyr Gly Val Pro Ser Gln
675 680 685
Gly Val Ser Gly Ser Val Gly Ser Ser Ser Pro Ser Ser Ser Tyr Gly
690 695 700
Ala Pro Ser Gln Ile Pro Ser Ser Ser Tyr Gly Ala Pro Ser Gln Ser
705 710 715 720
Ser Ile Gly Gly Phe Gly Ser Ser Arg Pro Ser Ser Ser Tyr Gly Ala
725 730 735
Pro Pro Gln Ala Pro Ser Ser Ser Tyr Ser Ala Pro Leu Arg Ala Pro
740 745 750
Ser Thr Ser Tyr Gly Ala Pro Ser Gly Gly Ser Gly Ser Asn Phe Gly
755 760 765
Ser Lys Pro Ser Thr Asn Tyr Gly Ala Pro Ser Gln Pro Pro Ser Thr
770 775 780
Asn Tyr Gly Pro Pro Ser Gln Pro Pro Ser Ser Ser Tyr Gly Thr Pro
785 790 795 800
Ser Arg Ala Pro Ser Pro Thr Tyr Ser Thr Pro Gln Ser Ser Gly Thr
805 810 815
Ser Phe Gly Ser Arg Pro Ser Ser Ser Tyr Gly Val Pro Ser Gln Pro
820 825 830
Thr Thr Asn Tyr Gly Ala Pro Ser Gln Thr Pro Ser Ser Asn Tyr Gly
835 840 845
Ala Pro Pro Ala Ser Ser Ala Pro Ser Ser Thr Tyr Gly Arg Pro Ser
850 855 860
Gln Ser Pro Ser Ser Ser Tyr Gly Ala Pro Ser Pro Ser Ser Ser Ser
865 870 875 880
Ser Ser Tyr Glu Ser Pro Ser Gln Pro Pro Ser Ser Ser Tyr Gly Ala
885 890 895
Pro Ser Gln Gly Pro Ser Ser Ser Tyr Gly Ala Pro Ser Arg Pro Ser
900 905 910
Ser Thr Tyr Gly Ala Pro Ser Pro Ser Ser Pro Ser Thr Asn Tyr Gly
915 920 925
Ala Pro Ala Pro Ser Ser Asn Tyr Gly Thr Pro Ala Gln Asp Leu Thr
930 935 940
Gly Ser Tyr Ala Ala Pro Ser Gln Pro Pro Ser Ala Gly Tyr Gly Ala
945 950 955 960
Pro Ser Gly Gln Pro Ser Ser Gly Gly Lys Gln Asn Phe Gln Val Lys
965 970 975
Asn Pro Phe Ala Gly Gln Thr His Gln Val Tyr Pro Ala Val Ser Ser
980 985 990
Ile Ser Phe Gly Leu Pro Ser Gln Ser Phe Asn Thr Ala Ile Gln Gly
995 1000 1005
Gln Glu Pro Ser Gln Ser Tyr Gly Ala Pro Thr Ala Ser Ser Pro
1010 1015 1020
Ser Ser Ser Tyr Gly Ala Pro Thr Gly Thr Gly Ser Ser Gln Pro
1025 1030 1035
Gly Gln Ser Tyr Ala Ser Asn Gly Gly Tyr Ser Tyr Ser
1040 1045 1050
<210> 30
<211> 506
<212> PRT
<213> Rhodnius prolixus
<400> 30
Gln Pro Pro Phe Asn His Tyr Leu Pro Ala Ala Arg Gly Ser Gly Ser
1 5 10 15
Asn Ser Ala Gln Tyr Thr Ala Pro Ser Ser Lys Phe Gly Thr Ser Thr
20 25 30
Gly Gln Tyr Gly Gln Pro Pro Ser Glu Val Pro Arg Gly Leu Gln Gln
35 40 45
Gly Ser Tyr Ala Glu Asp Val His Ser Ser Arg Ser Val Asn Pro Ser
50 55 60
Ser Gln Asn Gly Ile Pro Ser Gly His Phe Ser Ser Leu Ser Ser Asn
65 70 75 80
Tyr Gly Ala Pro Ser Ser Asp Tyr Ser Arg Ser Phe Leu Arg Tyr Gly
85 90 95
Thr Leu Ser Asn Lys Tyr Gly Val Pro Asn Ser Ala Leu Gly Ser Leu
100 105 110
Ser Ser Arg Asn Asn Lys Thr Pro Ala Thr Gln Leu Ser Tyr Gln Pro
115 120 125
Ser Ser His Tyr Asp Ser Arg Ser Thr Ser Glu Asp Gln Phe Ile Ser
130 135 140
Ser Arg Val Ser Asp Ser Gln Tyr Gly Ala Ser Ser Val Arg Arg Phe
145 150 155 160
Leu Pro Ser Ser Gln Tyr Ser Thr Pro Ser Ser Gln Tyr Gly Thr Pro
165 170 175
Ser Ser Gln Tyr Gly Thr Pro Ser Ser Gln Tyr Gly Thr Pro Ser Ser
180 185 190
Gln Tyr Gly Thr Pro Ser Ser Gln Tyr Gly Thr Pro Ser Ser Gln Tyr
195 200 205
Gly Thr Pro Ser Ser Gln Tyr Gly Thr Pro Ser Ser Gln Tyr Gly Thr
210 215 220
Pro Ser Ser Gln Tyr Gly Thr Pro Ser Ser Gln Tyr Gly Thr Pro Ser
225 230 235 240
Ser Pro Pro Ser Gln Tyr Gly Gly Pro Tyr Ser Met Arg Thr Ser Ala
245 250 255
Pro Asn Ser Gln Tyr Gly Thr Pro Ser Ser Phe Arg Thr Ser Pro Ser
260 265 270
Ser Gln Phe Gly Ser Ser Ser Ala His Ser Ser Ser Leu Ser Lys Phe
275 280 285
Arg Ser Val Pro Ser Ser Pro Tyr Gly Thr Leu Ser Ala Ile Arg Ser
290 295 300
Thr His Ser Ser Gln Tyr Gly Thr Pro Ser Ser Phe Ser Asp Ser Thr
305 310 315 320
Ser Ser Ser His Asn Gly Leu Pro Ser His Tyr Pro Gly Ser Gly Phe
325 330 335
Ser Gly Ser Ser Val Asn Asp Gln Lys Ser Tyr Thr Gly Asn Val Phe
340 345 350
Gly Gln Ser His Ser Arg Val Ala Asn Gly Asp Gln His Ala Arg Ser
355 360 365
Tyr Thr Leu Ala Gly Gly Asn Glu Ile Ser Glu Pro Ala Lys Tyr Asp
370 375 380
Phe Asn Tyr Asp Val Ser Asp Gly Glu Gln Gly Val Glu Phe Gly Gln
385 390 395 400
Glu Glu Ser Arg Asp Gly Glu Glu Thr Asn Gly Ser Tyr His Val Leu
405 410 415
Leu Pro Asp Gly Arg Arg Gln Arg Val Gln Tyr Thr Ala Gly Gln Tyr
420 425 430
Gly Tyr Lys Pro Thr Ile Ser Tyr Glu Asn Thr Gly Thr Leu Thr Thr
435 440 445
Gly Arg Gln Gln Phe Ser Asn Gly Phe Tyr Asn Val Gln Gln Ser Gly
450 455 460
Ser Glu Ser Gln Glu His Leu Gly Arg Ser Thr Gly Gln Asn Ser Tyr
465 470 475 480
Gly Gly Ser Asn Gly Tyr Glu Ser Gly Val Gly Tyr Gln Ser Gly Val
485 490 495
Gly Arg Arg Ser Arg Pro Ala Gly Ser Tyr
500 505
<210> 31
<211> 551
<212> PRT
<213> Solenopsis invicta
<400> 31
Arg Ser Glu Pro Pro Ile Asn Ser Tyr Leu Pro Pro Arg Ala Gly Ser
1 5 10 15
Ser Gly Ala Asn Gly Gly Arg Thr Asp Leu Thr Thr Gln Tyr Gly Ala
20 25 30
Pro Asp Phe Asn Asn Gly Gly Gly Ala Thr Ser Phe Ser Gly Asn Gly
35 40 45
Ala Gly Asp Gly Pro Ser Lys Leu Tyr Asp Val Pro Val Arg Gly Asn
50 55 60
Ala Gly Gly Asn Gly Leu Gly Arg Gly Asn Gly Phe Gly Gly Gly Gln
65 70 75 80
Pro Ser Ser Ser Tyr Gly Ala Pro Asn Gly Gly Ser Asn Glu Asn Arg
85 90 95
Gly Asn Gly Gly Arg Pro Ser Thr Ser Tyr Gly Val Pro Gly Ala Asn
100 105 110
Gly Asn Asn Gly Gly Gly Phe Gly Asn Gly Gly Asp Lys Gly Arg Pro
115 120 125
Ser Thr Ser Tyr Gly Val Pro Asp Ala Ser Gly Ser Ser Gln Gly Ser
130 135 140
Phe Gly Asn Val Gly Asn Gly Gly Arg Pro Ser Thr Asn Tyr Gly Val
145 150 155 160
Pro Gly Ala Asn Gly Asn Gly Gly Gly Phe Gly Asn Ala Ala Asn Glu
165 170 175
Gly Lys Pro Ser Thr Ser Tyr Gly Val Pro Gly Ala Asn Gly Asn Ser
180 185 190
Gln Gly Gly Phe Gly Asn Gly Gly Arg Pro Ser Thr Gly Tyr Gly Val
195 200 205
Pro Gly Ala Asn Gly Asn Asn Gly Gly Gly Phe Gly Gly Arg Pro Ser
210 215 220
Thr Ser Tyr Gly Ala Pro Gly Ala Asn Gly Asn His Arg Gly Gly Asn
225 230 235 240
Gly Gly Asn Ala Ser Pro Ser Thr Asn Tyr Gly Val Pro Gly Gly Asn
245 250 255
Asn Gly Asn Thr Asn Gly Lys Gly Arg Phe Asn Gly Gly Asn Ser Gly
260 265 270
Gly Gly Pro Ser Asn Asn Tyr Gly Val Pro Asn Glu Asn Ala Phe Gly
275 280 285
Gly Gly Leu Ser Thr Ser Tyr Gly Pro Pro Ser Arg Gly Gly Asn Gly
290 295 300
Asn Ser Gly Tyr Pro Ser Gly Gly Ser Asn Gly Gly Ser Phe Val Asn
305 310 315 320
Asn Gly Ala Asn Gly Tyr Pro Ser Gly Gly Pro Asn Gly Asn Ala Gly
325 330 335
Asn Phe Gly Asp Gly Arg Gly Gly Lys Gly Gly Gly Ser Ser Gly Glu
340 345 350
Gly Tyr Asn Asp Asn Ala Gln Glu Gly Ser Thr Glu Pro Ala Lys Tyr
355 360 365
Glu Phe Ser Tyr Lys Val Lys Asp Gln Gln Thr Gly Ser Glu Tyr Ser
370 375 380
His Thr Glu Thr Arg Asp Gly Asp Arg Ala Gln Gly Glu Phe Asn Val
385 390 395 400
Leu Leu Pro Asp Gly Arg Lys Gln Ile Val Glu Tyr Glu Ala Asp Gln
405 410 415
Asp Gly Phe Lys Pro Gln Ile Arg Tyr Glu Gly Glu Ala Asn Ala Gly
420 425 430
Gly Gly Tyr Ser Ser Gly Gly Ser Asn Asp Asn Asn Asp Gly Tyr Ser
435 440 445
Ser Gly Arg Pro Gly Ser Glu Ala Gly Gly Phe Ala Asn Asn Ser Gly
450 455 460
Phe Asn Gly Ser Gly Thr Asn Gly Gly Arg Ser Ser Gly Gly Pro Gly
465 470 475 480
Asp Gly Asn Pro Gly Gly Phe Asn Ser Gly Gly Gly Gly Gly Tyr Gln
485 490 495
Ser Gly Arg Pro Ala Gly Gln Ser Phe Gly Arg Asp Asn Asp Gly Gly
500 505 510
Leu Ser Gly Asp Ile Gly Gly Tyr Phe Ala Asn Ser Pro Ser Asn Asn
515 520 525
Ile Gly Gly Ser Asp Ser Ala Asn Val Gly Ser Asn Arg Gln Asn Gly
530 535 540
Gly Asn Gly Gly Tyr Gln Tyr
545 550
<210> 32
<211> 382
<212> PRT
<213> Culex quinquefasciatus
<400> 32
Lys Arg Glu Ala Pro Leu Pro Gly Gly Ser Tyr Leu Pro Pro Ser Asn
1 5 10 15
Gly Gly Gly Ala Gly Gly Tyr Pro Ala Ala Gly Pro Pro Ser Gly Ser
20 25 30
Tyr Gly Pro Pro Ser Asn Gly Asn Gly Asn Gly Asn Gly Ala Gly Gly
35 40 45
Tyr Pro Ser Ala Pro Ser Gln Gln Tyr Gly Ala Pro Ala Gly Gly Ala
50 55 60
Pro Ser Gln Gln Tyr Gly Ala Pro Ser Asn Gly Asn Gly Gly Ala Gly
65 70 75 80
Gly Tyr Pro Ser Ala Pro Ser Gln Gln Tyr Gly Ala Pro Asn Gly Asn
85 90 95
Gly Asn Gly Gly Phe Gly Gly Arg Pro Gln Ala Pro Ser Gln Gln Tyr
100 105 110
Gly Ala Pro Ser Asn Gly Asn Gly Gly Ala Arg Pro Ser Gln Gln Tyr
115 120 125
Gly Ala Pro Asn Gly Gly Asn Gly Asn Gly Arg Pro Gln Thr Pro Ser
130 135 140
Ser Gln Tyr Gly Ala Pro Ser Gly Gly Ala Pro Ser Ser Gln Tyr Gly
145 150 155 160
Ala Pro Ser Gly Gly Ala Pro Ser Gln Gln Tyr Gly Ala Pro Asn Gly
165 170 175
Gly Asn Gly Asn Gly Arg Pro Gln Thr Pro Ser Ser Gln Tyr Gly Ala
180 185 190
Pro Ser Gly Gly Ala Pro Ser Gln Gln Tyr Gly Ala Pro Asn Gly Gly
195 200 205
Asn Gly Asn Gly Arg Pro Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro
210 215 220
Ser Gly Gly Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ser Gly Gly Ala
225 230 235 240
Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gly Gly Ala Pro Ser Ser Gln
245 250 255
Tyr Gly Ala Pro Ala Gly Gly Ala Pro Ser Ser Gln Tyr Gly Ala Pro
260 265 270
Ala Gly Gly Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gly Gly Ala
275 280 285
Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gly Gly Ala Pro Ser Ser Gln
290 295 300
Tyr Gly Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gly Gly Ala Pro
305 310 315 320
Ser Ser Gln Tyr Gly Ala Pro Ala Gly Gly Ala Pro Ser Ser Gln Tyr
325 330 335
Gly Ala Pro Ser Gly Gly Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ser
340 345 350
Gly Gly Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gly Gly Ala Pro
355 360 365
Ser Ser Gln Tyr Gly Ala Pro Ser Gly Gly Ala Pro Ser Ser
370 375 380
<210> 33
<211> 491
<212> PRT
<213> Bactrocera cucurbitae
<400> 33
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Ala Asn Gly
1 5 10 15
Asn Gly Asn Gly Gly Gly Arg Pro Ser Ser Gln Tyr Gly Ala Pro Gly
20 25 30
Leu Gly Ser Asn Ser Asn Gly Asn Gly Asn Gly Asn Gly Gly Gly Arg
35 40 45
Pro Ser Ser Gln Tyr Gly Val Pro Gly Leu Gly Gly Asn Gly Asn Gly
50 55 60
Asn Gly Asn Gly Gly Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala
65 70 75 80
Pro Gly Leu Gly Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly Gly Arg
85 90 95
Pro Ser Ser Gln Tyr Gly Val Pro Gly Leu Gly Gly Asn Gly Asn Gly
100 105 110
Asn Gly Asn Gly Asn Gly Gly Gly Arg Pro Ser Ser Thr Tyr Gly Ala
115 120 125
Pro Gly Leu Arg Gly Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly Arg
130 135 140
Pro Ser Ser Thr Tyr Gly Ala Pro Gly Leu Gly Gly Asn Gly Asn Gly
145 150 155 160
Asn Gly Asn Gly Asn Gly Arg Pro Ser Ser Thr Tyr Gly Ala Pro Gly
165 170 175
Leu Gly Gly Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly Arg Pro Ser
180 185 190
Ser Thr Tyr Gly Ala Pro Gly Leu Asn Gly Asn Gly Leu Gly Gly Gly
195 200 205
Gln Lys Pro Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly Asn Gly Asn
210 215 220
Gly Tyr Ser Asn Gly Gly Asn Gly Asn Gly Asn Gly Gly Gly Arg Pro
225 230 235 240
Gly Gln Glu Tyr Leu Pro Pro Gly Arg Asn Gly Asn Gly Asn Gly Asn
245 250 255
Gly Gly Arg Gly Asn Gly Asn Gly Gly Gly Ala Asn Gly Tyr Asp Tyr
260 265 270
Ser Gln Gly Gly Ser Asp Ser Gly Glu Ser Gly Ile Val Asp Tyr Glu
275 280 285
Ala Asp Gln Gly Gly Tyr Arg Pro Gln Ile Arg Tyr Glu Gly Glu Ala
290 295 300
Asn Asn Gly Ala Gly Gly Leu Gly Gly Gly Ala Gly Gly Ala Asn Gly
305 310 315 320
Tyr Asp Tyr Glu Gln Asn Gly Asn Gly Leu Gly Gly Gly Asn Gly Tyr
325 330 335
Ser Asn Gly Gln Asp Leu Gly Ser Asn Gly Tyr Ser Ser Gly Arg Pro
340 345 350
Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly Tyr Ser
355 360 365
Gly Arg Asn Gly Lys Gly Arg Asn Gly Asn Gly Gly Gly Gln Gly Leu
370 375 380
Gly Arg Asn Gly Tyr Ser Asp Gly Arg Pro Ser Gly Gln Asp Leu Gly
385 390 395 400
Asp Asn Gly Tyr Ala Ser Gly Arg Pro Gly Gly Asn Gly Asn Gly Asn
405 410 415
Gly Gly Asn Gly Asn Gly Tyr Ser Asn Gly Asn Gly Tyr Ser Asn Gly
420 425 430
Asn Gly Asn Gly Thr Gly Asn Gly Gly Gly Gln Tyr Asn Gly Asn Gly
435 440 445
Asn Gly Tyr Ser Asp Gly Arg Pro Gly Gly Gln Asp Asn Leu Asp Gly
450 455 460
Gln Gly Tyr Ser Ser Gly Arg Pro Asn Gly Phe Gly Pro Gly Gly Gln
465 470 475 480
Asn Gly Asp Asn Asp Gly Asn Gly Tyr Arg Tyr
485 490
<210> 34
<211> 770
<212> PRT
<213> Trichogramma pretiosum
<400> 34
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Gly Gln Gly Gly
1 5 10 15
Gln Gly Gly Phe Gly Gly Ser Gly Gly Arg Pro Gly Gly Gly Ser Pro
20 25 30
Ser Asn Gln Tyr Gly Pro Pro Asn Phe Gln Asn Gly Gly Gly Gln Asn
35 40 45
Gly Gly Ser Gly Phe Gly Gly Asn Gly Asn Gly Asn Ser Phe Gly Pro
50 55 60
Pro Ser Asn Ser Tyr Gly Pro Pro Glu Phe Gly Ser Pro Gly Ala Gly
65 70 75 80
Ser Phe Gly Gly Gly Arg Pro Gln Asp Thr Tyr Gly Pro Pro Ser Asn
85 90 95
Gly Asn Gly Asn Gly Asn Gly Phe Gly Gly Asn Gly Asn Gly Gly Gly
100 105 110
Arg Pro Ser Ser Arg Pro Ser Asp Ser Tyr Gly Pro Pro Ser Ser Gly
115 120 125
Asn Gly Phe Gly Gly Gly Asn Ser Gly Arg Pro Ser Glu Ser Tyr Gly
130 135 140
Pro Pro Gln Asn Gly Gly Gly Ser Gly Asn Gly Asn Gln Gly Gly Gly
145 150 155 160
Asn Gly Phe Gly Asn Gly Gly Gly Arg Gly Gly Gln Gly Lys Pro Ser
165 170 175
Asp Ser Tyr Gly Pro Pro Asn Ser Gly Asn Arg Pro Gly Ser Ser Asn
180 185 190
Gly Gly Gly Gln Gln Gln Asn Gly Phe Gly Gly Gly Asn Gly Gly Arg
195 200 205
Pro Ser Asn Thr Tyr Gly Pro Pro Gly Gly Gly Asn Gly Gly Gly Arg
210 215 220
Pro Gly Gly Ser Ser Gly Gly Phe Gly Gly Gln Asn Gly Gly Arg Pro
225 230 235 240
Ser Asp Ser Tyr Gly Pro Pro Ser Asn Gly Asn Gly Asn Gly Gly Arg
245 250 255
Pro Ser Asn Asn Tyr Gly Pro Pro Asn Ser Gly Gly Gly Asn Gly Asn
260 265 270
Gly Phe Gly Gly Ser Asn Gly Lys Pro Ser Asn Ser Tyr Gly Pro Pro
275 280 285
Ser Asn Gly Asn Gly Gly Gly Phe Gly Gly Ser Asn Gly Arg Pro Ser
290 295 300
Asn Ser Tyr Gly Pro Pro Ser Gly Gly Asn Gly Gly Gly Phe Gly Gly
305 310 315 320
Ser Ser Ala Val Gly Arg Pro Gly Asn Ser Gly Ser Pro Ser Ser Ser
325 330 335
Gly Ser Gly Phe Gly Gly Asn Gly Gly Ala Ser Arg Pro Ser Ser Ser
340 345 350
Tyr Gly Pro Pro Ser Asn Gly Gly Gly Phe Gly Asn Gly Gly Gly Ser
355 360 365
Asn Gly Arg Pro Ser Ser Ser Tyr Gly Pro Pro Asn Ser Gly Ser Asn
370 375 380
Gly Gly Gly Phe Gly Gly Gln Asn Gly Asn Gly Arg Gln Asn Gly Asn
385 390 395 400
Asn Gly Gln Gly Gly Phe Gly Gly Gln Pro Ser Ser Ser Tyr Gly Pro
405 410 415
Pro Ser Asn Gly Asn Gly Phe Gly Gly Gly Gly Gly Ser Asn Gly Tyr
420 425 430
Pro Gln Asn Ser Gln Gly Gly Asn Gly Asn Gly Phe Gly Gln Gly Ser
435 440 445
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Pro Pro Ser Asn Gly Gly Gly
450 455 460
Gly Gly Asp Asn Gly Tyr Ser Ser Gly Gly Pro Gly Gly Phe Gly Gly
465 470 475 480
Gln Pro Gln Asp Ser Tyr Gly Pro Pro Pro Ser Gly Ala Val Asp Gly
485 490 495
Asn Asn Gly Phe Ser Ser Gly Gly Ser Ser Gly Asp Asn Asn Gly Tyr
500 505 510
Ser Ser Gly Gly Pro Gly Gly Asn Gly Phe Glu Asp Gly Asn Asp Glu
515 520 525
Pro Ala Lys Tyr Glu Phe Ser Tyr Glu Val Lys Asp Glu Gln Ser Gly
530 535 540
Ser Ser Phe Gly His Thr Glu Met Arg Asp Gly Asp Arg Ala Gln Gly
545 550 555 560
Glu Phe Asn Val Leu Leu Pro Asp Gly Arg Lys Gln Ile Val Glu Tyr
565 570 575
Glu Ala Asp Gln Asp Gly Phe Lys Pro Gln Ile Arg Tyr Glu Gly Glu
580 585 590
Ala Asn Thr Gly Gly Ala Gly Gly Tyr Pro Ser Gly Gly Pro Gly Gly
595 600 605
Gln Gly Gly Asn Gly Asn Gly Gly Tyr Pro Ser Gly Gly Pro Ser Asn
610 615 620
Gly Gly Phe Gly Gly Gln Asn Gly Gly Gly Asn Gly Gly Tyr Pro Ser
625 630 635 640
Gly Gly Pro Ser Gly Gly Gly Phe Gly Gly Gln Asn Gly Gly Ser Gly
645 650 655
Gly Tyr Pro Ser Gly Gly Pro Ser Gly Gly Gly Phe Gly Gly Gln Gly
660 665 670
Gly Phe Gly Gly Gln Asn Ser Gly Gly Asn Gly Gly Tyr Ser Ser Gly
675 680 685
Gly Pro Ala Ser Gly Gly Phe Gly Gly Gln Asn Gly Gly Asn Gly Gly
690 695 700
Tyr Pro Ser Gly Gly Pro Ser Gly Gly Gly Phe Gly Gly Gln Gly Gly
705 710 715 720
Phe Gly Gly Gln Asn Ser Gly Gly Asn Gly Gly Tyr Pro Ser Gly Gly
725 730 735
Pro Ser Ser Gly Gly Phe Gly Gly Gln Asn Gly Gly Gly Gly Gly Asn
740 745 750
Tyr Pro Ala Gly Ser Gly Gly Asp Ala Glu Ala Asn Gly Gly Tyr Gln
755 760 765
Tyr Ser
770
<210> 35
<211> 280
<212> PRT
<213> Drosophila sechellia
<400> 35
Gln Ser Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly
1 5 10 15
Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln
20 25 30
Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly Gly Lys Pro Ser
35 40 45
Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
50 55 60
Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
65 70 75 80
Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp
85 90 95
Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
100 105 110
Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Asn Gly Asn Gly
115 120 125
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
130 135 140
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg
145 150 155 160
Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Asn Gly Gly Arg
165 170 175
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro
180 185 190
Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Ser Gly
195 200 205
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln Gly Gln Gly Gly
210 215 220
Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Asn Gln
225 230 235 240
Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly Asn Gly Ser Ala
245 250 255
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Pro Gly Gly
260 265 270
Arg Pro Ser Asp Ser Tyr Gly Pro
275 280
<210> 36
<211> 280
<212> PRT
<213> Drosophila sechellia
<400> 36
Gln Ser Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly
1 5 10 15
Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln
20 25 30
Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly Gly Lys Pro Ser
35 40 45
Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
50 55 60
Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
65 70 75 80
Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp
85 90 95
Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
100 105 110
Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Asn Gly Asn Gly
115 120 125
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
130 135 140
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg
145 150 155 160
Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Asn Gly Gly Arg
165 170 175
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro
180 185 190
Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Ser Gly
195 200 205
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln Gly Gln Gly Gly
210 215 220
Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Asn Gln
225 230 235 240
Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly Asn Gly Ser Ala
245 250 255
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Pro Gly Gly
260 265 270
Arg Pro Ser Asp Ser Tyr Gly Pro
275 280
<210> 37
<211> 280
<212> PRT
<213> Drosophila sechellia
<400> 37
Gln Ser Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly
1 5 10 15
Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln
20 25 30
Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly Gly Lys Pro Ser
35 40 45
Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
50 55 60
Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
65 70 75 80
Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp
85 90 95
Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
100 105 110
Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Asn Gly Asn Gly
115 120 125
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
130 135 140
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg
145 150 155 160
Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Asn Gly Gly Arg
165 170 175
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro
180 185 190
Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Ser Gly
195 200 205
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln Gly Gln Gly Gly
210 215 220
Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Asn Gln
225 230 235 240
Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly Asn Gly Ser Ala
245 250 255
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Pro Gly Gly
260 265 270
Arg Pro Ser Asp Ser Tyr Gly Pro
275 280
<210> 38
<211> 280
<212> PRT
<213> Drosophila sechellia
<400> 38
Gln Ser Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly
1 5 10 15
Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln
20 25 30
Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly Gly Lys Pro Ser
35 40 45
Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
50 55 60
Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
65 70 75 80
Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp
85 90 95
Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
100 105 110
Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Asn Gly Asn Gly
115 120 125
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
130 135 140
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg
145 150 155 160
Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Asn Gly Gly Arg
165 170 175
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro
180 185 190
Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Ser Gly
195 200 205
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln Gly Gln Gly Gly
210 215 220
Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Asn Gln
225 230 235 240
Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly Asn Gly Ser Ala
245 250 255
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Pro Gly Gly
260 265 270
Arg Pro Ser Asp Ser Tyr Gly Pro
275 280
<210> 39
<211> 162
<212> PRT
<213> Drosophila sechellia
<400> 39
Tyr Ser Ser Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly
1 5 10 15
Tyr Ser Ser Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr
20 25 30
Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser
35 40 45
Asn Val Lys Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly
50 55 60
Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly
65 70 75 80
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg
85 90 95
Pro Gly Gly Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile
100 105 110
Gly Gly Arg Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser
115 120 125
Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser
130 135 140
Gly Arg Pro Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp
145 150 155 160
Gly Gln
<210> 40
<211> 162
<212> PRT
<213> Drosophila sechellia
<400> 40
Tyr Ser Ser Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly
1 5 10 15
Tyr Ser Ser Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr
20 25 30
Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser
35 40 45
Asn Val Lys Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly
50 55 60
Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly
65 70 75 80
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg
85 90 95
Pro Gly Gly Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile
100 105 110
Gly Gly Arg Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser
115 120 125
Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser
130 135 140
Gly Arg Pro Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp
145 150 155 160
Gly Gln
<210> 41
<211> 162
<212> PRT
<213> Drosophila sechellia
<400> 41
Tyr Ser Ser Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly
1 5 10 15
Tyr Ser Ser Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr
20 25 30
Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser
35 40 45
Asn Val Lys Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly
50 55 60
Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly
65 70 75 80
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg
85 90 95
Pro Gly Gly Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile
100 105 110
Gly Gly Arg Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser
115 120 125
Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser
130 135 140
Gly Arg Pro Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp
145 150 155 160
Gly Gln
<210> 42
<211> 162
<212> PRT
<213> Drosophila sechellia
<400> 42
Tyr Ser Ser Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly
1 5 10 15
Tyr Ser Ser Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr
20 25 30
Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser
35 40 45
Asn Val Lys Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly
50 55 60
Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly
65 70 75 80
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg
85 90 95
Pro Gly Gly Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile
100 105 110
Gly Gly Arg Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser
115 120 125
Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser
130 135 140
Gly Arg Pro Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp
145 150 155 160
Gly Gln
<210> 43
<211> 162
<212> PRT
<213> Drosophila sechellia
<400> 43
Tyr Ser Ser Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly
1 5 10 15
Tyr Ser Ser Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr
20 25 30
Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser
35 40 45
Asn Val Lys Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly
50 55 60
Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly
65 70 75 80
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg
85 90 95
Pro Gly Gly Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile
100 105 110
Gly Gly Arg Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser
115 120 125
Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser
130 135 140
Gly Arg Pro Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp
145 150 155 160
Gly Gln
<210> 44
<211> 162
<212> PRT
<213> Drosophila sechellia
<400> 44
Tyr Ser Ser Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly
1 5 10 15
Tyr Ser Ser Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr
20 25 30
Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser
35 40 45
Asn Val Lys Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly
50 55 60
Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly
65 70 75 80
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg
85 90 95
Pro Gly Gly Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile
100 105 110
Gly Gly Arg Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser
115 120 125
Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser
130 135 140
Gly Arg Pro Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp
145 150 155 160
Gly Gln
<210> 45
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 45
Gly Asp Tyr Lys Asp Asp Asp Asp Lys Asp Tyr Lys Asp Asp Asp Asp
1 5 10 15
Lys Asp Tyr Lys Asp Asp Asp Asp Lys
20 25
<210> 46
<211> 85
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 46
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg
85
<210> 47
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 47
Glu Ala Glu Ala
1
<210> 48
<211> 2
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 48
Ser Gly
1
<210> 49
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(3)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<400> 49
Ser Xaa Xaa Tyr Gly Xaa Pro
1 5
<210> 50
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 50
Gly Gly Gly Gly
1
<210> 51
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 51
Asn Gly Asn Gly
1
<210> 52
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 52
Gly Gln Gly Gly
1
<210> 53
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 53
Gly Gln Gly Asn
1
<210> 54
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 54
Gly Gln Gly Gln
1
<210> 55
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 55
Gly Gln Gly Gln Gly
1 5
<210> 56
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 56
Arg Pro Gly Gly Gln
1 5
<210> 57
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 57
Arg Pro Gly Gly Asn
1 5
<210> 58
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 58
Gly Gly Ser Phe
1
<210> 59
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 59
Gly Asn Gly Gly
1
<210> 60
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 60
Gly Gly Ala Gly Gly
1 5
<210> 61
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (1)..(2)
<223> Any amino acid
<400> 61
Xaa Xaa Glu Pro Pro Val Ser Tyr Leu Pro Pro Ser
1 5 10
<210> 62
<211> 4
<212> PRT
<213> Drosophila sechellia
<400> 62
Gly Arg Pro Glu
1
<210> 63
<211> 722
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 63
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg Glu Ala Glu Ala Gly Arg Pro Glu Pro Pro Val
85 90 95
Asn Ser Tyr Leu Pro Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Ser
100 105 110
Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly
115 120 125
Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Gly Gln
130 135 140
Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly Gly Lys Pro Ser Asp Ser
145 150 155 160
Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro Ser Ser
165 170 175
Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr
180 185 190
Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr
195 200 205
Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro Ser Ser
210 215 220
Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Asn Gly Asn Gly Gly Arg
225 230 235 240
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro
245 250 255
Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
260 265 270
Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Asn Gly Gly Arg Pro Ser
275 280 285
Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp
290 295 300
Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Ser Gly Gly Arg
305 310 315 320
Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln Gly Gln Gly Gly Phe Gly
325 330 335
Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Asn Gln Lys Pro
340 345 350
Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly Asn Gly Ser Ala Gly Arg
355 360 365
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Pro Gly Gly Arg Pro
370 375 380
Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly Ser Gly Ala Gly Gly Ala
385 390 395 400
Gly Gly Ser Gly Pro Gly Gly Ala Asp Tyr Asp Asn Asp Glu Pro Ala
405 410 415
Lys Tyr Glu Phe Asn Tyr Gln Val Glu Asp Ala Pro Ser Gly Leu Ser
420 425 430
Phe Gly His Ser Glu Met Arg Asp Gly Asp Phe Thr Thr Gly Gln Tyr
435 440 445
Asn Val Leu Leu Pro Asp Gly Arg Lys Gln Ile Val Glu Tyr Glu Ala
450 455 460
Asp Gln Gln Gly Tyr Arg Pro Gln Ile Arg Tyr Glu Gly Asp Ala Asn
465 470 475 480
Asp Gly Ser Gly Pro Ser Gly Pro Ser Gly Pro Gly Gly Pro Gly Gly
485 490 495
Gln Asn Leu Gly Ala Asp Gly Tyr Ser Ser Gly Arg Pro Gly Asn Gly
500 505 510
Asn Gly Asn Gly Asn Gly Gly Tyr Ser Ser Gly Arg Pro Gly Gly Gln
515 520 525
Asp Leu Gly Pro Ser Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp
530 535 540
Leu Gly Ala Gly Gly Tyr Ser Asn Val Lys Pro Gly Gly Gln Asp Leu
545 550 555 560
Gly Pro Gly Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly
565 570 575
Arg Asp Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala
580 585 590
Gly Ala Tyr Ser Asn Gly Arg Pro Gly Gly Asn Gly Asn Gly Gly Ser
595 600 605
Asp Gly Gly Arg Val Ile Ile Gly Gly Arg Val Ile Gly Gly Gln Asp
610 615 620
Gly Gly Asp Gln Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu
625 630 635 640
Gly Arg Asp Gly Tyr Ser Ser Gly Arg Pro Gly Gly Arg Pro Gly Gly
645 650 655
Asn Gly Gln Asp Ser Gln Asp Gly Gln Gly Tyr Ser Ser Gly Arg Pro
660 665 670
Gly Gln Gly Gly Arg Asn Gly Phe Gly Pro Gly Gly Gln Asn Gly Asp
675 680 685
Asn Asp Gly Ser Gly Tyr Arg Tyr Ser Gly Asp Tyr Lys Asp Asp Asp
690 695 700
Asp Lys Asp Tyr Lys Asp Asp Asp Asp Lys Asp Tyr Lys Asp Asp Asp
705 710 715 720
Asp Lys
SEQUENCE LISTING
<110> BOLT THREADS, INC.
<120> ELASTOMERIC PROTEINS
<150> US 62/446,230
<151> 2017-01-13
<160> 63
<170> PatentIn version 3.5
<210> 1
<211> 606
<212> PRT
<213> Drosophila sechellia
<400> 1
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Asp Ser Tyr
1 5 10 15
Gly Ala Pro Gly Gln Ser Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr
20 25 30
Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly
35 40 45
Ala Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly
50 55 60
Gly Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn
65 70 75 80
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly
85 90 95
Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
100 105 110
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn
115 120 125
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly
130 135 140
Asn Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly
145 150 155 160
Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly
165 170 175
Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn
180 185 190
Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn
195 200 205
Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly
210 215 220
Asn Gly Ser Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln
225 230 235 240
Gly Gln Gly Gly Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro
245 250 255
Gly Gln Asn Gln Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly
260 265 270
Asn Gly Ser Ala Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser
275 280 285
Gly Pro Gly Gly Arg Pro Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly
290 295 300
Ser Gly Ala Gly Gly Ala Gly Gly Ser Gly Pro Gly Gly Ala Asp Tyr
305 310 315 320
Asp Asn Asp Glu Pro Ala Lys Tyr Glu Phe Asn Tyr Gln Val Glu Asp
325 330 335
Ala Pro Ser Gly Leu Ser Phe Gly His Ser Glu Met Arg Asp Gly Asp
340 345 350
Phe Thr Thr Gly Gln Tyr Asn Val Leu Leu Pro Asp Gly Arg Lys Gln
355 360 365
Ile Val Glu Tyr Glu Ala Asp Gln Gln Gly Tyr Arg Pro Gln Ile Arg
370 375 380
Tyr Glu Gly Asp Ala Asn Asp Gly Ser Gly Pro Ser Gly Pro Ser Gly
385 390 395 400
Pro Gly Gly Pro Gly Gly Gln Asn Leu Gly Ala Asp Gly Tyr Ser Ser
405 410 415
Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly Tyr Ser Ser
420 425 430
Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr Ser Gly Gly
435 440 445
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser Asn Val Lys
450 455 460
Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly Gly Arg Pro
465 470 475 480
Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly Arg Pro Gly
485 490 495
Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg Pro Gly Gly
500 505 510
Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile Gly Gly Arg
515 520 525
Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser Gly Gly Arg
530 535 540
Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser Gly Arg Pro
545 550 555 560
Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp Gly Gln Gly
565 570 575
Tyr Ser Ser Gly Arg Pro Gly Gln Gly Gly Arg Asn Gly Phe Gly Pro
580 585 590
Gly Gly Gln Asn Gly Asp Asn Asp Gly Ser Gly Tyr Arg Tyr
595 600 605
<210> 2
<211> 304
<212> PRT
<213> Drosophila sechellia
<400> 2
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Asp Ser Tyr
1 5 10 15
Gly Ala Pro Gly Gln Ser Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr
20 25 30
Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly
35 40 45
Ala Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly
50 55 60
Gly Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn
65 70 75 80
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly
85 90 95
Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
100 105 110
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn
115 120 125
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly
130 135 140
Asn Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly
145 150 155 160
Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly
165 170 175
Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn
180 185 190
Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn
195 200 205
Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly
210 215 220
Asn Gly Ser Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln
225 230 235 240
Gly Gln Gly Gly Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro
245 250 255
Gly Gln Asn Gln Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly
260 265 270
Asn Gly Ser Ala Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser
275 280 285
Gly Pro Gly Gly Arg Pro Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly
290 295 300
<210> 3
<211> 211
<212> PRT
<213> Drosophila sechellia
<400> 3
Gly Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn
1 5 10 15
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly
20 25 30
Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
35 40 45
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn
50 55 60
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly
65 70 75 80
Asn Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly
85 90 95
Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly
100 105 110
Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn
115 120 125
Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn
130 135 140
Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly
145 150 155 160
Asn Gly Ser Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln
165 170 175
Gly Gln Gly Gly Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro
180 185 190
Gly Gln Asn Gln Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly
195 200 205
Asn Gly Ser
210
<210> 4
<211> 175
<212> PRT
<213> Acromyrmex echinatior
<400> 4
Phe Gly Glu Asn Arg Gly Asn Gly Gly Lys Pro Ser Thr Ser Tyr Gly
1 5 10 15
Val Pro Asp Ser Asn Gly Asn Asn Arg Gly Gly Phe Gly Asn Gly Gly
20 25 30
Ser Glu Gly Arg Pro Ser Thr Ser Tyr Gly Leu Pro Asp Ala Ser Arg
35 40 45
Asn Asn Gly Asn Gly Phe Gly Asn Val Gly Asn Glu Asp Lys Pro Ser
50 55 60
Thr Asn Tyr Gly Ile Pro Ala Asn Gly Asn Lys Val Ser Gly Phe Gly
65 70 75 80
Asn Val Gly Ser Glu Gly Arg Pro Ser Thr Ser Tyr Gly Val Pro Gly
85 90 95
Ala Asn Gly Asn Gln Gly Phe Gly Ser Gly Gly Ile Gly Gly Arg Pro
100 105 110
Ser Thr Ser Tyr Gly Val Pro Gly Val Asn Gly Asn Asn Gly Gly Gly
115 120 125
Phe Glu Asn Val Gly Arg Pro Ser Thr Ser Tyr Gly Thr Pro Asp Ala
130 135 140
Arg Gly Asn Asn Gly Gly Ser Phe Arg Asn Gly Asp Ile Gly Gly Arg
145 150 155 160
Pro Ser Thr Asn Tyr Gly Ile Pro Gly Ala Asn Gly Asn His Gly
165 170 175
<210> 5
<211> 158
<212> PRT
<213> Aeshna sp.
<400> 5
Ala Pro Ser Arg Gly Gly Gly His Gly Gly Gly Ser Ile Ser Ser Ser
1 5 10 15
Tyr Gly Ala Pro Ser Lys Gly Ser Gly Gly Phe Gly Gly Gly Ser Ile
20 25 30
Ser Ser Ser Tyr Gly Ala Pro Ser Lys Gly Ser Val Gly Gly Gly Val
35 40 45
Ser Ser Ser Tyr Gly Ala Pro Ala Ile Gly Gly Gly Ser Phe Gly Gly
50 55 60
Gly Ser Phe Gly Gly Gly Ser Phe Gly Gly Gly Ser Phe Gly Gly Gly
65 70 75 80
Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ser Ser Tyr Ser Ala Pro
85 90 95
Ser Ser Ser Tyr Gly Ala Pro Ser Lys Gly Ser Gly Gly Phe Gly Ser
100 105 110
Ser Gly Gly Phe Ser Ser Phe Ser Ser Ala Pro Ser Ser Ser Tyr Gly
115 120 125
Ala Pro Ser Ala Ser Tyr Ser Thr Pro Ser Ser Ser Tyr Gly Ala Pro
130 135 140
Ser Ser Gly Gly Phe Gly Ala Gly Gly Gly Phe Ser Ser Gly
145 150 155
<210> 6
<211> 457
<212> PRT
<213> Aeshna sp.
<400> 6
Glu Pro Pro Val Gly Gly Ser Gln Ser Tyr Leu Pro Pro Ser Ser Ser
1 5 10 15
Tyr Gly Ala Pro Ser Ala Gly Thr Gly Phe Gly His Gly Gly Gly Ser
20 25 30
Pro Ser Gln Ser Tyr Gly Ala Pro Ser Phe Gly Gly Gly Ser Val Gly
35 40 45
Gly Gly Ser His Phe Gly Gly Gly Ser His Ser Gly Gly Gly Gly Gly
50 55 60
Gly Tyr Pro Ser Gln Ser Tyr Gly Ala Pro Ser Arg Pro Ser Gly Ser
65 70 75 80
Ser Phe Gln Ala Phe Gly Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro
85 90 95
Ser Ser Gln Tyr Gly Ala Pro Ser Gly Gly Gly Gly Ser Tyr Ala Ile
100 105 110
Gln Gly Gly Ser Phe Ser Ser Gly Gly Ser Arg Ala Pro Ser Gln Ala
115 120 125
Tyr Gly Ala Pro Ser Asn Asn Ala Gly Leu Ser His Gln Ser Gln Ser
130 135 140
Phe Gly Gly Gly Leu Ser Ser Ser Tyr Gly Ala Pro Ser Ala Gly Phe
145 150 155 160
Gly Gly Gln Ser His Gly Gly Gly Tyr Ser Gln Gly Gly Asn Gly Gly
165 170 175
Gly His Gly Gly Ser Ser Gly Gly Gly Tyr Ser Tyr Gln Ser Phe Gly
180 185 190
Gly Gly Asn Gly Gly Gly His Gly Gly Ser Arg Pro Ser Ser Ser Tyr
195 200 205
Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ser Gly Gly Lys Gly Val
210 215 220
Ser Gly Gly Phe Val Ser Gln Pro Ser Gly Ser Tyr Gly Ala Pro Ser
225 230 235 240
Gln Ser Tyr Gly Ala Pro Ser Arg Gly Gly Gly His Gly Gly Gly Ser
245 250 255
Ile Ser Ser Ser Tyr Gly Ala Pro Ser Lys Gly Ser Gly Gly Phe Gly
260 265 270
Gly Gly Ser Ile Ser Ser Ser Tyr Gly Ala Pro Ser Lys Gly Ser Val
275 280 285
Gly Gly Gly Val Ser Ser Ser Tyr Gly Ala Pro Ala Ile Gly Gly Gly
290 295 300
Ser Phe Gly Gly Gly Ser Phe Gly Gly Gly Ser Phe Gly Gly Gly Ser
305 310 315 320
Phe Gly Gly Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ser Ser
325 330 335
Tyr Ser Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ser Lys Gly Ser Gly
340 345 350
Gly Phe Gly Ser Ser Gly Gly Phe Ser Ser Phe Ser Ser Ala Pro Ser
355 360 365
Ser Ser Tyr Gly Ala Pro Ser Ala Ser Tyr Ser Thr Pro Ser Ser Ser
370 375 380
Tyr Gly Ala Pro Ser Ser Gly Gly Phe Gly Ala Gly Gly Gly Phe Ser
385 390 395 400
Ser Gly Gly Tyr Ser Gly Gly Gly Gly Gly Tyr Ser Ser Gly Gly Ser
405 410 415
Gly Gly Phe Gly Gly His Gly Gly Ser Gly Gly Ala Gly Gly Tyr Ser
420 425 430
Gly Gly Gly Gly Tyr Ser Gly Gly Gly Ser Gly Gly Gly Gln Lys Tyr
435 440 445
Asp Ser Asn Gly Gly Tyr Val Tyr Ser
450 455
<210> 7
<211> 162
<212> PRT
<213> Haematobia irritans
<400> 7
Ala Gly Gly Gly Asn Gly Gly Gly Gly Thr Gly Gly Thr Pro Ser Ser
1 5 10 15
Ser Tyr Gly Ala Pro Ser Asn Gly Gly Gly Ser Asn Gly Asn Gly Phe
20 25 30
Gly Ser Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Gly Ser Asn
35 40 45
Gly Asn Gly Gly Gly Arg Pro Ser Leu Ser Tyr Gly Ala Pro Gly Ser
50 55 60
Gly Gly Ser Asn Gly Asn Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly
65 70 75 80
Ala Pro Gly Ala Gly Gly Ser Asn Gly Asn Gly Gly Gly Arg Pro Ser
85 90 95
Ser Ser Tyr Gly Ala Pro Gly Ala Gly Gly Ser Asn Gly Asn Gly Gly
100 105 110
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala Gly Gly Ser Asn
115 120 125
Gly Asn Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala
130 135 140
Gly Gly Ser Asn Gly Asn Gly Gly Ser Arg Pro Ser Ser Thr Tyr Gly
145 150 155 160
Ala Pro
<210> 8
<211> 580
<212> PRT
<213> Haematobia irritans
<400> 8
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Pro Leu Asn Asn
1 5 10 15
Tyr Gly Ala Pro Gly Ala Gly Gly Gly Ser Ser Asp Gly Ser Pro Leu
20 25 30
Ala Pro Ser Asp Ala Tyr Gly Ala Pro Asp Leu Gly Gly Gly Ser Gly
35 40 45
Gly Ser Gly Gln Gly Pro Ser Ser Ser Tyr Gly Ala Pro Gly Leu Gly
50 55 60
Gly Gly Asn Gly Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro Gly Leu
65 70 75 80
Gly Gly Gly Asn Gly Gly Ser Arg Arg Pro Ser Ser Ser Tyr Gly Ala
85 90 95
Pro Gly Ala Gly Gly Gly Asn Gly Gly Gly Gly Thr Gly Gly Thr Pro
100 105 110
Ser Ser Ser Tyr Gly Ala Pro Ser Asn Gly Gly Gly Ser Asn Gly Asn
115 120 125
Gly Phe Gly Ser Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Gly
130 135 140
Ser Asn Gly Asn Gly Gly Gly Arg Pro Ser Leu Ser Tyr Gly Ala Pro
145 150 155 160
Gly Ser Gly Gly Ser Asn Gly Asn Gly Gly Gly Arg Pro Ser Ser Ser
165 170 175
Tyr Gly Ala Pro Gly Ala Gly Gly Ser Asn Gly Asn Gly Gly Gly Arg
180 185 190
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala Gly Gly Ser Asn Gly Asn
195 200 205
Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala Gly Gly
210 215 220
Ser Asn Gly Asn Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro
225 230 235 240
Gly Ala Gly Gly Ser Asn Gly Asn Gly Gly Ser Arg Pro Ser Ser Thr
245 250 255
Tyr Gly Ala Pro Gly Ala Gly Gly Ser Asn Gly Asn Gly Cys Gly Asn
260 265 270
Lys Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ala Gly Ser Asn Gly Asn
275 280 285
Gly Gly Ser Glu Gln Gly Ser Ser Gly Ser Pro Ser Asp Ser Tyr Gly
290 295 300
Pro Pro Ala Ser Gly Thr Gly Arg Gly Arg Asn Gly Gly Gly Gly Gly
305 310 315 320
Ala Gly Gly Gly Arg Arg Gly Gln Pro Asn Gln Glu Tyr Leu Pro Pro
325 330 335
Asn Gln Gly Asp Asn Gly Asn Asn Gly Gly Ser Gly Gly Asp Asp Gly
340 345 350
Tyr Asp Tyr Ser Gln Ser Gly Asp Gly Gly Gly Gln Gly Gly Ser Gly
355 360 365
Gly Ser Gly Asn Gly Gly Asp Asp Gly Ser Asn Ile Val Glu Tyr Glu
370 375 380
Ala Gly Gln Glu Gly Tyr Arg Pro Gln Ile Arg Tyr Glu Gly Glu Ala
385 390 395 400
Asn Glu Gly Gly Gln Gly Ser Gly Gly Ala Gly Gly Ser Asp Gly Thr
405 410 415
Asp Gly Tyr Glu Tyr Glu Gln Asn Gly Gly Asp Gly Gly Ala Gly Gly
420 425 430
Ser Gly Gly Pro Gly Thr Gly Gln Asp Leu Gly Glu Asn Gly Tyr Ser
435 440 445
Ser Gly Arg Pro Gly Gly Asp Asn Gly Gly Gly Gly Gly Tyr Ser Asn
450 455 460
Gly Asn Gly Gln Gly Asp Gly Gly Gln Asp Leu Gly Ser Asn Gly Tyr
465 470 475 480
Ser Ser Gly Ala Pro Asn Gly Gln Asn Gly Gly Arg Arg Asn Gly Gly
485 490 495
Gly Gln Asn Asn Asn Gly Gln Gly Tyr Ser Ser Gly Arg Pro Asn Gly
500 505 510
Asn Gly Ser Gly Gly Arg Asn Gly Asn Gly Gly Arg Gly Asn Gly Gly
515 520 525
Gly Tyr Arg Asn Gly Asn Gly Asn Gly Gly Gly Asn Gly Asn Gly Ser
530 535 540
Gly Ser Gly Ser Gly Asn Asn Gly Tyr Asn Tyr Asp Gln Gln Gly Ser
545 550 555 560
Asn Gly Phe Gly Ala Gly Gly Gln Asn Gly Glu Asn Asp Gly Ser Gly
565 570 575
Tyr Arg Tyr Ser
580
<210> 9
<211> 256
<212> PRT
<213> Ctenocephalides felis
<400> 9
Ala Asn Gly Asn Gly Phe Glu Gly Ala Ser Asn Gly Leu Ser Ala Thr
1 5 10 15
Tyr Gly Ala Pro Asn Gly Gly Gly Phe Gly Gly Asn Gly Asn Gly Gly
20 25 30
Ala Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala Gly Asn Gly Gly Asn
35 40 45
Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala Gly Gly
50 55 60
Ser Gly Asn Gly Phe Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro
65 70 75 80
Gly Asn Gly Asn Gly Ala Asn Gly Gly Arg Gly Gly Arg Pro Ser Ser
85 90 95
Arg Tyr Gly Ala Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly
100 105 110
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Asn Gly Asn Gly
115 120 125
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Asn Gly Phe
130 135 140
Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala
145 150 155 160
Asn Gly Asn Gly Asn Gly Gly Ala Ile Gly Gln Pro Ser Ser Ser Tyr
165 170 175
Gly Ala Pro Gly Gln Asn Gly Asn Gly Gly Gly Leu Ser Ser Thr Tyr
180 185 190
Gly Ala Pro Gly Ala Gly Asn Gly Gly Phe Gly Gly Asn Gly Gly Gly
195 200 205
Leu Ser Ser Thr Tyr Gly Ala Pro Gly Ser Gly Asn Gly Gly Phe Gly
210 215 220
Gly Asn Gly Leu Ser Ser Thr Tyr Gly Ala Pro Gly Ser Gly Asn Gly
225 230 235 240
Gly Phe Gly Gly Asn Gly Gly Gly Leu Ser Ser Thr Tyr Gly Ala Pro
245 250 255
<210> 10
<211> 146
<212> PRT
<213> Ctenocephalides felis
<400> 10
Pro Gly Gly Ala Gly Gly Ala Gly Gly Tyr Pro Gly Gly Ala Gly Gly
1 5 10 15
Ala Gly Gly Ala Gly Gly Tyr Pro Gly Gly Ser Ala Gly Gly Ala Gly
20 25 30
Gly Tyr Pro Gly Gly Ser Gly Ser Gly Val Gly Gly Tyr Pro Gly Gly
35 40 45
Ser Asn Gly Gly Ala Gly Gly Tyr Pro Gly Gly Ser Asn Gly Gly Ala
50 55 60
Gly Gly Tyr Pro Gly Gly Ser Asn Gly Gly Ala Gly Gly Tyr Pro Gly
65 70 75 80
Gly Ser Asn Gly Gly Ala Gly Gly Tyr Pro Gly Gly Ser Asn Gly Asn
85 90 95
Gly Gly Tyr Ser Asn Gly Gly Ser Asn Gly Gly Gly Ala Gly Gly Tyr
100 105 110
Pro Gly Gly Ser Asn Gly Asn Gly Gly Tyr Pro Gly Ser Gly Ser Asn
115 120 125
Gly Gly Ala Gly Gly Tyr Pro Gly Gly Ser Asn Gly Asn Gly Gly Tyr
130 135 140
Pro Gly
145
<210> 11
<211> 201
<212> PRT
<213> Bombus terrestris
<400> 11
Phe Asp Gly Gln Asn Gly Ile Gly Gly Gly Asp Ser Gly Arg Asn Gly
1 5 10 15
Leu Ser Asn Ser Tyr Gly Val Pro Gly Ser Asn Gly Gly Arg Asn Gly
20 25 30
Asn Gly Arg Gly Asn Gly Phe Gly Gly Gly Gln Pro Ser Ser Ser Tyr
35 40 45
Gly Ala Pro Ser Asn Gly Leu Gly Gly Asn Gly Gly Ser Gly Ala Gly
50 55 60
Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Phe Gly
65 70 75 80
Gly Gly Gln Pro Ser Ser Ser Tyr Gly Ala Pro Ser Asn Gly Leu Gly
85 90 95
Gly Asn Gly Ala Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly
100 105 110
Gly Asn Gly Phe Gly Gly Gly Ser Asn Gly Ala Gly Lys Asn Gly Phe
115 120 125
Gly Gly Ala Pro Ser Asn Ser Tyr Gly Pro Pro Glu Asn Gly Asn Gly
130 135 140
Phe Gly Gly Gly Asn Gly Gly Gly Ser Pro Ser Gly Leu Tyr Gly Pro
145 150 155 160
Pro Gly Arg Asn Gly Gly Asn Gly Gly Asn Gly Gly Asn Gly Gly Asn
165 170 175
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Thr Pro Glu Arg Asn Gly Gly
180 185 190
Arg Pro Ser Gly Leu Tyr Gly Pro Pro
195 200
<210> 12
<211> 183
<212> PRT
<213> Tribolium castaneum
<400> 12
Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Arg Leu Ser Ser Thr Tyr
1 5 10 15
Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly
20 25 30
Gly Arg Pro Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly
35 40 45
Phe Gly Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser Thr Tyr Gly Pro
50 55 60
Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Arg
65 70 75 80
Pro Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly
85 90 95
Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser Thr Tyr Gly Pro Pro Gly
100 105 110
Gln Gly Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Arg Pro Ser
115 120 125
Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly Gly
130 135 140
Gln Asn Gly Gly Lys Pro Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly
145 150 155 160
Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser Thr
165 170 175
Tyr Gly Pro Pro Gly Gln Gly
180
<210> 13
<211> 551
<212> PRT
<213> Tribolium castaneum
<400> 13
Arg Ala Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Gln Asn Gly
1 5 10 15
Gly Pro Ser Ser Thr Tyr Gly Pro Pro Gly Phe Gln Pro Gly Thr Pro
20 25 30
Leu Gly Gly Gly Gly Asn Gly Gly His Pro Pro Ser Gln Gly Gly Asn
35 40 45
Gly Gly Phe Gly Gly Arg His Pro Asp Ser Asp Gln Arg Pro Gly Thr
50 55 60
Ser Tyr Leu Pro Pro Gly Gln Asn Gly Gly Ala Gly Arg Pro Gly Val
65 70 75 80
Thr Tyr Gly Pro Pro Gly Gln Gly Gly Gly Gln Asn Gly Gly Gly Pro
85 90 95
Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly
100 105 110
Gly Gln Asn Gly Gly Arg Leu Ser Ser Thr Tyr Gly Pro Pro Gly Gln
115 120 125
Gly Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser
130 135 140
Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly Gly Gln
145 150 155 160
Asn Gly Gly Arg Pro Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly
165 170 175
Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser Thr Tyr
180 185 190
Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly
195 200 205
Gly Arg Pro Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly
210 215 220
Phe Gly Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser Thr Tyr Gly Pro
225 230 235 240
Pro Gly Gln Gly Gly Asn Gly Phe Gly Gly Gly Gln Asn Gly Gly Lys
245 250 255
Pro Ser Ser Thr Tyr Gly Pro Pro Gly Gln Gly Gly Asn Gly Phe Gly
260 265 270
Gly Gly Gln Asn Gly Gly Arg Pro Ser Ser Thr Tyr Gly Pro Pro Gly
275 280 285
Gln Gly Gly Asn Gly Asn Gly Gly Gly His Asn Gly Gln Arg Pro Gly
290 295 300
Gly Ser Tyr Leu Pro Pro Ser Gln Gly Gly Asn Gly Gly Tyr Pro Ser
305 310 315 320
Gly Gly Pro Gly Gly Tyr Pro Ser Gly Gly Pro Gly Gly Asn Gly Gly
325 330 335
Tyr Gly Gly Glu Glu Glu Ser Thr Glu Pro Ala Lys Tyr Glu Phe Glu
340 345 350
Tyr Gln Val Asp Asp Asp Glu His Asn Thr His Phe Gly His Gln Glu
355 360 365
Ser Arg Asp Gly Asp Lys Ala Thr Gly Glu Tyr Asn Val Leu Leu Pro
370 375 380
Asp Gly Arg Lys Gln Val Val Gln Tyr Glu Ala Asp Ser Glu Gly Tyr
385 390 395 400
Lys Pro Lys Ile Ser Tyr Glu Gly Gly Asn Gly Asn Gly Gly Tyr Pro
405 410 415
Ser Gly Gly Pro Gly Gly Ala Gly Asn Gly Gly Tyr Pro Ser Gly Gly
420 425 430
Pro Gln Gly Gly Asn Gly Gly Tyr Pro Ser Gly Gly Pro Gln Gly Gly
435 440 445
Asn Gly Gly Tyr Pro Ser Gly Gly Pro Gln Gly Gly Asn Gly Gly Tyr
450 455 460
Pro Ser Gly Gly Pro Gln Gly Gly Asn Gly Gly Tyr Pro Ser Gly Gly
465 470 475 480
Pro Gln Gly Gly Asn Gly Gly Tyr Pro Ser Gly Gly Pro Gln Gly Gly
485 490 495
Asn Gly Gly Tyr Pro Ser Gly Gly Pro Gln Gly Gly Asn Gly Gly Tyr
500 505 510
Pro Ser Gly Gly Pro Gln Gly Gly Asn Gly Gly Tyr Thr Ser Gly Gly
515 520 525
Pro Gln Gly Gly Asn Gly Gly Tyr Pro Ser Gly Gly Pro Gln Gly Gly
530 535 540
Asn Gly Gly Ser Gly Pro Tyr
545 550
<210> 14
<211> 444
<212> PRT
<213> Tribolium castaneum
<400> 14
Gln Leu Thr Lys Arg Asp Ala Pro Leu Ser Gly Gly Tyr Pro Ser Gly
1 5 10 15
Gly Pro Ala Asn Ser Tyr Leu Pro Pro Gly Gly Ala Ser Gln Pro Ser
20 25 30
Gly Asn Tyr Gly Ala Pro Ser Gly Gly Phe Gly Gly Lys Ser Gly Gly
35 40 45
Phe Gly Gly Ser Gly Gly Phe Gly Gly Ala Pro Ser Gln Ser Tyr Gly
50 55 60
Ala Pro Ser Gly Gly Phe Gly Gly Ser Ser Ser Phe Gly Lys Ser Gly
65 70 75 80
Gly Phe Gly Gly Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Gly Gly
85 90 95
Phe Gly Gly Ser Ser Ser Phe Gly Lys Ser Ser Gly Gly Phe Gly Gly
100 105 110
Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Gly Gly Phe Gly Gly Ser
115 120 125
Ser Ser Phe Gly Lys Ser Gly Gly Phe Gly Gly Ala Pro Ser Gln Ser
130 135 140
Tyr Gly Ala Pro Ser Gly Gly Phe Gly Gly Ser Ser Ser Phe Gly Lys
145 150 155 160
Ser Gly Gly Phe Gly Gly Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser
165 170 175
Gly Gly Phe Gly Gly Lys Ser Ser Ser Phe Ser Ser Ala Pro Ser Gln
180 185 190
Ser Tyr Gly Ala Pro Ser Gly Gly Phe Gly Gly Lys Ser Gly Gly Phe
195 200 205
Gly Gly Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Gly Gly Phe Gly
210 215 220
Gly Lys Ser Gly Gly Phe Gly Gly Ala Pro Ser Gln Ser Tyr Gly Ala
225 230 235 240
Pro Ser Gly Gly Phe Gly Gly Ser Ser Ser Phe Gly Lys Ser Gly Gly
245 250 255
Phe Gly Gly Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Gly Gly Phe
260 265 270
Gly Gly Ser Ser Ser Phe Gly Lys Ser Ser Gly Phe Gly His Gly Ser
275 280 285
Gly Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Arg Ser Gln Pro Gln
290 295 300
Ser Asn Tyr Leu Pro Pro Ser Thr Ser Tyr Gly Thr Pro Val Ser Ser
305 310 315 320
Ala Lys Ser Ser Gly Ser Phe Gly Gly Ala Pro Ser Gln Ser Tyr Gly
325 330 335
Ala Pro Ser Gln Ser His Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser
340 345 350
Arg Ser Phe Ser Gln Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Gln
355 360 365
Gly His Ala Pro Ala Pro Gln Gln Ser Tyr Ser Ala Pro Ser Gln Ser
370 375 380
Tyr Gly Ala Pro Ser Gly Gly Phe Gly Gly Gly His Gly Gly Phe Gly
385 390 395 400
Gly Gln Gly Gln Gly Phe Gly Gly Gly Arg Ser Gln Pro Ser Gln Ser
405 410 415
Tyr Gly Ala Pro Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Ala Gly
420 425 430
Gly Gln Gln Tyr Ala Ser Asn Gly Gly Tyr Ser Tyr
435 440
<210> 15
<211> 426
<212> PRT
<213> Apis mellifera
<400> 15
Arg Ser Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Gly Asn Gly
1 5 10 15
Asn Gly Gly Gly Gly Gly Gly Ser Ser Asn Val Tyr Gly Pro Pro Gly
20 25 30
Phe Asp Gly Gln Asn Gly Ile Gly Glu Gly Asp Asn Gly Arg Asn Gly
35 40 45
Ile Ser Asn Ser Tyr Gly Val Pro Thr Gly Gly Asn Gly Tyr Asn Gly
50 55 60
Asp Ser Ser Gly Asn Gly Arg Pro Gly Thr Asn Gly Gly Arg Asn Gly
65 70 75 80
Asn Gly Asn Gly Arg Gly Asn Gly Tyr Gly Gly Gly Gln Pro Ser Asn
85 90 95
Ser Tyr Gly Pro Pro Ser Asn Gly His Gly Gly Asn Gly Ala Gly Arg
100 105 110
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Phe Ala Gly
115 120 125
Gly Ser Asn Gly Lys Asn Gly Phe Gly Gly Gly Pro Ser Ser Ser Tyr
130 135 140
Gly Pro Pro Glu Asn Gly Asn Gly Phe Asn Gly Gly Asn Gly Gly Pro
145 150 155 160
Ser Gly Leu Tyr Gly Pro Pro Gly Arg Asn Gly Gly Asn Gly Gly Asn
165 170 175
Gly Gly Asn Gly Gly Arg Pro Ser Gly Ser Tyr Gly Thr Pro Glu Arg
180 185 190
Asn Gly Gly Arg Leu Gly Gly Leu Tyr Gly Ala Pro Gly Arg Asn Gly
195 200 205
Asn Asn Gly Gly Asn Gly Tyr Pro Ser Gly Gly Leu Asn Gly Gly Asn
210 215 220
Gly Gly Tyr Pro Ser Gly Gly Pro Gly Asn Gly Gly Ala Asn Gly Gly
225 230 235 240
Tyr Pro Ser Gly Gly Ser Asn Gly Asp Asn Gly Gly Tyr Pro Ser Gly
245 250 255
Gly Pro Asn Gly Asn Gly Asn Gly Asn Gly Gly Tyr Gly Gln Asp Glu
260 265 270
Asn Asn Glu Pro Ala Lys Tyr Glu Phe Ser Tyr Glu Val Lys Asp Glu
275 280 285
Gln Ser Gly Ala Asp Tyr Gly His Thr Glu Ser Arg Asp Gly Asp Arg
290 295 300
Ala Gln Gly Glu Phe Asn Val Leu Leu Pro Asp Gly Arg Lys Gln Ile
305 310 315 320
Val Glu Tyr Glu Ala Asp Gln Asp Gly Phe Lys Pro Gln Ile Arg Tyr
325 330 335
Glu Gly Glu Ala Asn Ser Gln Gly Tyr Gly Ser Gly Gly Pro Gly Gly
340 345 350
Asn Gly Gly Asp Asn Gly Tyr Pro Ser Gly Gly Pro Gly Gly Asn Gly
355 360 365
Tyr Ser Ser Gly Arg Pro Asn Gly Gly Ser Asp Phe Ser Asp Gly Gly
370 375 380
Tyr Pro Ser Thr Arg Pro Gly Gly Glu Asn Gly Gly Tyr Arg Asn Gly
385 390 395 400
Asn Asn Gly Gly Asn Gly Asn Gly Gly Tyr Pro Ser Gly Asn Gly Gly
405 410 415
Asp Ala Ala Ala Asn Gly Gly Tyr Gln Tyr
420 425
<210> 16
<211> 318
<212> PRT
<213> Apis mellifera
<400> 16
Asp Ala Pro Ile Ser Gly Ser Tyr Leu Pro Pro Ser Thr Ser Tyr Gly
1 5 10 15
Thr Pro Asn Leu Gly Gly Gly Gly Pro Ser Ser Thr Tyr Gly Ala Pro
20 25 30
Ser Gly Gly Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ser
35 40 45
Ser Thr Tyr Gly Ala Pro Ser Ser Thr Tyr Gly Ala Pro Ser Asn Gly
50 55 60
Gly Gly Arg Pro Ser Ser Thr Tyr Gly Ala Pro Ser Asn Gly Gly Gly
65 70 75 80
Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro
85 90 95
Ser Ser Thr Tyr Gly Ala Pro Ser Asn Gly Gly Gly Arg Pro Ser Ser
100 105 110
Ser Tyr Gly Ala Pro Ser Phe Gly Gly Gly Gly Gly Phe Gly Gly Gly
115 120 125
Asn Gly Leu Ser Thr Ser Tyr Gly Ala Pro Ser Arg Gly Gly Gly Gly
130 135 140
Gly Gly Gly Ser Ile Ser Ser Ser Tyr Gly Ala Pro Thr Gly Gly Gly
145 150 155 160
Gly Gly Gly Pro Ser Thr Thr Tyr Gly Ala Pro Asn Gly Gly Gly Asn
165 170 175
Gly Tyr Ser Arg Pro Ser Ser Thr Tyr Gly Thr Pro Ser Thr Gly Gly
180 185 190
Gly Ser Phe Gly Gly Ser Gly Gly Tyr Ser Gly Gly Gly Gly Gly Tyr
195 200 205
Ser Gly Gly Gly Asn Gly Tyr Ser Gly Gly Gly Gly Gly Gly Tyr Ser
210 215 220
Gly Gly Asn Gly Gly Gly Tyr Ser Gly Gly Gly Asn Gly Gly Gly Tyr
225 230 235 240
Ser Gly Gly Asn Gly Gly Gly Tyr Ser Gly Gly Gly Gly Gly Gly Tyr
245 250 255
Ser Gly Gly Gly Gly Gly Gly Tyr Ser Gly Gly Gly Asn Gly Tyr Ser
260 265 270
Gly Gly Gly Gly Gly Gly Tyr Ser Gly Gly Asn Gly Gly Tyr Ser Gly
275 280 285
Gly Asn Gly Gly Tyr Ser Gly Gly Gly Gly Gly Tyr Ser Gly Gly Gly
290 295 300
Gly Gly Gly Gln Ser Tyr Ala Ser Asn Gly Gly Tyr Gln Tyr
305 310 315
<210> 17
<211> 747
<212> PRT
<213> Nasonia vitripennis
<400> 17
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Gly Gln Gly Gly
1 5 10 15
Gly Phe Gly Gly Gly Arg Pro Ser Gly Ala Ser Pro Ser Asp Gln Tyr
20 25 30
Gly Pro Pro Asp Phe Gln Gly Ala Gly Gly Arg Gly Gly Gln Ala Ala
35 40 45
Gly Gly Asn Phe Gly Gly Gly Gly Asn Gly Phe Gly Gly Ala Pro Ser
50 55 60
Ser Ser Tyr Gly Pro Pro Gly Phe Gly Ser Asn Glu Pro Asn Lys Phe
65 70 75 80
Ser Gly Ala Gly Gly Gly Gly Ala Gly Arg Pro Gln Asp Ser Tyr Gly
85 90 95
Pro Pro Ala Gly Gly Asn Gly Phe Ala Gly Ser Ala Gly Ala Gly Asn
100 105 110
Ser Gly Arg Pro Gly Gly Ala Ala Ala Gly Gly Arg Pro Ser Asp Ser
115 120 125
Tyr Gly Pro Pro Gln Gly Gly Gly Ser Gly Phe Gly Gly Gly Asn Ala
130 135 140
Gly Arg Pro Ser Asp Ser Tyr Gly Pro Pro Ser Ala Gly Gly Gly Gly
145 150 155 160
Phe Gly Gly Gly Ser Pro Gly Gly Gly Phe Gly Gly Gly Ser Pro Gly
165 170 175
Gly Gly Phe Gly Gly Gly Asn Gln Gly Ala Pro Gln Ser Ser Tyr Gly
180 185 190
Pro Pro Ala Ser Gly Phe Gly Gly Gln Gly Gly Ala Gly Gln Gly Arg
195 200 205
Pro Ser Asp Ser Tyr Gly Pro Pro Gly Gly Gly Ser Gly Gly Arg Pro
210 215 220
Ser Gln Gly Gly Asn Gly Phe Gly Gly Gly Asn Ala Gly Arg Pro Ser
225 230 235 240
Asp Ser Tyr Gly Pro Pro Ala Ala Gly Gly Gly Gly Phe Gly Gly Asn
245 250 255
Ala Gly Gly Asn Gly Gly Gly Asn Gly Phe Gly Gly Gly Arg Pro Ser
260 265 270
Gly Ser Pro Gly Gly Phe Gly Gly Gln Gly Gly Gly Gly Arg Pro Ser
275 280 285
Asp Ser Tyr Leu Pro Pro Ser Gly Gly Ser Gly Phe Gly Gly Gly Asn
290 295 300
Gly Arg Gln Pro Gly Gly Phe Gly Gln Gln Gly Gly Asn Gly Ala Gly
305 310 315 320
Gln Gln Asn Gly Gly Gly Gly Ala Gly Arg Pro Ser Ser Ser Tyr Gly
325 330 335
Pro Pro Ser Asn Gly Asn Gly Gly Gly Phe Ser Gly Gln Asn Gly Gly
340 345 350
Arg Gly Ser Pro Ser Ser Gly Gly Gly Phe Gly Gly Ala Gly Gly Ser
355 360 365
Pro Ser Ser Ser Tyr Gly Pro Pro Ala Gly Gly Ser Gly Phe Gly Asn
370 375 380
Asn Gly Gly Ala Gly Gly Arg Pro Ser Ser Ser Tyr Gly Pro Pro Ser
385 390 395 400
Ser Gly Gly Asn Gly Phe Gly Ser Gly Gly Gln Gly Gly Gln Gly Gly
405 410 415
Gln Gly Gly Gln Gly Gly Arg Pro Ser Ser Ser Tyr Gly Pro Pro Ser
420 425 430
Asn Gly Asn Gly Gly Phe Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser
435 440 445
Asn Gly Tyr Pro Gln Gly Gln Gly Asn Gly Asn Gly Gly Phe Gly Gly
450 455 460
Gln Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Pro Pro Gly
465 470 475 480
Gly Asp Ser Gly Tyr Pro Ser Gly Gly Pro Ser Gly Asn Phe Gly Gly
485 490 495
Ser Asn Ala Gly Gly Gly Gly Gly Gly Phe Gly Gly Gln Val Gln Asp
500 505 510
Ser Tyr Gly Pro Pro Pro Ser Gly Ala Val Asn Gly Asn Gly Asn Gly
515 520 525
Tyr Ser Ser Gly Gly Pro Gly Gly Asn Gly Leu Asp Glu Gly Asn Asp
530 535 540
Glu Pro Ala Lys Tyr Glu Phe Ser Tyr Glu Val Lys Asp Asp Gln Ser
545 550 555 560
Asp Gly Arg Lys Gln Ile Val Glu Tyr Glu Ala Asp Gln Asp Gly Phe
565 570 575
Lys Pro Gln Ile Arg Tyr Glu Gly Glu Ala Asn Thr Gly Ala Gly Gly
580 585 590
Ala Gly Gly Tyr Pro Ser Gly Gly Gly Gly Asp Ser Gly Tyr Pro Ser
595 600 605
Gly Pro Ser Gly Ala Gly Gly Asn Ala Gly Tyr Pro Ser Gly Gly Gly
610 615 620
Gly Gly Ala Gly Gly Phe Gly Gly Asn Gly Gly Gly Ser Asn Gly Tyr
625 630 635 640
Pro Ser Gly Gly Pro Ser Gly Gly Gln Gly Gln Phe Gly Gly Gln Gln
645 650 655
Gly Gly Asn Gly Gly Tyr Pro Ser Gly Pro Gln Gly Gly Ser Gly Phe
660 665 670
Gly Gly Gly Ser Gln Gly Ser Gly Ser Gly Gly Tyr Pro Ser Gly Gly
675 680 685
Pro Gly Gly Asn Gly Gly Asn Asn Asn Phe Gly Gly Gly Asn Ala Gly
690 695 700
Tyr Pro Ser Gly Gly Pro Ser Gly Gly Asn Gly Phe Asn Gln Gly Gly
705 710 715 720
Gln Asn Gln Gly Gly Ser Gly Gly Gly Tyr Pro Ser Gly Ser Gly Gly
725 730 735
Asp Ala Ala Ala Asn Gly Gly Tyr Gln Tyr Ser
740 745
<210> 18
<211> 419
<212> PRT
<213> Nasonia vitripennis
<400> 18
Arg Ala Glu Ala Pro Ile Ser Gly Asn Tyr Leu Pro Pro Ser Thr Ser
1 5 10 15
Tyr Gly Thr Pro Asn Leu Gly Gly Gly Gly Gly Gly Gly Gly Gly Phe
20 25 30
Gly Gly Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ser Gly Gly
35 40 45
Gly Phe Gly Gly Ser Phe Gly Gly Gly Ala Pro Ser Ser Ser Tyr Gly
50 55 60
Ala Pro Ser Thr Gly Gly Ser Phe Gly Gly Gly Ala Pro Ser Ser Ser
65 70 75 80
Tyr Gly Ala Pro Ser Ser Gly Gly Ser Phe Gly Gly Ser Phe Gly Gly
85 90 95
Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ser Phe Gly Gly Asn Ala
100 105 110
Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ala Gly Gly Ser Phe Gly Gly
115 120 125
Gly Ala Pro Ser Asn Ser Tyr Gly Pro Pro Ser Ser Ser Tyr Gly Ala
130 135 140
Pro Ser Ala Gly Gly Ser Phe Gly Gly Ser Ser Gly Gly Ser Phe Gly
145 150 155 160
Gly Ser Phe Gly Gly Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ala
165 170 175
Pro Ser Arg Pro Ser Ser Asn Tyr Gly Ala Pro Ser Arg Pro Ser Ser
180 185 190
Asn Tyr Gly Ala Pro Ser Ser Gly Gly Ser Gly Phe Gly Gly Gly Ser
195 200 205
Gly Phe Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ser
210 215 220
Gly Ser Phe Gly Gly Gly Phe Gly Gly Gly Ala Pro Ser Ser Ser Tyr
225 230 235 240
Gly Ala Pro Ala Pro Ser Arg Pro Ser Ser Asn Tyr Gly Ala Pro Ala
245 250 255
Pro Ser Arg Pro Ser Ser Asn Tyr Gly Ala Pro Ala Pro Ser Arg Pro
260 265 270
Ser Ser Ser Tyr Gly Ala Pro Ser Arg Pro Ser Ser Asn Tyr Gly Ala
275 280 285
Pro Ser Arg Pro Ser Ser Asn Tyr Gly Ala Pro Ser Ser Gly Gly Ser
290 295 300
Gly Phe Gly Gly Gly Ser Gly Phe Gly Gly Gly Arg Pro Ser Ser Ser
305 310 315 320
Tyr Gly Ala Pro Ser Ser Gly Ser Phe Gly Gly Gly Phe Gly Gly Gly
325 330 335
Ala Pro Ser Ser Ser Tyr Gly Ala Pro Ala Pro Ser Arg Pro Ser Ser
340 345 350
Asn Tyr Gly Pro Pro Ser Ser Ser Tyr Gly Ala Pro Ser Ser Gly Gly
355 360 365
Ser Gly Gly Phe Gly Gly Gly Ala Pro Ser Ser Ser Tyr Gly Ala Pro
370 375 380
Ser Phe Gly Gly Ser Ser Asn Ala Val Ser Arg Pro Ser Ser Ser Tyr
385 390 395 400
Gly Ala Pro Ser Ser Gly Gly Gly Gln Ser Tyr Ala Ser Asn Gly Gly
405 410 415
Tyr Gln Tyr
<210> 19
<211> 396
<212> PRT
<213> Pediculus humanus corporis
<400> 19
Glu Pro Pro Val Lys Thr Ser Tyr Leu Pro Pro Ser Ala Ser Arg Ser
1 5 10 15
Leu Asn Ser Gln Tyr Gly Ala Pro Ala Phe Thr Asp Ser Asn Glu Leu
20 25 30
Val Ala Pro Ser Pro Asn Ser Asn Phe His Asp Ser Tyr Asn Gln Gln
35 40 45
Gln Gln Ser Phe Asp Leu Ser Asn Gly Leu Ser Val Pro Ser Ala Ala
50 55 60
Gly Arg Leu Ser Asn Thr Tyr Gly Val Pro Ser Ala Gln Gly Ala Asn
65 70 75 80
Val Pro Ser Phe Asp Ser Ser Asp Ser Ile Ala Val Asp Ala Ala Gly
85 90 95
Arg Ser Gly Asn Ser Phe Ser Ser His Val Pro Ser Ser Thr Tyr Gly
100 105 110
Ala Pro Gly Asn Gly Phe Gly Gly Gly Ser Arg Ser Ser Gln Ser Gly
115 120 125
Ala Pro Ser Ser Val Tyr Gly Pro Pro Gln Ala Arg Asn Asn Asn Phe
130 135 140
Gly Asn Gly Ala Ala Pro Ser Ser Val Tyr Gly Pro Pro Gln Ala Arg
145 150 155 160
Asn Asn Asn Phe Gly Asn Gly Gly Ala Pro Ser Gln Val Tyr Gly Pro
165 170 175
Pro Lys Ala Arg Asn Asn Asn Phe Gly Asn Gly Ala Ala Pro Ser Ser
180 185 190
Val Tyr Gly Pro Pro Gln Ala Arg Asn Asn Asn Phe Gly Asn Gly Ala
195 200 205
Ala Pro Ser Ser Val Tyr Gly Pro Pro Gln Ala Arg Asn Asn Asn Phe
210 215 220
Ala Asn Ser Ala Ala Pro Ser Gln Val Tyr Gly Pro Pro Gln Ala Arg
225 230 235 240
Asn Asn Asn Phe Gly Asn Gly Ala Ala Pro Ser Ser Val Tyr Gly Pro
245 250 255
Pro Gln Ser Ser Ser Phe Ser Ser Pro Ser Gly Arg Ser Gly Gln Leu
260 265 270
Pro Ser Ala Thr Tyr Gly Ala Pro Phe Glu Arg Asn Gly Phe Gly Ser
275 280 285
Gln Gly Ser Ser Gly Phe Gln Gly Tyr Glu Pro Ser Lys Arg Ser Gln
290 295 300
Thr Thr Glu Asp Pro Phe Ala Glu Pro Ala Lys Tyr Glu Tyr Asp Tyr
305 310 315 320
Lys Val Gln Ala Ser Asp Glu Thr Gly Thr Glu Phe Gly His Lys Glu
325 330 335
Ser Arg Glu Asn Glu Ser Ala Arg Gly Ala Tyr His Val Leu Leu Pro
340 345 350
Asp Gly Arg Met Gln Ile Val Gln Tyr Glu Ala Asp Glu Thr Gly Tyr
355 360 365
Arg Pro Gln Ile Arg Tyr Glu Asp Thr Gly Tyr Pro Ser Ala Ala Ser
370 375 380
Ser Arg Ser Asn Asn Gly Phe Asn Gly Tyr Gln Tyr
385 390 395
<210> 20
<211> 573
<212> PRT
<213> Anopheles gambiae
<400> 20
Lys Arg Glu Ala Pro Leu Pro Pro Ser Gly Ser Tyr Leu Pro Pro Ser
1 5 10 15
Gly Gly Ala Gly Gly Tyr Pro Ala Ala Gln Thr Pro Ser Ser Ser Tyr
20 25 30
Gly Ala Pro Thr Gly Gly Ala Gly Ser Trp Gly Gly Asn Gly Gly Asn
35 40 45
Gly Gly Arg Gly His Ser Asn Gly Gly Gly Ser Ser Phe Gly Gly Ser
50 55 60
Ala Pro Ser Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Phe Gly Gly
65 70 75 80
Gln Ser Ser Gly Gly Phe Gly Gly His Ser Ser Gly Gly Phe Gly Gly
85 90 95
His Ser Ser Gly Gly His Gly Gly Asn Gly Asn Gly Asn Gly Asn Gly
100 105 110
Tyr Ser Ser Gly Arg Pro Ser Ser Gln Tyr Gly Pro Pro Gln Gln Gln
115 120 125
Gln Gln Gln Gln Ser Phe Arg Pro Pro Ser Thr Ser Tyr Gly Val Pro
130 135 140
Ala Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ala Gln Gln His Ser Asn
145 150 155 160
Gly Gly Asn Gly Gly Tyr Ser Ser Gly Arg Pro Ser Thr Gln Tyr Gly
165 170 175
Ala Pro Ala Gln Ser Asn Gly Asn Gly Phe Gly Asn Gly Arg Pro Ser
180 185 190
Ser Ser Tyr Gly Ala Pro Ala Arg Pro Ser Thr Gln Tyr Gly Ala Pro
195 200 205
Ser Ala Gly Asn Gly Asn Gly Tyr Ala Gly Asn Gly Asn Gly Arg Ser
210 215 220
Tyr Ser Asn Gly Asn Gly Asn Gly His Gly Asn Gly His Ser Asn Gly
225 230 235 240
Asn Gly Asn Asn Gly Tyr Ser Arg Gly Pro Ala Arg Gln Pro Ser Gln
245 250 255
Gln Tyr Gly Pro Pro Ala Gln Ala Pro Ser Ser Gln Tyr Gly Ala Pro
260 265 270
Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser
275 280 285
Ser Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala
290 295 300
Pro Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro Ala Pro Ser Arg
305 310 315 320
Pro Ser Gln Gln Tyr Gly Ala Pro Ala Pro Ser Arg Pro Ser Gln Gln
325 330 335
Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro Ala
340 345 350
Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser
355 360 365
Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro
370 375 380
Ala Gln Gln Pro Ser Ser Gln Tyr Gly Ala Pro Ala Pro Ser Arg Pro
385 390 395 400
Ser Gln Gln Tyr Gly Ala Pro Ala Gln Gln Pro Ser Ala Gln Tyr Gly
405 410 415
Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro Ala Pro Ser
420 425 430
Arg Pro Ser Gln Gln Tyr Gly Ala Pro Ala Gln Ala Pro Ser Ser Gln
435 440 445
Tyr Gly Ala Pro Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Gln
450 455 460
Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr
465 470 475 480
Gly Ala Pro Ser Phe Gly Pro Thr Gly Gly Ala Ser Phe Ser Ser Gly
485 490 495
Asn Gly Asn Val Gly Gly Ser Tyr Gln Val Ser Ser Thr Gly Asn Gly
500 505 510
Phe Ser Gln Ala Ser Phe Ser Ala Ser Ser Phe Ser Pro Asn Gly Arg
515 520 525
Thr Ser Leu Ser Ala Gly Gly Phe Ser Ser Gly Ala Pro Ser Ala Gln
530 535 540
Ser Ala Gly Gly Tyr Ser Ser Gly Gly Pro Ser Gln Val Pro Ala Thr
545 550 555 560
Leu Pro Gln Ser Tyr Ser Ser Asn Gly Gly Tyr Asn Tyr
565 570
<210> 21
<211> 513
<212> PRT
<213> Glossina morsitans
<400> 21
Arg Pro Glu Pro Pro Val Asn Thr Tyr Leu Pro Pro Ser Ala Gly Gly
1 5 10 15
Gly Ser Gly Gly Gly Ser Pro Leu Ala Pro Ser Asp Thr Tyr Gly Ala
20 25 30
Pro Gly Val Asn Gly Gly Gly Gly Gly Gly Gly Gly Pro Ser Ser Thr
35 40 45
Tyr Gly Ala Pro Gly Ser Gly Gly Gly Asn Gly Asn Gly Gly Gly Gly
50 55 60
Phe Gly Lys Pro Ser Ser Thr Tyr Gly Ala Pro Gly Leu Gly Gly Gly
65 70 75 80
Gly Asn Gly Gly Gly Arg Pro Ser Glu Thr Tyr Gly Ala Pro Ser Gly
85 90 95
Gly Gly Gly Asn Gly Phe Gly Lys Pro Ser Ser Thr Tyr Gly Ala Pro
100 105 110
Asn Gly Gly Gly Gly Asn Gly Gly Pro Gly Arg Pro Ser Ser Thr Tyr
115 120 125
Gly Ala Pro Gly Ser Gly Gly Gly Asn Gly Gly Ser Gly Arg Pro Ser
130 135 140
Ser Thr Tyr Gly Ala Pro Gly Leu Gly Gly Gly Asn Gly Gly Ser Gly
145 150 155 160
Arg Pro Ser Ser Met Tyr Gly Ala Pro Gly Leu Gly Gly Gly Asn Gly
165 170 175
Gly Ser Gly Arg Pro Ser Ser Thr Tyr Gly Ala Pro Gly Ser Gly Gly
180 185 190
Gly Asn Gly Gly Ser Gly Arg Pro Ser Ser Thr Tyr Gly Ala Pro Gly
195 200 205
Ser Gly Gly Gly Asn Gly Gly Ser Gly Arg Pro Ser Ser Thr Tyr Gly
210 215 220
Ala Pro Gly Asn Gly Asn Gly Gly Asn Gly Phe Gly Arg Pro Ser Ser
225 230 235 240
Thr Tyr Gly Ala Pro Gly Ser Gly Gly Ser Asn Gly Asn Gly Lys Pro
245 250 255
Ser Ser Thr Tyr Gly Ala Pro Gly Ser Gly Gly Gly Gly Gly Arg Pro
260 265 270
Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly Asn Gly Gly Arg Asn Gly
275 280 285
Asn Gly Asn Gly Gln Ser Gln Glu Tyr Leu Pro Pro Gly Gln Ser Gly
290 295 300
Ser Gly Gly Gly Gly Gly Tyr Gly Gly Gly Ser Gly Ser Gly Gly Ser
305 310 315 320
Gly Gly Gly Gly Gly Gly Gly Tyr Gly Gly Asp Gln Asp Asn Asn Val
325 330 335
Val Glu Tyr Glu Ala Asp Gln Glu Gly Tyr Arg Pro Gln Ile Arg Tyr
340 345 350
Glu Gly Asp Gly Ser Gln Gly Gly Phe Gly Gly Asp Gly Asp Gly Tyr
355 360 365
Ser Tyr Glu Gln Asn Gly Val Gly Gly Asp Gly Gly Gly Ala Gly Gly
370 375 380
Ala Gly Gly Tyr Ser Asn Gly Gln Asn Leu Gly Ala Asn Gly Tyr Ser
385 390 395 400
Ser Gly Arg Pro Asn Gly Gly Asn Gly Gly Gly Arg Arg Gly Gly Gly
405 410 415
Gly Gly Gly Gly Gly Ser Gly Gly Gly Gln Asn Leu Gly Ser Asn Gly
420 425 430
Tyr Ser Ser Gly Ala Pro Asn Gly Phe Gly Gly Gly Asn Gly Gln Gly
435 440 445
Tyr Ser Gly Gly Arg Ser Asn Gly Asn Gly Gly Gly Gly Gly Gly Arg
450 455 460
Asn Gly Gly Arg Tyr Arg Asn Gly Gly Gly Gly Gly Gly Gly Arg Asn
465 470 475 480
Gly Gly Gly Ser Asn Gly Tyr Asn Tyr Asp Gln Pro Gly Ser Asn Gly
485 490 495
Phe Gly Arg Gly Gly Gly Asn Gly Glu Asn Asp Gly Ser Gly Tyr His
500 505 510
Tyr
<210> 22
<211> 506
<212> PRT
<213> Atta cephalotes
<400> 22
Arg Ser Glu Pro Pro Val Asn Ser Tyr Leu His Pro Gly Ser Asp Thr
1 5 10 15
Ser Gly Thr Asn Gly Gly Arg Thr Asp Leu Ser Thr Gln Tyr Gly Ala
20 25 30
Pro Asp Phe Asn Asn Arg Gly Asn Gly Asn Ser Gly Ala Thr Ser Phe
35 40 45
Gly Gly Ser Gly Ala Gly Asn Gly Pro Ser Lys Leu Tyr Asp Val Pro
50 55 60
Ile Arg Gly Asn Thr Gly Gly Asn Gly Leu Gly Gln Phe Arg Gly Asn
65 70 75 80
Gly Phe Glu Ser Gly Gln Pro Ser Ser Ser Tyr Gly Ala Pro Lys Gly
85 90 95
Gly Phe Gly Glu Asn Arg Gly Asn Arg Gly Arg Pro Ser Thr Ser Tyr
100 105 110
Gly Val Pro Asp Ser Asn Arg Asn Asn Arg Gly Gly Phe Gly Asn Gly
115 120 125
Gly Ser Glu Ala Arg Pro Ser Thr Ser Tyr Gly Val Pro Gly Ala Asn
130 135 140
Gly Asn Gln Gly Gly Phe Gly Ser Gly Ser Ile Gly Gly Arg Pro Ser
145 150 155 160
Thr Ser Tyr Gly Val Pro Gly Ala Asn Gly Asn Asn Gly Asp Ser Phe
165 170 175
Arg Asn Gly Asp Ile Gly Gly Arg Pro Ser Thr Asn Tyr Gly Ala Pro
180 185 190
Gly Ala Asn Gly Asn His Gly Gly Gly Asn Gly Gly Asn Gly Arg Pro
195 200 205
Ser Asn Asn Tyr Gly Val Pro Gly Ala Asn Gly Asn Thr Asn Gly Lys
210 215 220
Gly Arg Leu Asn Gly Asn Ser Gly Gly Gly Pro Ser Asn Asn Tyr Gly
225 230 235 240
Ser Pro Asn Gly Phe Gly Lys Gly Leu Ser Thr Ser Tyr Gly Ser Pro
245 250 255
Asn Arg Gly Gly Asn Asp Asn His Tyr Pro Ser Arg Gly Ser Phe Ile
260 265 270
Asn Gly Gly Ile Asn Gly Tyr Ser Ser Gly Ser Pro Asn Gly Asn Ala
275 280 285
Gly Asn Phe Gly His Gly Asp Glu Ser Phe Gly Arg Gly Gly Gly Glu
290 295 300
Gly Glu Asn Thr Gly Glu Gly Tyr Asn Ala Asn Ala Gln Glu Glu Ser
305 310 315 320
Thr Glu Pro Ala Lys Tyr Glu Phe Ser Tyr Lys Val Lys Asp Gln Gln
325 330 335
Thr Gly Ser Asp Tyr Ser His Thr Glu Thr Arg Asp Gly Asp His Ala
340 345 350
Gln Gly Glu Phe Asn Val Leu Leu Pro Asp Gly Arg Lys Gln Ile Val
355 360 365
Glu Tyr Glu Ala Asp Gln Asp Gly Phe Lys Pro Gln Ile Arg Tyr Glu
370 375 380
Gly Glu Ala Asn Ala Asp Gly Gly Tyr Gly Ser Gly Leu Asn Asp Asn
385 390 395 400
Asn Asp Gly Tyr Ser Ser Gly Arg Pro Asp Ser Glu Ser Gly Gly Phe
405 410 415
Ala Asn Ser Gly Phe Asn Gly Gly Ser Ser Asn Gly Gly Tyr Pro Asn
420 425 430
Gly Gly Pro Gly Glu Arg Lys Leu Gly Gly Phe Asn Asn Gly Gly Ser
435 440 445
Ser Gly Tyr Gln Ser Gly Arg Ser Ala Gly Gln Ser Phe Gly Arg Asp
450 455 460
Asn Ala Gly Asp Leu Asn Asn Asp Ile Gly Gly Tyr Phe Ser Asn Ser
465 470 475 480
Pro Asn Asn Ile Gly Asp Ser Asp Asn Ala Asn Val Gly Ser Asn Arg
485 490 495
Gln Asn Asp Gly Asn Ser Gly Tyr Gln Tyr
500 505
<210> 23
<211> 550
<212> PRT
<213> Anopheles darlingi
<400> 23
Lys Arg Glu Ala Pro Leu Pro Pro Ser Gly Ser Tyr Leu Pro Pro Ser
1 5 10 15
Gly Gly Gly Gly Gly Gly Gly Gly Tyr Pro Ala Ala Gln Thr Pro Ser
20 25 30
Ser Ser Tyr Gly Ala Pro Ala Gly Gly Ala Gly Gly Trp Gly Gly Asn
35 40 45
Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly Arg Gly Gly Tyr Ser Asn
50 55 60
Gly Gly Gly His Ser Gly Ser Ala Pro Ser Gln Ser Tyr Gly Ala Pro
65 70 75 80
Ser Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Gln Ser Tyr Gly Ala
85 90 95
Pro Ala Ala Ala Pro Ser Gln Ser Tyr Gly Ala Pro Ser Phe Gly Gly
100 105 110
Asn Gly Gly Gly Ala Ser His Gly Ser Gly Gly Phe Thr Gly Gly His
115 120 125
Gly Gly Asn Gly Asn Gly Asn Gly Tyr Ser Ser Gly Arg Pro Ser Ser
130 135 140
Gln Tyr Gly Pro Pro Gln Gln Gln Gln Gln Pro Gln Gln Gln Ser Phe
145 150 155 160
Arg Pro Pro Ser Thr Ser Tyr Gly Val Pro Ala Ala Pro Ser Ser Ser
165 170 175
Tyr Gly Ala Pro Ser Ala Asn Gly Phe Ser Asn Gly Gly Arg Pro Ser
180 185 190
Ser Gln Tyr Gly Ala Pro Ala Pro Gln Ser Asn Gly Asn Glu Phe Gly
195 200 205
Ala Pro Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ser Arg Pro Ser Thr
210 215 220
Gln Tyr Gly Ala Pro Ser Asn Gly Asn Gly Asn Gly Tyr Ala Gly His
225 230 235 240
Gly Asn Gly Asn Gly His Gly Asn Gly Asn Gly His Ser Asn Gly Asn
245 250 255
Gly Asn Gly Tyr Asn Arg Gly Pro Ala Arg Gln Pro Ser Ser Gln Tyr
260 265 270
Gly Pro Pro Ser Gln Gly Pro Pro Ser Ser Gln Tyr Gly Pro Pro Ser
275 280 285
Gln Tyr Gly Pro Pro Ser Ser Gly Thr Ser Phe Ile Ala Tyr Gly Pro
290 295 300
Pro Ser Gln Gly Pro Pro Ser Ser Gln Tyr Gly Ala Pro Ala Pro Ser
305 310 315 320
Arg Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln
325 330 335
Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr Gly Pro Pro Arg
340 345 350
Gln Ser Ser Pro Gln Phe Gly Ala Pro Ala Pro Arg Pro Pro Ser Ser
355 360 365
Gln Tyr Gly Ala Pro Ala Gln Ala Pro Ser Ser Gln Tyr Gly Ala Pro
370 375 380
Ala Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Ala Pro Ser
385 390 395 400
Ser Gln Tyr Gly Ala Pro Ala Pro Ser Arg Pro Ser Ser Gln Tyr Gly
405 410 415
Val Pro Ala Gln Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Ala
420 425 430
Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gln Thr Pro Ser Ser Gln Tyr
435 440 445
Gly Ala Pro Ser Phe Gly Ser Thr Gly Gly Ser Ser Phe Gly Gly Asn
450 455 460
Gly Gly Val Gly Gly Ser Tyr Gln Thr Ala Ser Ser Gly Asn Gly Phe
465 470 475 480
Ser Gln Ala Ser Phe Ser Ala Ser Ser Phe Ser Ser Asn Gly Arg Ser
485 490 495
Ser Gln Ser Ala Gly Gly Tyr Ser Ser Gly Gly Pro Ser Gln Val Pro
500 505 510
Ala Thr Ile Pro Gln Gln Tyr Ser Ser Gly Gly Gly Ser Tyr Ser Ser
515 520 525
Gly Gly His Ser Gln Val Pro Ala Thr Leu Pro Gln Gln Tyr Ser Ser
530 535 540
Asn Gly Gly Tyr Asn Tyr
545 550
<210> 24
<211> 585
<212> PRT
<213> Acromyrmex echinatior
<400> 24
Arg Ser Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Gly Pro Gly Thr
1 5 10 15
Ser Gly Ala Asn Gly Gly Gln Thr Asp Leu Ser Ile Gln Tyr Arg Ala
20 25 30
Ser Asp Phe Asn Asn Arg Gly Asn Val Asn Gly Asn Ser Gly Ala Thr
35 40 45
Ser Phe Gly Gly Pro Gly Ala Ser Asn Gly Pro Ser Lys Leu Tyr Asp
50 55 60
Val Pro Ile Gly Gly Asn Ala Gly Gly Asn Gly Leu Gly Gln Phe Arg
65 70 75 80
Gly Asn Gly Phe Glu Gly Gly Gln Pro Ser Ser Ser Tyr Gly Ala Pro
85 90 95
Asn Gly Gly Phe Gly Glu Asn Arg Gly Asn Gly Gly Lys Pro Ser Thr
100 105 110
Ser Tyr Gly Val Pro Asp Ser Asn Gly Asn Asn Arg Gly Gly Phe Gly
115 120 125
Asn Gly Gly Ser Glu Gly Arg Pro Ser Thr Ser Tyr Gly Leu Pro Asp
130 135 140
Ala Ser Arg Asn Asn Gly Asn Gly Phe Gly Asn Val Gly Asn Glu Asp
145 150 155 160
Lys Pro Ser Thr Asn Tyr Gly Ile Pro Ala Asn Gly Asn Lys Val Ser
165 170 175
Gly Phe Gly Asn Val Gly Ser Glu Gly Arg Pro Ser Thr Ser Tyr Gly
180 185 190
Val Pro Gly Ala Asn Gly Asn Gln Gly Phe Gly Ser Gly Gly Ile Gly
195 200 205
Gly Arg Pro Ser Thr Ser Tyr Gly Val Pro Gly Val Asn Gly Asn Asn
210 215 220
Gly Gly Gly Phe Glu Asn Val Gly Arg Pro Ser Thr Ser Tyr Gly Thr
225 230 235 240
Pro Asp Ala Arg Gly Asn Asn Gly Gly Ser Phe Arg Asn Gly Asp Ile
245 250 255
Gly Gly Arg Pro Ser Thr Asn Tyr Gly Ile Pro Gly Ala Asn Gly Asn
260 265 270
His Gly Gly Gly Asn Gly Gly Asn Gly Arg Pro Ser Ser Asn Tyr Gly
275 280 285
Val Pro Gly Gly Asn Gly Asn Thr Asn Gly Lys Gly Arg Phe Asn Gly
290 295 300
Asn Ser Gly Gly Arg Pro Ser Asn Ser Tyr Gly Ser Pro Asn Gly Phe
305 310 315 320
Gly Lys Gly Leu Ser Thr Ser Tyr Ser Pro Ser Asn Arg Asp Gly Asn
325 330 335
Gly Asn His Tyr Pro Ser Gly Asp Ser Asn Arg Gly Ser Phe Val Asn
340 345 350
Gly Gly Ile Asn Gly Tyr Pro Ser Gly Ser Pro Asn Gly Asn Ala Gly
355 360 365
Asn Phe Arg His Gly Asp Glu Ser Phe Gly Arg Gly Gly Glu Gly Gly
370 375 380
Gly Arg Ser Thr Gly Glu Gly Tyr Asn Ala Asn Ala Gln Glu Glu Ser
385 390 395 400
Thr Glu Pro Ala Lys Tyr Glu Phe Ser Tyr Lys Val Lys Asp Gln Gln
405 410 415
Thr Gly Ser Asp Tyr Ser His Thr Glu Thr Arg Asp Gly Asp His Ala
420 425 430
Gln Gly Glu Phe Asn Val Leu Leu Pro Asp Gly Arg Lys Gln Ile Val
435 440 445
Glu Tyr Glu Ala Asp Gln Asp Gly Phe Lys Pro Gln Ile Arg Tyr Glu
450 455 460
Gly Glu Ala Asn Ala Asp Gly Glu Tyr Asp Ser Gly Gly Leu Asn Asp
465 470 475 480
Asn Asn Asp Gly Tyr Ser Ser Gly Arg Pro Gly Ser Glu Ser Gly Gly
485 490 495
Phe Ala Asn Asn Ser Gly Phe Asn Gly Gly Ser Ser Asn Gly Gly Tyr
500 505 510
Pro Ser Gly Gly Ser Gly Glu Gly Lys Leu Gly Phe Asn Ser Gly Gly
515 520 525
Asn Ser Gly Tyr Gln Ser Gly Arg Pro Ala Gly Gln Ser Phe Gly Arg
530 535 540
Asp Asn Ala Gly Asp Leu Ser Asn Asp Ile Gly Gly Phe Ser Asn Ser
545 550 555 560
Pro Asn Asn Ile Gly Gly Asp Asn Ala Asn Val Gly Ser Asn Arg Gln
565 570 575
Asn Gly Gly Asn Ser Gly Tyr Gln Tyr
580 585
<210> 25
<211> 748
<212> PRT
<213> Acyrthosiphon pisum
<400> 25
Glu Ser Pro Tyr Gly Gly Gly Ser Ser Asn Ser Asn Gly Asn Gly Arg
1 5 10 15
Asn Gly Gly Tyr Gly Gly Lys Gly Gln Tyr Gly Gly Gly Asn Gly Gly
20 25 30
Gly Val Gly Ser Ser Ser Ala Ser Pro Phe Phe Ser Gly Ala Asn Gln
35 40 45
Tyr Gly Ser Gln Ser Gly Leu Ser Gly Ala Ala Asn Asn Arg Tyr Pro
50 55 60
Ser Phe Gly Ser Lys Phe Gly Gly Asn Lys Gly Ser Tyr Gly Gly Ser
65 70 75 80
Ser Ser Arg Asn Asn Gly Arg Tyr Gly Ser Gly Ser Ala Ser Gly Tyr
85 90 95
Gly Ser Gly Ser Ser Gly Gly Leu Gly Ser Thr Gly Arg Ser Thr Gly
100 105 110
Gly Tyr Gly Gly Gly Ser Ser Gly Ser Tyr Gly Ser Gly Ser Ser Gly
115 120 125
Ser Leu Gly Ser Ser Thr Gly Ser Asn Gly Ile Tyr Gly Ala Gly Ser
130 135 140
Ser Gly Gly Phe Gly Ser Gly Ser Ser Gly Ser Tyr Gly Gly Gly Ser
145 150 155 160
Ser Gly Gly Phe Gly Ser Gly Ser Ser Gly Ser Tyr Gly Gly Gly Ser
165 170 175
Ser Gly Gly Phe Gly Ser Gly Ser Ser Gly Ser Tyr Gly Gly Gly Ser
180 185 190
Ser Gly Gly Phe Gly Ser Gly Ser Ser Gly Ser Tyr Gly Gly Gly Ser
195 200 205
Ser Gly Gly Phe Gly Ser Gly Ser Ser Gly Asn Tyr Gly Ser Gly Ser
210 215 220
Ser Gly Ser Tyr Gly Ser Gly Gly Gly Gly Leu Gly Gly Ala Ser Ser
225 230 235 240
Gly Asn Asn Asp Gly Tyr Gly Ala Gly Gly Ser Gly Ser Tyr Asp Gln
245 250 255
Leu Gly Gly Ala Asn Gly Asn Gly Leu Gly Gly Ser Gly Asn Asp Pro
260 265 270
Leu Ser Glu Pro Ala Asn Tyr Glu Phe Ser Tyr Glu Val Asn Ala Pro
275 280 285
Glu Ser Gly Ala Ile Phe Gly His Lys Glu Ser Arg Gln Gly Glu Glu
290 295 300
Ala Thr Gly Val Tyr His Val Leu Leu Pro Asp Gly Arg Thr Gln Ile
305 310 315 320
Val Glu Tyr Glu Ala Asp Glu Asp Gly Tyr Lys Pro Lys Ile Thr Tyr
325 330 335
Thr Asp Pro Val Gly Gly Tyr Ala Gly Asp Arg Gln Ser Gly Asn Ser
340 345 350
Tyr Gly Gly Asn Gly Gly Phe Gly Gly Ser Gly Ser Leu Gly Gly Ser
355 360 365
Gly Gly Asn Leu Gly Gly Leu Tyr Asn Gly Gly Gly Ser Ser Asn Asn
370 375 380
Gly Ala Gly Tyr Gly Gly Ser Ser Ser Ser Leu Gly Ser Arg Tyr Gly
385 390 395 400
Gly Ser Gly Gly Ser Ser Gly Ser Gly Val Gly Gly Gly Tyr Gly Gly
405 410 415
Ser Gly Ser Ser Ser Gly Gly Ile Gly Ser Ser Tyr Gly Gly Ser Gly
420 425 430
Ser Leu Ser Gly Gly Leu Gly Gly Gly Tyr Gly Gly Ser Gly Ser Ser
435 440 445
Ser Gly Gly Leu Gly Gly Gly Tyr Gly Gly Ser Gly Gly Ser Ser Gly
450 455 460
Gly Gly Phe Gly Gly Leu Gly Gly Ser Gly Gly Ser Ser Gly Ser Gly
465 470 475 480
Tyr Gly Gly Ser Gly Ser Ser Ser Gly Gly Leu Gly Asn Ser Tyr Gly
485 490 495
Gly Ser Gly Ser Ser Asn Gly Gly Leu Gly Gly Gly Tyr Ser Gly Ser
500 505 510
Gly Gly Ser Ser Gly Gly Leu Gly Gly Gly Tyr Gly Ala Ser Ser Gly
515 520 525
Ser Ser Gly Ser Gly Leu Gly Gly Gly Tyr Gly Gly Ser Gly Ser Ser
530 535 540
Ser Gly Gly Leu Gly Ser Gly Tyr Gly Gly Leu Gly Ser Ser Ser Gly
545 550 555 560
Gly Leu Gly Gly Gly Tyr Gly Gly Ser Gly Ser Ser Ser Gly Gly Leu
565 570 575
Gly Gly Gly Tyr Gly Gly Ser Gly Ser Ser Asn Gly Gly Ile Gly Gly
580 585 590
Gly Tyr Gly Gly Ser Ser Gly Ser Ser Gly Gly Leu Gly Gly Gly Tyr
595 600 605
Gly Gly Ser Gly Ser Ser Ser Gly Gly Leu Gly Gly Gly Tyr Gly Gly
610 615 620
Ser Gly Gly Ser Asn Ser Gly Leu Gly Ser Ser Tyr Gly Gly Ser Gly
625 630 635 640
Ser Thr Asn Gly Gly Leu Gly Gly Gly Tyr Gly Gly Leu Gly Ser Ser
645 650 655
Ser Gly Gly Leu Gly Gly Gly Tyr Gly Gly Ser Gly Gly Ser Asn Gly
660 665 670
Gly Ile Gly Gly Gly Tyr Gly Gly Ser Ser Gly Ser Gly Gly Ser Gln
675 680 685
Gly Ser Ala Tyr Gly Gly Ser Gly Ser Ser Ser Gly Ser Gln Gly Gly
690 695 700
Gly Tyr Gly Gly Ser Gly Ser Ser Ser Gly Gly Leu Gly Gly Gly Tyr
705 710 715 720
Gly Ser Ser Ser Gly Ser Ser Ser Gly Leu Gly Gly Ser Tyr Gly Ser
725 730 735
Asn Arg Asn Gly Leu Gly Ser Gly Ser Ser Tyr Ser
740 745
<210> 26
<211> 616
<212> PRT
<213> Drosophila virilis
<400> 26
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Pro Gly Asp
1 5 10 15
Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Phe
20 25 30
Gly Gly Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ala Gly Asn Gly
35 40 45
Asn Gly Asn Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly
50 55 60
Gln Gly Gln Gly Gly Phe Gly Gly Lys Pro Ser Asp Ser Tyr Gly Ala
65 70 75 80
Pro Gly Ala Gly Asn Gly Asn Gly Asn Gly Arg Pro Ser Ser Ser Tyr
85 90 95
Gly Ala Pro Gly Gln Gly Gln Gly Gln Gly Gly Phe Gly Gly Arg Pro
100 105 110
Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Gly Phe Gly Gly
115 120 125
Lys Pro Ser Asp Thr Tyr Gly Ala Pro Gly Ala Gly Asn Gly Asn Gly
130 135 140
Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Gly Ile
145 150 155 160
Gly Gly Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ala Gly Asn Gly
165 170 175
Asn Gly Asn Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly
180 185 190
Gln Gly Gly Phe Gly Gly Lys Pro Ser Asp Thr Tyr Gly Ala Pro Gly
195 200 205
Ala Gly Asn Gly Asn Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly
210 215 220
Gln Gly Gln Gly Gly Phe Gly Gly Lys Pro Ser Asp Thr Tyr Gly Ala
225 230 235 240
Pro Gly Ala Gly Asn Gly Asn Gly Asn Gly Arg Pro Ser Ser Ser Tyr
245 250 255
Gly Ala Pro Gly Gln Gly Gln Gly Gly Phe Gly Gly Lys Pro Ser Asp
260 265 270
Thr Tyr Gly Ala Pro Gly Ala Gly Asn Gly Asn Gly Arg Pro Ser Ser
275 280 285
Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Gln Gly Gly Phe Gly Gly
290 295 300
Lys Pro Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly Ala Gly Ala Gly
305 310 315 320
Gly Ala Gly Gly Pro Gly Ala Gly Gly Gly Gly Asp Tyr Asp Asn Asp
325 330 335
Glu Pro Ala Lys Tyr Glu Phe Asn Tyr Gln Val Glu Asp Ala Pro Ser
340 345 350
Gly Leu Ser Phe Gly His Ser Glu Met Arg Asp Gly Asp Phe Thr Thr
355 360 365
Gly Gln Tyr Asn Val Leu Leu Pro Asp Gly Arg Lys Gln Ile Val Glu
370 375 380
Tyr Glu Ala Asp Gln Gln Gly Tyr Arg Pro Gln Val Arg Tyr Glu Gly
385 390 395 400
Asp Ala Asn Gly Asn Gly Gly Pro Gly Gly Ala Gly Gly Pro Gly Gly
405 410 415
Gln Asp Leu Gly Gln Asn Gly Tyr Ser Ser Gly Arg Pro Gly Gly Gln
420 425 430
Asp Leu Gly Gln Gly Gly Tyr Ser Asn Gly Arg Pro Gly Gly Gln Asp
435 440 445
Leu Gly Gln Asn Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu
450 455 460
Gly Gln Asn Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly
465 470 475 480
Gln Asn Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Gln
485 490 495
Asn Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Gln Asn
500 505 510
Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Gln Asn Gly
515 520 525
Tyr Ser Gly Gly Arg Pro Gly Gly Asn Gly Gly Ser Asp Gly Gly Arg
530 535 540
Val Ile Ile Gly Gly Arg Val Ile Gly Gln Asp Gly Gly Asp Gly Gln
545 550 555 560
Gly Tyr Ser Ser Gly Arg Pro Asn Gly Gln Asp Gly Gly Phe Gly Gln
565 570 575
Asp Asn Thr Asp Gly Arg Gly Tyr Ser Ser Gly Lys Pro Gly Gln Gly
580 585 590
Arg Asn Gly Asn Gly Asn Ser Phe Gly Pro Gly Gly Gln Asn Gly Asp
595 600 605
Asn Asp Gly Ser Gly Tyr Arg Tyr
610 615
<210> 27
<211> 557
<212> PRT
<213> Drosophila erecta
<400> 27
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Asp Ser Tyr
1 5 10 15
Gly Ala Pro Gly Gln Ser Gly Pro Gly Gly Arg Pro Ser Asp Ser Tyr
20 25 30
Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly
35 40 45
Ala Pro Gly Leu Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly
50 55 60
Phe Gly Gly Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ala Gly Asn
65 70 75 80
Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ala Gly
85 90 95
Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Ser
100 105 110
Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly
115 120 125
Asn Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln
130 135 140
Gly Gln Gly Asn Gly Asn Ser Gly Arg Pro Ser Ser Ser Tyr Gly Ala
145 150 155 160
Pro Gly Ala Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro
165 170 175
Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly
180 185 190
Ala Gly Asn Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala
195 200 205
Pro Gly Gly Gly Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly Ser Gly
210 215 220
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Gly
225 230 235 240
Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Asn Gln
245 250 255
Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly Ser Gly Ser Gly
260 265 270
Asn Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser
275 280 285
Gly Pro Gly Gly Arg Pro Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly
290 295 300
Ser Gly Ala Gly Gly Ala Gly Gly Ser Gly Pro Gly Gly Ala Asp Tyr
305 310 315 320
Asp Asn Asp Ile Val Glu Tyr Glu Ala Asp Gln Gln Gly Tyr Arg Pro
325 330 335
Gln Ile Arg Tyr Glu Gly Asp Ala Asn Asp Gly Ser Gly Pro Ser Gly
340 345 350
Pro Gly Gly Gln Asn Leu Gly Ala Asp Gly Tyr Ser Ser Gly Arg Pro
355 360 365
Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly Tyr Ser Gly Gly Arg Pro
370 375 380
Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr Ser Gly Gly Arg Pro Gly
385 390 395 400
Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser Asn Gly Arg Pro Gly Gly
405 410 415
Gln Asp Leu Gly Pro Ser Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln
420 425 430
Asp Leu Gly Pro Ser Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp
435 440 445
Leu Gly Ala Gly Gly Tyr Ser Asn Gly Arg Pro Gly Gly Asn Gly Asn
450 455 460
Gly Asn Gly Gly Ala Asp Gly Gly Arg Val Ile Ile Gly Gly Arg Val
465 470 475 480
Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser Gly Gly Arg Pro
485 490 495
Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser Gly Arg Pro Gly
500 505 510
Gly Arg Pro Gly Ala Asn Gly Gln Asp Asn Gln Asp Gly Gln Gly Tyr
515 520 525
Ser Ser Gly Arg Ser Gly Lys Gly Gly Arg Asn Ser Phe Gly Pro Gly
530 535 540
Gly Gln Asn Gly Asp Asn Asp Gly Ser Gly Tyr Arg Tyr
545 550 555
<210> 28
<211> 796
<212> PRT
<213> Lutzomyia longipalpis
<400> 28
Arg Pro Glu Pro Pro Ala Asn Thr Tyr Leu Pro Pro Ser Ser Ser Tyr
1 5 10 15
Ala Ala Pro Gly Gln Gln Gly Gly Ser Gly Phe Gly Gly Gly Gly Gly
20 25 30
Ser Gly Gly Ser Gly Gly Phe Gly Gln Pro Gly Ala Phe Gly Arg Pro
35 40 45
Ser Ser Ser Tyr Gly Pro Pro Ser Gln Gly Gly Ala Gly Gly Gly Phe
50 55 60
Gly Ser Asp Ser Gln Phe Gly Gly Gly Phe Gly Gly Gly Ala Gly Gly
65 70 75 80
Phe Gly Ser Gly Gly Ser Gly Ala Pro Gly Ala Ser Gln Arg Pro Ser
85 90 95
Ser Ser Tyr Gly Pro Pro Gly Gln Thr Gly Gly Gly Gly Phe Gly Ala
100 105 110
Gln Gly Ala Pro Gly Ser Ser Phe Gly Pro Gly Gly Gly Phe Gly Gly
115 120 125
Gly Ser Pro Gly Gln Ala Gly Ser Pro Gly Phe Gln Arg Pro Ser Ser
130 135 140
Ser Tyr Gly Pro Pro Gly Gln Ser Pro Gly Gly Gly Phe Ser Gln Gln
145 150 155 160
Gly Gly Ala Pro Gly Ala Ser Gln Arg Pro Ser Ser Thr Tyr Gly Ala
165 170 175
Pro Gly Gln Gly Ala Gly Gly Phe Gly Gln Gly Gly Ser Gly Gly Phe
180 185 190
Gly Gly Thr Gly Gly Ser Val Ala Ile Gly Gly Arg Pro Ser Ser Ser
195 200 205
Tyr Gly Ala Pro Gly Gln Gly Ser Ser Gly Gly Phe Gly Gly Gly Ser
210 215 220
Gly Gly Phe Gly Ser Gln Ala Pro Ser Thr Ser Tyr Gly Ala Pro Gly
225 230 235 240
Gln Gly Ser Pro Gly Gly Gly Phe Gly Ser Gln Gly Gly Pro Gly Gly
245 250 255
Gln Pro Gly Ser Pro Gly Phe Gly Gly Ser Gln Arg Pro Ser Ser Ser
260 265 270
Tyr Gly Pro Pro Gly Gln Gly Gly Ala Pro Gly Gln Gly Gly Ser Pro
275 280 285
Gly Phe Gly Ala Ser Ser Arg Ser Gly Gly Ala Gly Gly Phe Gly Ala
290 295 300
Ser Gln Gln Pro Ser Ser Ser Tyr Gly Pro Pro Gly Gln Gly Ala Gly
305 310 315 320
Ser Gly Phe Gln Gly Thr Gly Gly Gly Phe Gly Gly Pro Gly Gln Arg
325 330 335
Pro Gly Phe Gly Gly Ser Gln Thr Pro Ala Thr Ser Tyr Gly Ala Pro
340 345 350
Gly Gln Ala Gly Gly Ala Ser Gly Gly Phe Gly Gly Ala Gly Ala Gln
355 360 365
Arg Pro Ser Ser Ser Tyr Gly Pro Pro Gly Gln Ala Ser Gly Phe Gly
370 375 380
Gly Gly Ser Ser Gly Gly Gly Phe Gly Gly Gly Ser Ser Gly Gly Phe
385 390 395 400
Gly Gly Asn Gln Gly Gly Phe Gly Gly Asn Gln Gly Gly Phe Gly Gly
405 410 415
Ser Gln Thr Pro Ser Ser Ser Tyr Gly Ala Pro Ser Phe Gly Ser Gly
420 425 430
Gly Ser Pro Gly Ala Ala Gly Gly Ala Gly Gly Phe Gly Gln Gly Gly
435 440 445
Val Gly Gly Ser Gly Gln Pro Gly Gly Phe Gly Gly Gly Asp Gln Gly
450 455 460
Tyr Pro Pro Arg Gly Gly Pro Gly Gly Phe Gly Pro Gly Ser Gly Gly
465 470 475 480
Ser Gly Ala Gly Gly Pro Ile Ala Gly Gly Ser Gly Ser Gly Tyr Pro
485 490 495
Gly Gly Ser Asp Ser Gly Ser Asn Glu Pro Ala Lys Tyr Asp Phe Ser
500 505 510
Tyr Gln Val Asp Asp Pro Ala Ser Gly Thr Ser Phe Gly His Ser Glu
515 520 525
Gln Arg Asp Gly Asp Tyr Thr Ser Gly Gln Tyr Asn Val Leu Leu Pro
530 535 540
Asp Gly Arg Lys Gln Ile Val Glu Tyr Glu Ala Asp Leu Gly Gly Tyr
545 550 555 560
Arg Pro Gln Ile Lys Tyr Glu Gly Gly Ser Ser Gly Gly Ala Gly Gly
565 570 575
Tyr Pro Ser Gly Gly Pro Gly Ser Gln Gly Gly Ala Gly Gly Tyr Pro
580 585 590
Ser Gly Gly Pro Gly Gly Pro Gly Ser Pro Gly Gly Ala Gly Gly Tyr
595 600 605
Gln Ser Gly Ala Ala Gly Gly Ala Gly Gly Tyr Pro Ser Gly Gly Pro
610 615 620
Gly Gly Pro Gly Ala Gly Gly Tyr Pro Ser Gly Gly Pro Gly Gly Pro
625 630 635 640
Gly Ser Gln Ala Gly Gly Phe Ser Gly Gly Phe Gly Gly Gly Ser Asp
645 650 655
Gly Ala Phe Gly Gly Ala Gly Gly Phe Ser Gln Gly Gly Ala Gly Gly
660 665 670
Gly Asp Ala Gly Tyr Pro Arg Gly Gly Pro Gly Gly Phe Gly Gly Ala
675 680 685
Gly Ser Pro Gly Phe Gly Gly Ser Gly Ser Pro Gly Phe Gly Gly Ser
690 695 700
Gly Ser Pro Gly Ala Gln Gly Ser Ser Gly Phe Gly Gly Thr Gly Gly
705 710 715 720
Gly Phe Gly Gly Gly Ala Asp Gly Tyr Pro Arg Gly Gly Pro Gly Ala
725 730 735
Gly Gln Ser Gly Phe Gln Asp Gly Arg Gly Ala Thr Gly Gly Ala Gly
740 745 750
Gln Pro Gly Gly Arg Gly Ser Phe Gly Arg Pro Gly Ser Ala Arg Gly
755 760 765
Gly Ser Ser Ser Asn Gly Tyr Ala Asn Gly Gly Ala Glu Gly Tyr Pro
770 775 780
Arg Asp Asn Pro Gln Asn Arg Gly Ser Gly Tyr Ser
785 790 795
<210> 29
<211> 1051
<212> PRT
<213> Rhodnius prolixus
<400> 29
Lys Arg Asp Asp Pro Leu Arg Arg Phe Leu Ala Pro Leu Val Gly Gly
1 5 10 15
Gly Asn Gly Ser Gly Gly Gly Gly Gly Gly Tyr Asn Tyr Asn Lys Pro
20 25 30
Ala Asn Gly Leu Ser Leu Pro Gly Gly Gly Gly Ala Leu Pro Pro Ala
35 40 45
Thr Ser Tyr Gly Val Pro Asp Arg Pro Ala Pro Val Pro Ser Ser Pro
50 55 60
Pro Ser Ser Ser Tyr Gly Ala Pro Gln Pro Ser Pro Asn Tyr Gly Ala
65 70 75 80
Pro Ser Ser Ser Tyr Gly Ala Pro Ser Gln Gln Pro Ser Arg Ser Tyr
85 90 95
Gly Ala Pro Ser Gln Gly Pro Ser Thr Ser Tyr Ser Gln Arg Pro Ser
100 105 110
Ser Ser Tyr Gly Ala Pro Ala Pro Gln Thr Pro Ser Ser Ser Tyr Gly
115 120 125
Ala Pro Ala Gln Gln Pro Ser Gly Ser Tyr Gly Ala Pro Ser Gly Gly
130 135 140
Gly Gly Ser Ser Gly Tyr Thr Gly Gly Ala Gln Arg Pro Ser Gly Ser
145 150 155 160
Tyr Gly Ala Pro Ser Gln Gly Gly Pro Ser Gly Asn Tyr Gly Pro Pro
165 170 175
Ser Gln Gln Pro Ser Ser Asn Tyr Gly Ala Pro Ser Gln Thr Pro Ser
180 185 190
Ser Asn Tyr Gly Ala Pro Ala Gln Arg Pro Ser Thr Ser Tyr Gly Ala
195 200 205
Pro Ser Gln Pro Pro Ser Ser Ser Tyr Gly Ser Pro Pro Gln Arg Ala
210 215 220
Ser Gly Tyr Pro Ser Ser Ser Ser Gly Pro Ser Asn Gly Tyr Ser Pro
225 230 235 240
Pro Ala Gln Arg Pro Ser Ser Ser Tyr Gly Pro Pro Ser Gln Gln Pro
245 250 255
Ala Ser Ser Tyr Gly Ala Pro Ser Gln Thr Pro Ser Ser Asn Tyr Gly
260 265 270
Pro Pro Ala Pro Ile Pro Ser Ser Asn Tyr Gly Ala Pro Ser Gln Pro
275 280 285
Pro Ser Lys Pro Ser Ala Pro Ser Ser Ser Tyr Gly Thr Pro Ser Gln
290 295 300
Thr Pro Ser Thr Ser Tyr Gly Ala Pro Ser Gln Ala Pro Ser Ser Ser
305 310 315 320
Tyr Gly Ala Pro Ser Arg Pro Ser Pro Pro Ser Ser Ser Tyr Gly Ala
325 330 335
Pro Ser Gln Gly Pro Ser Ser Ser Tyr Gly Pro Pro Ser Arg Pro Ser
340 345 350
Gln Pro Ser Ser Pro Ser Ser Gly Tyr Gly Ala Pro Ser Gln Gly Pro
355 360 365
Ser Ser Ser Tyr Gly Ala Pro Ser Arg Pro Ser Ser Pro Ser Ser Ser
370 375 380
Tyr Gly Ala Pro Pro Ser Ser Ser Tyr Gly Ala Pro Ser Arg Pro Ser
385 390 395 400
Pro Pro Ser Ser Ser Tyr Gly Ala Pro Ser Gln Gly Pro Ser Ser Ser
405 410 415
Tyr Gly Pro Pro Ser Arg Pro Ser Gln Pro Ser Ser Pro Ser Ser Gly
420 425 430
Tyr Gly Ala Pro Ser Gln Gly Pro Ser Ser Ser Tyr Gly Ala Pro Ser
435 440 445
Arg Pro Ser Ser Pro Ser Ser Ser Tyr Gly Ala Pro Pro Ser Ser Ser
450 455 460
Tyr Gly Ala Pro Ser Arg Pro Ser Pro Pro Ser Ser Ser Tyr Gly Ala
465 470 475 480
Pro Ser Gln Gly Pro Ser Ser Ser Tyr Gly Pro Pro Ser Arg Pro Ser
485 490 495
Gln Pro Ser Ser Pro Ser Ser Ser Tyr Gly Ala Pro Ser Gln Gly Pro
500 505 510
Ser Ser Ser Tyr Gly Ala Pro Ser Arg Pro Ser Pro Pro Ser Ser Ser
515 520 525
Tyr Gly Ala Pro Ser Gln Gly Pro Ser Ser Ser Tyr Gly Pro Pro Ser
530 535 540
Arg Pro Ser Gln Pro Ser Ser Thr Tyr Gly Val Pro Ser Gly Gly Arg
545 550 555 560
Pro Ser Thr Pro Ser Ser Ser Tyr Gly Ala Pro Pro Gln Ala Leu Ser
565 570 575
Ser Thr Tyr Gly Ala Pro Ser Gly Arg Pro Gly Ala Pro Ser Gln Lys
580 585 590
Pro Ser Ser Ser Tyr Gly Ala Pro Ser Leu Gly Gly Asn Ala Ser Arg
595 600 605
Gly Pro Lys Ser Ser Pro Pro Ser Ser Ser Tyr Gly Ala Pro Ser Val
610 615 620
Gly Thr Ser Val Ser Ser Tyr Ala Pro Ser Gln Gly Gly Ala Gly Gly
625 630 635 640
Phe Gln Ser Ser Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ser Thr Gly
645 650 655
Pro Ser Ser Thr Tyr Gly Pro Pro Ser Gln Pro Pro Ser Ser Ser Tyr
660 665 670
Gly Val Pro Ser Gln Pro Pro Ser Ser Asn Tyr Gly Val Pro Ser Gln
675 680 685
Gly Val Ser Gly Ser Val Gly Ser Ser Ser Pro Ser Ser Ser Tyr Gly
690 695 700
Ala Pro Ser Gln Ile Pro Ser Ser Ser Tyr Gly Ala Pro Ser Gln Ser
705 710 715 720
Ser Ile Gly Gly Phe Gly Ser Ser Arg Pro Ser Ser Ser Tyr Gly Ala
725 730 735
Pro Pro Gln Ala Pro Ser Ser Ser Tyr Ser Ala Pro Leu Arg Ala Pro
740 745 750
Ser Thr Ser Tyr Gly Ala Pro Ser Gly Gly Ser Gly Ser Asn Phe Gly
755 760 765
Ser Lys Pro Ser Thr Asn Tyr Gly Ala Pro Ser Gln Pro Pro Ser Thr
770 775 780
Asn Tyr Gly Pro Pro Ser Gln Pro Pro Ser Ser Ser Tyr Gly Thr Pro
785 790 795 800
Ser Arg Ala Pro Ser Pro Thr Tyr Ser Thr Pro Gln Ser Ser Gly Thr
805 810 815
Ser Phe Gly Ser Arg Pro Ser Ser Ser Tyr Gly Val Pro Ser Gln Pro
820 825 830
Thr Thr Asn Tyr Gly Ala Pro Ser Gln Thr Pro Ser Ser Asn Tyr Gly
835 840 845
Ala Pro Pro Ala Ser Ser Ala Pro Ser Ser Thr Tyr Gly Arg Pro Ser
850 855 860
Gln Ser Pro Ser Ser Ser Tyr Gly Ala Pro Ser Pro Ser Ser Ser Ser
865 870 875 880
Ser Ser Tyr Glu Ser Pro Ser Gln Pro Pro Ser Ser Ser Tyr Gly Ala
885 890 895
Pro Ser Gln Gly Pro Ser Ser Ser Tyr Gly Ala Pro Ser Arg Pro Ser
900 905 910
Ser Thr Tyr Gly Ala Pro Ser Pro Ser Ser Pro Ser Thr Asn Tyr Gly
915 920 925
Ala Pro Ala Pro Ser Ser Asn Tyr Gly Thr Pro Ala Gln Asp Leu Thr
930 935 940
Gly Ser Tyr Ala Ala Pro Ser Gln Pro Pro Ser Ala Gly Tyr Gly Ala
945 950 955 960
Pro Ser Gly Gln Pro Ser Ser Gly Gly Lys Gln Asn Phe Gln Val Lys
965 970 975
Asn Pro Phe Ala Gly Gln Thr His Gln Val Tyr Pro Ala Val Ser Ser
980 985 990
Ile Ser Phe Gly Leu Pro Ser Gln Ser Phe Asn Thr Ala Ile Gln Gly
995 1000 1005
Gln Glu Pro Ser Gln Ser Tyr Gly Ala Pro Thr Ala Ser Ser Pro
1010 1015 1020
Ser Ser Ser Tyr Gly Ala Pro Thr Gly Thr Gly Ser Ser Gln Pro
1025 1030 1035
Gly Gln Ser Tyr Ala Ser Asn Gly Gly Tyr Ser Tyr Ser
1040 1045 1050
<210> 30
<211> 506
<212> PRT
<213> Rhodnius prolixus
<400> 30
Gln Pro Pro Phe Asn His Tyr Leu Pro Ala Ala Arg Gly Ser Gly Ser
1 5 10 15
Asn Ser Ala Gln Tyr Thr Ala Pro Ser Ser Lys Phe Gly Thr Ser Thr
20 25 30
Gly Gln Tyr Gly Gln Pro Pro Ser Glu Val Pro Arg Gly Leu Gln Gln
35 40 45
Gly Ser Tyr Ala Glu Asp Val His Ser Ser Arg Ser Val Asn Pro Ser
50 55 60
Ser Gln Asn Gly Ile Pro Ser Gly His Phe Ser Ser Leu Ser Ser Asn
65 70 75 80
Tyr Gly Ala Pro Ser Ser Asp Tyr Ser Arg Ser Phe Leu Arg Tyr Gly
85 90 95
Thr Leu Ser Asn Lys Tyr Gly Val Pro Asn Ser Ala Leu Gly Ser Leu
100 105 110
Ser Ser Arg Asn Asn Lys Thr Pro Ala Thr Gln Leu Ser Tyr Gln Pro
115 120 125
Ser Ser His Tyr Asp Ser Arg Ser Thr Ser Glu Asp Gln Phe Ile Ser
130 135 140
Ser Arg Val Ser Asp Ser Gln Tyr Gly Ala Ser Ser Val Arg Arg Phe
145 150 155 160
Leu Pro Ser Ser Gln Tyr Ser Thr Pro Ser Ser Gln Tyr Gly Thr Pro
165 170 175
Ser Ser Gln Tyr Gly Thr Pro Ser Ser Gln Tyr Gly Thr Pro Ser Ser
180 185 190
Gln Tyr Gly Thr Pro Ser Ser Gln Tyr Gly Thr Pro Ser Ser Gln Tyr
195 200 205
Gly Thr Pro Ser Ser Gln Tyr Gly Thr Pro Ser Ser Gln Tyr Gly Thr
210 215 220
Pro Ser Ser Gln Tyr Gly Thr Pro Ser Ser Gln Tyr Gly Thr Pro Ser
225 230 235 240
Ser Pro Pro Ser Gln Tyr Gly Gly Pro Tyr Ser Met Arg Thr Ser Ala
245 250 255
Pro Asn Ser Gln Tyr Gly Thr Pro Ser Ser Phe Arg Thr Ser Pro Ser
260 265 270
Ser Gln Phe Gly Ser Ser Ser Ala His Ser Ser Ser Leu Ser Lys Phe
275 280 285
Arg Ser Val Pro Ser Ser Pro Tyr Gly Thr Leu Ser Ala Ile Arg Ser
290 295 300
Thr His Ser Ser Gln Tyr Gly Thr Pro Ser Ser Phe Ser Asp Ser Thr
305 310 315 320
Ser Ser Ser His Asn Gly Leu Pro Ser His Tyr Pro Gly Ser Gly Phe
325 330 335
Ser Gly Ser Ser Val Asn Asp Gln Lys Ser Tyr Thr Gly Asn Val Phe
340 345 350
Gly Gln Ser His Ser Arg Val Ala Asn Gly Asp Gln His Ala Arg Ser
355 360 365
Tyr Thr Leu Ala Gly Gly Asn Glu Ile Ser Glu Pro Ala Lys Tyr Asp
370 375 380
Phe Asn Tyr Asp Val Ser Asp Gly Glu Gln Gly Val Glu Phe Gly Gln
385 390 395 400
Glu Glu Ser Arg Asp Gly Glu Glu Thr Asn Gly Ser Tyr His Val Leu
405 410 415
Leu Pro Asp Gly Arg Arg Gln Arg Val Gln Tyr Thr Ala Gly Gln Tyr
420 425 430
Gly Tyr Lys Pro Thr Ile Ser Tyr Glu Asn Thr Gly Thr Leu Thr Thr
435 440 445
Gly Arg Gln Gln Phe Ser Asn Gly Phe Tyr Asn Val Gln Gln Ser Gly
450 455 460
Ser Glu Ser Gln Glu His Leu Gly Arg Ser Thr Gly Gln Asn Ser Tyr
465 470 475 480
Gly Gly Ser Asn Gly Tyr Glu Ser Gly Val Gly Tyr Gln Ser Gly Val
485 490 495
Gly Arg Arg Ser Arg Pro Ala Gly Ser Tyr
500 505
<210> 31
<211> 551
<212> PRT
<213> Solenopsis invicta
<400> 31
Arg Ser Glu Pro Pro Ile Asn Ser Tyr Leu Pro Pro Arg Ala Gly Ser
1 5 10 15
Ser Gly Ala Asn Gly Gly Arg Thr Asp Leu Thr Thr Gln Tyr Gly Ala
20 25 30
Pro Asp Phe Asn Asn Gly Gly Gly Ala Thr Ser Phe Ser Gly Asn Gly
35 40 45
Ala Gly Asp Gly Pro Ser Lys Leu Tyr Asp Val Pro Val Arg Gly Asn
50 55 60
Ala Gly Gly Asn Gly Leu Gly Arg Gly Asn Gly Phe Gly Gly Gly Gln
65 70 75 80
Pro Ser Ser Ser Tyr Gly Ala Pro Asn Gly Gly Ser Asn Glu Asn Arg
85 90 95
Gly Asn Gly Gly Arg Pro Ser Thr Ser Tyr Gly Val Pro Gly Ala Asn
100 105 110
Gly Asn Asn Gly Gly Gly Phe Gly Asn Gly Gly Asp Lys Gly Arg Pro
115 120 125
Ser Thr Ser Tyr Gly Val Pro Asp Ala Ser Gly Ser Ser Gln Gly Ser
130 135 140
Phe Gly Asn Val Gly Asn Gly Gly Arg Pro Ser Thr Asn Tyr Gly Val
145 150 155 160
Pro Gly Ala Asn Gly Asn Gly Gly Gly Phe Gly Asn Ala Ala Asn Glu
165 170 175
Gly Lys Pro Ser Thr Ser Tyr Gly Val Pro Gly Ala Asn Gly Asn Ser
180 185 190
Gln Gly Gly Phe Gly Asn Gly Gly Arg Pro Ser Thr Gly Tyr Gly Val
195 200 205
Pro Gly Ala Asn Gly Asn Asn Gly Gly Gly Phe Gly Gly Arg Pro Ser
210 215 220
Thr Ser Tyr Gly Ala Pro Gly Ala Asn Gly Asn His Arg Gly Gly Asn
225 230 235 240
Gly Gly Asn Ala Ser Pro Ser Thr Asn Tyr Gly Val Pro Gly Gly Asn
245 250 255
Asn Gly Asn Thr Asn Gly Lys Gly Arg Phe Asn Gly Gly Asn Ser Gly
260 265 270
Gly Gly Pro Ser Asn Asn Tyr Gly Val Pro Asn Glu Asn Ala Phe Gly
275 280 285
Gly Gly Leu Ser Thr Ser Tyr Gly Pro Pro Ser Arg Gly Gly Asn Gly
290 295 300
Asn Ser Gly Tyr Pro Ser Gly Gly Ser Asn Gly Gly Ser Phe Val Asn
305 310 315 320
Asn Gly Ala Asn Gly Tyr Pro Ser Gly Gly Pro Asn Gly Asn Ala Gly
325 330 335
Asn Phe Gly Asp Gly Arg Gly Gly Lys Gly Gly Gly Ser Ser Gly Glu
340 345 350
Gly Tyr Asn Asp Asn Ala Gln Glu Gly Ser Thr Glu Pro Ala Lys Tyr
355 360 365
Glu Phe Ser Tyr Lys Val Lys Asp Gln Gln Thr Gly Ser Glu Tyr Ser
370 375 380
His Thr Glu Thr Arg Asp Gly Asp Arg Ala Gln Gly Glu Phe Asn Val
385 390 395 400
Leu Leu Pro Asp Gly Arg Lys Gln Ile Val Glu Tyr Glu Ala Asp Gln
405 410 415
Asp Gly Phe Lys Pro Gln Ile Arg Tyr Glu Gly Glu Ala Asn Ala Gly
420 425 430
Gly Gly Tyr Ser Ser Gly Gly Ser Asn Asp Asn Asn Asp Gly Tyr Ser
435 440 445
Ser Gly Arg Pro Gly Ser Glu Ala Gly Gly Phe Ala Asn Asn Ser Gly
450 455 460
Phe Asn Gly Ser Gly Thr Asn Gly Gly Arg Ser Ser Gly Gly Pro Gly
465 470 475 480
Asp Gly Asn Pro Gly Gly Phe Asn Ser Gly Gly Gly Gly Gly Tyr Gln
485 490 495
Ser Gly Arg Pro Ala Gly Gln Ser Phe Gly Arg Asp Asn Asp Gly Gly
500 505 510
Leu Ser Gly Asp Ile Gly Gly Tyr Phe Ala Asn Ser Pro Ser Asn Asn
515 520 525
Ile Gly Gly Ser Asp Ser Ala Asn Val Gly Ser Asn Arg Gln Asn Gly
530 535 540
Gly Asn Gly Gly Tyr Gln Tyr
545 550
<210> 32
<211> 382
<212> PRT
<213> Culex quinquefasciatus
<400> 32
Lys Arg Glu Ala Pro Leu Pro Gly Gly Ser Tyr Leu Pro Pro Ser Asn
1 5 10 15
Gly Gly Gly Ala Gly Gly Tyr Pro Ala Ala Gly Pro Pro Ser Gly Ser
20 25 30
Tyr Gly Pro Pro Ser Asn Gly Asn Gly Asn Gly Asn Gly Ala Gly Gly
35 40 45
Tyr Pro Ser Ala Pro Ser Gln Gln Tyr Gly Ala Pro Ala Gly Gly Ala
50 55 60
Pro Ser Gln Gln Tyr Gly Ala Pro Ser Asn Gly Asn Gly Gly Ala Gly
65 70 75 80
Gly Tyr Pro Ser Ala Pro Ser Gln Gln Tyr Gly Ala Pro Asn Gly Asn
85 90 95
Gly Asn Gly Gly Phe Gly Gly Arg Pro Gln Ala Pro Ser Gln Gln Tyr
100 105 110
Gly Ala Pro Ser Asn Gly Asn Gly Gly Ala Arg Pro Ser Gln Gln Tyr
115 120 125
Gly Ala Pro Asn Gly Gly Asn Gly Asn Gly Arg Pro Gln Thr Pro Ser
130 135 140
Ser Gln Tyr Gly Ala Pro Ser Gly Gly Ala Pro Ser Ser Gln Tyr Gly
145 150 155 160
Ala Pro Ser Gly Gly Ala Pro Ser Gln Gln Tyr Gly Ala Pro Asn Gly
165 170 175
Gly Asn Gly Asn Gly Arg Pro Gln Thr Pro Ser Ser Gln Tyr Gly Ala
180 185 190
Pro Ser Gly Gly Ala Pro Ser Gln Gln Tyr Gly Ala Pro Asn Gly Gly
195 200 205
Asn Gly Asn Gly Arg Pro Gln Thr Pro Ser Ser Gln Tyr Gly Ala Pro
210 215 220
Ser Gly Gly Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ser Gly Gly Ala
225 230 235 240
Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gly Gly Ala Pro Ser Ser Gln
245 250 255
Tyr Gly Ala Pro Ala Gly Gly Ala Pro Ser Ser Gln Tyr Gly Ala Pro
260 265 270
Ala Gly Gly Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gly Gly Ala
275 280 285
Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gly Gly Ala Pro Ser Ser Gln
290 295 300
Tyr Gly Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gly Gly Ala Pro
305 310 315 320
Ser Ser Gln Tyr Gly Ala Pro Ala Gly Gly Ala Pro Ser Ser Gln Tyr
325 330 335
Gly Ala Pro Ser Gly Gly Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ser
340 345 350
Gly Gly Ala Pro Ser Ser Gln Tyr Gly Ala Pro Ala Gly Gly Ala Pro
355 360 365
Ser Ser Gln Tyr Gly Ala Pro Ser Gly Gly Ala Pro Ser Ser
370 375 380
<210> 33
<211> 491
<212> PRT
<213> Bactrocera cucurbitae
<400> 33
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Ser Ala Asn Gly
1 5 10 15
Asn Gly Asn Gly Gly Gly Arg Pro Ser Ser Gln Tyr Gly Ala Pro Gly
20 25 30
Leu Gly Ser Asn Ser Asn Gly Asn Gly Asn Gly Asn Gly Gly Gly Arg
35 40 45
Pro Ser Ser Gln Tyr Gly Val Pro Gly Leu Gly Gly Asn Gly Asn Gly
50 55 60
Asn Gly Asn Gly Gly Gly Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ala
65 70 75 80
Pro Gly Leu Gly Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly Gly Arg
85 90 95
Pro Ser Ser Gln Tyr Gly Val Pro Gly Leu Gly Gly Asn Gly Asn Gly
100 105 110
Asn Gly Asn Gly Asn Gly Gly Gly Arg Pro Ser Ser Thr Tyr Gly Ala
115 120 125
Pro Gly Leu Arg Gly Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly Arg
130 135 140
Pro Ser Ser Thr Tyr Gly Ala Pro Gly Leu Gly Gly Asn Gly Asn Gly
145 150 155 160
Asn Gly Asn Gly Asn Gly Arg Pro Ser Ser Thr Tyr Gly Ala Pro Gly
165 170 175
Leu Gly Gly Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly Arg Pro Ser
180 185 190
Ser Thr Tyr Gly Ala Pro Gly Leu Asn Gly Asn Gly Leu Gly Gly Gly
195 200 205
Gln Lys Pro Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly Asn Gly Asn
210 215 220
Gly Tyr Ser Asn Gly Gly Asn Gly Asn Gly Asn Gly Gly Gly Arg Pro
225 230 235 240
Gly Gln Glu Tyr Leu Pro Pro Gly Arg Asn Gly Asn Gly Asn Gly Asn
245 250 255
Gly Gly Arg Gly Asn Gly Asn Gly Gly Gly Ala Asn Gly Tyr Asp Tyr
260 265 270
Ser Gln Gly Gly Ser Asp Ser Gly Glu Ser Gly Ile Val Asp Tyr Glu
275 280 285
Ala Asp Gln Gly Gly Tyr Arg Pro Gln Ile Arg Tyr Glu Gly Glu Ala
290 295 300
Asn Asn Gly Ala Gly Gly Leu Gly Gly Gly Ala Gly Gly Ala Asn Gly
305 310 315 320
Tyr Asp Tyr Glu Gln Asn Gly Asn Gly Leu Gly Gly Gly Asn Gly Tyr
325 330 335
Ser Asn Gly Gln Asp Leu Gly Ser Asn Gly Tyr Ser Ser Gly Arg Pro
340 345 350
Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly Asn Gly Tyr Ser
355 360 365
Gly Arg Asn Gly Lys Gly Arg Asn Gly Asn Gly Gly Gly Gln Gly Leu
370 375 380
Gly Arg Asn Gly Tyr Ser Asp Gly Arg Pro Ser Gly Gln Asp Leu Gly
385 390 395 400
Asp Asn Gly Tyr Ala Ser Gly Arg Pro Gly Gly Asn Gly Asn Gly Asn
405 410 415
Gly Gly Asn Gly Asn Gly Tyr Ser Asn Gly Asn Gly Tyr Ser Asn Gly
420 425 430
Asn Gly Asn Gly Thr Gly Asn Gly Gly Gly Gln Tyr Asn Gly Asn Gly
435 440 445
Asn Gly Tyr Ser Asp Gly Arg Pro Gly Gly Gln Asp Asn Leu Asp Gly
450 455 460
Gln Gly Tyr Ser Ser Gly Arg Pro Asn Gly Phe Gly Pro Gly Gly Gln
465 470 475 480
Asn Gly Asp Asn Asp Gly Asn Gly Tyr Arg Tyr
485 490
<210> 34
<211> 770
<212> PRT
<213> Trichogramma pretiosum
<400> 34
Arg Pro Glu Pro Pro Val Asn Ser Tyr Leu Pro Pro Gly Gln Gly Gly
1 5 10 15
Gln Gly Gly Phe Gly Gly Ser Gly Gly Arg Pro Gly Gly Gly Ser Pro
20 25 30
Ser Asn Gln Tyr Gly Pro Pro Asn Phe Gln Asn Gly Gly Gly Gln Asn
35 40 45
Gly Gly Ser Gly Phe Gly Gly Asn Gly Asn Gly Asn Ser Phe Gly Pro
50 55 60
Pro Ser Asn Ser Tyr Gly Pro Pro Glu Phe Gly Ser Pro Gly Ala Gly
65 70 75 80
Ser Phe Gly Gly Gly Arg Pro Gln Asp Thr Tyr Gly Pro Pro Ser Asn
85 90 95
Gly Asn Gly Asn Gly Asn Gly Phe Gly Gly Asn Gly Asn Gly Gly Gly
100 105 110
Arg Pro Ser Ser Arg Pro Ser Asp Ser Tyr Gly Pro Pro Ser Ser Gly
115 120 125
Asn Gly Phe Gly Gly Gly Asn Ser Gly Arg Pro Ser Glu Ser Tyr Gly
130 135 140
Pro Pro Gln Asn Gly Gly Gly Ser Gly Asn Gly Asn Gln Gly Gly Gly
145 150 155 160
Asn Gly Phe Gly Asn Gly Gly Gly Arg Gly Gly Gln Gly Lys Pro Ser
165 170 175
Asp Ser Tyr Gly Pro Pro Asn Ser Gly Asn Arg Pro Gly Ser Ser Asn
180 185 190
Gly Gly Gly Gln Gln Gln Asn Gly Phe Gly Gly Gly Asn Gly Gly Arg
195 200 205
Pro Ser Asn Thr Tyr Gly Pro Pro Gly Gly Gly Asn Gly Gly Gly Arg
210 215 220
Pro Gly Gly Ser Ser Gly Gly Phe Gly Gly Gln Asn Gly Gly Arg Pro
225 230 235 240
Ser Asp Ser Tyr Gly Pro Pro Ser Asn Gly Asn Gly Asn Gly Gly Arg
245 250 255
Pro Ser Asn Asn Tyr Gly Pro Pro Asn Ser Gly Gly Gly Asn Gly Asn
260 265 270
Gly Phe Gly Gly Ser Asn Gly Lys Pro Ser Asn Ser Tyr Gly Pro Pro
275 280 285
Ser Asn Gly Asn Gly Gly Gly Phe Gly Gly Ser Asn Gly Arg Pro Ser
290 295 300
Asn Ser Tyr Gly Pro Pro Ser Gly Gly Asn Gly Gly Gly Phe Gly Gly
305 310 315 320
Ser Ser Ala Val Gly Arg Pro Gly Asn Ser Gly Ser Pro Ser Ser Ser
325 330 335
Gly Ser Gly Phe Gly Gly Asn Gly Gly Ala Ser Arg Pro Ser Ser Ser
340 345 350
Tyr Gly Pro Pro Ser Asn Gly Gly Gly Phe Gly Asn Gly Gly Gly Ser
355 360 365
Asn Gly Arg Pro Ser Ser Ser Tyr Gly Pro Pro Asn Ser Gly Ser Asn
370 375 380
Gly Gly Gly Phe Gly Gly Gln Asn Gly Asn Gly Arg Gln Asn Gly Asn
385 390 395 400
Asn Gly Gln Gly Gly Phe Gly Gly Gln Pro Ser Ser Ser Tyr Gly Pro
405 410 415
Pro Ser Asn Gly Asn Gly Phe Gly Gly Gly Gly Gly Ser Asn Gly Tyr
420 425 430
Pro Gln Asn Ser Gln Gly Gly Asn Gly Asn Gly Phe Gly Gln Gly Ser
435 440 445
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Pro Pro Ser Asn Gly Gly Gly
450 455 460
Gly Gly Asp Asn Gly Tyr Ser Ser Gly Gly Pro Gly Gly Phe Gly Gly
465 470 475 480
Gln Pro Gln Asp Ser Tyr Gly Pro Pro Pro Ser Gly Ala Val Asp Gly
485 490 495
Asn Asn Gly Phe Ser Ser Gly Gly Ser Ser Gly Asp Asn Asn Gly Tyr
500 505 510
Ser Ser Gly Gly Pro Gly Gly Asn Gly Phe Glu Asp Gly Asn Asp Glu
515 520 525
Pro Ala Lys Tyr Glu Phe Ser Tyr Glu Val Lys Asp Glu Gln Ser Gly
530 535 540
Ser Ser Phe Gly His Thr Glu Met Arg Asp Gly Asp Arg Ala Gln Gly
545 550 555 560
Glu Phe Asn Val Leu Leu Pro Asp Gly Arg Lys Gln Ile Val Glu Tyr
565 570 575
Glu Ala Asp Gln Asp Gly Phe Lys Pro Gln Ile Arg Tyr Glu Gly Glu
580 585 590
Ala Asn Thr Gly Gly Ala Gly Gly Tyr Pro Ser Gly Gly Pro Gly Gly
595 600 605
Gln Gly Gly Asn Gly Asn Gly Gly Tyr Pro Ser Gly Gly Pro Ser Asn
610 615 620
Gly Gly Phe Gly Gly Gln Asn Gly Gly Gly Asn Gly Gly Tyr Pro Ser
625 630 635 640
Gly Gly Pro Ser Gly Gly Gly Phe Gly Gly Gln Asn Gly Gly Ser Gly
645 650 655
Gly Tyr Pro Ser Gly Gly Pro Ser Gly Gly Gly Phe Gly Gly Gln Gly
660 665 670
Gly Phe Gly Gly Gln Asn Ser Gly Gly Asn Gly Gly Tyr Ser Ser Gly
675 680 685
Gly Pro Ala Ser Gly Gly Phe Gly Gly Gln Asn Gly Gly Asn Gly Gly
690 695 700
Tyr Pro Ser Gly Gly Pro Ser Gly Gly Gly Phe Gly Gly Gln Gly Gly
705 710 715 720
Phe Gly Gly Gln Asn Ser Gly Gly Asn Gly Gly Tyr Pro Ser Gly Gly
725 730 735
Pro Ser Ser Gly Gly Phe Gly Gly Gln Asn Gly Gly Gly Gly Gly Asn
740 745 750
Tyr Pro Ala Gly Ser Gly Gly Asp Ala Glu Ala Asn Gly Gly Tyr Gln
755 760 765
Tyr Ser
770
<210> 35
<211> 280
<212> PRT
<213> Drosophila sechellia
<400> 35
Gln Ser Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly
1 5 10 15
Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln
20 25 30
Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly Gly Lys Pro Ser
35 40 45
Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
50 55 60
Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
65 70 75 80
Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp
85 90 95
Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
100 105 110
Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Asn Gly Asn Gly
115 120 125
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
130 135 140
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg
145 150 155 160
Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Asn Gly Gly Arg
165 170 175
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro
180 185 190
Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Ser Gly
195 200 205
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln Gly Gln Gly Gly
210 215 220
Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Asn Gln
225 230 235 240
Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly Asn Gly Ser Ala
245 250 255
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Pro Gly Gly
260 265 270
Arg Pro Ser Asp Ser Tyr Gly Pro
275 280
<210> 36
<211> 280
<212> PRT
<213> Drosophila sechellia
<400> 36
Gln Ser Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly
1 5 10 15
Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln
20 25 30
Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly Gly Lys Pro Ser
35 40 45
Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
50 55 60
Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
65 70 75 80
Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp
85 90 95
Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
100 105 110
Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Asn Gly Asn Gly
115 120 125
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
130 135 140
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg
145 150 155 160
Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Asn Gly Gly Arg
165 170 175
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro
180 185 190
Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Ser Gly
195 200 205
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln Gly Gln Gly Gly
210 215 220
Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Asn Gln
225 230 235 240
Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly Asn Gly Ser Ala
245 250 255
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Pro Gly Gly
260 265 270
Arg Pro Ser Asp Ser Tyr Gly Pro
275 280
<210> 37
<211> 280
<212> PRT
<213> Drosophila sechellia
<400> 37
Gln Ser Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly
1 5 10 15
Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln
20 25 30
Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly Gly Lys Pro Ser
35 40 45
Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
50 55 60
Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
65 70 75 80
Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp
85 90 95
Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
100 105 110
Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Asn Gly Asn Gly
115 120 125
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
130 135 140
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg
145 150 155 160
Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Asn Gly Gly Arg
165 170 175
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro
180 185 190
Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Ser Gly
195 200 205
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln Gly Gln Gly Gly
210 215 220
Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Asn Gln
225 230 235 240
Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly Asn Gly Ser Ala
245 250 255
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Pro Gly Gly
260 265 270
Arg Pro Ser Asp Ser Tyr Gly Pro
275 280
<210> 38
<211> 280
<212> PRT
<213> Drosophila sechellia
<400> 38
Gln Ser Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly
1 5 10 15
Gly Gly Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln
20 25 30
Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly Gly Lys Pro Ser
35 40 45
Asp Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
50 55 60
Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
65 70 75 80
Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp
85 90 95
Thr Tyr Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro
100 105 110
Ser Ser Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Asn Gly Asn Gly
115 120 125
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
130 135 140
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg
145 150 155 160
Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Asn Gly Gly Arg
165 170 175
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro
180 185 190
Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Ser Gly
195 200 205
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln Gly Gln Gly Gly
210 215 220
Phe Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Asn Gln
225 230 235 240
Lys Pro Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly Asn Gly Ser Ala
245 250 255
Gly Arg Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Pro Gly Gly
260 265 270
Arg Pro Ser Asp Ser Tyr Gly Pro
275 280
<210> 39
<211> 162
<212> PRT
<213> Drosophila sechellia
<400> 39
Tyr Ser Ser Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly
1 5 10 15
Tyr Ser Ser Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr
20 25 30
Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser
35 40 45
Asn Val Lys Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly
50 55 60
Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly
65 70 75 80
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg
85 90 95
Pro Gly Gly Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile
100 105 110
Gly Gly Arg Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser
115 120 125
Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser
130 135 140
Gly Arg Pro Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp
145 150 155 160
Gly Gln
<210> 40
<211> 162
<212> PRT
<213> Drosophila sechellia
<400> 40
Tyr Ser Ser Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly
1 5 10 15
Tyr Ser Ser Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr
20 25 30
Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser
35 40 45
Asn Val Lys Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly
50 55 60
Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly
65 70 75 80
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg
85 90 95
Pro Gly Gly Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile
100 105 110
Gly Gly Arg Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser
115 120 125
Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser
130 135 140
Gly Arg Pro Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp
145 150 155 160
Gly Gln
<210> 41
<211> 162
<212> PRT
<213> Drosophila sechellia
<400> 41
Tyr Ser Ser Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly
1 5 10 15
Tyr Ser Ser Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr
20 25 30
Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser
35 40 45
Asn Val Lys Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly
50 55 60
Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly
65 70 75 80
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg
85 90 95
Pro Gly Gly Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile
100 105 110
Gly Gly Arg Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser
115 120 125
Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser
130 135 140
Gly Arg Pro Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp
145 150 155 160
Gly Gln
<210> 42
<211> 162
<212> PRT
<213> Drosophila sechellia
<400> 42
Tyr Ser Ser Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly
1 5 10 15
Tyr Ser Ser Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr
20 25 30
Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser
35 40 45
Asn Val Lys Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly
50 55 60
Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly
65 70 75 80
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg
85 90 95
Pro Gly Gly Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile
100 105 110
Gly Gly Arg Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser
115 120 125
Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser
130 135 140
Gly Arg Pro Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp
145 150 155 160
Gly Gln
<210> 43
<211> 162
<212> PRT
<213> Drosophila sechellia
<400> 43
Tyr Ser Ser Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly
1 5 10 15
Tyr Ser Ser Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr
20 25 30
Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser
35 40 45
Asn Val Lys Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly
50 55 60
Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly
65 70 75 80
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg
85 90 95
Pro Gly Gly Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile
100 105 110
Gly Gly Arg Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser
115 120 125
Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser
130 135 140
Gly Arg Pro Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp
145 150 155 160
Gly Gln
<210> 44
<211> 162
<212> PRT
<213> Drosophila sechellia
<400> 44
Tyr Ser Ser Gly Arg Pro Gly Asn Gly Asn Gly Asn Gly Asn Gly Gly
1 5 10 15
Tyr Ser Ser Gly Arg Pro Gly Gly Gln Asp Leu Gly Pro Ser Gly Tyr
20 25 30
Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Gly Tyr Ser
35 40 45
Asn Val Lys Pro Gly Gly Gln Asp Leu Gly Pro Gly Gly Tyr Ser Gly
50 55 60
Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Gly Gly
65 70 75 80
Arg Pro Gly Gly Gln Asp Leu Gly Ala Gly Ala Tyr Ser Asn Gly Arg
85 90 95
Pro Gly Gly Asn Gly Asn Gly Gly Ser Asp Gly Gly Arg Val Ile Ile
100 105 110
Gly Gly Arg Val Ile Gly Gly Gln Asp Gly Gly Asp Gln Gly Tyr Ser
115 120 125
Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Arg Asp Gly Tyr Ser Ser
130 135 140
Gly Arg Pro Gly Gly Arg Pro Gly Gly Asn Gly Gln Asp Ser Gln Asp
145 150 155 160
Gly Gln
<210> 45
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 45
Gly Asp Tyr Lys Asp Asp Asp Asp Lys Asp Tyr Lys Asp Asp Asp Asp
1 5 10 15
Lys Asp Tyr Lys Asp Asp Asp Asp Lys
20 25
<210> 46
<211> 85
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 46
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg
85
<210> 47
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 47
Glu Ala Glu Ala
1
<210> 48
<211> 2
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 48
Ser Gly
1
<210> 49
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (2)..(3)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Any amino acid
<400> 49
Ser Xaa Xaa Tyr Gly Xaa Pro
1 5
<210> 50
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 50
Gly Gly Gly Gly
1
<210> 51
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 51
Asn Gly Asn Gly
1
<210> 52
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 52
Gly Gln Gly Gly
1
<210> 53
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 53
Gly Gln Gly Asn
1
<210> 54
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 54
Gly Gln Gly Gln
1
<210> 55
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 55
Gly Gln Gly Gln Gly
1 5
<210> 56
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 56
Arg Pro Gly Gly Gln
1 5
<210> 57
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 57
Arg Pro Gly Gly Asn
1 5
<210> 58
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 58
Gly Gly Ser Phe
1
<210> 59
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 59
Gly Asn Gly Gly
1
<210> 60
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 60
Gly Gly Ala Gly Gly
1 5
<210> 61
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (1)..(2)
<223> Any amino acid
<400> 61
Xaa Xaa Glu Pro Pro Val Ser Tyr Leu Pro Pro Ser
1 5 10
<210> 62
<211> 4
<212> PRT
<213> Drosophila sechellia
<400> 62
Gly Arg Pro Glu
1
<210> 63
<211> 722
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 63
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg Glu Ala Glu Ala Gly Arg Pro Glu Pro Pro Val
85 90 95
Asn Ser Tyr Leu Pro Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Ser
100 105 110
Gly Ala Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly
115 120 125
Asn Gly Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Gly Gln
130 135 140
Gly Gln Gly Gln Gly Gln Gly Gly Tyr Gly Gly Lys Pro Ser Asp Ser
145 150 155 160
Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro Ser Ser
165 170 175
Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr
180 185 190
Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr
195 200 205
Gly Ala Pro Gly Gly Gly Gly Asn Gly Asn Gly Gly Arg Pro Ser Ser
210 215 220
Ser Tyr Gly Ala Pro Gly Gln Gly Gln Gly Asn Gly Asn Gly Gly Arg
225 230 235 240
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro
245 250 255
Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
260 265 270
Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Asn Gly Gly Arg Pro Ser
275 280 285
Ser Ser Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp
290 295 300
Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Asn Gly Ser Gly Gly Arg
305 310 315 320
Pro Ser Ser Ser Tyr Gly Ala Pro Ala Gln Gly Gln Gly Gly Phe Gly
325 330 335
Gly Arg Pro Ser Asp Ser Tyr Gly Ala Pro Gly Gln Asn Gln Lys Pro
340 345 350
Ser Asp Ser Tyr Gly Ala Pro Gly Ser Gly Asn Gly Ser Ala Gly Arg
355 360 365
Pro Ser Ser Ser Tyr Gly Ala Pro Gly Ser Gly Pro Gly Gly Arg Pro
370 375 380
Ser Asp Ser Tyr Gly Pro Pro Ala Ser Gly Ser Gly Ala Gly Gly Ala
385 390 395 400
Gly Gly Ser Gly Pro Gly Gly Ala Asp Tyr Asp Asn Asp Glu Pro Ala
405 410 415
Lys Tyr Glu Phe Asn Tyr Gln Val Glu Asp Ala Pro Ser Gly Leu Ser
420 425 430
Phe Gly His Ser Glu Met Arg Asp Gly Asp Phe Thr Thr Gly Gln Tyr
435 440 445
Asn Val Leu Leu Pro Asp Gly Arg Lys Gln Ile Val Glu Tyr Glu Ala
450 455 460
Asp Gln Gln Gly Tyr Arg Pro Gln Ile Arg Tyr Glu Gly Asp Ala Asn
465 470 475 480
Asp Gly Ser Gly Pro Ser Gly Pro Ser Gly Pro Gly Gly Pro Gly Gly
485 490 495
Gln Asn Leu Gly Ala Asp Gly Tyr Ser Ser Gly Arg Pro Gly Asn Gly
500 505 510
Asn Gly Asn Gly Asn Gly Gly Tyr Ser Ser Gly Arg Pro Gly Gly Gln
515 520 525
Asp Leu Gly Pro Ser Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp
530 535 540
Leu Gly Ala Gly Gly Tyr Ser Asn Val Lys Pro Gly Gly Gln Asp Leu
545 550 555 560
Gly Pro Gly Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly
565 570 575
Arg Asp Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu Gly Ala
580 585 590
Gly Ala Tyr Ser Asn Gly Arg Pro Gly Gly Asn Gly Asn Gly Gly Ser
595 600 605
Asp Gly Gly Arg Val Ile Ile Gly Gly Arg Val Ile Gly Gly Gln Asp
610 615 620
Gly Gly Asp Gln Gly Tyr Ser Gly Gly Arg Pro Gly Gly Gln Asp Leu
625 630 635 640
Gly Arg Asp Gly Tyr Ser Ser Gly Arg Pro Gly Gly Arg Pro Gly Gly
645 650 655
Asn Gly Gln Asp Ser Gln Asp Gly Gln Gly Tyr Ser Ser Gly Arg Pro
660 665 670
Gly Gln Gly Gly Arg Asn Gly Phe Gly Pro Gly Gly Gln Asn Gly Asp
675 680 685
Asn Asp Gly Ser Gly Tyr Arg Tyr Ser Gly Asp Tyr Lys Asp Asp Asp
690 695 700
Asp Lys Asp Tyr Lys Asp Asp Asp Asp Lys Asp Tyr Lys Asp Asp Asp
705 710 715 720
Asp Lys
Claims (68)
- 発酵物中で組換え宿主細胞の集団を培養する工程であって、該組換え宿主細胞が、分泌型レジリンコード配列を含むベクターを含み、かつ該組換え宿主細胞が、該分泌型レジリンコード配列によってコードされた組換えレジリンタンパク質を分泌する、該工程;および
該発酵物から該組換えレジリンタンパク質を精製する工程
を含む、組換えレジリンタンパク質を含む組成物を作製するための方法。 - 前記組換えレジリンタンパク質が、全長または短縮型のネイティブレジリンである、請求項1に記載の方法。
- 前記ネイティブレジリンが、セイシェルショウジョウバエ(Drosophila sechellia)、パナマハキリアリ(Acromyrmex echinatior)、ヤンマ(Aeshna)、ノサシバエ(Haematobia irritans)、ネコノミ(Ctenocephalides felis)、セイヨウオオマルハナバチ(Bombus terrestris)、コクヌストモドキ(Tribolium castaneum)、ミツバチ(Apis mellifera)、キョウソヤドリコバチ(Nasonia vitripennis)、コロモジラミ(Pediculus humanus corporis)、ガンビアハマダラカ(Anopheles gambiae)、グロッシーナ・モーシタンス(Glossina morsitans)、アッタ・セファロテス(Atta cephalotes)、アノフェレス・ダーリンジ(Anopheles darlingi)、エンドウヒゲナガアブラムシ(Acyrthosiphon pisum)、クロショウジョウバエ(Drosophila virilis)、キリシマキノコショウジョウバエ(Drosophila erecta)、スナバエ(Lutzomyia longipalpis)、オオサシガメ(Rhodnius prolixus)、ヒアリ(Solenopsis invicta)、ネッタイイエカ(Culex quinquefasciatus)、ウリミバエ(Bactrocera cucurbitae)、およびトリコグラムマ・プレチオスム(Trichogramma pretiosum)からなる群より選択される生物に由来する、請求項1に記載の方法。
- 前記組換えレジリンタンパク質がSEQ ID NO:1を含む、請求項1に記載の方法。
- 前記組換えレジリンタンパク質がSEQ ID NO:4を含む、請求項1に記載の方法。
- 前記組換えレジリンタンパク質がα接合因子分泌シグナルを含む、請求項1に記載の方法。
- 前記組換えレジリンタンパク質がFLAGタグを含む、請求項1に記載の方法。
- 前記ベクターが、複数の分泌型レジリンコード配列を含む、請求項1に記載の方法。
- 前記組換え宿主細胞が酵母細胞である、請求項1に記載の方法。
- 前記酵母細胞がメチロトローフ酵母細胞である、請求項9に記載の方法。
- 前記組換え宿主細胞が、ピキア(コマガテラ)パストリス(Pichia (Komagataella) pastoris)、ハンゼヌラ・ポリモルファ(Hansenula polymorpha)、アークスラ・アデニニボランス(Arxula adeninivorans)、ヤロウイア・リポリチカ(Yarrowia lipolytica)、ピキア(シェフェルソミセス)スチピチス(Pichia (Scheffersomyces) stipitis)、ピキア・メタノリカ(Pichia methanolica)、サッカロミセス・セレビシエ(Saccharomyces cerevisiae)、およびクルイベロミセス・ラクチス(Kluyveromyces lactis)からなる群より選択される種である、請求項1に記載の方法。
- 前記組換え宿主細胞が、2mg レジリン/g乾燥細胞重量/時間を上回る速度で前記組換えレジリンを産生する、請求項1に記載の方法。
- 前記組換え宿主細胞が前記組換えレジリンの分泌型画分を産生し、該分泌型画分が、該組換え宿主細胞によって発現された組換えレジリン全タンパク質と比較して50%超である、請求項1に記載の方法。
- 前記組換え宿主細胞が、2mg レジリン/g乾燥細胞重量/時間を上回る速度で前記組換えレジリンを分泌する、請求項1に記載の方法。
- 80%超の前記組換えレジリンが、前記発酵物中の前記組換え宿主細胞の外部に存在する、請求項1に記載の方法。
- 前記発酵物が、1L当たり少なくとも2gの組換えレジリンを含む、請求項1に記載の方法。
- 前記組換えレジリンタンパク質を精製する工程が、
前記発酵物を遠心分離することによって、第1のペレット画分および第1の上清画分を生成すること;ならびに
該第1のペレット画分から該組換えレジリンタンパク質を単離すること
を含む、請求項1に記載の方法。 - 前記組換えレジリンタンパク質を精製する工程が、
該組換えレジリンタンパク質が可溶である溶液を生成するために、前記第1のペレット画分にカオトロープを添加すること;
該カオトロープを含む該第1のペレット画分を遠心分離することによって、第2の上清画分および第2のペレット画分を生成すること;ならびに
該第2の上清画分から可溶性全長レジリンを単離すること
をさらに含む、請求項17に記載の方法。 - 分泌型レジリンコード配列を含むベクター。
- 前記分泌型レジリンコード配列が、全長または短縮型のネイティブレジリンをコードする、請求項19に記載のベクター。
- 前記分泌型レジリンコード配列が、改変された全長または短縮型のネイティブレジリンをコードする、請求項19に記載のベクター。
- 前記改変されたレジリンが、アミノ酸残基の付加を含むか、アミノ酸残基の削除を含むか、アミノ酸残基の置換を含むか、またはアミノ酸残基の位置の変更を含み、該アミノ酸残基が別のレジリンと架橋することができる、請求項21に記載のベクター。
- 前記全長または短縮型のネイティブレジリンが、セイシェルショウジョウバエ、パナマハキリアリ、ヤンマ、ノサシバエ、ネコノミ、セイヨウオオマルハナバチ、コクヌストモドキ、ミツバチ、キョウソヤドリコバチ、コロモジラミ、ガンビアハマダラカ、グロッシーナ・モーシタンス、アッタ・セファロテス、アノフェレス・ダーリンジ、エンドウヒゲナガアブラムシ、クロショウジョウバエ、キリシマキノコショウジョウバエ、スナバエ、オオサシガメ、ヒアリ、ネッタイイエカ、ウリミバエ、およびトリコグラムマ・プレチオスムからなる群より選択される生物に由来する、請求項20~22のいずれか一項に記載のベクター。
- 前記分泌型レジリンコード配列が、SEQ ID NO:1を含むポリペプチドをコードする、請求項23に記載のベクター。
- 前記分泌型レジリンコード配列が、SEQ ID NO:4を含むポリペプチドをコードする、請求項23に記載のベクター。
- 前記分泌型レジリンコード配列が、1つまたは複数のAリピートまたは準Aリピートを含む組換えレジリンをコードする、請求項19に記載のベクター。
- 前記分泌型レジリンコード配列が、1つまたは複数のBリピートまたは準Bリピートを含む組換えレジリンをコードする、請求項19に記載のベクター。
- 前記分泌型レジリンコード配列が組換えレジリンをコードし、該組換えレジリンが、1つもしくは複数のAリピートもしくは準Aリピート、または1つもしくは複数のBリピートもしくは準Bリピートのいずれか一方のみを含む、請求項19に記載のベクター。
- 前記分泌型レジリンコード配列が、1つまたは複数のAリピートまたは準Aリピートと1つまたは複数のBリピートまたは準Bリピートとを含む組換えレジリンをコードする、請求項19に記載のベクター。
- 前記組換えレジリンがキチン結合ドメインをさらに含む、請求項26~29のいずれか一項に記載のベクター。
- 前記分泌型レジリンコード配列が、α接合因子分泌シグナルを含むポリペプチドをコードする、請求項19~30のいずれか一項に記載のベクター。
- 前記分泌型レジリンコード配列がFLAGタグを含む、請求項19~30のいずれか一項に記載のベクター。
- 複数の分泌型レジリンコード配列を含む、請求項19~32のいずれか一項に記載のベクター。
- 3つの分泌型レジリンコード配列を含む、請求項33に記載のベクター。
- 前記分泌型レジリンコード配列が、構成性または誘導性のプロモーターに機能的に連結されている、請求項19~34のいずれか一項に記載のベクター。
- 請求項19~35のいずれか一項に記載のベクターを1つまたは複数含む、組換え宿主細胞。
- 酵母細胞である、請求項36に記載の組換え宿主細胞。
- 前記酵母細胞がメチロトローフ酵母細胞である、請求項37に記載の組換え宿主細胞。
- ピキア(コマガテラ)パストリス、ハンゼヌラ・ポリモルファ、アークスラ・アデニニボランス、ヤロウイア・リポリチカ、ピキア(シェフェルソミセス)スチピチス、ピキア・メタノリカ、サッカロミセス・セレビシエ、およびクルイベロミセス・ラクチスからなる群より選択される種である、請求項38に記載の組換え宿主細胞。
- 請求項19~35のいずれか一項に記載のベクターを3つ含む、請求項36に記載の組換え宿主細胞。
- 2mg レジリン/g乾燥細胞重量/時間を上回る速度で組換えレジリンを産生する、請求項36~40のいずれか一項に記載の組換え宿主細胞。
- 前記組換え宿主細胞が組換えレジリンの分泌型画分を有し、該分泌型画分が50%超である、請求項36~41のいずれか一項に記載の組換え宿主細胞。
- 2mg レジリン/g乾燥細胞重量/時間を上回る速度でレジリンを分泌する、請求項36~42のいずれか一項に記載の組換え宿主細胞。
- 請求項36~43のいずれか一項に記載の組換え宿主細胞と該組換え宿主細胞を増殖させるのに適した培養用培地とを含む、発酵物。
- 1L当たり少なくとも2gの組換えレジリンを含む、請求項44に記載の発酵物。
- 80%超の組換えレジリンが、前記組換え宿主細胞の外部に存在する、請求項44に記載の発酵物。
- 前記組換えレジリンが全長組換えレジリンである、請求項44~46のいずれか一項に記載の発酵物。
- 請求項44~47のいずれか一項に記載の発酵物から得られた組換えレジリンを含む、組成物。
- 少なくとも60重量%の組換えレジリンを含む、請求項48に記載の組成物。
- ほぼ同じ量のネイティブレジリンを含む組成物と比較して類似した特性を有する、請求項48に記載の組成物。
- ほぼ同じ量のネイティブレジリンを含む組成物と比較して異なる特性を有する、請求項48に記載の組成物。
- 50%超の弾性エネルギーを有する、請求項48に記載の組成物。
- 10MPa未満の圧縮弾性率を有する、請求項48に記載の組成物。
- 10MPa未満の引張弾性率を有する、請求項48に記載の組成物。
- 1MPa未満の剪断弾性率を有する、請求項48に記載の組成物。
- 1%超の破断伸び(extension to break)を有する、請求項48に記載の組成物。
- 0.1kPa超の最大引張強さを有する、請求項48に記載の組成物。
- 90未満のショア00硬度を有する、請求項48に記載の組成物。
- 全長レジリンを含む、請求項48に記載の組成物。
- 組換えレジリンの分泌を促進する条件下で発酵物を作製するために請求項36~42のいずれか一項に記載の組換え宿主細胞を培養する工程を含む、請求項48~59のいずれか一項に記載の組成物を作製するための方法。
- 全長ネイティブレジリンを作製するために前記組換えレジリンを精製する工程をさらに含む、請求項60に記載の方法。
- 全長ネイティブレジリンを作製するために前記組換えレジリンを精製する工程が、
前記発酵物を遠心分離することによって、第1のペレット画分および第1の上清画分を生成すること;ならびに
該第1のペレット画分から組換えレジリンタンパク質を単離すること
を含む、請求項61に記載の方法。 - 前記第1のペレット画分から前記組換えレジリンタンパク質を単離することが、
該組換えレジリンタンパク質が可溶である溶液を生成するために、該第1のペレット画分にカオトロープを添加すること;
該カオトロープを含む該第1のペレット画分を遠心分離することによって、第2の上清画分および第2のペレット画分を生成すること;ならびに
該第2の上清画分から該組換えレジリンタンパク質を単離すること
を含む、請求項62に記載の方法。 - 複数の前記組換えレジリンを架橋する工程をさらに含む、請求項60~63のいずれか一項に記載の方法。
- 前記架橋が酵素的架橋である、請求項64に記載の方法。
- 前記架橋が光化学的架橋である、請求項64に記載の方法。
- 前記組換えレジリンタンパク質が全長レジリンタンパク質を含む、請求項60~66のいずれか一項に記載の方法。
- 培養用培地と組換え宿主細胞とを含む発酵物であって、
該組換え宿主細胞がベクターを含み、該ベクターが分泌型レジリンコード配列を含み、かつ該組換え宿主細胞が、少なくとも2mg/g乾燥細胞重量/時間の速度で組換えレジリンを分泌する、該発酵物。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762446230P | 2017-01-13 | 2017-01-13 | |
US62/446,230 | 2017-01-13 | ||
PCT/US2018/013839 WO2018132821A2 (en) | 2017-01-13 | 2018-01-16 | Elastomeric proteins |
JP2019538182A JP2020503882A (ja) | 2017-01-13 | 2018-01-16 | エラストマータンパク質 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019538182A Division JP2020503882A (ja) | 2017-01-13 | 2018-01-16 | エラストマータンパク質 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023162366A true JP2023162366A (ja) | 2023-11-08 |
Family
ID=62839519
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019538182A Pending JP2020503882A (ja) | 2017-01-13 | 2018-01-16 | エラストマータンパク質 |
JP2023140621A Pending JP2023162366A (ja) | 2017-01-13 | 2023-08-31 | エラストマータンパク質 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019538182A Pending JP2020503882A (ja) | 2017-01-13 | 2018-01-16 | エラストマータンパク質 |
Country Status (4)
Country | Link |
---|---|
US (3) | US10988515B2 (ja) |
EP (1) | EP3568408A4 (ja) |
JP (2) | JP2020503882A (ja) |
WO (1) | WO2018132821A2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020503882A (ja) | 2017-01-13 | 2020-02-06 | ボルト スレッズ インコーポレイテッド | エラストマータンパク質 |
US11178934B2 (en) * | 2018-07-18 | 2021-11-23 | Bolt Threads Inc. | Resilin material footwear and fabrication methods |
US11993068B2 (en) | 2022-04-15 | 2024-05-28 | Spora Cayman Holdings Limited | Mycotextiles including activated scaffolds and nano-particle cross-linkers and methods of making them |
WO2023220628A1 (en) | 2022-05-11 | 2023-11-16 | Conagen Inc. | Resilin-silica binding domain fusion proteins for biomaterial formation |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL82935A0 (en) * | 1986-08-12 | 1987-12-20 | Phillips Petroleum Co | Secretion of heterologous proteins from yeast |
US5268273A (en) * | 1990-12-14 | 1993-12-07 | Phillips Petroleum Company | Pichia pastoris acid phosphatase gene, gene regions, signal sequence and expression vectors comprising same |
AU2003902483A0 (en) | 2003-05-21 | 2003-06-05 | Commonwealth Scientific And Industrial Research Organisation | A bioelastomer ii |
CA2564413C (en) | 2004-06-07 | 2013-10-01 | Mcmaster University | Stable composite material comprising supported porous gels |
WO2006026325A2 (en) | 2004-08-26 | 2006-03-09 | Pathak Chandrashekhar P | Implantable tissue compositions and method |
WO2008019183A2 (en) * | 2006-05-18 | 2008-02-14 | The Regents Of The University Of California | Biopolymer and protein production using type iii secretion systems of gram negative bacteria |
EP2178949B1 (en) | 2007-08-14 | 2017-12-13 | Cook Medical Technologies LLC | Photoactivated crosslinking of a protein or peptide |
CA2777487A1 (en) * | 2009-10-30 | 2011-05-05 | Merck Sharp & Dohme Corp. | Methods for the production of recombinant proteins with improved secretion efficiencies |
US20140206022A1 (en) * | 2012-12-17 | 2014-07-24 | Allergan, Inc. | Three-dimensional cell culture methods for test material assessment of cell differentiation |
US9074098B2 (en) | 2013-02-26 | 2015-07-07 | University Of Massachusetts | Telechelic based networks from novel macromonomers, compositions, preparation and uses thereof |
JP6556122B2 (ja) * | 2013-09-17 | 2019-08-07 | ボルト スレッズ インコーポレイテッド | 改良シルク繊維を合成するための方法および組成物 |
WO2015053975A1 (en) | 2013-10-07 | 2015-04-16 | The Board Of Trustees Of The University Of Illinois | Volume response sensors having controlled reversible crosslinking |
WO2015068160A1 (en) | 2013-11-05 | 2015-05-14 | Collplant Ltd. | Cross-linked resilin-containing materials |
EP3294762B1 (en) * | 2015-05-11 | 2022-01-19 | Impossible Foods Inc. | Expression constructs and methods of genetically engineering methylotrophic yeast |
JP2020503882A (ja) | 2017-01-13 | 2020-02-06 | ボルト スレッズ インコーポレイテッド | エラストマータンパク質 |
-
2018
- 2018-01-16 JP JP2019538182A patent/JP2020503882A/ja active Pending
- 2018-01-16 WO PCT/US2018/013839 patent/WO2018132821A2/en unknown
- 2018-01-16 US US16/477,133 patent/US10988515B2/en active Active
- 2018-01-16 EP EP18739425.9A patent/EP3568408A4/en active Pending
-
2021
- 2021-03-31 US US17/219,277 patent/US11858971B2/en active Active
-
2023
- 2023-08-31 JP JP2023140621A patent/JP2023162366A/ja active Pending
- 2023-12-08 US US18/533,639 patent/US20240294584A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3568408A4 (en) | 2020-12-16 |
WO2018132821A3 (en) | 2018-08-23 |
WO2018132821A2 (en) | 2018-07-19 |
US20210340194A1 (en) | 2021-11-04 |
US10988515B2 (en) | 2021-04-27 |
US11858971B2 (en) | 2024-01-02 |
US20190330287A1 (en) | 2019-10-31 |
EP3568408A2 (en) | 2019-11-20 |
US20240294584A1 (en) | 2024-09-05 |
JP2020503882A (ja) | 2020-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3823682B1 (en) | Cross-linked elastomeric proteins in polar nonaqueous solvents and uses thereof | |
JP2023162366A (ja) | エラストマータンパク質 | |
US11725030B2 (en) | Compositions and methods for producing high secreted yields of recombinant proteins | |
JP7063486B2 (ja) | 高分泌収量の組み換えタンパク質を産生するための組成物及び方法 | |
BR112020022260A2 (pt) | polímeros da proteína do leite recombinantes | |
US20120202748A1 (en) | Recombinant mussel adhesive protein fp-131 | |
US12122810B2 (en) | Compositions and methods for producing high secreted yields of recombinant proteins |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230929 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230929 |