KR20080056255A - 실크 단백질 - Google Patents
실크 단백질 Download PDFInfo
- Publication number
- KR20080056255A KR20080056255A KR1020087010225A KR20087010225A KR20080056255A KR 20080056255 A KR20080056255 A KR 20080056255A KR 1020087010225 A KR1020087010225 A KR 1020087010225A KR 20087010225 A KR20087010225 A KR 20087010225A KR 20080056255 A KR20080056255 A KR 20080056255A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- seq
- ser
- glu
- lys
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title abstract description 379
- 102000004169 proteins and genes Human genes 0.000 title abstract description 339
- 239000000047 product Substances 0.000 claims abstract description 31
- 238000004519 manufacturing process Methods 0.000 claims abstract description 25
- 239000004753 textile Substances 0.000 claims abstract description 10
- 229920003023 plastic Polymers 0.000 claims abstract description 6
- 239000004033 plastic Substances 0.000 claims abstract description 6
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 215
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 208
- 229920001184 polypeptide Polymers 0.000 claims description 199
- 241000256844 Apis mellifera Species 0.000 claims description 95
- 108091033319 polynucleotide Proteins 0.000 claims description 91
- 102000040430 polynucleotide Human genes 0.000 claims description 91
- 239000002157 polynucleotide Substances 0.000 claims description 91
- 239000002773 nucleotide Substances 0.000 claims description 87
- 239000000835 fiber Substances 0.000 claims description 85
- 239000000203 mixture Substances 0.000 claims description 81
- 241000196324 Embryophyta Species 0.000 claims description 78
- 238000000034 method Methods 0.000 claims description 77
- 235000001014 amino acid Nutrition 0.000 claims description 66
- 150000001413 amino acids Chemical group 0.000 claims description 62
- 125000003729 nucleotide group Chemical group 0.000 claims description 51
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 38
- 239000002537 cosmetic Substances 0.000 claims description 36
- 241000257303 Hymenoptera Species 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 30
- 229920001577 copolymer Polymers 0.000 claims description 29
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 24
- 230000009261 transgenic effect Effects 0.000 claims description 24
- 239000012634 fragment Substances 0.000 claims description 23
- 241001415255 Bombus terrestris Species 0.000 claims description 21
- 244000025254 Cannabis sativa Species 0.000 claims description 20
- 241000894007 species Species 0.000 claims description 20
- 241001465754 Metazoa Species 0.000 claims description 17
- 239000013604 expression vector Substances 0.000 claims description 15
- 239000003814 drug Substances 0.000 claims description 14
- 229940079593 drug Drugs 0.000 claims description 10
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims description 10
- 239000003937 drug carrier Substances 0.000 claims description 8
- 201000010099 disease Diseases 0.000 claims description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 7
- 238000011282 treatment Methods 0.000 claims description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 4
- 241000282414 Homo sapiens Species 0.000 claims description 4
- 241001660113 Oecophylla smaragdina Species 0.000 claims description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 4
- 239000000969 carrier Substances 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 3
- 241001026814 Mallada signata Species 0.000 claims description 2
- 241000736258 Myrmecia <insect> Species 0.000 claims description 2
- 230000001580 bacterial effect Effects 0.000 claims description 2
- 238000004581 coalescence Methods 0.000 claims 1
- 230000002265 prevention Effects 0.000 claims 1
- 150000007523 nucleic acids Chemical class 0.000 abstract description 21
- 102000039446 nucleic acids Human genes 0.000 abstract description 20
- 108020004707 nucleic acids Proteins 0.000 abstract description 20
- 235000018102 proteins Nutrition 0.000 description 332
- 210000004027 cell Anatomy 0.000 description 95
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 69
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 65
- 229940024606 amino acid Drugs 0.000 description 62
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 57
- 108010005233 alanylglutamic acid Proteins 0.000 description 54
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 51
- 108010076504 Protein Sorting Signals Proteins 0.000 description 48
- 108010049041 glutamylalanine Proteins 0.000 description 46
- 108020004414 DNA Proteins 0.000 description 44
- 230000014509 gene expression Effects 0.000 description 39
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 32
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 32
- 239000000463 material Substances 0.000 description 30
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 29
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 29
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 29
- 241000238633 Odonata Species 0.000 description 28
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 28
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 27
- 108010044940 alanylglutamine Proteins 0.000 description 27
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 27
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 26
- 108010050848 glycylleucine Proteins 0.000 description 26
- 239000002245 particle Substances 0.000 description 25
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 24
- 239000000243 solution Substances 0.000 description 23
- 108010034529 leucyl-lysine Proteins 0.000 description 22
- 108010047495 alanylglycine Proteins 0.000 description 21
- 238000009958 sewing Methods 0.000 description 21
- 210000001519 tissue Anatomy 0.000 description 21
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 20
- -1 acidic residues Chemical compound 0.000 description 20
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 19
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 18
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 18
- 239000002299 complementary DNA Substances 0.000 description 18
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 16
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 16
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 16
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 16
- 241001454890 Myrmecia forficata Species 0.000 description 16
- 230000001105 regulatory effect Effects 0.000 description 16
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 15
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 15
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 15
- 241000238631 Hexapoda Species 0.000 description 15
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 15
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 15
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 15
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 14
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 14
- 108091034117 Oligonucleotide Proteins 0.000 description 14
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 14
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 13
- 241000880493 Leptailurus serval Species 0.000 description 13
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 13
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 13
- 239000000306 component Substances 0.000 description 13
- 108010064235 lysylglycine Proteins 0.000 description 13
- 239000000049 pigment Substances 0.000 description 13
- 239000000126 substance Substances 0.000 description 13
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 13
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 12
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 12
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 12
- 239000002609 medium Substances 0.000 description 12
- 230000009466 transformation Effects 0.000 description 12
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 11
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 11
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 11
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 11
- HOZNVKDCKZPRER-XUXIUFHCSA-N Met-Lys-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HOZNVKDCKZPRER-XUXIUFHCSA-N 0.000 description 11
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 11
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 11
- 235000004279 alanine Nutrition 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 11
- 210000004907 gland Anatomy 0.000 description 11
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 10
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 10
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 10
- 241000256836 Apis Species 0.000 description 10
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 10
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 10
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 10
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 10
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 10
- 108010079364 N-glycylalanine Proteins 0.000 description 10
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 10
- 238000000576 coating method Methods 0.000 description 10
- 235000019253 formic acid Nutrition 0.000 description 10
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 10
- 210000003079 salivary gland Anatomy 0.000 description 10
- 238000006467 substitution reaction Methods 0.000 description 10
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 9
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 9
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 9
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 9
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 9
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 9
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 9
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 9
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 9
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 9
- 108010009298 lysylglutamic acid Proteins 0.000 description 9
- 210000003491 skin Anatomy 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 9
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 8
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 8
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 8
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 8
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 8
- 241000255789 Bombyx mori Species 0.000 description 8
- 238000012357 Gap analysis Methods 0.000 description 8
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 8
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 8
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 8
- 241000208125 Nicotiana Species 0.000 description 8
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 8
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 8
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 8
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 8
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 8
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 8
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 8
- 102000004142 Trypsin Human genes 0.000 description 8
- 108090000631 Trypsin Proteins 0.000 description 8
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 8
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 8
- 239000000853 adhesive Substances 0.000 description 8
- 230000001070 adhesive effect Effects 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 210000004209 hair Anatomy 0.000 description 8
- 230000002209 hydrophobic effect Effects 0.000 description 8
- 150000002500 ions Chemical class 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 239000003921 oil Substances 0.000 description 8
- 210000000056 organ Anatomy 0.000 description 8
- 239000007787 solid Substances 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 239000012588 trypsin Substances 0.000 description 8
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 7
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 7
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 7
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 7
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 7
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 7
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 7
- 241000588724 Escherichia coli Species 0.000 description 7
- 101710145505 Fiber protein Proteins 0.000 description 7
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 7
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 7
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 7
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 7
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 7
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 7
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 7
- 239000004472 Lysine Substances 0.000 description 7
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 7
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 7
- 108700026244 Open Reading Frames Proteins 0.000 description 7
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 7
- 108700019146 Transgenes Proteins 0.000 description 7
- 239000002253 acid Substances 0.000 description 7
- 230000027455 binding Effects 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 239000011248 coating agent Substances 0.000 description 7
- 210000003041 ligament Anatomy 0.000 description 7
- 235000019198 oils Nutrition 0.000 description 7
- 239000000123 paper Substances 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 238000003752 polymerase chain reaction Methods 0.000 description 7
- 230000028327 secretion Effects 0.000 description 7
- 210000002435 tendon Anatomy 0.000 description 7
- 101150047137 ABF1 gene Proteins 0.000 description 6
- ODWSTKXGQGYHSH-FXQIFTODSA-N Ala-Arg-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O ODWSTKXGQGYHSH-FXQIFTODSA-N 0.000 description 6
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 6
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 6
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 6
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 6
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 6
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 6
- 241000239290 Araneae Species 0.000 description 6
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 6
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 6
- 102100031503 Barrier-to-autointegration factor-like protein Human genes 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- 241000628997 Flos Species 0.000 description 6
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 6
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 6
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 6
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 6
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 6
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 6
- 239000004471 Glycine Substances 0.000 description 6
- 101000729827 Homo sapiens Barrier-to-autointegration factor-like protein Proteins 0.000 description 6
- 101001106801 Homo sapiens Rab11 family-interacting protein 5 Proteins 0.000 description 6
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 6
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 6
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 6
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 6
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 6
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 102100021330 Rab11 family-interacting protein 5 Human genes 0.000 description 6
- 101100066561 Schizosaccharomyces pombe (strain 972 / ATCC 24843) fep1 gene Proteins 0.000 description 6
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 6
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Chemical group OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 6
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 6
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 6
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 206010052428 Wound Diseases 0.000 description 6
- 208000027418 Wounds and injury Diseases 0.000 description 6
- 230000009471 action Effects 0.000 description 6
- 239000000654 additive Substances 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 108010013835 arginine glutamate Proteins 0.000 description 6
- 108010062796 arginyllysine Proteins 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 6
- 230000037308 hair color Effects 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- 229920000728 polyester Polymers 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000011084 recovery Methods 0.000 description 6
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 6
- 108010071207 serylmethionine Proteins 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 239000001993 wax Substances 0.000 description 6
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical group OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 5
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 5
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 5
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 5
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 5
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 5
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 5
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 5
- 241000701489 Cauliflower mosaic virus Species 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 229920000742 Cotton Polymers 0.000 description 5
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 5
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 5
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 5
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 5
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 5
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 5
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 5
- 244000299507 Gossypium hirsutum Species 0.000 description 5
- 241000255777 Lepidoptera Species 0.000 description 5
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 5
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 5
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 5
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 5
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 5
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 5
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 5
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 5
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 5
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 5
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 5
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 5
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 5
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 5
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 239000000975 dye Substances 0.000 description 5
- 239000004744 fabric Substances 0.000 description 5
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 5
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 5
- 108010015792 glycyllysine Proteins 0.000 description 5
- 239000010410 layer Substances 0.000 description 5
- 108010057821 leucylproline Proteins 0.000 description 5
- 108010056787 lysyl-arginyl-glutamyl-glutamic acid Proteins 0.000 description 5
- 108010017391 lysylvaline Proteins 0.000 description 5
- 210000001161 mammalian embryo Anatomy 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 239000011347 resin Substances 0.000 description 5
- 229920005989 resin Polymers 0.000 description 5
- 230000000475 sunscreen effect Effects 0.000 description 5
- 239000000516 sunscreening agent Substances 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 4
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 4
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 4
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 4
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 4
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 4
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 4
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 4
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 4
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 4
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 4
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 4
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 4
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 4
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 4
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 4
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 4
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 4
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 4
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 4
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 4
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 4
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 4
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 4
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 4
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 4
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 4
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 4
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 4
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 4
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 4
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 4
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 4
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 4
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 4
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 4
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 4
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 4
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 4
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 4
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 4
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 4
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 4
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 4
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 4
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 4
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 4
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 4
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 description 4
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 4
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 4
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 4
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 4
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 4
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 4
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 4
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 4
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 4
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 4
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 4
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 4
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 4
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 4
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 4
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 4
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 4
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 4
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 4
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 4
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 4
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 4
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 4
- 229920001410 Microfiber Polymers 0.000 description 4
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 4
- 239000004677 Nylon Substances 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 4
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 4
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 4
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 4
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 4
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 4
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 4
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 4
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 4
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 4
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 4
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 4
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 4
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 4
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 4
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 4
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 4
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 4
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 4
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 4
- XLOMVQKBTHCTTD-UHFFFAOYSA-N Zinc monoxide Chemical compound [Zn]=O XLOMVQKBTHCTTD-UHFFFAOYSA-N 0.000 description 4
- 230000002378 acidificating effect Effects 0.000 description 4
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 4
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 239000006071 cream Substances 0.000 description 4
- 238000004132 cross linking Methods 0.000 description 4
- 230000018044 dehydration Effects 0.000 description 4
- 238000006297 dehydration reaction Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 239000012153 distilled water Substances 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000005040 ion trap Methods 0.000 description 4
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 4
- 239000003658 microfiber Substances 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 229920001778 nylon Polymers 0.000 description 4
- 239000012860 organic pigment Substances 0.000 description 4
- 230000001590 oxidative effect Effects 0.000 description 4
- 229920002451 polyvinyl alcohol Polymers 0.000 description 4
- 235000019422 polyvinyl alcohol Nutrition 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 4
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 3
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 3
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 3
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 3
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 3
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 3
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 3
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 3
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 3
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 3
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 3
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 3
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 3
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 3
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 3
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 3
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 3
- 241000238421 Arthropoda Species 0.000 description 3
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 3
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 3
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 3
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 3
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 3
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 3
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 3
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 3
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 241001454881 Cotesia Species 0.000 description 3
- 102000012410 DNA Ligases Human genes 0.000 description 3
- 108010061982 DNA Ligases Proteins 0.000 description 3
- 238000001157 Fourier transform infrared spectrum Methods 0.000 description 3
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 3
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 3
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 3
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 3
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 3
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 3
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 3
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 3
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 3
- QYPKJXSMLMREKF-BPUTZDHNSA-N Glu-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N QYPKJXSMLMREKF-BPUTZDHNSA-N 0.000 description 3
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 3
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 3
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 3
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 3
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 3
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 3
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 3
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 3
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 3
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 3
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 3
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 3
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 3
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 3
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 3
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 3
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 3
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 3
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 3
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 3
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 3
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 3
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 3
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 3
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 3
- 239000004698 Polyethylene Substances 0.000 description 3
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 3
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 3
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 3
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 3
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 3
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 3
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 3
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 3
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 3
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 3
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 3
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 3
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 3
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 3
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 3
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 3
- WLBZWXXGSOLJBA-HOCLYGCPSA-N Trp-Gly-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 WLBZWXXGSOLJBA-HOCLYGCPSA-N 0.000 description 3
- YPBYQWFZAAQMGW-XIRDDKMYSA-N Trp-Lys-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N YPBYQWFZAAQMGW-XIRDDKMYSA-N 0.000 description 3
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 3
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 3
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 3
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 3
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 3
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 3
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 3
- QHSSPPHOHJSTML-HOCLYGCPSA-N Val-Trp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N QHSSPPHOHJSTML-HOCLYGCPSA-N 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 239000007864 aqueous solution Substances 0.000 description 3
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 229940098773 bovine serum albumin Drugs 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 229920002678 cellulose Polymers 0.000 description 3
- 239000001913 cellulose Substances 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- 235000014113 dietary fatty acids Nutrition 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 235000013601 eggs Nutrition 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 239000000194 fatty acid Substances 0.000 description 3
- 229930195729 fatty acid Natural products 0.000 description 3
- 150000004665 fatty acids Chemical class 0.000 description 3
- 210000002950 fibroblast Anatomy 0.000 description 3
- 239000000945 filler Substances 0.000 description 3
- 239000000118 hair dye Substances 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 125000001165 hydrophobic group Chemical group 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000006210 lotion Substances 0.000 description 3
- 108010089256 lysyl-aspartyl-glutamyl-leucine Proteins 0.000 description 3
- 238000000520 microinjection Methods 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 238000003909 pattern recognition Methods 0.000 description 3
- 229920000573 polyethylene Polymers 0.000 description 3
- 229920001296 polysiloxane Polymers 0.000 description 3
- NLKNQRATVPKPDG-UHFFFAOYSA-M potassium iodide Chemical compound [K+].[I-] NLKNQRATVPKPDG-UHFFFAOYSA-M 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 230000001681 protective effect Effects 0.000 description 3
- 239000012460 protein solution Substances 0.000 description 3
- 210000001938 protoplast Anatomy 0.000 description 3
- 210000003296 saliva Anatomy 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 239000000344 soap Substances 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 125000001424 substituent group Chemical group 0.000 description 3
- 239000004094 surface-active agent Substances 0.000 description 3
- 239000002562 thickening agent Substances 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- JHFAEUICJHBVHB-UHFFFAOYSA-N 1h-indol-2-ol Chemical compound C1=CC=C2NC(O)=CC2=C1 JHFAEUICJHBVHB-UHFFFAOYSA-N 0.000 description 2
- CWLKGDAVCFYWJK-UHFFFAOYSA-N 3-aminophenol Chemical compound NC1=CC=CC(O)=C1 CWLKGDAVCFYWJK-UHFFFAOYSA-N 0.000 description 2
- PLIKAWJENQZMHA-UHFFFAOYSA-N 4-aminophenol Chemical compound NC1=CC=C(O)C=C1 PLIKAWJENQZMHA-UHFFFAOYSA-N 0.000 description 2
- IKHGUXGNUITLKF-UHFFFAOYSA-N Acetaldehyde Chemical compound CC=O IKHGUXGNUITLKF-UHFFFAOYSA-N 0.000 description 2
- 241000254032 Acrididae Species 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 2
- MBWYUTNBYSSUIQ-HERUPUMHSA-N Ala-Asn-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N MBWYUTNBYSSUIQ-HERUPUMHSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 2
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 2
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 2
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 2
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 2
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 2
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 2
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 2
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 2
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 2
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 2
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 2
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- ISCYZXFOCXWUJU-KZVJFYERSA-N Ala-Thr-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O ISCYZXFOCXWUJU-KZVJFYERSA-N 0.000 description 2
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 2
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 2
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 2
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 2
- PNEYBMLMFCGWSK-UHFFFAOYSA-N Alumina Chemical class [O-2].[O-2].[O-2].[Al+3].[Al+3] PNEYBMLMFCGWSK-UHFFFAOYSA-N 0.000 description 2
- 241000256837 Apidae Species 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- 241000219195 Arabidopsis thaliana Species 0.000 description 2
- OOBVTWHLKYJFJH-FXQIFTODSA-N Arg-Ala-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O OOBVTWHLKYJFJH-FXQIFTODSA-N 0.000 description 2
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 2
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 2
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 2
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 2
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 2
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 2
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 2
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 2
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 2
- MSILNNHVVMMTHZ-UWVGGRQHSA-N Arg-His-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 MSILNNHVVMMTHZ-UWVGGRQHSA-N 0.000 description 2
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 2
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 2
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 2
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 2
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 2
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 2
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 2
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 2
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 2
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 2
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 2
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 2
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 2
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 2
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 2
- JZRLLSOWDYUKOK-SRVKXCTJSA-N Asn-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N JZRLLSOWDYUKOK-SRVKXCTJSA-N 0.000 description 2
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 2
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 2
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 2
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 2
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 2
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 2
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 2
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 2
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 2
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 2
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 2
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 2
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 2
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 2
- UWMIZBCTVWVMFI-FXQIFTODSA-N Asp-Ala-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UWMIZBCTVWVMFI-FXQIFTODSA-N 0.000 description 2
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 2
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 2
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 2
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 2
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 2
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 2
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 2
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 2
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 2
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 2
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 235000016068 Berberis vulgaris Nutrition 0.000 description 2
- 241000335053 Beta vulgaris Species 0.000 description 2
- 241001136816 Bombus <genus> Species 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 241001070941 Castanea Species 0.000 description 2
- 235000014036 Castanea Nutrition 0.000 description 2
- 108010022172 Chitinases Proteins 0.000 description 2
- 102000012286 Chitinases Human genes 0.000 description 2
- 241000723346 Cinnamomum camphora Species 0.000 description 2
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 240000008067 Cucumis sativus Species 0.000 description 2
- KABHAOSDMIYXTR-GUBZILKMSA-N Cys-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N KABHAOSDMIYXTR-GUBZILKMSA-N 0.000 description 2
- JXVFJOMFOLFPMP-KKUMJFAQSA-N Cys-Leu-Tyr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JXVFJOMFOLFPMP-KKUMJFAQSA-N 0.000 description 2
- 241000701832 Enterobacteria phage T3 Species 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 2
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 2
- IGNGBUVODQLMRJ-CIUDSAMLSA-N Gln-Ala-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IGNGBUVODQLMRJ-CIUDSAMLSA-N 0.000 description 2
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 2
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 2
- DLOHWQXXGMEZDW-CIUDSAMLSA-N Gln-Arg-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DLOHWQXXGMEZDW-CIUDSAMLSA-N 0.000 description 2
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 2
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 2
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 2
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 2
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 2
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 2
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 2
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 2
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 2
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 2
- RSUVOPBMWMTVDI-XEGUGMAKSA-N Glu-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(O)=O)C)C(O)=O)=CNC2=C1 RSUVOPBMWMTVDI-XEGUGMAKSA-N 0.000 description 2
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 2
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 2
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 2
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 2
- XIKYNVKEUINBGL-IUCAKERBSA-N Glu-His-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O XIKYNVKEUINBGL-IUCAKERBSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 2
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 2
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 2
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 2
- OFIHURVSQXAZIR-SZMVWBNQSA-N Glu-Lys-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OFIHURVSQXAZIR-SZMVWBNQSA-N 0.000 description 2
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 2
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 2
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 2
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- LWYUQLZOIORFFJ-XKBZYTNZSA-N Glu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O LWYUQLZOIORFFJ-XKBZYTNZSA-N 0.000 description 2
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 2
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 2
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 2
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 2
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 2
- GNPVTZJUUBPZKW-WDSKDSINSA-N Gly-Gln-Ser Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GNPVTZJUUBPZKW-WDSKDSINSA-N 0.000 description 2
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 2
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 2
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 2
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 2
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 2
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 2
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 2
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 2
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 2
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 2
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 2
- LKJCZEPXHOIAIW-HOTGVXAUSA-N Gly-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN LKJCZEPXHOIAIW-HOTGVXAUSA-N 0.000 description 2
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 2
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 2
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 2
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- KNNSUUOHFVVJOP-GUBZILKMSA-N His-Glu-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N KNNSUUOHFVVJOP-GUBZILKMSA-N 0.000 description 2
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 2
- JVEKQAYXFGIISZ-HOCLYGCPSA-N His-Trp-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(O)=O)C1=CN=CN1 JVEKQAYXFGIISZ-HOCLYGCPSA-N 0.000 description 2
- PDLQNLSEJXOQNQ-IHPCNDPISA-N His-Trp-Lys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CN=CN1 PDLQNLSEJXOQNQ-IHPCNDPISA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 2
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 2
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 2
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 2
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 2
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 2
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 2
- CYHJCEKUMCNDFG-LAEOZQHASA-N Ile-Gln-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N CYHJCEKUMCNDFG-LAEOZQHASA-N 0.000 description 2
- QHGBCRCMBCWMBJ-UHFFFAOYSA-N Ile-Glu-Ala-Lys Natural products CCC(C)C(N)C(=O)NC(CCC(O)=O)C(=O)NC(C)C(=O)NC(C(O)=O)CCCCN QHGBCRCMBCWMBJ-UHFFFAOYSA-N 0.000 description 2
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 2
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 2
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 2
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 2
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 2
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 2
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 2
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 2
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 2
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 2
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 2
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 2
- PRZVBIAOPFGAQF-SRVKXCTJSA-N Leu-Glu-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O PRZVBIAOPFGAQF-SRVKXCTJSA-N 0.000 description 2
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 2
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 2
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 2
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 2
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 2
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 2
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 2
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 2
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 2
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 2
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 2
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 2
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 2
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 2
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 2
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 2
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 2
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- ZASPELYMPSACER-HOCLYGCPSA-N Lys-Gly-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZASPELYMPSACER-HOCLYGCPSA-N 0.000 description 2
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 2
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 2
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 2
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 2
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 2
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 2
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 2
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 2
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 2
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 2
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 2
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 2
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 2
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 2
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 2
- XBAJINCXDBTJRH-WDSOQIARSA-N Lys-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N XBAJINCXDBTJRH-WDSOQIARSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 2
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 2
- SQUTUWHAAWJYES-GUBZILKMSA-N Met-Asp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SQUTUWHAAWJYES-GUBZILKMSA-N 0.000 description 2
- AWOMRHGUWFBDNU-ZPFDUUQYSA-N Met-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N AWOMRHGUWFBDNU-ZPFDUUQYSA-N 0.000 description 2
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 2
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 2
- AXHNAGAYRGCDLG-UWVGGRQHSA-N Met-Lys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AXHNAGAYRGCDLG-UWVGGRQHSA-N 0.000 description 2
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 241000238903 Nephila Species 0.000 description 2
- 241001368225 Odontofroggatia Species 0.000 description 2
- 238000009004 PCR Kit Methods 0.000 description 2
- 101710091688 Patatin Proteins 0.000 description 2
- 108010033276 Peptide Fragments Proteins 0.000 description 2
- 102000007079 Peptide Fragments Human genes 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 2
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 2
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 2
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 2
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 2
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 235000010582 Pisum sativum Nutrition 0.000 description 2
- 240000004713 Pisum sativum Species 0.000 description 2
- 108010059820 Polygalacturonase Proteins 0.000 description 2
- 239000004743 Polypropylene Substances 0.000 description 2
- 239000004372 Polyvinyl alcohol Substances 0.000 description 2
- 241001124612 Pompilidae Species 0.000 description 2
- QBFONMUYNSNKIX-AVGNSLFASA-N Pro-Arg-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QBFONMUYNSNKIX-AVGNSLFASA-N 0.000 description 2
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 2
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 2
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 2
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 2
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 2
- 101710093788 Protein O-mannosyl-transferase 2 Proteins 0.000 description 2
- 108010003894 Protein-Lysine 6-Oxidase Proteins 0.000 description 2
- 102000004669 Protein-Lysine 6-Oxidase Human genes 0.000 description 2
- 108010026552 Proteome Proteins 0.000 description 2
- 241000220324 Pyrus Species 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- 229920000297 Rayon Polymers 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 2
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 2
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 2
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 2
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 2
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 2
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 2
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 2
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 2
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 2
- LPSKHZWBQONOQJ-XIRDDKMYSA-N Ser-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N LPSKHZWBQONOQJ-XIRDDKMYSA-N 0.000 description 2
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 2
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 2
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 2
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 2
- 108010013296 Sericins Proteins 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 229920001872 Spider silk Polymers 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 2
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 2
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 2
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- FKIGTIXHSRNKJU-IXOXFDKPSA-N Thr-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CN=CN1 FKIGTIXHSRNKJU-IXOXFDKPSA-N 0.000 description 2
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 2
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 2
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 2
- MCDVZTRGHNXTGK-HJGDQZAQSA-N Thr-Met-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O MCDVZTRGHNXTGK-HJGDQZAQSA-N 0.000 description 2
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- MYNYCUXMIIWUNW-IEGACIPQSA-N Thr-Trp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MYNYCUXMIIWUNW-IEGACIPQSA-N 0.000 description 2
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 2
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 2
- GWEVSGVZZGPLCZ-UHFFFAOYSA-N Titan oxide Chemical compound O=[Ti]=O GWEVSGVZZGPLCZ-UHFFFAOYSA-N 0.000 description 2
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 2
- IUFQHOCOKQIOMC-XIRDDKMYSA-N Trp-Asn-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N IUFQHOCOKQIOMC-XIRDDKMYSA-N 0.000 description 2
- PKUJMYZNJMRHEZ-XIRDDKMYSA-N Trp-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKUJMYZNJMRHEZ-XIRDDKMYSA-N 0.000 description 2
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 2
- UUIYFDAWNBSWPG-IHPCNDPISA-N Trp-Lys-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N UUIYFDAWNBSWPG-IHPCNDPISA-N 0.000 description 2
- ULHASJWZGUEUNN-XIRDDKMYSA-N Trp-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O ULHASJWZGUEUNN-XIRDDKMYSA-N 0.000 description 2
- WKQNLTQSCYXKQK-VFAJRCTISA-N Trp-Lys-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WKQNLTQSCYXKQK-VFAJRCTISA-N 0.000 description 2
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 2
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 2
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 2
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 2
- SMKXLHVZIFKQRB-GUBZILKMSA-N Val-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N SMKXLHVZIFKQRB-GUBZILKMSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 2
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 2
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 2
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 2
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 2
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 2
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 2
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 2
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 2
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 2
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 2
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- RQOMPQGUGBILAG-AVGNSLFASA-N Val-Met-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQOMPQGUGBILAG-AVGNSLFASA-N 0.000 description 2
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 2
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 2
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 2
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 2
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 2
- 241000256856 Vespidae Species 0.000 description 2
- 241001481304 Vespoidea Species 0.000 description 2
- 238000002441 X-ray diffraction Methods 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 108010069490 alanyl-glycyl-seryl-glutamic acid Proteins 0.000 description 2
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- POJWUDADGALRAB-UHFFFAOYSA-N allantoin Chemical compound NC(=O)NC1NC(=O)NC1=O POJWUDADGALRAB-UHFFFAOYSA-N 0.000 description 2
- QWCKQJZIFLGMSD-UHFFFAOYSA-N alpha-aminobutyric acid Chemical compound CCC(N)C(O)=O QWCKQJZIFLGMSD-UHFFFAOYSA-N 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 150000001408 amides Chemical class 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 2
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 2
- 235000011130 ammonium sulphate Nutrition 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 239000003963 antioxidant agent Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010091818 arginyl-glycyl-aspartyl-valine Proteins 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 239000003212 astringent agent Substances 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- TZCXTZWJZNENPQ-UHFFFAOYSA-L barium sulfate Chemical compound [Ba+2].[O-]S([O-])(=O)=O TZCXTZWJZNENPQ-UHFFFAOYSA-L 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 239000000560 biocompatible material Substances 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 238000009835 boiling Methods 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 210000004271 bone marrow stromal cell Anatomy 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- OSGAYBCDTDRGGQ-UHFFFAOYSA-L calcium sulfate Chemical compound [Ca+2].[O-]S([O-])(=O)=O OSGAYBCDTDRGGQ-UHFFFAOYSA-L 0.000 description 2
- YCIMNLLNPGFGHC-UHFFFAOYSA-N catechol Chemical compound OC1=CC=CC=C1O YCIMNLLNPGFGHC-UHFFFAOYSA-N 0.000 description 2
- 210000004671 cell-free system Anatomy 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 210000004439 collateral ligament Anatomy 0.000 description 2
- 230000001332 colony forming effect Effects 0.000 description 2
- 238000004040 coloring Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000002939 deleterious effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 229920001971 elastomer Polymers 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 239000002657 fibrous material Substances 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 239000003205 fragrance Substances 0.000 description 2
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 239000000017 hydrogel Substances 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 230000001418 larval effect Effects 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000004811 liquid chromatography Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010059573 lysyl-lysyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010043322 lysyl-tryptophyl-alpha-lysine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 238000010841 mRNA extraction Methods 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 244000045947 parasite Species 0.000 description 2
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 229920001606 poly(lactic acid-co-glycolic acid) Polymers 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920001155 polypropylene Polymers 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000002964 rayon Substances 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- GHMLBKRAJCXXBS-UHFFFAOYSA-N resorcinol Chemical compound OC1=CC=CC(O)=C1 GHMLBKRAJCXXBS-UHFFFAOYSA-N 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 210000000513 rotator cuff Anatomy 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000003352 sequestering agent Substances 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 239000002453 shampoo Substances 0.000 description 2
- 239000002002 slurry Substances 0.000 description 2
- 229910000029 sodium carbonate Inorganic materials 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 238000009987 spinning Methods 0.000 description 2
- 239000007921 spray Substances 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 230000003637 steroidlike Effects 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 229960000187 tissue plasminogen activator Drugs 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- 239000005526 vasoconstrictor agent Substances 0.000 description 2
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 108010000998 wheylin-2 peptide Proteins 0.000 description 2
- 210000002268 wool Anatomy 0.000 description 2
- 230000029663 wound healing Effects 0.000 description 2
- 239000011787 zinc oxide Substances 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- SBKVPJHMSUXZTA-MEJXFZFPSA-N (2S)-2-[[(2S)-2-[[(2S)-1-[(2S)-5-amino-2-[[2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-3-(1H-indol-3-yl)propanoyl]amino]-3-(1H-imidazol-4-yl)propanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-4-methylpentanoyl]amino]-5-oxopentanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]acetyl]amino]-5-oxopentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylsulfanylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 SBKVPJHMSUXZTA-MEJXFZFPSA-N 0.000 description 1
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 1
- BVAUMRCGVHUWOZ-ZETCQYMHSA-N (2s)-2-(cyclohexylazaniumyl)propanoate Chemical compound OC(=O)[C@H](C)NC1CCCCC1 BVAUMRCGVHUWOZ-ZETCQYMHSA-N 0.000 description 1
- MRTPISKDZDHEQI-YFKPBYRVSA-N (2s)-2-(tert-butylamino)propanoic acid Chemical compound OC(=O)[C@H](C)NC(C)(C)C MRTPISKDZDHEQI-YFKPBYRVSA-N 0.000 description 1
- JBFQOLHAGBKPTP-NZATWWQASA-N (2s)-2-[[(2s)-4-carboxy-2-[[3-carboxy-2-[[(2s)-2,6-diaminohexanoyl]amino]propanoyl]amino]butanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)C(CC(O)=O)NC(=O)[C@@H](N)CCCCN JBFQOLHAGBKPTP-NZATWWQASA-N 0.000 description 1
- SUQWGICKJIJKNO-IHRRRGAJSA-N (2s)-2-[[2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]acetyl]amino]pentanedioic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O SUQWGICKJIJKNO-IHRRRGAJSA-N 0.000 description 1
- NPDBDJFLKKQMCM-SCSAIBSYSA-N (2s)-2-amino-3,3-dimethylbutanoic acid Chemical compound CC(C)(C)[C@H](N)C(O)=O NPDBDJFLKKQMCM-SCSAIBSYSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 1
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- WZCQRUWWHSTZEM-UHFFFAOYSA-N 1,3-phenylenediamine Chemical compound NC1=CC=CC(N)=C1 WZCQRUWWHSTZEM-UHFFFAOYSA-N 0.000 description 1
- CBCKQZAAMUWICA-UHFFFAOYSA-N 1,4-phenylenediamine Chemical compound NC1=CC=C(N)C=C1 CBCKQZAAMUWICA-UHFFFAOYSA-N 0.000 description 1
- SATOZHHJULWRHN-PJKMHFRUSA-N 1-[(2s,4s,5r)-2-amino-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C)=CN1[C@]1(N)O[C@H](CO)[C@@H](O)C1 SATOZHHJULWRHN-PJKMHFRUSA-N 0.000 description 1
- CPKVUHPKYQGHMW-UHFFFAOYSA-N 1-ethenylpyrrolidin-2-one;molecular iodine Chemical compound II.C=CN1CCCC1=O CPKVUHPKYQGHMW-UHFFFAOYSA-N 0.000 description 1
- KJCVRFUGPWSIIH-UHFFFAOYSA-N 1-naphthol Chemical compound C1=CC=C2C(O)=CC=CC2=C1 KJCVRFUGPWSIIH-UHFFFAOYSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- IHWDSEPNZDYMNF-UHFFFAOYSA-N 1H-indol-2-amine Chemical compound C1=CC=C2NC(N)=CC2=C1 IHWDSEPNZDYMNF-UHFFFAOYSA-N 0.000 description 1
- OGNSCSPNOLGXSM-UHFFFAOYSA-N 2,4-diaminobutyric acid Chemical compound NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 1
- CHZCERSEMVWNHL-UHFFFAOYSA-N 2-hydroxybenzonitrile Chemical compound OC1=CC=CC=C1C#N CHZCERSEMVWNHL-UHFFFAOYSA-N 0.000 description 1
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 1
- 101150042997 21 gene Proteins 0.000 description 1
- LXDNKOBFMPHCPF-UHFFFAOYSA-N 2h-pyridine-1,4-diamine Chemical compound NN1CC=C(N)C=C1 LXDNKOBFMPHCPF-UHFFFAOYSA-N 0.000 description 1
- 229940018563 3-aminophenol Drugs 0.000 description 1
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 1
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- IYLLULUTZPKQBW-UHFFFAOYSA-N Acrinol Chemical compound CC(O)C(O)=O.C1=C(N)C=CC2=C(N)C3=CC(OCC)=CC=C3N=C21 IYLLULUTZPKQBW-UHFFFAOYSA-N 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000256852 Aculeata Species 0.000 description 1
- 101710146995 Acyl carrier protein Proteins 0.000 description 1
- 101150021974 Adh1 gene Proteins 0.000 description 1
- 241001275701 Agaonidae Species 0.000 description 1
- 241001408627 Agriopis marginaria Species 0.000 description 1
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 1
- FSBCNCKIQZZASN-GUBZILKMSA-N Ala-Arg-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O FSBCNCKIQZZASN-GUBZILKMSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 1
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- LFFOJBOTZUWINF-ZANVPECISA-N Ala-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O)=CNC2=C1 LFFOJBOTZUWINF-ZANVPECISA-N 0.000 description 1
- CKIBTNMWVMKAHB-RWGOJESNSA-N Ala-Trp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 CKIBTNMWVMKAHB-RWGOJESNSA-N 0.000 description 1
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 1
- 108010025188 Alcohol oxidase Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- POJWUDADGALRAB-PVQJCKRUSA-N Allantoin Natural products NC(=O)N[C@@H]1NC(=O)NC1=O POJWUDADGALRAB-PVQJCKRUSA-N 0.000 description 1
- 244000291564 Allium cepa Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- 229910000013 Ammonium bicarbonate Inorganic materials 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 235000011437 Amygdalus communis Nutrition 0.000 description 1
- 244000144730 Amygdalus persica Species 0.000 description 1
- 241000256815 Apocrita Species 0.000 description 1
- 241001481391 Apoidea Species 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- IJPNNYWHXGADJG-GUBZILKMSA-N Arg-Ala-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O IJPNNYWHXGADJG-GUBZILKMSA-N 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 1
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- ZRNWJUAQKFUUKV-SRVKXCTJSA-N Arg-Met-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O ZRNWJUAQKFUUKV-SRVKXCTJSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- 239000004475 Arginine Chemical group 0.000 description 1
- 241000326710 Argiope lobata Species 0.000 description 1
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- FLJVGAFLZVBBNG-BPUTZDHNSA-N Asn-Trp-Arg Chemical compound N[C@@H](CC(=O)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O FLJVGAFLZVBBNG-BPUTZDHNSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- ATHZHGQSAIJHQU-XIRDDKMYSA-N Asn-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ATHZHGQSAIJHQU-XIRDDKMYSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 1
- ICTXFVKYAGQURS-UBHSHLNASA-N Asp-Asn-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ICTXFVKYAGQURS-UBHSHLNASA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- FIAKNCXQFFKSSI-ZLUOBGJFSA-N Asp-Ser-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O FIAKNCXQFFKSSI-ZLUOBGJFSA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- 244000003416 Asparagus officinalis Species 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241000702194 Bacillus virus SPO1 Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 241001415256 Bombus lucorum Species 0.000 description 1
- 241000167854 Bourreria succulenta Species 0.000 description 1
- 241000700105 Brachionidae Species 0.000 description 1
- 241000135033 Branchus Species 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000003351 Brassica cretica Nutrition 0.000 description 1
- 101000726146 Brassica napus Cruciferin Proteins 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 235000003343 Brassica rupestris Nutrition 0.000 description 1
- 241000195940 Bryophyta Species 0.000 description 1
- BMTAFVWTTFSTOG-UHFFFAOYSA-N Butylate Chemical compound CCSC(=O)N(CC(C)C)CC(C)C BMTAFVWTTFSTOG-UHFFFAOYSA-N 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 1
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- WWZKQHOCKIZLMA-UHFFFAOYSA-N Caprylic acid Natural products CCCCCCCC(O)=O WWZKQHOCKIZLMA-UHFFFAOYSA-N 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 240000004160 Capsicum annuum Species 0.000 description 1
- 235000008534 Capsicum annuum var annuum Nutrition 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000317929 Chalcididae Species 0.000 description 1
- GHXZTYHSJHQHIJ-UHFFFAOYSA-N Chlorhexidine Chemical compound C=1C=C(Cl)C=CC=1NC(N)=NC(N)=NCCCCCCN=C(N)N=C(N)NC1=CC=C(Cl)C=C1 GHXZTYHSJHQHIJ-UHFFFAOYSA-N 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 241001124637 Chrysididae Species 0.000 description 1
- 241000258935 Chrysopidae Species 0.000 description 1
- 244000223760 Cinnamomum zeylanicum Species 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 244000131522 Citrus pyriformis Species 0.000 description 1
- 241001672694 Citrus reticulata Species 0.000 description 1
- 240000000560 Citrus x paradisi Species 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 240000007154 Coffea arabica Species 0.000 description 1
- 102000000503 Collagen Type II Human genes 0.000 description 1
- 108010041390 Collagen Type II Proteins 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 240000000491 Corchorus aestuans Species 0.000 description 1
- 235000011777 Corchorus aestuans Nutrition 0.000 description 1
- 235000010862 Corchorus capsularis Nutrition 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 101710190853 Cruciferin Proteins 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 235000009849 Cucumis sativus Nutrition 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 240000001980 Cucurbita pepo Species 0.000 description 1
- 235000009852 Cucurbita pepo Nutrition 0.000 description 1
- XEEIQMGZRFFSRD-XVYDVKMFSA-N Cys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N XEEIQMGZRFFSRD-XVYDVKMFSA-N 0.000 description 1
- VTJLJQGUMBWHBP-GUBZILKMSA-N Cys-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N VTJLJQGUMBWHBP-GUBZILKMSA-N 0.000 description 1
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 1
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- YAHZABJORDUQGO-NQXXGFSBSA-N D-ribulose 1,5-bisphosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)C(=O)COP(O)(O)=O YAHZABJORDUQGO-NQXXGFSBSA-N 0.000 description 1
- ZAQJHHRNXZUBTE-UHFFFAOYSA-N D-threo-2-Pentulose Natural products OCC(O)C(O)C(=O)CO ZAQJHHRNXZUBTE-UHFFFAOYSA-N 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000918844 Dusona sp. Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- 241001302160 Escherichia coli str. K-12 substr. DH10B Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 239000001856 Ethyl cellulose Substances 0.000 description 1
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 1
- 241001598371 Eucharitidae Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 102000009114 Fatty acid desaturases Human genes 0.000 description 1
- 108010087894 Fatty acid desaturases Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- YCKRFDGAMUMZLT-UHFFFAOYSA-N Fluorine atom Chemical compound [F] YCKRFDGAMUMZLT-UHFFFAOYSA-N 0.000 description 1
- 241001507629 Formicidae Species 0.000 description 1
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- FAQVCWVVIYYWRR-WHFBIAKZSA-N Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O FAQVCWVVIYYWRR-WHFBIAKZSA-N 0.000 description 1
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 1
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 1
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 1
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- BUVMZWZNWMKASN-QEJZJMRPSA-N Glu-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 BUVMZWZNWMKASN-QEJZJMRPSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- PNAOVYHADQRJQU-GUBZILKMSA-N Glu-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N PNAOVYHADQRJQU-GUBZILKMSA-N 0.000 description 1
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- QLPYYTDOUQNJGQ-AVGNSLFASA-N Glu-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N QLPYYTDOUQNJGQ-AVGNSLFASA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- NTOWAXLMQFKJPT-YUMQZZPRSA-N Gly-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN NTOWAXLMQFKJPT-YUMQZZPRSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 1
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- 108700037728 Glycine max beta-conglycinin Proteins 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 239000012981 Hank's balanced salt solution Substances 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 241000255967 Helicoverpa zea Species 0.000 description 1
- 244000043261 Hevea brasiliensis Species 0.000 description 1
- 239000004705 High-molecular-weight polyethylene Substances 0.000 description 1
- VJJSDSNFXCWCEJ-DJFWLOJKSA-N His-Ile-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O VJJSDSNFXCWCEJ-DJFWLOJKSA-N 0.000 description 1
- SOYCWSKCUVDLMC-AVGNSLFASA-N His-Pro-Arg Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCNC(=N)N)C(=O)O SOYCWSKCUVDLMC-AVGNSLFASA-N 0.000 description 1
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 1
- DRKZDEFADVYTLU-AVGNSLFASA-N His-Val-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DRKZDEFADVYTLU-AVGNSLFASA-N 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- 244000025221 Humulus lupulus Species 0.000 description 1
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 229920002153 Hydroxypropyl cellulose Polymers 0.000 description 1
- 241000256827 Ichneumonidae Species 0.000 description 1
- 241000256818 Ichneumonoidea Species 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 1
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 1
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- WKSHBPRUIRGWRZ-KCTSRDHCSA-N Ile-Trp-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N WKSHBPRUIRGWRZ-KCTSRDHCSA-N 0.000 description 1
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- ZGUNAGUHMKGQNY-ZETCQYMHSA-N L-alpha-phenylglycine zwitterion Chemical compound OC(=O)[C@@H](N)C1=CC=CC=C1 ZGUNAGUHMKGQNY-ZETCQYMHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- RHGKLRLOHDJJDR-BYPYZUCNSA-N L-citrulline Chemical compound NC(=O)NCCC[C@H]([NH3+])C([O-])=O RHGKLRLOHDJJDR-BYPYZUCNSA-N 0.000 description 1
- XIGSAGMEBXLVJJ-YFKPBYRVSA-N L-homocitrulline Chemical compound NC(=O)NCCCC[C@H]([NH3+])C([O-])=O XIGSAGMEBXLVJJ-YFKPBYRVSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- TVEOVCYCYGKVPP-HSCHXYMDSA-N Leu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N TVEOVCYCYGKVPP-HSCHXYMDSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 241000186781 Listeria Species 0.000 description 1
- 241000186779 Listeria monocytogenes Species 0.000 description 1
- 241000820032 Lomamyia Species 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- GVKINWYYLOLEFQ-XIRDDKMYSA-N Lys-Trp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O GVKINWYYLOLEFQ-XIRDDKMYSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 102000013460 Malate Dehydrogenase Human genes 0.000 description 1
- 108010026217 Malate Dehydrogenase Proteins 0.000 description 1
- 108010038049 Mating Factor Proteins 0.000 description 1
- 241001587859 Melecta albifrons Species 0.000 description 1
- 235000010654 Melissa officinalis Nutrition 0.000 description 1
- 244000062730 Melissa officinalis Species 0.000 description 1
- 241000014004 Melittidae Species 0.000 description 1
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 1
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- AOFZWWDTTJLHOU-ULQDDVLXSA-N Met-Lys-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AOFZWWDTTJLHOU-ULQDDVLXSA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241000918963 Microgastrinae Species 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 241000501454 Mutillidae Species 0.000 description 1
- 241000159443 Myrcia Species 0.000 description 1
- 241001124152 Myrmeleontidae Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- WHNWPMSKXPGLAX-UHFFFAOYSA-N N-Vinyl-2-pyrrolidone Chemical class C=CN1CCCC1=O WHNWPMSKXPGLAX-UHFFFAOYSA-N 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- 101710202365 Napin Proteins 0.000 description 1
- RHGKLRLOHDJJDR-UHFFFAOYSA-N Ndelta-carbamoyl-DL-ornithine Natural products OC(=O)C(N)CCCNC(N)=O RHGKLRLOHDJJDR-UHFFFAOYSA-N 0.000 description 1
- 241000258923 Neuroptera Species 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 241000207836 Olea <angiosperm> Species 0.000 description 1
- 239000005642 Oleic acid Substances 0.000 description 1
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 240000001090 Papaver somniferum Species 0.000 description 1
- 235000008753 Papaver somniferum Nutrition 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- 108010004729 Phycoerythrin Proteins 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 229920000436 Poly(lactide-co-glycolide)-block-poly(ethylene glycol)-block-poly(lactide-co-glycolide) Polymers 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 229920001710 Polyorthoester Polymers 0.000 description 1
- 229920000153 Povidone-iodine Polymers 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 241000256808 Pteromalidae Species 0.000 description 1
- WTKZEGDFNFYCGP-UHFFFAOYSA-N Pyrazole Chemical compound C=1C=NNC=1 WTKZEGDFNFYCGP-UHFFFAOYSA-N 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 241000219492 Quercus Species 0.000 description 1
- 241000700638 Raccoonpox virus Species 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 206010038997 Retroviral infections Diseases 0.000 description 1
- 240000000528 Ricinus communis Species 0.000 description 1
- 235000004443 Ricinus communis Nutrition 0.000 description 1
- 235000017848 Rubus fruticosus Nutrition 0.000 description 1
- 240000007651 Rubus glaucus Species 0.000 description 1
- 235000011034 Rubus glaucus Nutrition 0.000 description 1
- 235000009122 Rubus idaeus Nutrition 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 108010029987 Salivary Proteins and Peptides Proteins 0.000 description 1
- 102000001848 Salivary Proteins and Peptides Human genes 0.000 description 1
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 1
- 241001468001 Salmonella virus SP6 Species 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 241000256851 Scoliidae Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 244000082988 Secale cereale Species 0.000 description 1
- 108010016634 Seed Storage Proteins Proteins 0.000 description 1
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 1
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 1
- UICKAKRRRBTILH-GUBZILKMSA-N Ser-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N UICKAKRRRBTILH-GUBZILKMSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 1
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- XPVIVVLLLOFBRH-XIRDDKMYSA-N Ser-Trp-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H](N)CO)C(O)=O XPVIVVLLLOFBRH-XIRDDKMYSA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 240000003829 Sorghum propinquum Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 229920002334 Spandex Polymers 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 241000256248 Spodoptera Species 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 101710154134 Stearoyl-[acyl-carrier-protein] 9-desaturase, chloroplastic Proteins 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 241001124685 Tenthredinidae Species 0.000 description 1
- 241000383558 Thalia <angiosperm> Species 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 235000006468 Thea sinensis Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- GQPQJNMVELPZNQ-GBALPHGKSA-N Thr-Ser-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O GQPQJNMVELPZNQ-GBALPHGKSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- XEVHXNLPUBVQEX-DVJZZOLTSA-N Thr-Trp-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N)O XEVHXNLPUBVQEX-DVJZZOLTSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 241000255985 Trichoplusia Species 0.000 description 1
- 241000255993 Trichoplusia ni Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- BRBCKMMXKONBAA-KWBADKCTSA-N Trp-Ala-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 BRBCKMMXKONBAA-KWBADKCTSA-N 0.000 description 1
- AVYVKJMBNLPWRX-WFBYXXMGSA-N Trp-Ala-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 AVYVKJMBNLPWRX-WFBYXXMGSA-N 0.000 description 1
- OZUJUVFWMHTWCZ-HOCLYGCPSA-N Trp-Gly-His Chemical compound N[C@@H](Cc1c[nH]c2ccccc12)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OZUJUVFWMHTWCZ-HOCLYGCPSA-N 0.000 description 1
- ADMHZNPMMVKGJW-BPUTZDHNSA-N Trp-Ser-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ADMHZNPMMVKGJW-BPUTZDHNSA-N 0.000 description 1
- FBVGQXJIXFZKSQ-GMVOTWDCSA-N Tyr-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N FBVGQXJIXFZKSQ-GMVOTWDCSA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 1
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 1
- KSGKJSFPWSMJHK-JNPHEJMOSA-N Tyr-Tyr-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSGKJSFPWSMJHK-JNPHEJMOSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 208000024780 Urticaria Diseases 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 244000078534 Vaccinium myrtillus Species 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 1
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 241000276425 Xiphophorus maculatus Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- YKTSYUJCYHOUJP-UHFFFAOYSA-N [O--].[Al+3].[Al+3].[O-][Si]([O-])([O-])[O-] Chemical compound [O--].[Al+3].[Al+3].[O-][Si]([O-])([O-])[O-] YKTSYUJCYHOUJP-UHFFFAOYSA-N 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 210000001361 achilles tendon Anatomy 0.000 description 1
- NIXOWILDQLNWCW-UHFFFAOYSA-N acrylic acid group Chemical group C(C=C)(=O)O NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 1
- 229920006243 acrylic copolymer Polymers 0.000 description 1
- 229920006397 acrylic thermoplastic Polymers 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 230000001476 alcoholic effect Effects 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001335 aliphatic alkanes Chemical class 0.000 description 1
- 229960000458 allantoin Drugs 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 108010004469 allophycocyanin Proteins 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 229960002684 aminocaproic acid Drugs 0.000 description 1
- 235000012538 ammonium bicarbonate Nutrition 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 229940035676 analgesics Drugs 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 239000000730 antalgic agent Substances 0.000 description 1
- 210000001264 anterior cruciate ligament Anatomy 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 239000002260 anti-inflammatory agent Substances 0.000 description 1
- 229940121363 anti-inflammatory agent Drugs 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000001153 anti-wrinkle effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 210000000628 antibody-producing cell Anatomy 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 210000003056 antler Anatomy 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Chemical group OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 239000012298 atmosphere Substances 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000005102 attenuated total reflection Methods 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 235000021015 bananas Nutrition 0.000 description 1
- 229910052788 barium Inorganic materials 0.000 description 1
- DSAJWYNOEDNPEQ-UHFFFAOYSA-N barium atom Chemical compound [Ba] DSAJWYNOEDNPEQ-UHFFFAOYSA-N 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 235000013871 bee wax Nutrition 0.000 description 1
- 239000012166 beeswax Substances 0.000 description 1
- 229960000686 benzalkonium chloride Drugs 0.000 description 1
- CADWTSSKOVRVJC-UHFFFAOYSA-N benzyl(dimethyl)azanium;chloride Chemical compound [Cl-].C[NH+](C)CC1=CC=CC=C1 CADWTSSKOVRVJC-UHFFFAOYSA-N 0.000 description 1
- GONOPSZTUGRENK-UHFFFAOYSA-N benzyl(trichloro)silane Chemical compound Cl[Si](Cl)(Cl)CC1=CC=CC=C1 GONOPSZTUGRENK-UHFFFAOYSA-N 0.000 description 1
- 238000005574 benzylation reaction Methods 0.000 description 1
- 229940000635 beta-alanine Drugs 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- 230000006287 biotinylation Effects 0.000 description 1
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 1
- 235000020279 black tea Nutrition 0.000 description 1
- 235000021029 blackberry Nutrition 0.000 description 1
- 238000004061 bleaching Methods 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 239000004327 boric acid Substances 0.000 description 1
- 239000004566 building material Substances 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 239000000378 calcium silicate Substances 0.000 description 1
- 229910052918 calcium silicate Inorganic materials 0.000 description 1
- OYACROKNLOSFPA-UHFFFAOYSA-N calcium;dioxido(oxo)silane Chemical compound [Ca+2].[O-][Si]([O-])=O OYACROKNLOSFPA-UHFFFAOYSA-N 0.000 description 1
- 235000009120 camo Nutrition 0.000 description 1
- 229960000846 camphor Drugs 0.000 description 1
- 229930008380 camphor Natural products 0.000 description 1
- 238000003981 capillary liquid chromatography Methods 0.000 description 1
- 239000001511 capsicum annuum Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000006229 carbon black Substances 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 150000001733 carboxylic acid esters Chemical class 0.000 description 1
- 210000000845 cartilage Anatomy 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 230000007910 cell fusion Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 235000005607 chanvre indien Nutrition 0.000 description 1
- 238000010382 chemical cross-linking Methods 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 229960003260 chlorhexidine Drugs 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- 229930002868 chlorophyll a Natural products 0.000 description 1
- NSMUHPMZFPKNMZ-VBYMZDBQSA-M chlorophyll b Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C=O)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 NSMUHPMZFPKNMZ-VBYMZDBQSA-M 0.000 description 1
- 229930002869 chlorophyll b Natural products 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000012501 chromatography medium Substances 0.000 description 1
- IVHBBMHQKZBJEU-UHFFFAOYSA-N cinchocaine hydrochloride Chemical compound [Cl-].C1=CC=CC2=NC(OCCCC)=CC(C(=O)NCC[NH+](CC)CC)=C21 IVHBBMHQKZBJEU-UHFFFAOYSA-N 0.000 description 1
- 235000017803 cinnamon Nutrition 0.000 description 1
- 229960002173 citrulline Drugs 0.000 description 1
- 235000013477 citrulline Nutrition 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 239000008199 coating composition Substances 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- 235000016213 coffee Nutrition 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 150000001913 cyanates Chemical class 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000645 desinfectant Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 229960002086 dextran Drugs 0.000 description 1
- 229960000633 dextran sulfate Drugs 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 229940045574 dibucaine hydrochloride Drugs 0.000 description 1
- 150000001991 dicarboxylic acids Chemical class 0.000 description 1
- PGUYAANYCROBRT-UHFFFAOYSA-N dihydroxy-selanyl-selanylidene-lambda5-phosphane Chemical compound OP(O)([SeH])=[Se] PGUYAANYCROBRT-UHFFFAOYSA-N 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 235000021186 dishes Nutrition 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 238000000635 electron micrograph Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 230000001804 emulsifying effect Effects 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 238000005886 esterification reaction Methods 0.000 description 1
- 238000007046 ethoxylation reaction Methods 0.000 description 1
- 229920001249 ethyl cellulose Polymers 0.000 description 1
- 235000019325 ethyl cellulose Nutrition 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 238000012681 fiber drawing Methods 0.000 description 1
- 230000003176 fibrotic effect Effects 0.000 description 1
- 102000034240 fibrous proteins Human genes 0.000 description 1
- 108091005899 fibrous proteins Proteins 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000005227 gel permeation chromatography Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000003365 glass fiber Substances 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 108010083391 glycinin Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- ZRALSGWEFCBTJO-UHFFFAOYSA-O guanidinium Chemical compound NC(N)=[NH2+] ZRALSGWEFCBTJO-UHFFFAOYSA-O 0.000 description 1
- 239000003721 gunpowder Substances 0.000 description 1
- 239000003676 hair preparation Substances 0.000 description 1
- 239000011121 hardwood Substances 0.000 description 1
- 239000011487 hemp Substances 0.000 description 1
- 239000008241 heterogeneous mixture Substances 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 235000012907 honey Nutrition 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 229920002674 hyaluronan Polymers 0.000 description 1
- 229960003160 hyaluronic acid Drugs 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 229960002163 hydrogen peroxide Drugs 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 239000001863 hydroxypropyl cellulose Substances 0.000 description 1
- 235000010977 hydroxypropyl cellulose Nutrition 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000000976 ink Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 239000001023 inorganic pigment Substances 0.000 description 1
- 239000002198 insoluble material Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 235000021332 kidney beans Nutrition 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000000865 liniment Substances 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 229940018564 m-phenylenediamine Drugs 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- HCWCAKKEBCNQJP-UHFFFAOYSA-N magnesium orthosilicate Chemical compound [Mg+2].[Mg+2].[O-][Si]([O-])([O-])[O-] HCWCAKKEBCNQJP-UHFFFAOYSA-N 0.000 description 1
- 239000000391 magnesium silicate Substances 0.000 description 1
- 229910052919 magnesium silicate Inorganic materials 0.000 description 1
- 235000019792 magnesium silicate Nutrition 0.000 description 1
- 229940049920 malate Drugs 0.000 description 1
- BJEPYKJPYRNKOW-UHFFFAOYSA-N malic acid Chemical compound OC(=O)C(O)CC(O)=O BJEPYKJPYRNKOW-UHFFFAOYSA-N 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000005499 meniscus Effects 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 239000010445 mica Substances 0.000 description 1
- 229910052618 mica group Inorganic materials 0.000 description 1
- 239000004530 micro-emulsion Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 235000011929 mousse Nutrition 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 235000010460 mustard Nutrition 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 210000003098 myoblast Anatomy 0.000 description 1
- KUDPGZONDFORKU-UHFFFAOYSA-N n-chloroaniline Chemical compound ClNC1=CC=CC=C1 KUDPGZONDFORKU-UHFFFAOYSA-N 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-N n-hexanoic acid Natural products CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 231100001223 noncarcinogenic Toxicity 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 239000000346 nonvolatile oil Substances 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- VIKNJXKGJWUCNN-XGXHKTLJSA-N norethisterone Chemical compound O=C1CC[C@@H]2[C@H]3CC[C@](C)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1 VIKNJXKGJWUCNN-XGXHKTLJSA-N 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000014571 nuts Nutrition 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 230000000399 orthopedic effect Effects 0.000 description 1
- 210000003101 oviduct Anatomy 0.000 description 1
- 150000002924 oxiranes Chemical class 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 239000011236 particulate material Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 235000011837 pasties Nutrition 0.000 description 1
- 210000000426 patellar ligament Anatomy 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 235000021017 pears Nutrition 0.000 description 1
- 239000002304 perfume Substances 0.000 description 1
- 125000000864 peroxy group Chemical group O(O*)* 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 229960003742 phenol Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- PJPOCNJHYFUPCE-UHFFFAOYSA-N picen-1-ol Chemical compound C1=CC=CC2=C(C=CC=3C4=CC=C5C=CC=C(C=35)O)C4=CC=C21 PJPOCNJHYFUPCE-UHFFFAOYSA-N 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 239000002798 polar solvent Substances 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 229920000233 poly(alkylene oxides) Polymers 0.000 description 1
- 229920003229 poly(methyl methacrylate) Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 108010094020 polyglycine Proteins 0.000 description 1
- 229920000232 polyglycine polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920001343 polytetrafluoroethylene Polymers 0.000 description 1
- 239000004810 polytetrafluoroethylene Substances 0.000 description 1
- 229920002635 polyurethane Polymers 0.000 description 1
- 239000004814 polyurethane Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 235000020004 porter Nutrition 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 210000002967 posterior cruciate ligament Anatomy 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 229960001621 povidone-iodine Drugs 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 244000062645 predators Species 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 235000019260 propionic acid Nutrition 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- JEXVQSWXXUJEMA-UHFFFAOYSA-N pyrazol-3-one Chemical compound O=C1C=CN=N1 JEXVQSWXXUJEMA-UHFFFAOYSA-N 0.000 description 1
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical compound O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 description 1
- 230000000384 rearing effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 229960001755 resorcinol Drugs 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 230000005070 ripening Effects 0.000 description 1
- 229940109850 royal jelly Drugs 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000000565 sealant Substances 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 230000008684 selective degradation Effects 0.000 description 1
- JRPHGDYSKGJTKZ-UHFFFAOYSA-K selenophosphate Chemical compound [O-]P([O-])([O-])=[Se] JRPHGDYSKGJTKZ-UHFFFAOYSA-K 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 239000008257 shaving cream Substances 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 229920002379 silicone rubber Polymers 0.000 description 1
- 239000004945 silicone rubber Substances 0.000 description 1
- 229940034586 silk sericin Drugs 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 210000004872 soft tissue Anatomy 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 239000004759 spandex Substances 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000001694 spray drying Methods 0.000 description 1
- 235000020354 squash Nutrition 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 229910052712 strontium Inorganic materials 0.000 description 1
- CIOAGBVUUVVLOB-UHFFFAOYSA-N strontium atom Chemical compound [Sr] CIOAGBVUUVVLOB-UHFFFAOYSA-N 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
- ISXSCDLOGDJUNJ-UHFFFAOYSA-N tert-butyl prop-2-enoate Chemical compound CC(C)(C)OC(=O)C=C ISXSCDLOGDJUNJ-UHFFFAOYSA-N 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 229920001169 thermoplastic Polymers 0.000 description 1
- 239000004416 thermosoftening plastic Substances 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 239000004408 titanium dioxide Substances 0.000 description 1
- 229940034610 toothpaste Drugs 0.000 description 1
- 239000000606 toothpaste Substances 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 150000003626 triacylglycerols Chemical class 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 231100000588 tumorigenic Toxicity 0.000 description 1
- 230000000381 tumorigenic effect Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 150000003673 urethanes Chemical class 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 210000003934 vacuole Anatomy 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 229920006163 vinyl copolymer Polymers 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
- 239000002569 water oil cream Substances 0.000 description 1
- 238000004078 waterproofing Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 229940093612 zein Drugs 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
- C07K14/43572—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from bees
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/30—Macromolecular organic or inorganic compounds, e.g. inorganic polyphosphates
- A61K47/42—Proteins; Polypeptides; Degradation products thereof; Derivatives thereof, e.g. albumin, gelatin or zein
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
- A61P17/02—Drugs for dermatological disorders for treating wounds, ulcers, burns, scars, keloids, or the like
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/73—Fusion polypeptide containing domain for protein-protein interaction containing coiled-coiled motif (leucine zippers)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biomedical Technology (AREA)
- Pharmacology & Pharmacy (AREA)
- Insects & Arthropods (AREA)
- Microbiology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Tropical Medicine & Parasitology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Dermatology (AREA)
- Cell Biology (AREA)
- Inorganic Chemistry (AREA)
- Epidemiology (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Cosmetics (AREA)
Abstract
본 발명은 실크 단백질 뿐만 아니라, 상기 단백질을 코딩하는 핵산을 제공한다. 본 발명은 또한 실크 단백질을 합성하는 재조합 세포 및/또는 유기체를 제공한다. 본 발명의 실크 단백질은 다양한 목적으로, 예로서, 개인 관리 제품, 플라스틱, 직물 및 생체 의학 제품 생산에 사용될 수 있다.
Description
본 발명은 실크 단백질 뿐만 아니라, 상기 단백질을 코딩하는 핵산에 관한 것이다. 본 발명은 또한 실크 단백질을 합성하는 재조합 세포 및/또는 유기체에 관한 것이다. 본 발명의 실크 단백질은 다양한 목적으로, 예로서, 개인 관리 제품(personal care product), 플라스틱, 직물 및 생체 의학 제품 생산에 사용될 수 있다.
실크는 강도 및 인성이 뛰어난 섬유 단백질 분비물이며, 이는 그 자체로서 광범위한 연구의 표적이 되어 왔다. 실크는 30,000여종 이상의 거미와 많은 곤충들에 의해 생산된다. 이들 실크중 매우 극소수만이 특징을 갖고 있고, 대부분의 연구자들은 재배되는 누에인 봄빅스 모리(Bombyx mori)의 고치 실크와, 황금 원형-섬유 거미(orb-weaving spider)인 네필라 클라비페스(Nephila clavipes)의 거미줄에 집중하고 있다.
나비목(Lepidoptera)과 거미에 있어서 견섬유 실크 유전자는 일반적으로 교대로 있는 소수성 및 친수성 블록의 넓은 부위에 걸쳐져 있는 양끝단에 돌기된 말단 도메인을 갖는 거대한 단백질을 코딩한다[Bini et al., 2004]. 일반적으로, 이들 단백질은 β-구조, β-나선구조, α-나선형 구조 및 무정형 부위와 느슨하게 결 합되어 있는 β-병풍 구조의 결정 배열의 상이한 조합을 포함한다(리뷰를 위해[Craig and Riekel, 2002]를 참조할 수 있다).
공지되어 있는 가장 강한 천연 섬유들중 몇몇을 실크 섬유가 대표하고 있기 때문에 그의 합성을 재현하기 위한 시도로 광범위하게 연구되고 있다. 그러나, 나비목 및 거미 견섬유 유전자 발현의 재현에 관한 문제는 다양한 재조합 발현 시스템에서 발현율이 낮다는 점인데, 이는 유해한 재조합 이벤트를 일으키는 실크 유전자의 반복 뉴클레오티드 모티프의 조합, 큰 유전자 크기 및 숙주 세포 내에서 tRNA 풀을 고갈시키는, 유전자내 각 아미노산에 대하여 사용되는 소수의 코돈 때문이다. 재조합 발현은 번역시, 예를 들면, 코돈 선호 및 코돈 요구의 결과로서 번역 중지 및 유전자를 절단시키는 광범위한 재조합율과 같은 난제를 초래한다. 현재까지의, 실크 유전자 발현과 관련된 많은 문제들은 보다 짧고, 덜 반복적인 서열을 통해서 해소될 수 있다.
나비목(특히, 봄빅스 모리의 고치 실크) 및 거미(특히, 네필라 클라비페스 거미줄)에 대해서는 광범위한 지식이 축적되어 있는 반면, 다른 곤충의 실크의 화학 조성 및 분자 구조에 대해서는 거의 알려진 바 없다.
1960년대 초반, 꿀벌 유충의 침샘으로부터 추출된 실크 섬유로부터 얻은 X-선 회절 패턴 결과, 침이 있는 벌목(Hymenoptera)의 실크는 알파-나선형 구조를 갖는 것으로 밝혀졌다[Rudall, 1962]. 이러한 실크가 나선형이라는 것을 입증했을 뿐만 아니라, 수득된 상기 패턴은 알파-나선형 쇄의 꼬인 코일 시스템을 나타내었다[Atkins, 1967]. 말벌인 슈도폼피루스 훔볼티(Pseudopompilus humbolti)[Rudall, 1962] 및 뒤영벌인 봄부스 루코룸(Bombus lucorum)[Lucas and Rudall, 1967]을 비롯한, 다른 세요아목(Aculeata) 종으로부터 유래된 고치 실크에 대하여 유사한 X-선 회절 패턴을 수득하였다.
세요아목 실크에 관하여 기술된 알파-나선형 구조와는 대조적으로, 세요아목에 대한 관련 계통 분기인 맵시벌상과(Ichneumonoidea)로부터 특징화되는 실크는 평행-β 구조를 갖는다. 이러한 구조를 갖는 4개의 일례에 관한 X-선 다이아그램은 고치벌과(Braconidae)(코테시아(Cotesia)(=아펜텔레스(Apenteles)) 글로머레이트(glomerata); 코테시아(Cotesia)(=아펜텔레스(Apenteles)) 고놉테리기스(gonopterygis); 아펜텔레스 비그넬리(Apenteles bignelli))에서 기술되었고, 3개는 맵시벌과(Ichneumonidae)(두소나 sp.(Dusona sp.); 피토디에트리스 sp.(Phytodietris sp.); 브랜추스 페모랄리스(Branchus femoralis))에서 기술되었다[Lucas and Rudall, 1967]. 또한, 고치벌과(코테시아 글로머레이트) 실크의 서열도 기술되어 있다(진뱅크 데이타베이스 등록번호 AB 188680; [Yamada et al., 2004]). 이러한 부분 단백질 서열은 고도로 보존되는 28개의 X-아스파라긴 반복부(여기에서, X는 알라닌 또는 세린이다)로 구성되나, 헵타드(heptad) 반복부를 형성하는 꼬인 코일을 함유하는 것으로는 예측되지 않는다. 고치벌과의 고치 실크의 아미노산 조성을 광범위하게 분석한 결과, 밤나방살이고치벌아과(Microgastrinae)로부터 유래된 실크는 그의 아스파라긴 및 세린 함량이 높다는 점에서 독특한 것으로 밝혀졌다([Lucas et al., 1960];[Quicke et al., 2004]). 관련된 아과는 아미노산 조성이 유의적으로 상이한 실크를 생산하는데, 이는 밤나방살이고치벌아과 실크가 상기 아과에서 특이적으로 진보한 것임을 제안한다[Yamada et al., 2004]. 단리된 고치 실크 단백질로부터 유래된 내부 펩티드에서 수득한 서열로부터 디자인된 PCR 프라이머를 사용하여 코테시아 글로머레이트의 부분 cDNA를 단리하였다. 이러한 부분 서열의 예측되는 아미노산 조성은 철저히 세척한, 이들 종으로부터 얻은 실크의 아미노산 조성과 매우 유사하다.
다른, 침이 없는 벌아목(Apocrita)과 나머지 벌목(심프타(Symphata))내 실크중 다수의 구조는 대개 통상적으로 평행-β 구조이고, 이들 모두 콜라겐 유사성이고, 잎벌과(Tenthredinidae)에 의해 생산되는 폴리글리신 실크이다[Lucas and Rudall, 1967].
꿀벌 실크 단백질은 최종 영(instar) 중간 무렵에 합성되고, 이는 탈중합화된 실크 단백질의 믹스로서 영상화될 수 있다[Silva-Zacarin et al., 2003]. 영이 진행됨에 따라, 물은 상기 샘으로부터 제거되고, 탈수를 통해 실크 단백질의 중합화가 이루어짐으로써 조직화가 잘된 불용성 실크 미세섬유 표지 탁토이드가 형성된다[Silva-Zacarin et al, 2003]. 탈수가 진행됨에 따라 탁토이드가 추가로 재조직화되고[Silva-Zacarin et al., 2003], 가능하게는 미세섬유 사이의 새로운 미세섬유간 결합이 이루어진다[Rudall, 1962]. 꿀벌 실크 샘으로부터 단리된 원섬유의 전자 현미경 영상은 직경이 대략 20-25Å인 구조를 나타낸다[Flower and Kenchington, 1967]. 이 값은 3-, 4-, 또는 5-가닥 꼬인 코일과 일치한다.
다양한 침이 있는 벌목 종 실크의 아미노산 조성은 (Lucas and Rudall (1967))에 의해 측정되었고, 고함량의 알라닌, 세린, 산성 잔기, 아스파르트산 및 글루탐산과 종래의 견섬유와 비교할 때에 양이 감소된 글리신을 함유하는 것으로 밝혀졌다. 침이 있는 벌목 실크의 나선형 함량은 글리신 함량의 감소와 산성 잔기 함량의 증가 결과인 것으로 간주되었다[Rudall and Kenchington, 1971].
풀잠자리(목: 풀잠자리목(Neuroptera)) 유충 실크에 대해서는 알려진 바가 거의 없다. 고치는 내부의 고체층과 외부의 섬유층, 이 2개로 구성된다. 앞서, 고치는 큐티쿨린 실크로 구성된다고 기술된 바와 같이[Rudall and Kenchington, 1971], 오직 내부 고체층에 관해서만 기술되어 있다. (LaMunyon (1988))은 외부 섬유를 구성하는, 말피 기관으로부터 분비된 물질을 기술하였다. 상기 층이 침전된 후, 고체 내부벽은 많은 융모를 가진 루멘중 상피 세포로부터 분비된 분비물로부터 구성되었다[LaMunyon, 1988].
또한, 풀잠자리 유충은 모든 영에 걸쳐 말피 기관으로부터 단백질성의 접착성 물질을 생산하여 유충을 기질에 접착시키거나, 유충의 등 위에 위장 아이템을 붙이거나, 먹이를 포획하는 것으로 알려져 있다[Speilger, 1962]. 로마미이아(Lomamyia)(베토티다에(Bethothidae))에서, 유충은 실크와 접착성 물질을 동시에 생산하고, 이들 2개의 물질은 매우 동일한 산물일 수 있다고 가정되어 왔다[Speilger, 1962]. 접착성 분비물은 가용성이 높고, 이는 또한 포식자에 대한 방어에도 관련이 있는 것으로 여겨지고 있다[LaMunyon & Adams, 1987].
벌목 및 풀잠자리목과 같은 곤충에 의해 생산된 실크의 독특한 성질을 고려할 때, 이들 유기체로부터 실크 단백질을 코딩하는 신규한 핵산을 동정할 필요가 있다.
[발명의 요약]
본 발명자들은 곤충으로부터 다수의 실크 단백질을 동정하였다. 이들 실크 단백질은 놀랍게도 다른 공지 실크 단백질과 그의 1차 서열, 2차 구조 및/또는 아미노산 함량면에서 상이하다.
따라서, 제1 측면에서, 본 발명은 폴리펩티드의 적어도 일부가 꼬인 코일 구조를 갖는, 실질적으로 정제된 실크 폴리펩티드 및/또는 재조합 실크 폴리펩티드를 제공한다.
당업계에 공지되어 있는 바와 같이, 폴리펩티드의 꼬인 코일 구조는 공통 서열 (abcdefg)n로 표시되는 헵타드 반복부를 특징으로 하는데, 일반적으로 a와 d 위치에는 소수성 잔기가 존재하고, 일반적으로 나머지 위치에는 극성 잔기가 존재한다. 놀랍게도, 본 발명의 폴리펩티드의 헵타드는 총괄적으로 볼 때, '소수성' 헵타드 위치 a 및 d에 매우 고도로 풍부한 알라닌을 갖는다는 점에서 신규한 조성을 갖는다. 게다가, 이들 위치에는 고수준의 작은 극성 잔기가 존재한다. 추가로, e 위치에는 또한 고수준의 알라닌 및 작은 소수성 잔기가 존재한다.
따라서, 특히 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 a 및 d에 있는 아미노산 중 25% 이상이 알라닌 잔기이다.
추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 a, d 및 e에 있는 아미노산 중 25% 이상이 알라닌 잔기이다.
추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 a에 있는 아미노산 중 25% 이상이 알라닌 잔기이다.
추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 d에 있는 아미노산 중 25% 이상이 알라닌 잔기이다.
추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 e에 있는 아미노산 중 25% 이상이 알라닌 잔기이다.
특히 바람직한 실시태양에서, 헵타드 서열 10 카피 이상이 인접한다.
추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 5 카피 이상 포함하며, 위치 a 및 d에 있는 아미노산 중 15% 이상이 알라닌 잔기이다.
추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 5 카피 이상 포함하며, 위치 a, d 및 e에 있는 아미노산 중 15% 이상이 알라닌 잔기이다.
추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 5 카피 이상 포함하며, 위치 a에 있는 아미노산 중 15% 이상이 알라닌 잔기이다.
추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 5 카피 이상 포함하며, 위치 d에 있는 아미노산 중 15% 이상이 알라닌 잔기이다.
추가의 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 5 카피 이상 포함하며, 위치 e에 있는 아미노산 중 15% 이상이 알라닌 잔기이다.
특히 바람직한 실시태양에서, 헵타드 서열 5 카피 이상이 인접한다.
하나의 실시태양에서, 폴리펩티드는
i) 서열 번호 1, 서열 번호 2, 서열 번호 22, 서열 번호 23, 서열 번호 40, 서열 번호 41, 서열 번호 56 및 서열 번호 57 중 어느 하나에 제시된 아미노산 서열;
ii) 서열 번호 1, 서열 번호 2, 서열 번호 22, 서열 번호 23, 서열 번호 40, 서열 번호 41, 서열 번호 56 및 서열 번호 57 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및
iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함한다.
또다른 실시태양에서, 폴리펩티드는
i) 서열 번호 3, 서열 번호 4, 서열 번호 24, 서열 번호 25, 서열 번호 42, 서열 번호 43, 서열 번호 58 및 서열 번호 59 중 어느 하나에 제시된 아미노산 서열;
ii) 서열 번호 3, 서열 번호 4, 서열 번호 24, 서열 번호 25, 서열 번호 42, 서열 번호 43, 서열 번호 58 및 서열 번호 59 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및
iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함한다.
또다른 실시태양에서, 폴리펩티드는
i) 서열 번호 5, 서열 번호 6, 서열 번호 26, 서열 번호 27, 서열 번호 44, 서열 번호 45, 서열 번호 60 및 서열 번호 61 중 어느 하나에 제시된 아미노산 서열;
ii) 서열 번호 5, 서열 번호 6, 서열 번호 26, 서열 번호 27, 서열 번호 44, 서열 번호 45, 서열 번호 60 및 서열 번호 61 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및
iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함한다.
또다른 실시태양에서, 폴리펩티드는
i) 서열 번호 7, 서열 번호 8, 서열 번호 28, 서열 번호 29, 서열 번호 46, 서열 번호 47, 서열 번호 62 및 서열 번호 63 중 어느 하나에 제시된 아미노산 서열;
ii) 서열 번호 7, 서열 번호 8, 서열 번호 28, 서열 번호 29, 서열 번호 46, 서열 번호 47, 서열 번호 62 및 서열 번호 63 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및
iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함한다.
추가의 실시태양에서, 폴리펩티드는
i) 서열 번호 72 또는 서열 번호 73에 제시된 아미노산 서열;
ii) 서열 번호 72 및/또는 서열 번호 73에 30% 이상 일치하는 아미노산 서열; 및
iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함한다.
제1 측면의 단백질과 공-회합하고 있는 추가의 실크 단백질이 동정되었다. 이들 단백질중 하나(서열 번호 10)는 PROFsec에 의해 41%의 알파-나선형, 8%의 베타-구조 및 50%의 루프 2차 구조를 갖는 것으로 예측되었고, 따라서, 혼합형 구조 단백질로서 분류된다. 본 단백질의 MARCOIL 분석을 통해 꼬인 코일 구조를 갖는 단백질의 특징을 나타내는 헵타드 반복부의 짧은 부위만을 예측하였다.
따라서, 제2 측면에서, 본 발명은
i) 서열 번호 9, 서열 번호 10 및 서열 번호 30 중 어느 하나에 제시된 아미노산 서열;
ii) 서열 번호 9, 서열 번호 10 및 서열 번호 30 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및
iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함하는, 실질적으로 정제된 실크 폴리펩티드 및/또는 재조합 실크 폴리펩티드를 제공한다.
이론에 의해 제한하고자 하는 것은 아니지만, 제1 측면의 단백질 4개는 서로에 대하여 거의 평행한 나선형 축을 갖는 다발을 형성하고, 이러한 다발은 축방향으로 원섬유까지 확장되는 것으로 보인다. 추가로, 예를 들면, 꿀벌 및 뒤영벌과 같은 적어도 일부의 종에서 제2 측면의 단백질은 다양한 제1 측면의 꼬인 코일 단백질 다발 함께 결합하여 섬유 단백질 복합체를 형성하는데 도움을 주는 "접착체"로서의 역할을 하는 것으로 예측된다. 그러나, 실크 섬유와 공중합체는 제2 측면의 폴리펩티드 없이도 여전히 형성될 수 있다.
바람직한 실시태양에서, 본 발명의 폴리펩티드는 벌목 또는 풀잠자리목 종으로부터 정제될 수 있거나, 그로부터 선택되는 폴리펩티드의 돌연변이체이다. 바람직하게는, 벌목 종은 아피스 멜리페라(Apis mellifera), 오에코필라 스마라그디나(Oecophylla smaragdina), 미르메시아 포리카타(Myrmecia foricata) 또는 봄부스 테레스트리스(Bombus terrestris)이다. 바람직하게는, 풀잠자리목 종은 말라다 시그나타(Mallada signata)이다.
또다른 측면에서, 본 발명은 1종 이상의 다른 폴리펩티드에 융합된 본 발명의 폴리펩티드를 제공한다.
바람직한 실시태양에서, 1종 이상의 다른 폴리펩티드는 본 발명의 폴리펩티드의 안정성을 증진시키는 폴리펩티드, 융합 단백질 정제에 도움을 주는 폴리펩티드 및 세포로부터 본 발명의 폴리펩티드가 분비되는 것(예컨대, 식물 세포로부터 분비되는 것)을 돕는 폴리펩티드로 구성된 군으로부터 선택된다.
또다른 측면에서, 본 발명은 폴리펩티드의 적어도 일부가 꼬인 코일 구조를 갖고, 실크 폴리펩티드를 코딩하는 단리된 폴리뉴클레오티드 및/또는 외인성 폴리뉴클레오티드를 제공한다.
하나의 실시태양에서, 폴리뉴클레오티드는
i) 서열 번호 11, 서열 번호 12, 서열 번호 31, 서열 번호 32, 서열 번호 48, 서열 번호 49, 서열 번호 64 및 서열 번호 65 중 어느 하나에 제시된 뉴클레오티드 서열;
ii) 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열;
iii) 서열 번호 11, 서열 번호 12, 서열 번호 31, 서열 번호 32, 서열 번호 48, 서열 번호 49, 서열 번호 64 및 서열 번호 65 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및
iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함한다.
또다른 실시태양에서, 폴리뉴클레오티드는
i) 서열 번호 13, 서열 번호 14, 서열 번호 33, 서열 번호 34, 서열 번호 50, 서열 번호 51, 서열 번호 66 및 서열 번호 67 중 어느 하나에 제시된 뉴클레오티드 서열;
ii) 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열;
iii) 서열 번호 13, 서열 번호 14, 서열 번호 33, 서열 번호 34, 서열 번호 50, 서열 번호 51, 서열 번호 66 및 서열 번호 67 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및
iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함한다.
또다른 실시태양에서, 폴리뉴클레오티드는
i) 서열 번호 15, 서열 번호 16, 서열 번호 35, 서열 번호 36, 서열 번호 52, 서열 번호 53, 서열 번호 68 및 서열 번호 69 중 어느 하나에 제시된 뉴클레오티드 서열;
ii) 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열;
iii) 서열 번호 15, 서열 번호 16, 서열 번호 35, 서열 번호 36, 서열 번호 52, 서열 번호 53, 서열 번호 68 및 서열 번호 69 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및
iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함한다.
추가의 실시태양에서, 폴리뉴클레오티드는
i) 서열 번호 17, 서열 번호 18, 서열 번호 37, 서열 번호 38, 서열 번호 54, 서열 번호 55, 서열 번호 70, 서열 번호 71 및 서열 번호 76 중 어느 하나에 제시된 뉴클레오티드 서열;
ii) 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열;
iii) 서열 번호 17, 서열 번호 18, 서열 번호 37, 서열 번호 38, 서열 번호 54, 서열 번호 55, 서열 번호 70, 서열 번호 71 및 서열 번호 76 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및
iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함한다.
또다른 실시태양에서, 폴리뉴클레오티드는
i) 서열 번호 74 또는 서열 번호 75로 제공되는 뉴클레오티드 서열;
ii) 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열;
iii) 서열 번호 74 또는 서열 번호 75에 30% 이상 일치하는 뉴클레오티드 서열; 및
iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함한다.
추가의 측면에서, 본 발명은
i) 서열 번호 19, 서열 번호 20, 서열 번호 21 및 서열 번호 39 중 어느 하나에 제시된 뉴클레오티드 서열;
ii) 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열;
iii) 서열 번호 19, 서열 번호 20, 서열 번호 21 및 서열 번호 39 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및
iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함하는, 단리된 폴리뉴클레오티드 및/또는 외인성 폴리뉴클레오티드를 제공한다.
바람직한 실시태양에서, 폴리뉴클레오티드는 벌목 또는 풀잠자리목으로부터 단리될 수 있거나, 벌목 또는 풀잠자리목으로부터 단리된 폴리뉴클레오티드의 돌연변이체이다. 바람직하게는, 벌목 종은 아피스 멜리페라, 오에코필라 스마라그디나, 미르메시아 포리카타 또는 봄부스 테레스트리스이다. 바람직하게는, 풀잠자리목 종은 말라다 시그나타이다.
추가의 측면에서, 본 발명은 본 발명의 1종 이상의 폴리뉴클레오티드를 포함하는 벡터를 제공한다.
바람직하게는, 벡터는 발현 벡터이다.
또다른 측면에서, 본 발명은 본 발명의 1종 이상의 폴리뉴클레오티드 및/또는 본 발명의 1종 이상의 벡터를 포함하는 숙주 세포를 제공한다.
숙주 세포는 임의 유형의 세포일 수 있다. 일례로 박테리아, 효모 또는 식물 세포를 포함하나, 이에 한정되지 않는다.
폴리펩티드를 코딩하는 폴리뉴클레오티드가 발현될 수 있도록 하는 조건하에서 본 발명의 숙주 세포, 또는 본 발명의 벡터를 배양하고, 발현된 폴리펩티드를 회수하는 것을 포함하는, 본 발명에 따른 폴리펩티드를 제조하는 방법 또한 제공한다.
트랜스제닉(transgenic) 식물이 본 발명의 폴리펩티드 생산에 특히 유용할 것이라고 직시된다. 따라서, 추가의 또다른 측면에서, 본 발명은 1종 이상의 본 발명의 폴리펩티드를 코딩하는 외인성 폴리뉴클레오티드를 포함하는 트랜스제닉 식물을 제공한다.
또다른 측면에서, 본 발명은 1종 이상의 본 발명의 폴리펩티드를 코딩하는 외인성 폴리뉴클레오티드를 포함하는, 인간을 제외한 트랜스제닉 동물을 제공한다.
추가의 또다른 측면에서, 본 발명은 본 발명의 폴리펩티드에 특이적으로 결합하는 항체를 제공한다.
추가의 측면에서, 본 발명은 1종 이상의 본 발명의 폴리펩티드를 포함하는 실크 섬유를 제공한다.
바람직하게는, 폴리펩티드는 재조합 폴리펩티드이다.
하나의 실시태양에서, 폴리펩티드 중 적어도 일부는 가교 결합된 것이다. 하나의 실시태양에서, 폴리펩티드의 리진 잔기 중 적어도 일부는 가교 결합된 것이다.
또다른 측면에서, 본 발명은 2종 이상 본 발명의 폴리펩티드를 포함하는 공중합체를 제공한다.
바람직하게는, 폴리펩티드는 재조합 폴리펩티드이다.
하나의 실시태양에서, 공중합체는 4종 이상의 상이한 제1 측면의 폴리펩티드를 포함한다. 또다른 실시태양에서, 공중합체는 추가로 제2 측면의 폴리펩티드를 포함한다.
하나의 실시태양에서, 폴리펩티드 중 적어도 일부는 가교 결합된 것이다. 하나의 실시태양에서, 폴리펩티드의 리진 잔기 중 적어도 일부는 가교 결합된 것이다.
숙련된 수령인이 이해하고 있는 바와 같이, 본 발명의 폴리펩티드는 당업계에서 다른 유형의 실크 단백질에 대해 공지되어 있는 바와 같이 매우 다양한 용도를 갖고 있다. 따라서, 추가의 측면에서, 본 발명은 1종 이상의 본 발명의 폴리펩티드, 본 발명의 실크 섬유 및/또는 본 발명의 공중합체를 포함하는 제품을 제공한다.
제품의 일례로는 개인 관리 제품, 직물, 플라스틱 및 생체 의학 제품을 포함하나, 이에 한정되지 않는다.
또한 추가의 측면에서, 본 발명은 1종 이상의 본 발명의 폴리펩티드, 본 발명의 실크 섬유 및/또는 본 발명의 공중합체 및 1종 이상의 허용 가능한 담체를 포함하는 제품을 제공한다.
하나의 실시태양에서, 조성물은 추가로 약물을 포함한다.
또다른 실시태양에서, 조성물은 의료 장치 또는 미용화장품(cosmetic)에서 의약으로서 사용된다.
또다른 측면에서, 본 발명은 1종 이상의 본 발명의 폴리뉴클레오티드 및 하나 이상의 담체를 포함하는 제품을 제공한다.
바람직한 실시태양에서, 본 발명의 조성물, 실크 섬유, 공중합체 및/또는 제품은 곤충에 의해 생산되는 로얄 젤리 단백질은 포함하지 않는다.
추가의 측면에서, 본 발명은 질병 치료 또는 예방용 약물 및 약제학적으로 허용 가능한 담체를 포함하는 조성물을 투여하는 방법으로서, 여기에서, 약제학적으로 허용 가능한 담체가 1종 이상의 본 발명의 폴리펩티드, 본 발명의 실크 섬유 및/또는 본 발명의 공중합체로부터 선택되는 것인, 질병을 치료 또는 예방하는 방법을 제공한다.
추가의 또다른 측면에서, 본 발명은 질병 치료 또는 예방용 약제 제조를 위한 1종 이상의 본 발명의 폴리펩티드, 본 발명의 실크 섬유 및/또는 본 발명의 공중합체 및 약물의 용도를 제공한다.
추가의 측면에서, 본 발명은 1종 이상의 본 발명의 폴리펩티드, 1종 이상의 본 발명의 폴리뉴클레오티드, 본 발명의 실크 섬유 및/또는 본 발명의 공중합체를 포함하는 키트를 제공한다.
바람직하게는, 키트는 추가로 키트 사용에 관한 정보 및/또는 설명서를 포함한다.
자명한 바와 같이, 본 발명의 한 측면의 바람직한 특성과 특징은 본 발명의 다수의 다른 측면에 적용될 수 있다.
본 명세서를 통하여, "포함한다(comprises)" 또는 이것의 변형인 "포함한다(comprises)" 또는 "포함하는(comprising)"이라는 용어는 언급된 요소, 완전체, 또는 단계, 또는 요소, 완전체, 또는 단계들의 군을 포함하는 것을 의미하나, 그 외의 다른 요소, 완전체, 또는 단계, 또는 요소, 완전체, 또는 단계들의 군을 포함하지 않는다는 것은 아니다.
이하, 본 발명은 하기의 비제한적인 실시예와 첨부되는 도면과 관련하여 기술된다.
[도면의 간단한 설명]
도 1. 실크: 1) 꿀벌 실크, 2) 뒤영벌 실크, 3) 불독 개미 실크, 4) 바느질 개미 실크, 5) 풀잠자리 유충 실크의 아미드 I 및 II 부위의 푸리에 변환 적외선 스펙트럼. 모든 실크는 나선형 단백질로 예상되는 스펙트럼을 갖는다. 벌목 실크 (개미 및 벌)은 1645-1646cm-1(표지됨)에서 최대 스펙트럼값을 갖고, 꼬인 코일 단백질의 전형적인 특징을 나타내는 바와 같이[Heimburg et al., 1999], 종래의 알파-나선형 신호보다 대략 10cm-1 아래로 이동하였고, 범위는 넓어졌다.
도 2. SDS로 세척된 꿀벌 벌집 실크의 아미노산 조성과 제노스피라 단백질(즉, 제노스피라1, 제노스피라2, 제노스피라3 및 제노스피라4)(동몰량으로 총합은 65%) 및 제노신 (35%)의 아미노산 조성 비교.
도 3. 아미노산 조성과 실크 유전자에 의해 코딩된 단백질로부터 예측되는 아미노산 조성의 비교.
도 4. 꿀벌 실크 단백질내 꼬인 코일 부위 예측. COILS는 서열을 공지의 평행한 2-가닥 꼬인 코일의 데이타베이스와 비교하고, 유사도 스코어를 유도해 내는 프로그램이다. [Lupas et al. (1991)]에 기재되어 있는 바와 같이, 상기 스코어를 구상 및 꼬인 코일 단백질에서의 스코어 분포와 상기 스코어를 비교함으로써 프로그램은 서열이 꼬인 코일 구조를 채택하게 될 가능성에 대하여 산출하게 된다. 28개의 윈도우 크기를 사용함으로써 상기 프로그램은 하기 갯수만큼의 잔기가 각 단백질 꼬인 코일 도메인내 존재한다고 예측하고 있다: 제노스피라3: 77개; 제노스피라4: 35개; 제노스피라1: 28개; 제노스피라2: 80개.
도 5. 꼬인 코일 구조를 형성하는 주 헵타드에 관한 MARCOIL 예측을 나타내는 꿀벌 실크 단백질의 정렬. 헵타드 서열을 아미노산 위에 나타내고, 위치 a 및 d의 알라닌 잔기는 하이라이트로 표시되어 있다.
도 6. 헵타드 위치 배정을 나타내는 벌목 (벌 및 개미) 실크 단백질의 Marcoil 예측된 꼬인 코일 부위의 정렬. Amel, 꿀벌; BB, 뒤영벌; BA, 불독 개미; WA, 바느질 개미; F1-4, 실크 견섬유 1-4. 헵타드 서열을 아미노산 위에 나타내고, 위치 a, d 및 e의 알라닌 잔기는 하이라이트로 표시되어 있다.
도 7. 말라다 시그나타 유충 실크 단백질 및 벌목 실크 단백질의 오솔로그 집단의 예측된 꼬인 코일 부위내 헵타드 위치의 아미노산 성질.
도 8. 말기의 최종 영 침샘 단백질의 SDS 폴리아크릴아미드 겔 전기영동. 트립신 분해 후, cDNA 서열로부터 동정된 단백질로부터 예측된 단백질 서열과 데이타를 매치시키는 애질런트 스펙트럼 밀 소프트웨어(Agilent's Spectrum Mill software)를 사용하여 질량 스펙트럼 데이타 세트를 분석하여 단백질을 동정하였다. 소프트웨어는 펩티드 단편에 대하여 실험상 관찰된 질량 세트와, 제공된 데이타베이스내의 단백질 서열에 따라 생성될 수 있는 단편의 예측치 사이의 각 매치의 질에 관한 스코어를 생성하였다. 본원에 나타낸 서열 매치 모두는 스펙트럼 밀 소프트웨어에 의해 20보다 큰 스코어를 받았는데, 여기에서, 20이라는 스코어는 유효 매치의 자동, 신뢰 허용에 대하여 충분할 것이다.
도 9. 실크 단백질중 꼬인 코일 부위의 절약 분석. 4개의 꼬인 코일 단백질이 갖는 관련성은 유전자가 진정 세요아목(Euaculeata) 분기 이전의 공통 조상으로부터 진화하였다는 것을 제안한다. 점선으로 경계를 표시한 영역은 쥬라기 말기에 개미 및 말벌(말벌과(Vespoidea))이 벌(꿀벌과(Apoidea))로부터 분기되지 이전에 발생한 변종을 나타낸다(155 myrs; [Grimaldi and Engel, 2005]). 1000회의 반복으로부터 부트스트랩 수치를 표시하는 숫자를 나타낸다.
도 10. A) 트립신 분해 후에 벌 실크로부터 생성된 펩티드의 질량 스펙트럼 분석으로 동정된 아피스 멜리페라 실크 단백질. 음영으로 표시된 부분은 질량 스펙트럼 분석으로 동정된 펩티드이다. 본원에 나타낸 서열 매치 모두는 스펙트럼 밀 소프트웨어에 의해 20보다 큰 스코어를 받았는데, 여기에서, 20이라는 스코어는 유효 매치의 자동, 신뢰 허용에 대하여 충분할 것이다.
B) 뒤영벌, 불독 개미, 바느질 개미 및 풀잠자리 실크 단백질의 전장의 아미노 서열.
도 11. 꿀벌, 뒤영벌, 불독 개미, 바느질 개미 및 풀잠자리 실크 단백질을 코딩하는 오픈 리딩 프레임.
도 12. 제노신을 코딩하는 서열. 단일 인트론(하이라이트로 표시)이 개입된 전체 코딩 서열을 제공한다.
도 13. 타바코에서 실크 단백질의 발현. 1. 빈 발현 벡터로 형질전환된 E. 콜라이(E. coli), 2. AmelF4(제노스피라4) 코딩 부위를 함유하는 발현 벡터로 형질전환된 E. 콜라이, 3. 빈 발현 벡터로 형질전환된 타바코, 4. AmelF4 코딩 부위로 형질전환된 타바코로부터의 단백질 웨스턴 블롯 분석 후의 히스티딘 태깅된 단백질의 검출.
도 14. 복굴절성 실을 나타내는, 재조합 꿀벌 실크 단백질로 제조된 섬유. 복굴절성은 구조물이 실내 존재한다는 것을 지시한다. 상이한 재조합 꿀벌 실들을 패널 A-D 각각에 나타내고, 재조합 풀잠자리 실을 패널 E에 나타낸다.
서열목록에 관한 풀이
서열 번호 1 - 본원에서 제노스피라1(또는 본원에서 AmelF1)로 명명되는 꿀벌 실크 단백질(마이너스 신호 펩티드).
서열 번호 2 - 본원에서 제노스피라1로 명명되는 꿀벌 실크 단백질.
서열 번호 3 - 본원에서 제노스피라2(또는 본원에서 AmelF2)로 명명되는 꿀벌 실크 단백질(마이너스 신호 펩티드).
서열 번호 4 - 본원에서 제노스피라2로 명명되는 꿀벌 실크 단백질.
서열 번호 5 - 본원에서 제노스피라3(또는 본원에서 AmelF3)으로 명명되는 꿀벌 실크 단백질(마이너스 신호 펩티드).
서열 번호 6 - 본원에서 제노스피라3으로 명명되는 꿀벌 실크 단백질.
서열 번호 7 - 본원에서 제노스피라4(또는 본원에서 AmelF4)로 명명되는 꿀벌 실크 단백질(마이너스 신호 펩티드).
서열 번호 8 - 본원에서 제노스피라4로 명명되는 꿀벌 실크 단백질.
서열 번호 9 - 본원에서 제노신(또는 본원에서 AmelSA1)으로 명명되는 꿀벌 실크 단백질(마이너스 신호 펩티드).
서열 번호 10 - 본원에서 제노신으로 명명되는 꿀벌 실크 단백질.
서열 번호 11 - 꿀벌 실크 단백질 제노스피라1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 12 - 꿀벌 실크 단백질 제노스피라1을 코딩하는 뉴클레오티드 서열.
서열 번호 13 - 꿀벌 실크 단백질 제노스피라2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 14 - 꿀벌 실크 단백질 제노스피라2를 코딩하는 뉴클레오티드 서열.
서열 번호 15 - 꿀벌 실크 단백질 제노스피라3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 16 - 꿀벌 실크 단백질 제노스피라3을 코딩하는 뉴클레오티드 서열.
서열 번호 17 - 꿀벌 실크 단백질 제노스피라4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 18 - 꿀벌 실크 단백질 제노스피라4를 코딩하는 뉴클레오티드 서열.
서열 번호 19 - 꿀벌 실크 단백질 제노신을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 20 - 꿀벌 실크 단백질 제노신을 코딩하는 뉴클레오티드 서열.
서열 번호 21 - 꿀벌 실크 단백질 제노신을 코딩하는 유전자 서열.
서열 번호 22 - 본원에서 BBF1로 명명되는 뒤영벌 실크 단백질(마이너스 신호 펩티드).
서열 번호 23 - 본원에서 BBF1로 명명되는 뒤영벌 실크 단백질.
서열 번호 24 - 본원에서 BBF2로 명명되는 뒤영벌 실크 단백질(마이너스 신호 펩티드).
서열 번호 25 - 본원에서 BBF2로 명명되는 뒤영벌 실크 단백질.
서열 번호 26 - 본원에서 BBF3으로 명명되는 뒤영벌 실크 단백질(마이너스 신호 펩티드).
서열 번호 27 - 본원에서 BBF3으로 명명되는 뒤영벌 실크 단백질.
서열 번호 28 - 본원에서 BBF4로 명명되는 뒤영벌 실크 단백질(마이너스 신호 펩티드).
서열 번호 29 - 본원에서 BBF4로 명명되는 뒤영벌 실크 단백질.
서열 번호 30 - 본원에서 BBSA1로 명명되는 뒤영벌 실크 단백질의 부분 아미노산 서열.
서열 번호 31 - 뒤영벌 실크 단백질 BBF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 32 - 뒤영벌 실크 단백질 BBF1을 코딩하는 뉴클레오티드 서열.
서열 번호 33 - 뒤영벌 실크 단백질 BBF2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 34 - 뒤영벌 실크 단백질 BBF2를 코딩하는 뉴클레오티드 서열.
서열 번호 35 - 뒤영벌 실크 단백질 BBF3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 36 - 뒤영벌 실크 단백질 BBF3을 코딩하는 뉴클레오티드 서열.
서열 번호 37 - 뒤영벌 실크 단백질 BBF4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 38 - 뒤영벌 실크 단백질 BBF4를 코딩하는 뉴클레오티드 서열.
서열 번호 39 - 뒤영벌 실크 단백질 BBSA1을 코딩하는 부분 뉴클레오티드 서열.
서열 번호 40 - 본원에서 BAF1로 명명되는 불독 개미 실크 단백질(마이너스 신호 펩티드).
서열 번호 41 - 본원에서 BAF1로 명명되는 불독 개미 실크 단백질.
서열 번호 42 - 본원에서 BAF2로 명명되는 불독 개미 실크 단백질(마이너스 신호 펩티드).
서열 번호 43 - 본원에서 BAF2로 명명되는 불독 개미 실크 단백질.
서열 번호 44 - 본원에서 BAF3으로 명명되는 불독 개미 실크 단백질(마이너스 신호 펩티드).
서열 번호 45 - 본원에서 BAF3으로 명명되는 불독 개미 실크 단백질.
서열 번호 46 - 본원에서 BAF4로 명명되는 불독 개미 실크 단백질(마이너스 신호 펩티드).
서열 번호 47 - 본원에서 BAF4로 명명되는 불독 개미 실크 단백질.
서열 번호 48 - 불독 개미 실크 단백질 BAF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 49 - 불독 개미 실크 단백질 BAF1을 코딩하는 뉴클레오티드 서열.
서열 번호 50 - 불독 개미 실크 단백질 BAF2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 51 - 불독 개미 실크 단백질 BAF2를 코딩하는 뉴클레오티드 서열.
서열 번호 52 - 불독 개미 실크 단백질 BAF3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 53 - 불독 개미 실크 단백질 BAF3을 코딩하는 뉴클레오티드 서열.
서열 번호 54 - 불독 개미 실크 단백질 BAF4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 55 - 불독 개미 실크 단백질 BAF4를 코딩하는 뉴클레오티드 서열.
서열 번호 56 - 본원에서 GAF1로 명명되는 바느질 개미 실크 단백질(마이너스 신호 펩티드).
서열 번호 57 - 본원에서 GAF1로 명명되는 바느질 개미 실크 단백질.
서열 번호 58 - 본원에서 GAF2로 명명되는 바느질 개미 실크 단백질(마이너스 신호 펩티드).
서열 번호 59 - 본원에서 GAF2로 명명되는 바느질 개미 실크 단백질.
서열 번호 60 - 본원에서 GAF3으로 명명되는 바느질 개미 실크 단백질(마이너스 신호 펩티드).
서열 번호 61 - 본원에서 GAF3으로 명명되는 바느질 개미 실크 단백질.
서열 번호 62 - 본원에서 GAF4로 명명되는 바느질 개미 실크 단백질(마이너스 신호 펩티드).
서열 번호 63 - 본원에서 GAF4로 명명되는 바느질 개미 실크 단백질.
서열 번호 64 - 바느질 개미 실크 단백질 GAF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 65 - 바느질 개미 실크 단백질 GAF1을 코딩하는 뉴클레오티드 서열.
서열 번호 66 - 바느질 개미 실크 단백질 GAF2를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 67 - 바느질 개미 실크 단백질 GAF2를 코딩하는 뉴클레오티드 서열.
서열 번호 68 - 바느질 개미 실크 단백질 GAF3을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 69 - 바느질 개미 실크 단백질 GAF3을 코딩하는 뉴클레오티드 서열.
서열 번호 70 - 바느질 개미 실크 단백질 GAF4를 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 71 - 바느질 개미 실크 단백질 GAF4를 코딩하는 뉴클레오티드 서열.
서열 번호 72 - 본원에서 MalF1로 명명되는 풀잠자리 실크 단백질(마이너스 신호 펩티드).
서열 번호 73 - 본원에서 MalF1로 명명되는 풀잠자리 실크 단백질.
서열 번호 74 - 풀잠자리 실크 단백질 MalF1을 코딩하는 뉴클레오티드 서열(신호 펩티드를 코딩하는 마이너스 부위).
서열 번호 75 - 풀잠자리 실크 단백질 MalF1을 코딩하는 뉴클레오티드 서열.
서열 번호 76 - (pET14b 및 pVEC8로 서브클로닝되기 이전의) 식물 발현을 위해 최적화된, 본원에서 제노스피라4 코돈으로 명명되는 꿀벌 실크 단백질을 코딩하는 뉴클레오티드 서열.
서열 번호 77 - 식물 발현(번역 융합 미포함)을 위해 최적화된 꿀벌 실크 단백질(제노스피라4) 오픈 리딩 프레임.
[상세한 설명]
일반 기법 및 정의
달리 구체적으로 정의하지 않는 한, 본원에서 사용되는 모든 기술적 및 과학적 용어는 당업계(예로서, 세포 배양, 분자 유전학, 면역학, 면역조직학, 단백질 화학 및 생화학에서)의 숙련자에게 통상적으로 이해되는 것과 동일한 의미를 가져야 한다.
달리 명시하지 않는 한, 본 발명에서 사용되는 재조합 단백질, 세포 배양 및 면역학적 기법은 당업계의 숙련자에게 잘 알려져 있는 표준 방법이다. 그러한 기법은 출처, 예를 들면, ([J. Perbal, A Practical Guide to Molecular Cloning, John Wiley and Sons (1984)], [J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbour Laboratory Press (1989)], [T.A. Brown (editor), Essential Molecular Biology: A Practical Approach, Volumes 1 and 2, IRL Press (1991)], [D.M. Glover and B.D. Hames (editors), DNA Cloning: A Practical Approach, Volumes 1-4, IRL Press (1995 and 1996)] 및 [F.M. Ausubel et al. (editors), Current Protocols in Molecular Biology, Greene Pub. Associates and Wiley-Interscience (1988)(현재까지 업데이트된 것 모두 포함)], [Ed Harlow and David Lane (editors) Antibodies: A Laboratory Manual, Cold Spring Harbour Laboratory, (1988)] 및 [J.E. Coligan et al. (editors) Current Protocols in Immunology, John Wiley & Sons(현재까지 업데이트된 것 모두 포함)])의 문헌을 통해 기술되고 설명되고, 이는 본원에서 참고로 인용된다.
본원에서 사용되는 바, "실크 단백질" 및 "실크 폴리펩티드"라는 용어는 실크 섬유 및/또는 섬유 단백질 복합체를 생산하는데 사용될 수 있는 섬유 단백질/폴리펩티드를 지칭한다. 본 발명의 자연적으로 발생된 실크 단백질이 예를 들면, 꿀벌과 같은 곤충의 벌집 실크중 일부를 형성하지만, 본원에 기술되어 있는 바와 같이, 적절한 곤충 내에서 발현될 경우, 동일한 작용을 실행하는 상기 단백질의 변이체가 용이하게 생산될 수 있다.
본원에서 사용되는 바, "실크 섬유"는 예를 들면, 직물과 같은 다양한 품목으로 직조될 수 있는, 본 발명의 단백질을 포함하는 미세섬유를 지칭한다.
본원에서 사용되는 바, "공중합체"는 2개 이상의 본 발명의 실크 단백질을 포함하는 조성물이다. 이 용어는 예를 들면, 곤충의 벌집과 같이 자연적으로 발생된 공중합체는 제외시킨다.
"식물"이라는 용어는 전체 식물, 식물 구조(예컨대, 잎, 줄기), 뿌리, 꽃 기관/구조, 종자(배, 배유 및 종피), 식물 조직(예컨대, 관다발 조직, 기본 조직 등), 세포 및 상기의 자손을 포함한다.
"트랜스제닉 식물"은 동일 종, 변종, 또는 재배종의 야생형 식물에서 발견되지 않는 유전자 작제물("트랜스 유전자(transgene)")을 함유하는 식물을 지칭한다. 본원에서 지칭되는 "트랜스 유전자"는 생명 공학 분야에 있어서의 일반적인 의미를 갖고, 재조합 DNA 또는 RNA 기술에 의해 생산되거나 변경되고, 식물 세포로 도입되는 유전자 서열을 포함한다. 트랜스 유전자는 식물 세포로부터 유래된 유전자 서열을 포함할 수 있다. 전형적으로, 트랜스 유전자는 예컨대, 형질전환과 같은 인간 조작에 의해 식물에 도입되지만, 당업자가 인지하고 있는 것과 같은 임의의 방법이 사용될 수 있다
"폴리뉴클레오티드"는 올리고뉴클레오티드, 핵산 분자 또는 그의 임의의 단편을 지칭한다. 이는 게놈 또는 합성 기원의, 이중 가닥 또는 단일 가닥 및 당질, 지질, 단백질, 또는 본원에서 정의된 특정 활성을 실행하는 다른 물질과 배합된 DNA 또는 RNA일 수 있다.
본원에서 사용되는 바, "작동 가능하게 연결된" 것은 2개 이상의 핵산(예로서, DNA) 세그먼트들 간의 작용 관계를 지칭한다. 전형적으로, 전사되는 서열에 대한 전사 조절 요소의 작용 관계를 지칭한다. 예컨대, 프로모터가 적절한 숙주 세포에서 코딩 서열의 전사를 자극하거나 조정한다면, 이는 본원에서 정의된 예를 들면, 폴리뉴클레오티드와 같은 코딩 서열에 작동 가능하게 연결된 것이다. 일반적으로, 전사되는 서열에 작동 가능하게 연결된 프로모터 전사 조절 요소는 전사되는 서열에 물리적으로 인접해 있고, 즉, 시스-작용한다. 그러나, 몇몇 전사 조절 요소는 예를 들면, 인핸서는 전사가 그에 의해 증진되는 코딩 서열에 물리적으로 인접해 있거나, 근접하게 위치할 필요도 없다.
"신호 펩티드"라는 용어는 분비되는 성숙한 단백질에 우선하는 아미노 말단 폴리펩티드를 지칭한다. 신호 펩티드는 성숙한 단백질로부터 절단되는 바, 성숙한 단백질 내에 존재하는 것은 아니다. 신호 펩티드는 세포막을 가로질러 분비되는 단백질을 지시하고 전위시키는 작용을 갖는다. 신호 펩티드는 신호 서열로도 지칭된다.
본원에서 사용되는 바, "형질전환"은 폴리뉴클레오티드의 혼입에 의해 세포내 새로운 유전자를 습득하는 것이다.
본원에서 사용되는 바, "약물"이라는 용어는 특정 질병을 치료 또는 예방하기 위하여 사용될 수 있는 임의의 화합물을 지칭하는 것으로, 본 발명의 실크 단백질과 함께 제형화될 수 있는 약물의 일례로는 단백질, 핵산, 항암제, 진통제, 항생제, 소염제(스테로이드성 및 비-스테로이드성 모두), 호르몬, 백신, 표지된 물질 등을 포함하나, 이에 한정되지 않는다.
폴리펩티드
본 발명자는 "실질적으로 정제된 폴리펩티드"란 일반적으로 지질, 핵산, 다른 폴리펩티드 및 다른 오염성 분자, 예를 들면, 그의 본래의 상태에서 그와 회합되어 있는 왁스로부터 분리되어 있는 폴리펩티드라는 것을 의미한다. 본 발명의 다른 단백질을 제외하고, 실질적으로 정제된 폴리펩티드는 그와 자연적으로 회합되어 있는 다른 성분들로부터 바람직하게는 60% 이상 유리, 더욱 바람직하게는, 75% 이상 유리 및 더욱 바람직하게는 90% 이상이 유리되어 있다.
폴리펩티드와 관련하여 "재조합"이라는 용어는 폴리펩티드가 세포에 의해, 또는 무세포 발현 시스템에서 그의 본래의 상태와 비교할 때 변경된 양으로 또는 변경된 속도로 생산되는 폴리펩티드를 언급한다. 하나의 실시태양에서, 세포는 자연적으로 폴리펩티드를 생산하지 않는 세포이다. 그러나, 세포는, 생산하고자 하는 폴리펩티드의 양을 변경, 바람직하게는 증가시키는 비-내인성 유전자를 포함하는 세포일 수 있다. 본 발명의 재조합 폴리펩티드로는 그가 생산되는 트랜스제닉(재조합) 세포, 또는 무세포 발현 시스템의 다른 성분들로부터 분리되지 않는 폴리펩티드 및 상기 세포, 또는 무세포 시스템에서 생산된 후, 이어서 적어도 몇몇의 다른 성분들로부터 정제되는 폴리펩티드를 포함한다.
"폴리펩티드" 및 "단백질"이라는 용어는 일반적으로 상호교환적으로 사용되고, 비-아미노산 기의 첨가에 의해 변형될 수 있거나, 변형될 수 없는 단일 폴리펩티드 쇄를 지칭한다. 본원에서 사용되는 바, "단백질" 및 "폴리펩티드"라는 용어는 또는 본원에 기술된 본 발명의 폴리펩티드의 변이체, 돌연변이체, 변형체, 유사체 및/또는 유도체를 포함한다.
폴리펩티드 일치도(%)는 갭 생성 패널티=5 및 갭 확장 패널티=0.3으로 GAP[Needleman and Wunsch, 1970) 분석(GCG 프로그램)에 의해 측정된다. 질의 서열의 길이는 15개 이상의 아미노산이고, GAP 분석은 15개 이상의 아미노산에 대하여 2개의 서열을 정렬하고, 더욱 바람직하게는, 질의 서열의 길이는 50개 이상의 아미노산이고, GAP 분석은 50개 이상의 아미노산에 대하여 2개의 서열을 정렬한다. 더욱 바람직하게는, 질의 서열의 길이는 100개 이상의 아미노산이고, GAP 분석은 100개 이상의 아미노산에 대하여 2개의 서열을 정렬한다. 더욱 더 바람직하게는, 질의 서열의 길이는 250개 이상의 아미노산이고, GAP 분석은 250개 이상의 아미노산에 대하여 2개의 서열을 정렬한다. 더욱 더 바람직하게는, GAP 분석은 2개 서열의 전장에 대하여 2개의 서열을 정렬한다.
본원에서 사용되는 바, "생물학적으로 활성"인 단편은 전장의 폴리펩티드의 정의된 활성, 즉, 실크를 생산하는데 사용되는 능력을 유지하는 본 발명의 폴리펩티드의 일부분이다. 생물학적으로 활성 단편은 정의된 활성을 유지하는 한, 어느 크기도 될 수 있다.
정의된 폴리펩티드와 관련하여, 상기 제공된 것보다 더 높은 일치도 값(%)이 바람직한 실시태양을 포함할 것이라는 것도 이해될 것이다. 따라서, 해당되는 경우, 최소 일치도 값(%)을 고려해 볼 때, 폴리펩티드는 관련하여 지명된 서열 번호와 40% 이상, 더욱 바람직하게는, 45% 이상, 더욱 바람직하게는, 50% 이상, 더욱 바람직하게는, 55% 이상, 더욱 바람직하게는, 60% 이상, 더욱 바람직하게는, 65% 이상, 더욱 바람직하게는, 70% 이상, 더욱 바람직하게는, 75% 이상, 더욱 바람직하게는, 80% 이상, 더욱 바람직하게는, 85% 이상, 더욱 바람직하게는, 90% 이상, 더욱 바람직하게는, 91% 이상, 더욱 바람직하게는, 92% 이상, 더욱 바람직하게는, 93% 이상, 더욱 바람직하게는, 94% 이상, 더욱 바람직하게는, 95% 이상, 더욱 바람직하게는, 96% 이상, 더욱 바람직하게는, 97% 이상, 더욱 바람직하게는, 98% 이상, 더욱 바람직하게는, 99% 이상, 더욱 바람직하게는, 99.1% 이상, 더욱 바람직하게는, 99.2% 이상, 더욱 바람직하게는, 99.3% 이상, 더욱 바람직하게는, 99.4% 이상, 더욱 바람직하게는, 99.5% 이상, 더욱 바람직하게는, 99.6% 이상, 더욱 바람직하게는, 99.7% 이상, 더욱 바람직하게는, 99.8% 이상 및 더욱 더 바람직하게는, 99.9% 이상 일치하는 아미노산 서열을 포함한다.
본 발명의 폴리펩티드의 아미노산 서열 돌연변이체는 적절한 뉴클레오티드 변화를 본 발명의 핵산에 도입하거나, 원하는 폴리펩티드를 시험관내에서 합성함으로써 제조될 수 있다. 그러한 돌연변이체는 아미노산 서열내 예컨대, 잔기의 결실, 삽입, 또는 치환을 포함한다. 단, 최종 폴리펩티드 산물이 원하는 특징을 소지한다면, 최종 작제물에 달하기 위하여 결실, 삽입 및 치환의 조합이 이루어질 수 있다.
돌연변이체 (변경된) 폴리펩티드는 당업계에 공지된 임의의 기법을 사용하여 제조될 수 있다. 예컨대, 본 발명의 폴리뉴클레오티드는 시험관 내에서 돌연변이 유발될 수 있다. 그러한 시험관내 돌연변이 유발 기법으로는 적합한 벡터 내로 폴리뉴클레오티드를 서브-클로닝하는 것, "돌연변이자" 균주, 예를 들면, E. 콜라이 XL-1 레드(Stratagene)내로 벡터를 형질전환시키는 것 및 적합한 세대수 동안 형질전환된 박테리아를 증식시키는 것을 포함한다. 또다른 일례로, 본 발명의 폴리뉴클레오티드를 (Harayama (1998))에 의해 광범위하게 기재된 DNA 셔플링 기법에 이용한다. 이들 DNA 셔플링 기법은 가능하게는 본 발명의 것과 관련된 유전자 이외의 본 발명의 유전자, 예를 들면, 본원에서 특징화된 특정 종 이외의 벌목 또는 풀잠자리목 종으로부터 유래된 실크 유전자를 포함한다. 돌연변이화/변경된 DNA로부터 유래된 산물은 실크 단백질로서 사용될 수 있는지 여부를 결정하기 위하여 본원에 기술된 기법을 사용함으로써 용이하게 선별될 수 있다.
아미노산 서열 돌연변이체 디자인시, 돌연변이 부위의 위치 및 돌연변이의 성질은 변형시키고자 하는 특징(들)에 따라 달라질 것이다. 돌연변이 부위는 개별적으로 또는 계속하여, 예를 들면, (1) 먼저 보존적 아미노산 선택물로 치환한 후, 달성 결과에 따라 더 많은 라디칼 선택물로 치환하거나, (2) 표적 잔기를 결실시키거나, (3) 위치 부위에 인접하는 다른 잔기를 삽입함으로써 변형될 수 있다.
아미노산 서열 결실 범위는 일반적으로, 약 1 내지 15개의 잔기, 더욱 바람직하게는, 약 1 내지 10개의 잔기 및 전형적으로, 약 1 내지 5개의 인접 잔기이다.
치환 돌연변이체에서는 폴리펩티드 분자 내의 1종 이상의 아미노산 잔기가 제거되고, 그 자리에 다른 잔기가 삽입된다. 치환 돌연변이 유발에 대한 가장 큰 관심의 대상이 되는 부위로는 작용을 위해 중요한 것으로 동정된 부위를 포함한다. 관심의 대상이 되는 다른 부위는 다양한 균주 또는 종으로부터 수득된 특정 잔기가 동정된 것이다. 이러한 위치는 생물학적 활성에 중요할 수 있다. 이들 부위, 특히, 3개 이상의 다른 동일 보존 부위의 서열내 포함되는 것이 상대적으로 보존적인 방식으로 바람직하게 치환된다. 그러한 보존적인 치환체를 "예시적인 치환"이라는 제목하의 표 1에 제시한다.
상기 요약한 바와 같이, 본 발명의 폴리펩티드 중 몇몇의 일부는 꼬인 코일 구조를 갖는다. 폴리펩티드의 꼬인 코일 구조는 공통 서열 (abcdefg)n로 나타내는 헵타드 반복부를 특징으로 한다. 바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드의 일부는 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 a 및 d에 있는 아미노산 중 25% 이상이 알라닌 잔기이다.
표 1. 예시적인 치환
바람직한 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드는 12 카피 이상, 더욱 바람직하게는, 15 카피 이상, 더욱 더 바람직하게는, 18 카피 이상의 연속된 헵타드 카피를 포함한다. 추가의 실시태양에서, 꼬인 코일 구조를 갖는 폴리펩티드는 헵타드를 최대 적어도 28 카피 가질 수 있다. 전형적으로, 헵타드 카피는 직렬로 반복될 것이다. 그러나, 예컨대, 도 5 및 6에 나타낸 것과 같이, 수개의 아미노산이 2개의 헵타드 사이에서 발견될 수 있거나, 수개의 절단된 헵타드가 발견될 수 있는 것과 같이(예컨대, 도 5의 제노스피라1을 참조할 수 있다), 완전한 직렬 반복부일 필요는 없다.
꼬인 코일 구조를 본 발명의 폴리펩티드에 대하여 이루어질 수 있는 아미노산 치환에 관한 가이던스는 도 5 및 6 뿐만 아니라, 표 6 내지 10에서 제공된다. 본원에서 제공되는 실험 데이타에 기초한, 예측상의 유용한 아미노산 치환체가 어쨌든 표 1에서 제공되는 예시적인 치환과 상충하는 경우, 실험 데이타에 기초한 치환을 사용하는 것이 바람직하다.
본 발명의 폴리펩티드의 꼬인 코일 구조는 특히, 헵타드중 아미노산 위치 a, d 및 e에 고함량의 알라닌 잔기를 갖는다. 그러나, 위치 b, c, f 및 g 또한 고빈도로 알라닌 잔기를 갖는다. 바람직한 실시태양에서, 헵타드중 아미노산 위치 a, d 및/또는 e에 있는 아미노산 중 15% 이상, 더욱 바람직하게는, 25% 이상, 더욱 바람직하게는, 30% 이상, 더욱 바람직하게는, 40% 이상 및 더욱 더 바람직하게는, 50% 이상이 알라닌 잔기이다. 추가의 바람직한 실시태양에서, 헵타드중 a 및 d의 양 위치에 있는 아미노산 중 25% 이상, 더욱 바람직하게는, 30% 이상, 더욱 바람직하게는, 40% 이상 및 더욱 더 바람직하게는, 50% 이상이 알라닌 잔기이다. 추가로, 헵타드중 위치 b, c, f 및 g에 있는 아미노산 중 바람직하게는, 15% 이상, 더욱 바람직하게는, 20% 이상, 더욱 바람직하게는, 더욱 더 바람직하게는, 25% 이상이 알라닌 잔기이다.
전형적으로, 헵타드는 어느 프롤린 또는 히스티딘 잔기도 포함하지 않을 것이다. 추가로, 헵타드는 만약 있다 해도, 소수의(1 또는 2개) 페닐알라닌, 메티오닌, 티로신, 시스테인, 글리신 또는 트립토판 잔기를 포함할 것이다. 알라닌 이외의, 헵타드내 공통(예컨대, 5% 초과, 더욱 바람직하게는, 10% 초과) 아미노산으로는류신(특히, 위치 b 및 d), 세린(특히, 위치 b, e 및 f), 글루탐산(특히, 위치 c, e 및 f), 리신(특히, 위치 b, c, d, f 및 g), 뿐만 아니라, 위치 g의 아르기닌을 포함한다.
본 발명의 폴리펩티드(및 폴리뉴클레오티드)는 매우 다양한 벌목 및 풀잠자리목 종으로부터 정제(분리)될 수 있다. 벌목의 일례로는 벌아목(벌, 개미 및 말벌)의 임의의 종을 포함하며, 이는 하기와 같은 곤충과: 청벌과(Chrysididae)(뻐꾸기벌), 개미과(Formicidae)(개미), 개미벌과(Mutillidae)(개미벌), 대모벌과(Pompilidae)(거미 말벌), 배벌과(Scoliidae), 말벌과(Vespidae) (종이 말벌, 포터 말벌, 호박벌), 무화과 말벌과(Agaonidae)(무화과 말벌), 수중다리좀벌과(Chalcididae)(수중다리좀벌), 개미살이좀벌과(Eucharitidae)(개미살이좀벌), 벼룩좀벌과(Eupelmidae)(벼룩좀벌), 금좀벌과(Pteromalidae)(금좀벌), 호리벌과(Evaniidae)(호리벌), 고치벌과, 맵시벌과(맵시벌), 가위벌과(Megachilidae), 꿀벌과(Apidae), 어리 꿀벌과(Colletidae), 꼬마꽃벌과(Halictidae) 및 털보애꽃벌과(Melittidae)(오일 채집 벌)을 포함하나, 이에 한정되지 않는다. 풀잠자리목의 일례로는 하기 곤충과: 사마귀붙이과(Mantispidae), 풀잠자리과(Chrysopidae)(풀잠자리), 명주잠자리과(Myrmeleontidae)(명주잠자리) 및 뿔잠자리과(Ascalaphidae)(뿔잠자리)로부터의 종을 포함하나, 이에 한정되지 않는다. 그러한 추가의 폴리펩티드(및 폴리뉴클레오티드)는 봄부스 테레스트리스, 미르메시아 포르피카타, 오에코필라 스마라그디나 및 말라다 시그나타로부터 유래된 실크에 대하여 본원에 기술된 것과 동일한 방법을 사용하여 특징될 수 있다.
추가로, 원하는 경우, 비천연 아미노산 또는 화학적 아미노산 유사체가 본 발명의 폴리펩티드내로 치환체 또는 첨가체로서 도입될 수 있다. 그러한 아미노산으로는 일반적으로 공통 아미노산의 D-이성체, 2,4-디아미노부티르산, α-아미노 이소부티르산, 4-아미노부티르산, 2-아미노부티르산, 6-아미노 헥사노산, 2-아미노 이소부티르산, 3-아미노 프로피온산, 오르니틴, 노르류신, 노르발린, 하이드록시프롤린, 사코신, 시트룰린, 호모시트룰린, 시스테인산, t-부틸글리신, t-부틸알라닌, 페닐글리신, 사이클로헥실알라닌, β-알라닌, 플루오로-아미노산, 변조 아미노산 예를 들면, β-메틸 아미노산, Cα-메틸 아미노산, Nα-메틸 아미노산 및 아미노산 유사체를 포함하나, 이에 한정되지 않는다.
또한, 합성시 또는 합성 이후에, 예로서, 바이오틴화, 벤질화, 당화, 아세틸화, 인산화, 아미드화, 보호기/차단기에 의한 유도체화, 단백질분해 절단, 항체 분자 또는 다른 세포 리간드에 연결 등에 의해 차별적으로 변형된 본 발명의 폴리펩티드는 본 발명의 범주 내에 포함된다. 이들 변형은 본 발명의 폴리펩티드의 안정성 및/또는 생체활성을 증가시키는 역할을 할 수 있다.
본 발명의 폴리펩티드는 천연 폴리펩티드의 생산 및 회수, 재조합 폴리펩티드의 생산 및 회수 및 폴리펩티드의 화학적 합성을 비롯한 다양한 방법으로 생산될 수 있다. 하나의 실시태양에서, 본 발명의 분리된 폴리펩티드는 폴리펩티드를 생산하는데 유효한 조건하에서 폴리펩티드를 발현시킬 수 있는 세포를 배양하고, 폴리펩티드를 회수함으로써 생산된다. 배양에 바람직한 세포는 본 발명의 재조합 세포이다. 유효한 배양 조건으로는 폴리펩티드 생산을 허용하는 유효 배지, 생체 반응 장치, 온도, pH 및 산소 조건을 포함한다. 유효 배지란 그 안에서 세포가 배양됨으로써 본 발명의 폴리펩티들 생산하게 되는 임의의 배지를 지칭한다. 그러한 배지는 전형적으로 동화될 수 있는 탄소, 질소 및 인산염 공급원 및 적절한 염, 미네랄, 금속 및 다른 영양소, 예를 들면, 비타민을 갖는 수성 배지를 포함한다. 본 발명의 세포는 종래의 발효 생체 반응 장치, 진탕 플라스크, 시험관, 미량역가 디쉬 및 페트리판에서 배양될 수 있다. 재조합 세포에 적합한 온도, pH 및 산소 함량하에 배양이 수행될 수 있다. 그러한 배양 조건은 당업계의 숙련인의 전문적 기술내 포함된다.
폴리뉴클레오티드
본 발명자는 DNA, RNA, 또는 그의 조합, 단일 또는 이중 가닥, 센스 또는 안티센스 배향 또는 양 둘의 조합, dsRNA 등을 비롯한 "단리된 폴리뉴클레오티드"를 그의 본래의 상태로 함께 회합하거나 연결된 폴리뉴클레오티드 서열로부터 적어도 부분적으로 분리된 폴리뉴클레오티드라고 정의한다. 단리된 폴리뉴클레오티드는 그들이 자연적으로 함께 회합하고 있는 다른 성분들로부터 바람직하게는, 60% 이상 유리, 바람직하게는, 75% 이상 유리 및 가장 바람직하게는, 90% 이상 유리된 것이다. 추가로, "폴리뉴클레오티드"라는 용어는 본원에서 "핵산"이라는 용어와 상호교환적으로 사용된다.
폴리뉴클레오티드와 관련하여 "외인성"이라는 용어는 폴리뉴클레오티드가 그의 본래의 상태와 비교하여 양이 변경되어 세포에, 또는 무세포 발현 시스템에 존재할 때의 폴리뉴클레오티드를 지칭한다. 하나의 실시태양에서, 세포는 자연적으로 폴리뉴클레오티드를 포함하지 않는 세포이다. 그러나, 세포는 코딩된 폴리펩티드의 생산량을 변경, 바람직하게는 증가시키는 비-내인성 폴리뉴클레오티드를 포함하는 세포일 수 있다. 본 발명의 외인성 폴리뉴클레오티드로는 그가 존재하는 트랜스제닉(재조합) 세포, 또는 무세포 발현 시스템의 다른 성분들로부터 분리되지 않는 폴리뉴클레오티드 및 상기 세포, 또는 무세포 시스템에서 생산된 후, 이어서 적어도 몇몇의 다른 성분들로부터 정제되는 폴리뉴클레오티드를 포함한다.
폴리뉴클레오티드 일치도(%)는 갭 생성 패널티=5 및 갭 확장 패널티=0.3으로 GAP[Needleman and Wunsch, 1970) 분석(GCG 프로그램)에 의해 측정된다. 달리 명시되지 않는 한, 질의 서열의 길이는 45개 이상의 뉴클레오티드이고, GAP 분석은 45개 이상의 뉴클레오티드 부위에 대하여 2개의 서열을 정렬한다. 바람직하게는, 질의 서열의 길이는 150개 이상의 뉴클레오티드이고, GAP 분석은 300개 이상의 뉴클레오티드 부위에 대하여 2개의 서열을 정렬한다. 더욱 바람직하게는, 질의 서열의 길이는 150개 이상의 뉴클레오티드이고, GAP 분석은 300개 이상의 뉴클레오티드 부위에 대하여 2개의 서열을 정렬한다. 더욱 더 바람직하게는, GAP 분석은 2개 서열의 전장에 대하여 2개의 서열을 정렬한다.
정의된 폴리뉴클레오티드와 관련하여, 상기 제공된 것보다 더 높은 일치도 값(%)이 바람직한 실시태양을 포함할 것이라는 것도 이해될 것이다. 따라서, 해당되는 경우, 최소 일치도 값(%)을 고려해 볼 때, 폴리뉴클레오티드는 관련하여 지명된 서열 번호와 40% 이상, 더욱 바람직하게는, 45% 이상, 더욱 바람직하게는, 50% 이상, 더욱 바람직하게는, 55% 이상, 더욱 바람직하게는, 60% 이상, 더욱 바람직하게는, 65% 이상, 더욱 바람직하게는, 70% 이상, 더욱 바람직하게는, 75% 이상, 더욱 바람직하게는, 80% 이상, 더욱 바람직하게는, 85% 이상, 더욱 바람직하게는, 90% 이상, 더욱 바람직하게는, 91% 이상, 더욱 바람직하게는, 92% 이상, 더욱 바람직하게는, 93% 이상, 더욱 바람직하게는, 94% 이상, 더욱 바람직하게는, 95% 이상, 더욱 바람직하게는, 96% 이상, 더욱 바람직하게는, 97% 이상, 더욱 바람직하게는, 98% 이상, 더욱 바람직하게는, 99% 이상, 더욱 바람직하게는, 99.1% 이상, 더욱 바람직하게는, 99.2% 이상, 더욱 바람직하게는, 99.3% 이상, 더욱 바람직하게는, 99.4% 이상, 더욱 바람직하게는, 99.5% 이상, 더욱 바람직하게는, 99.6% 이상, 더욱 바람직하게는, 99.7% 이상, 더욱 바람직하게는, 99.8% 이상 및 더욱 더 바람직하게는, 99.9% 이상 일치하는 아미노산 서열을 포함한다.
본 발명의 폴리뉴클레오티드는 자연적으로 발생된 분자와 비교할 때, 뉴클레오티드 잔기의 결실, 삽입, 또는 치환이라는 하나 이상의 돌연변이를 가질 수 있다. 돌연변이체는 자연적으로 발생된 것이거나(즉, 천연 공급원으로부터 단리된 것), 합성일 수 있다(예컨대, 핵산 상에서의 자리-지정 돌연변이 유발에 의해).
본 발명의 올리고뉴클레오티드 및/또는 폴리뉴클레오티드는 엄격한 조건하에서 본 발명의 실크 유전자, 또는 상기 유전자 측면에 위치하는 부위에 혼성화한다. 본원에서 사용되는 바, "엄격한 혼성화 조건" 등은 올리고뉴클레오티드 길이에 따른 혼성화 온도의 변화를 비롯한 당업계의 통상적인 파라미터를 지칭한다. 핵산 혼성화 파라미터는 상기 방법이 작성되어 있는 참조 문헌에서 찾아볼 수 있다([Sambrook, et al. (상기 동일)] 및 [Ausubel, et al. (상기 동일)]). 예컨대, 본원에서 사용되는 바, 엄격한 혼성화 조건은 혼성화 완충액(3.5 x SSC, 0.02% 피콜, 0.02% 폴리비닐 피롤리돈, 0.02% 소 혈청 알부민(BSA: Bovine Serum Albumin), 2.5mM NaH2PO4 (pH 7), 0.5% SDS, 2mM EDTA)중 65℃에서 혼성화한 후, 0.2 x SSC, 0.01% BSA중 50℃에서 1회 이상 세척하는 것을 지칭한다. 별법으로, 핵산 및/또는 올리고뉴클레오티드("프라이머" 또는 "프로브"로서도 지칭될 수 있다)는 핵산 증폭 기법, 예를 들면, PCR에 사용되는 조건하에서 관심의 대상이 되는 곤충의 게놈, 예를 들면, 꿀벌의 게놈에 혼성화한다.
본 발명의 올리고뉴클레오티드는 RNA, DNA, 또는 그의 유도체일 수 있다. 폴리뉴클레오티드 및 올리고뉴클레오티드라는 용어는 중복되는 의미를 갖지만, 올리고뉴클레오티드는 전형적으로 상대적으로 짧은 단일 가닥 분자이다. 그러한 올리고뉴클레오티드의 최소 크기는 올리고뉴클레오티드와 표적 핵산 분자 상의 상보적인 서열 사이의 안정적인 하이브리드 형성을 위해 필요한 크기이다. 올리고뉴클레오티드 길이는 바람직하게는, 15개 이상의 뉴클레오티드, 더욱 바람직하게는, 18개 이상의 뉴클레오티드, 더욱 바람직하게는, 19개 이상의 뉴클레오티드, 더욱 바람직하게는, 20개 이상의 뉴클레오티드, 더욱 더 바람직하게는, 25개 이상의 뉴클레오티드이다.
보통, 폴리뉴클레오티드 또는 올리고뉴클레오티드 단량체는 포스포디에스테르 결합 또는 그의 유사체에 의해 연결됨으로써, 크기 범위가 상대적으로 짧은 단량체 단위, 예로서, 12-18개부터 수백 여개의 단량체 단위인 올리고뉴클레오티드를 형성한다. 포스포디에스테르 결합의 유사체로는 포스포로티오에이트, 포스포로디티오에이트, 포스포로셀레노에이트, 포스포로디셀레노에이트, 포스포로아닐로티오에이트, 포스포라닐리데이트, 포스포라미데이트를 포함한다.
본 발명은 예컨대, 핵산 분자를 동정하는 프로브, 또는 핵산 분자를 생산하는 프라이머로서 사용될 수 있는 올리고뉴클레오티드를 포함한다. 프로브로서 사용되는 본 발명의 올리고뉴클레오티드는 전형적으로 검출 가능한 표지, 예를 들면, 방사성 동위 원소, 효소, 바이오틴, 형광 분자, 또는 화학발광 분자에 접합된다.
재조합 벡터
본 발명의 하나의 실시태양은 숙주 세포 내로 폴리뉴클레오티드 분자를 전달할 수 있는 임의의 벡터 내로 삽입되는 본 발명의 1종 이상의 단리된 폴리뉴클레오티드 분자를 포함하는 재조합 벡터를 포함한다. 그러한 벡터는, 자연적으로는 본 발명의 폴리뉴클레오티드 분자에 인접해서는 발견되지 않고, 바람직하게는, 폴리뉴클레오티드 분자(들)이 유래되는 종 이외의 종으로부터 유래된 것인, 이종 폴리뉴클레오티드 서열을 함유한다. 벡터는 RNA 또는 DNA, 원핵 또는 진핵성일 수 있고, 전형적으로는 트랜스포존(예를 들면, US 5,792,294에 기재되어 있는 것), 바이러스, 또는 플라스미드이다.
한 유형의 재조합 벡터는 발현 벡터에 작동 가능하게 연결되어 있는 본 발명의 폴리뉴클레오티드 분자를 포함한다. 작동 가능하게 연결되어 있다라는 표현은 폴리뉴클레오티드 분자가 숙주 세포 내로 형질전환되었을 때에 발현될 수 있는 방식으로 발현 벡터 내로 폴리뉴클레오티드 분자가 삽입되는 것을 지칭한다. 본원에서 사용되는 바, 발현 벡터는 숙주 세포를 형질전환시킬 수 있고, 특정 폴리뉴클레오티드 분자를 발현시킬 수 있는 DNA 또는 RNA 벡터이다. 바람직하게는, 발현 벡터는 또한 숙주 세포 내에서 복제될 수 있다. 발현 벡터는 원핵 또는 진핵성일 수 있고, 전형적으로는 바이러스 또는 플라스미드이다. 본 발명의 발현 벡터는 박테리아, 진균, 내부 기생충, 절지동물, 동물 및 식물 세포를 비롯한 본 발명의 재조합 세포에서 작용을 하는(즉, 유전자 발현 지시) 임의의 벡터를 포함한다. 본 발명의 특히 바람직한 발현 벡터는 식물 세포에서 유전자 발현을 지시할 수 있다. 본 발명의 벡터는 또한 무세포 발현 시스템에서 폴리펩티드를 생산하는데 사용될 수 있고, 그러한 시스템은 당업계에 잘 알려져 있다.
특히, 본 발명의 발현 벡터는 조절 서열, 예를 들면, 전사 조절 서열, 번역 조절 서열, 복제기점 및 재조합 세포와 상용성이고, 본 발명의 폴리뉴클레오티드 분자의 발현을 조절하는 다른 조절 서열을 포함한다. 특히, 본 발명의 재조합 분자는 전사 조절 서열을 포함한다. 전사 조절 서열은 전사의 개시, 연장 및 종결을 조절하는 서열이다. 특히 중요한 전사 조절 서열은 전사 개시를 조절하는 것, 예를 들면, 프로모터, 인핸서, 오퍼레이터 및 리프레서 서열를 포함한다. 적합한 전사 조절 서열은 1종 이상의 본 발명의 재조합 세포에서 작용할 수 있는 임의의 전사 조절 서열을 포함한다. 다양한 상기 전사 조절 서열은 당업자에게 알려져 있다. 바람직한 전사 조절 서열은 박테리아, 효모, 절지동물, 식물 또는 포유동물 세포에서 작용하는 것, 예를 들면, tac, lac, trp, trc, oxy-pro, omp/lpp, rrnB, 박테리오파지 람다, 박테리오파지 T7, T7lac, 박테리오파지 T3, 박테리오파지 SP6, 박테리오파지 SP01, 메탈로티오네인, 알파-메이팅 인자, 피치아(Pichia) 알코올 옥시다제, 알파바이러스 아게놈성 프로모터(예를 들면, 신드비스(Sindbis) 바이러스 아게놈성 프로모터), 항생제 내성 유전자, 배큘로바이러스, 헬리코베르파 지아(Heliothis zea) 곤충 바이러스, 백시나 바이러스, 헤르페스바이러스, 라쿤 폭스바이러스, 다른 폭스바이러스, 아데노바이러스, 거대 세포 바이러스(예를 들면, 중간 초기 프로모터), 원숭이 바이러스 40, 레트로바이러스, 액틴, 레트로바이러스 말단의 긴 반복부, 라우스 육종바이러스, 열 쇼크, 인산염 및 질산염 전사 조절 서열 뿐만 아니라, 원핵 또는 진핵에서 유전자 발현을 조절할 수 있는 다른 서열을 포함하나, 이에 한정되지 않는다.
특히 바람직한 전사 조절 서열은 식물 또는 그의 일부분의 사용에 따라 구성적으로, 또는 단계별로 및/또는 조직 특이적으로 식물에서 전사를 지시하는데 활성을 띤 프로모터이다. 이들 식물 프로모터로는 구성(constitutive) 발현을 나타내는 프로모터, 예를 들면, 콜리플라워 모자이크 바이러스(CaMV: Cauliflower Mosaic Virus)의 35S 프로모터, 잎-특이 발현을 위한 것, 예를 들면, 리불로스이인산 카르복실라제 소단위체(small subunit) 유전자의 프로모터, 뿌리-특이 발현을 위한 것, 예를 들면, 글루타민 신타제 유전자로부터의 프로모터, 종자-특이 발현을 위한 것, 예를 들면, 브라시카 나푸스(Brassica napus)로부터의 크루시페린 프로모터, 괴경-특이 발현을 위한 것, 예를 들면, 감자로부터의 제I 부류 파타틴 프로모터, 또는 과실-특이 발현을 위한 것, 예를 들면, 토마토로부터의 폴리갈락투로나제(PG: polygalacturonase) 프로모터를 포함한다.
본 발명의 재조합 분자는 또한 (a) 본 발명의 발현된 폴리펩티드가 폴리펩티드를 생산하는 세포로부터 분비될 수 있도록 하는 분비 신호(즉, 신호 세그먼트 핵산 서열)를 함유할 수 있고/거나, (b) 융합 단백질로서 본 발명의 핵산 분자를 발현시키는 융합 서열을 함유할 수 있다. 적합한 신호 세그먼트의 일례로는 본 발명의 폴리펩티드의 분비를 지시할 수 있는 임의의 신호 세그먼트를 포함한다. 바람직한 신호 세그먼트로는 조직 플라스미노겐 활성제(t-PA: tissue plasminogen activator), 인터페론, 인터루킨, 성장 호르몬, 바이러스 인벨럽 당단백질 신호 세그먼트, 니코티아나 넥타린(Nicotiana nectarin) 신호 펩티드(US 5,939,288), 타바코 확장 신호, 대두 올레오신 오일체 결합 단백질 신호, 아라비도프시스 탈리아나(Arabidopsis thaliana) 액포 염기성 키티나제 신호 펩티드 뿐만 아니라, 본 발명의 폴리펩티드의 본래의 신호 서열을 포함하나, 이에 한정되지 않는다. 또한, 본 발명의 핵산 분자는 코딩된 폴리펩티드를 프로테오좀으로 보내는 융합 세그먼트, 예를 들면, 유비퀴틴 융합 세그먼트에 결합될 수 있다. 재조합 분자는 또한 본 발명의 핵산 서열 주변의 그리고/또는 그 안의 개재 서열 및/또는 비번역 서열을 포함할 수 있다.
숙주 세포
본 발명의 또다른 실시태양으로는 하나 이상의 본 발명의 재조합 분자, 그의 자손 세포로 형질전환된 숙주 세포를 포함하는 재조합 세포를 포함한다. 폴리뉴클레오티드 분자를 세포로 형질전환시키는 것은 폴리뉴클레오티드 분자를 세포 내로 삽입시킬 수 있는 임의의 방법에 의해 수행될 수 있다. 형질전환 기법으로는 형질감염, 전기천공, 미세주입, 리포펙션, 흡착 및 원형질체 융합을 포함하나, 이에 한정되지 않는다. 재조합 세포는 단세포 남아 있을 수 있거나, 조직, 기관 또는 다세포 유기체로 성장할 수 있다. 형질전환된 본 발명의 폴리뉴클레오티드 분자는 염색체 밖에 남아 있을 수 있거나, 발현되는 그의 능력이 유지되는 방식으로 형질전환된(즉, 재조합) 세포의 염색체내의 하나 이상의 부위로 통합될 수 있다.
형질전환시키는데 적합한 숙주 세포로는 본 발명의 폴리뉴클레오티드로 형질전환될 수 있는 임의의 세포를 포함한다. 본 발명의 숙주 세포는 본 발명의 폴리펩티드를 내인적으로(즉, 자연적으로) 생산할 수 있거나, 1종 이상의 본 발명의 폴리뉴클레오티드 분자로 형질전환된 후에 상기 폴리펩티드를 생산할 수 있다. 본 발명의 숙주 세포는 1종 이상의 본 발명의 단백질을 생산할 수 있는 임의의 세포일 수 있고, 박테리아, 진균(효모 포함), 기생충, 절지동물, 동물 및 식물 세포를 포함한다. 숙주 세포의 일례로는 살모넬라(Salmonella), 에스케리키아(Escherichia), 바실러스(Bacillus), 리스테리아(Listeria), 사카로미세스(Saccharomyces), 스포돕테라(Spodoptera), 마이코박테리아(Mycobacteria), 트리코플러시아(Trichoplusia), BHK(baby hamster kidney) 세포, MDCK 세포, CRPK 세포, CV-I 세포, COS(예로서, COS-7) 세포 및 베로(Vero) 세포를 포함한다. 숙주 세포의 추가의 일례로는 E. 콜라이 K-12 유도체를 비롯한 E. 콜라이; 살모넬라 티피(Salmonella typhi); 약독화된 균주를 비롯한 살모넬라 티피무리엄(Salmonella typhimurium); 스포돕테라 프루지페르다(Spodoptera frugiperda); 트리코플루시아 니(Trichoplusia ni) 및 비-발암성 마우스 근육모세포 G8 세포(예로서, ATCC CRL 1246)이다. 추가의 적절한 포유동물 세포 숙주로는 기타 확장 세포주, 기타 섬유모세포 세포주(예로서, 인간, 뮤린 또는 닭 배아 섬유모세포 세포주), 골수종 세포주, 차이니즈 햄스터 난소 세포, 마우스 NIH/3T3 세포, LMTK 세포 및/또는 HeLa 세포를 포함한다. 특히 바람직한 숙주 세포는 식물 세포, 예를 들면, 도이췌 잠룽 폰 미크로오르가니스멘 운트 첼쿨투렌 게엠베하(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH)(져먼 콜렉션 오브 마이크로오가니즘 앤드 셀 컬쳐(German Collection of Microorganisms and Cell Cultures))로부터 이용가능한 것이다.
예컨대, 숙주 세포 내에서 폴리뉴클레오티드 분자의 카피수를 조작하고, 폴리뉴클레오티드 분자가 전사되는 효율을 조작하고, 생성된 전사체가 번역되는 효율을 조작하고, 번역 후 변형 효율을 조작함으로써 형질전환된 폴리뉴클레오티드 분자의 발현을 개선시키기 위하여 재조합 DNA 기술을 사용할 수 있다. 본 발명의 폴리뉴클레오티드 분자의 발현을 증가시키는데 유용한 재조합 기법으로는 폴리뉴클레오티드 분자를 카피수가 높은 플라스미드로 작동 가능하게 연결시키는 것, 폴리뉴클레오티드 분자를 하나 이상의 숙주 세포 염색체 내로 통합시키는 것, 벡터 안정성 서열을 플라스미드에 첨가하는 것, 전사 조절 신호(예로서, 프로모터, 오퍼레이터, 인핸서)를 치환 또는 변형시키는 것, 번역 조절 신호(예로서, 리보솜 결합 부위, 샤인-달가노(Shine-Dalgarno) 서열)를 치환 또는 변형시키는 것, 본 발명의 폴리뉴클레오티드 분자를 숙주 세포의 코돈 용도에 상응하도록 변형시키는 것 및 전사체를 불안정화시키는 서열을 결실시키는 것을 포함하나, 이에 한정되지 않는다.
트랜스제닉 식물
"식물"이라는 용어는 식물 전체, 식물 기관(예로서, 잎, 줄기, 뿌리 등), 종자, 식물 세포 등을 지칭한다. 본 발명의 실시에서의 사용을 위해 고려되는 식물로는 외떡잎식물 및 쌍떡잎식물, 이들 모두를 포함한다. 표적 식물로는 곡류(밀, 보리, 호밀, 귀리, 벼, 수수 및 관련 작물); 비트(사탕무 및 사료용 비트); 이과, 핵과 및 연실류(사과, 배, 자두, 복숭아, 아몬드 , 체리, 딸기, 라스베리 및 블랙-베리); 콩과 식물(강낭콩, 렌즈콩, 완두콩, 대두); 유지 식물(평지, 머스타드, 양귀비, 올리브, 해바라기, 코코넛, 피마자유 식물, 코코아 빈, 땅콩); 오이 식물(페포호박, 오이, 메론); 섬유 식물(목화, 아마, 대마, 황마); 감귤류(오렌지, 레몬, 자몽, 만다린귤나무); 채소류(시금치, 상추, 아스파라거스, 양배추, 당근, 양파, 토마토, 감자, 파프리카); 녹나무과(아보카도, 계피, 장뇌); 또는 식물, 예를 들면, 옥수수, 타바코, 너트, 커피, 사탕수수, 홍차, 덩국식물, 홉, 잔디, 바나나 및 천연 고무 식물 뿐만 아니라, 관상용(화초, 관목, 활엽수 및 상록수, 예를 들면, 침엽수)을 포함하나, 이에 한정되지 않는다.
본 발명과 관련하여 정의된 바와 같이, 트랜스제닉 식물은 원하는 식물 또는 식물 기관에서 1종 이상의 본 발명의 폴리펩티드를 생산할 수 있도록 재조합 기법을 사용하여 유전적으로 변형된 식물(뿐만 아니라 상기 식물의 세포) 및 그의 자손을 포함한다. 트랜스제닉 식물은 당업계에 알려져 있는 기법, 예를 들면, 일반적으로, ([A. Slater et al., Plant Biotechnology - The Genetic Manipulation of Plants, Oxford University Press (2003)] 및 [P. Christou and H. Klee, Handbook of Plant Biotechnology, John Wiley and Sons (2004)])에 기재되어 있는 것을 사용하여 생산될 수 있다.
본 발명의 폴리뉴클레오티드는 트랜스제닉 식물에서 모든 발생 단계 동안 구성적으로 발현될 수 있다. 식물 또는 식물 기관 용도에 따라, 폴리펩티드는 단계-특이 방식으로 발현될 수 있다. 추가로, 폴리뉴클레오티드는 조직-특이적으로 발현될 수 있다.
식물에서 관심의 대상이 되는 폴리펩티드를 코딩하는 유전자를 발현시키는 것으로 알려져 있거나, 그런 것으로 밝혀진 조절 서열이 본 발명에 사용될 수 있다. 사용되는 조절 서열을 선택하는 것은 관심의 대상이 되는 표적 식물 및/또는 표적 기관에 따라 달라진다. 그러한 조절 서열은 식물 또는 식물 바이러스로부터 수득할 수 있거나, 화학적으로 합성될 수 있다. 그러한 조절 서열은 당업자에게 잘 알려져 있다.
구성 식물 프로모터가 잘 알려져 있다. 앞서 언급된 프로모터 이외에, 몇몇 다른 적합한 프로모터로는 노팔린 신타제 프로모터, 옥토파인 신타제 프로모터, CaMV 35S 프로모터, 리불로스-1,5-이인산염 카르복실라제 프로모터, Adh1-기재 pEmu, Act1, SAM 신타제 프로모터 및 Ubi 프로모터 및 엽록소 a/b 결합 단백질의 프로모터를 포함한다. 별법으로, 트랜스 유전자(들)가 조절되는 양식으로 발현될 필요가 있을 수 있다. 가능하게는, 조직-특이적, 발생-특이적이거나, 유도성인 프로모터의 조절하에 실크 단백질의 코딩 서열을 배치함으로써 폴리펩티드 발현을 조절할 수 있다. 수개의 조직-특이적으로 조절되는 유전자 및/또는 프로모터가 식물에 있어서 보고되어 있다. 이들은 종자 저장 단백질(예를 들면, 나핀, 크루시페린, β-콘글리시닌, 글리시닌 및 파세올린), 제인 또는 오일체 단백질(예를 들면, 올레오신)을 코딩하는 유전자, 또는 지방산 생합성(아실 캐리어 단백질, 스테아로일-ACP 데사투라제 및 지방산 데사투라제(fad 2-1) 포함) 에 관여하는 유전자 및 배아 발생시 발현되는 기타 유전자(예를 들면, Bce4)를 포함한다. 완두콩 비실린 프로모터가 종자-특이 발현에 특히 유용하다. 완전히 자란 잎에서 발현에 유용한 다른 프로모터는 노화 발생시 켜지는 프로모터, 예를 들면, 아라비도프시스로부터의 SAG 프로모터이다. 개화시, 또는 개화기 동안, 과실 발생시를 거쳐, 적어도 익기 시작할 때까지 발현되는 과실-특이 프로모터 부류는 US 4,943,674에서 논의된 바 있다. 조직-특이 프로모터에 관한 다른 일례로는 구근에서의 발현을 지시하는 것(예컨대, 파타틴 유전자 프로모터), 섬유 세포에서의 발현을 지시하는 것(발생적으로 조절된 섬유 세포 단백질의 일례는 E6 섬유이다)을 포함한다.
예를 들면, 종결자 서열 및 폴리아데닐화 신호와 같은 다른 조절 서열로는 식물에서의 것과 같은 작용을 하는 임의의 서열을 포함하고, 그를 선택하는 것은 숙련인에게는 자명할 것이다. 발현 카세트에 사용되는 종결 부위는 상대적으로 교환가능한 것으로 보이기 때문에 대개 편의상 선택될 것이다. 사용되는 종결 부위는 전사 개시 부위와의 본래의 것일 수 있거나, 관심의 대상이 되는 폴리뉴클레오티드 서열과의 본래의 것일 수 있거나, 또다른 공급원으로부터 유래될 수 있다. 종결 부위는 자연적으로 발생된 것일 수 있거나, 전체 또는 부분적으로 합성된 것일 수 있다. 편리한 종결 부위는 A. 투메파시엔스(A. tumefaciens)의 Ti-플라스미드로부터 이용가능한 것, 예를 들면, 옥토파인 신타제 및 노팔린 신타제 종결 부위, 또는 β-파세올린의 유전자인, 화학적으로 유도성인 lant 유전자, pIN로부터 이용가능한 것이다.
관심의 대상이 되는 폴리펩티드를 코딩하는 핵산 서열을 함유하는 발현 작제물을 표적 식물로 도입시키기 위하여 수개의 기법이 이용될 수 있다. 그러한 기법으로는 칼슘/폴리에틸렌 글리콜 방법, 전기천공 및 미세주사 또는 (코팅된) 입자 충격(bombardment)을 사용한 원형질체의 형질전환을 포함한다. 이른바 직접 DNA 형질전환 방법 이외에도, 벡터를 포함하는 형질전환 시스템, 예를 들면, 바이러스 및 박테리아 벡터(예로서, 애그로박테리움(Agrobacterium) 속으로부터의 것)가 광범위하게 사용될 수 있다. 선택 및/또는 선별 이후, 형질전환되는 원형질체, 세포 또는 식물 부는 당업계에 공지된 방법을 사용하여 식물 전체에서 재생될 수 있다. 형질전환 및/또는 재생 기법을 선택하는 것은 본 발명에 있어 중요치 않다.
트랜스제닉 세포 및 식물에 트랜스 유전자가 존재하는지를 확인하기 위하여 당업자에게 알려져 있는 방법을 사용하여 중합효소 연쇄 반응(PCR: polymerase chain reaction) 증폭 또는 써던 블롯 분석을 실시할 수 있다. 트랜스 유전자의 발현 산물은 산물의 성질에 따라 다양한 방법들중 임의의 것으로 검출될 수 있고, 웨스턴 블롯 및 효소 검정법을 포함한다. 상이한 식물 조직에서의 단백질 발현을 정량하고, 복제를 검출하는데 특히 유용한 방법은 리포터 유전자, 예를 들면, GUS를 사용하는 것이다. 일단 트랜스제닉 식물을 수득하면, 원하는 표현형을 갖는 식물 조직 또는 식물 부를 생산하도록 재배할 수 있다. 식물 조직 또는 식물 부를 수확할 수 있고/거나, 종자를 수집할 수 있다. 종자는 원하는 특징이 있는 조직 또는 부를 갖는 추가의 식물을 재배하기 위한 근원으로서의 역할을 할 수 있다.
인간을 제외한 트랜스제닉 동물
트랜스제닉 동물을 생산하는 기법은 당업계에 잘 알려져 있다. 본 주제에 관하여 유용한 일반 서적은 [Houdebine, Transgenic animals - Generation and Use (Harwood Academic, 1997)]이다.
이종 DNA는 예컨대, 포유동물의 수정란으로 도입될 수 있다. 예를 들면, 전능성 또는 다능성 줄기 세포는 미세주사, 인산칼슘 매개 침강, 리포좀 융합, 레트로바이러스 감염 또는 다른 수단에 의해 형질전환될 수 있고, 이어서, 형질전화된 세포는 배아로 도입된 후, 배아는 트랜스제닉 동물로 발생한다. 매우 바람직한 방법에서 원하는 DNA를 함유하는 레트로바이러스로 발생중인 배아를 감염시키고, 감염된 배아로부터 트랜스제닉 동물을 생산한다. 그러나, 가장 바람직한 방법에서 적절한 DNA는 바람직하게 단세포 단계에서 배아의 전핵 또는 세포질로 공주입되고, 배아는 성숙한 트랜스제닉 동물로 발생할 수 있다.
트랜스제닉 동물을 생산하는데 사용되는 또다른 방법으로는 표준 방법에 의해 전핵 단계의 난으로 핵산을 미세주입하는 것을 포함한다. 이어서, 주입된 난은 상상 임신한 수혜자의 수란관으로 전달되기 이전에 배양된다.
트랜스제닉 동물은 또한 핵 전달 기술에 의해 생산될 수 있다. 이러한 방법을 사용으로 기증 동물로부터의 섬유모 세포는 조절 서열의 조절하에서 관심의 대상이 되는 결합 도메인 또는 결합부에 대한 코딩 서열을 혼입하고 있는 플라스미드로 안정적으로 형질감염된다. 이어서 안정적인 형질감염체는 제핵 난모세포로 융합되고, 배양되고 암컷 수혜자로 전달된다.
실크 회수 방법 및 생산
본 발명의 실크 단백질은 다양한 방법으로 상기 단백질을 생산하는 예를 들면, 식물, 박테리아 또는 효모 세포와 같은 재조합 세포로부터 추출되고 정제될 수 있다. 하나의 실시태양에서, 상기 방법으로는 pH를 낮추고 열을 가한 후, 황산암모늄 분별법에 의해 균질화된 세포/조직/식물 등으로부터 본래의 세포 단백질을 제거하는 것을 포함한다. 간랸하게, 세포/조직/식물을 균질화하여 전 가용성 단백질을 추출한다. pH 4.7에서 침강시킨 후, 60℃에서 침강시켜 본래의 단백질을 제거한다. 이어서, 40% 포화도를 갖는 황산암모늄으로 생성된 상등액을 분별시킨다. 생성된 단백질은 대략 95% 순도가 될 것이다. 종래의 겔 또는 친화 크로마토그래피로 추가 정제를 달성할 수 있다.
또다른 일례로, 세포 용해물을 1시간 이상 동안 고농도의 산, 예로서, HCl 또는 프로피온산으로 처리하여 pH를 ~1-2 낮춤으로써 실크 단백질은 가용화시키지만, 다른 단백질은 침강시킨다.
단백질 농도가 임계값을 초과할 때, 원섬유 응집체는 본 발명의 실크 단백질의 자발적인 자가-조립에 의해 용액으로 형성될 것이다. (O'Brien et al.)[I. O'Brien et al., "Design, Synthesis and Fabrication of Novel Self-Assembling Fibrillar Proteins", in Silk Polymers: Materials Science and Biotechnology, pp. 104-117, Kaplan, Adams, Farmer and Viney, eds., c. 1994 by American Chemical Society, Washington, D. C]의 방법에 따라 모으고, 거시적 섬유로 기계적으로 방적할 수 있다.
고유의 꼬인 코일 2차 구조 성질상, 단백질, 예를 들면, 제노스피라1-4, BBF1-4, BAF1-4 및 GAF1-4는 탈수시 자발적으로 꼬인 코일 2차 구조를 형성할 것이다. 하기 기술하는 바와 같이, 꼬인 코일의 강도는 근접해 있는 리신 잔기의 효소적 또는 화학적 가교 결합을 통해 증강될 수 있다.
본 발명의 실크 섬유 및/또는 공중합체는 공정 요건이 낮다. 본 발명의 실크 단백질은, 예로서, 가교 결합 예를 들면, 리신 가교 결합으로 강화될 수 있는 강한 꼬인 코일을 자발적으로 형성함에 따라 강 섬유를 형성하는 방적과 같은 최소의 공정을 요구한다. 이는 섬유의 조(β-구조) 및 강도를 얻기 위해 복잡한 방적 기법을 필요로 하는 B. 모리(B. mori) 및 거미 재조합 실크 폴리펩티드와는 대조를 이룬다.
그러나, 섬유는 액체 결정상의 특징적인 성질을 갖는 용액으로부터 방적될 수 있다. 상 전이가 일어나는 섬유 농도는 용액내 존재하는 단백질의 조성 또는 단백질의 배합에 따라 달라진다. 그러나, 상 전이는 용액의 투명도와 복굴절을 모니터함으로써 검출될 수 있다. 교차된 편광 필터를 통해 관찰하였을 때 용액이 외관상 투명하고, 복굴절이 나타날 때 액체 결정상의 징후가 검출될 수 있다.
하나의 섬유 형성 기법에서는 먼저 기계적 수단에 의해 픽업되는 것의 길이가 충분할 때까지 메탄올로부터 오르피스를 통해 단백질 용액으로부터 섬유를 압출시킬 수 있다. 이어서, 메탄올 용액을 통해 상기의 기계적 수단에 의해서 섬유을 예인하고, 수집하고, 건조시킬 수 있다. 섬유 인발 방법은 당업계에 잘 알려져 있는 것으로 간주된다.
본 발명의 실크 섬유 및/또는 공중합체를 생산하기 위하여 사용될 수 있는 방법의 추가적인 일례로는 US 2004/0170827 및 US 2005/0054830에 기재되어 있다.
바람직한 실시태양에서, 본 발명의 실크 섬유 및/또는 공중합체는 가교 결합되어 있다. 하나의 실시태양에서, 실크 섬유 및/또는 공중합체는 당업계에 알려져 있는 기법을 사용하여 관심의 대상이 되는 표면/물품/제품 등에 가교 결합되어 있다. 또다른 실시태양에서 (또는 이전 실시태양과의 조합으로), 실크 섬유 및/또는 공중합체에서 적어도 몇몇의 실크 단백질은 서로서로에 대하여 가교 결합되어 있다. 바람직하게는, 실크 단백질은 단백질중 리신 잔기에서 가교 결합되어 있다. 그러한 사교결합은 당업계에 공지되어 있는 화학적 및/또는 효소적 기법을 사용하여 실시될 수 있다. 예컨대, 효소적 가교 결합은 리실 옥시다제에 의해 촉매화될 수 있는 반면, 비효소적 가교 결합은 당화된 리신 잔기에 의해 생성될 수 있다[Reiser et al., 1992].
항체
본 발명은 또한 본 발명의 폴리펩티드 또는 그의 단편에 대한 모노클로날 또는 폴리클로날 항체를 제공한다. 따라서, 본 발명은 추가로 본 발명의 폴리펩티드에 대한 모노클로날 또는 폴리클로날 항체를 생산하는 방법을 제공한다.
"특이적으로 결합"이라는 용어는 항체가 다른 공지 실크 단백질을 제외한, 1종 이상의 본 발명의 폴리펩티드에 결합할 수 있는 능력을 지칭한다.
본원에서 사용되는 바, "에피토프"라는 용어는 항체가 결합하는 본 발명의 폴리펩티드의 부위를 지칭한다. 에피토프에 대한 항체를 생성하기 위하여 에피토프를 동물에 투여할 수 있지만, 본 발명의 항체는 바람직하게 전체 폴리펩티드 맥락에서 에피토프 부위에 특이적으로 결합한다.
폴리클로날 항체가 바람직한 경우, 선택된 포유동물(예로서, 마우스, 래빗, 염소, 말 등)을 본 발명의 면역원성 폴리펩티드로 면역화시킨다. 면역화된 동물로부터 유래된 혈청을 수집하고, 공지 방법에 따라 처리한다. 폴리클로날 항체를 함유하는 혈청이 다른 항원에 대한 항체를 함유할 경우, 면역친화성 크로마토그래피에 의해 폴리클로날 항체를 정제할 수 있다. 폴리클로날 항혈청을 생산하고, 공정처리하는 기법이 당업계에 알려져 있다. 그러한 항체를 제조할 수 있도록 하기 위하여, 본 발명은 또한 동물에서 면역원으로서 사용하기 위한 것으로, 또다른 폴리펩티드에 합텐화된 본 발명의 폴리펩티드 또는 그의 단편을 제공한다.
본 발명의 폴리펩티드에 대한 모노클로날 항체 또한 당업자에 의해 용이하게 생산될 수 있다. 하이브리도마에 의해 모노클로날 항체를 제조하는 일반 방법론이 잘 알려져 있다. 세포 융합에 의해 및 다른 기법, 예를 들면, 종양원성 DNA로 B 림프구를 직접 형질전환시키는 것, 또는 엡스타인-바 바이러스로 형질감염시키는 것에 의해 불멸의 항체-생산 세포주를 생성할 수 있다. 생산된 모노클로날 항체 패널을 다양한 성질; 즉, 동형 및 에피토프 친화도에 대하여 선별할 수 있다.
대체 기법으로는 예컨대, 파지가 매우 다양한 상보성 결정 부위(CDR: complementarity determining region)를 포함하는 그의 코트 표면상에 scFv를 발현시키는, 파지 디스플레이 라이브러리를 선별하는 것을 포함한다. 이러한 기법은 당업계에 잘 알려져 있다.
본 발명의 목적을 위해, "항체"라는 용어는, 그와 반대로 기술되지 않는 한, 표적 항원에 대하여 그들의 결합 활성을 유지하는, 전체 항체의 단편을 포함한다. 그러한 단편은 Fv, F(ab') 및 F(ab')2 단편 뿐만 아니라, 단일 쇄 항체(scFv)를 포함한다. 추가로, 항체 및 그의 단편은 예컨대, EP-A-239400에 기재되어 있는 바와 같이 인간화된 항체일 수 있다.
본 발명의 항체는 적합한 시약, 대조군, 설명서 등과 함께 적합한 용기 내의 고체 지지체에 결합할 수 있고/거나, 키트 내로 패킹될 수 있다.
바람직하게는, 본 발명의 항체는 검출 가능하게 표지된다. 항체 결합을 직접적으로 측정할 수 있도록 하는, 검출 가능한 표지의 일례로는 방사성 동위 원소, 형광단, 염료, 자기 비드, 화학발광, 콜로이드성 입자 등을 포함한다. 결합을 간접적으로 측정할 수 있도록 하는 표지의 일례로는 기질이 착색된 산물 또는 형광 산물을 제공할 수 있는 효소를 포함한다. 추가의 예시적인 검출 가능한 표지로는 적합한 기질의 첨가 후, 검출 가능한 산물 신호를 제공할 수 있는 공유 결합된 효소를 포함한다. 접합체에 사용하기 적합한 효소의 일례로는 홀스래디시 퍼옥시다제, 알칼리성 포스파타제, 말레이트 탈수소효소 등을 포함한다. 상업적으로 이용할 수 없는 경우, 상기 항체-효소 접합체는 당업자에게 알려져 있는 기법에 의해 용이하게 생산된다. 추가의 예시적인 검출 가능 표지로는 고 친화도로 아비딘 또는 스트렙타비딘에 결합하는 바이오틴; 플루오로크롬(예로서, 피코빌리단백질, 피코에리트린 및 알로피코시아닌; 형광 표지 세포 분리기와 함께 사용될 수 있는 플루오레세인 및 텍사스 레드(Texas red)); 합텐 등을 포함한다. 바람직하게는, 검출 가능한 표지, 예로서, 플레티 루미노미터에서 직접 측정할 수 있도록 한다. 본 발명의 폴리펩티드를 검출하기 위하여 상기와 같이 표지된 항체가 당업계에 공지된 기법에 사용될 수 있다.
조성물
본 발명의 조성물은 "허용 가능한 담체"를 포함할 수 있다. 그러한 허용 가능한 담체의 일례로는 물, 염수, 링거액, 덱스트로스 용액, 핸크 용액 및 기타의 생리학적으로 균형잡힌 염 수용액을 포함한다. 비수용성 비히클, 예를 들면, 고정유, 참깨유, 에틸 올레이트 및 트리글리세리드 또한 사용될 수 있다.
하나의 실시태양에서, "허용 가능한 담체"는 "약제학적으로 허용 가능한 담체"이다. 약제학적으로 허용 가능한 담체라는 용어는 동물, 특히, 포유동물 및 더욱 특히, 인간에게 투여되었을 때 알레르기성, 독성, 또는 다른 유해한 부작용을 일으키지 않는 분자 엔티티 및 조성물을 지칭한다. 유용한 약제학적으로 허용 가능한 담체 또는 희석제의 일례로는 용매, 분산 매질, 코팅제, 안정화제, 보호성 콜로이드제, 접착성, 증점제, 점탄성 조절제, 투과제, 격리제 및 본 발명의 폴리펩티드의 활성에는 영향을 미치지 않는 등장화제 및 흡추 지연제를 포함하나, 이에 한정되지 않는다. 예컨대, 코팅제, 예를 들면, 레시틴을 사용함으로써, 분산제의 경우, 필요한 입자 크기를 유지시킴으로써 및 계면활성제를 사용함으로써 적절한 유동성이 유지될 수 있다. 더욱 일반적으로, 본 발명의 폴리펩티드는 일반적인 제법에 상응하는 임의의 비-독성 고체 또는 액체의 첨가제와 함께 배합될 수 있다.
본원에서 개요된 바와 같이, 몇몇 실시태양에서, 본 발명의 폴리펩티드, 실크 섬유 및/또는 공중합체는 약제학적으로 허용 가능한 담체로서 사용된다.
다른 적합한 조성물은 구체적으로 본 발명의 폴리펩티드의 특정 용도에 관하여 하기에 기술된다.
용도
실크 단백질은 인성 및 강도가 뛰어나기 때문에 신규한 생체 적합 물질의 생성에 유용하다. 그러나, 현재의, 거미 및 곤충의 섬유 단백질은 거대 단백질이고(10O kDa 초과), 이들은 고도로 반복성인 아미노산 서열로 구성된다. 이들 단백질은, 특히 재조합 시스템에서 생산을 어렵게 만드는, 고도로 편재된 코돈을 함유하는 거대 유전자에 의해 코딩된다. 반대로, 본 발명의 실크 단백질은 짧고, 비-반복성이다. 이러한 성질을 통해 상기 단백질을 코딩하는 유전자는 특히 신규한 생체 적합 물질의 생산을 위한 것으로서 관심의 대상이 된다.
본 발명의 실크 단백질, 실크 섬유 및/또는 공중합체는 광범위하고 다양하게 의료용, 군용, 산업용 및 상업용으로 사용될 수 있다. 섬유는 의료 장치, 예를 들면, 봉합사, 피부 이식편, 세포 성장 매트릭스, 대체 인대 및 외과용 메쉬 제조에, 그리고, 매우 다양한 산업용품 및 상업용품, 예컨대, 케이블, 로프, 망, 낚시줄, 의류 섬유, 방탄 조끼 안감, 용기용 섬유, 배낭(backpack), 배낭(knapsack), 가방 또는 지갑 끈, 접착성 결합재, 비-접착성 결합재, 스트래핑재, 텐트 섬유, 타포린, 수영장 덮개, 자동차 덮개, 울타리의 재료, 밀폐제, 구성재, 방수재, 가요성 파티션 재료, 스포츠 장치에; 및, 사실상, 그에 대한 바람직한 특징이 높은 인장 강도와 탄력성인, 거의 모든 섬유 또는 섬유 사용에 사용될 수 있다. 본 발명의 실크 단백질, 실크 섬유 및/또는 공중합체는 또한 예를 들면, 미용화장품, 피부 관리, 모발 관리 및 모발 염색제와 같은 개인 관리 제품용 조성물; 및 예를 들면, 안료와 같은 입자 코팅제에 사용된다.
실크 단백질은 그들 본래의 형태로 사용될 수 있거나, 더 많은 유익한 효과를 제공하는 유도체를 형성하기 위하여 변형될 수 있다. 예컨대, 실크 단백질은 US 5,981,718 및 US 5,856,451에 기재되어 있는 것과 같이, 알레르기 유발성을 감소시키기 위하여 중합체에 접합됨으로써 변형될 수 있다. 적합한 변형 중합체로는 폴리알킬렌 옥시드, 폴리비닐 알코올, 폴리-카복실레이트, 폴리(비닐피롤리돈) 및 텍스트란을 포함하나, 이에 한정되지 않는다. 또다른 일례로, 실크 단백질은 선택적인 분해와, 다른 단백질 개질제의 스플라이싱에 의해 변형될 수 있다. 예컨대, 약 60℃의 승온하에서 산으로 처리함으로써 실크 단백질은 보다 작은 펩티드로 절단될 수 있다. 유용한 산으로는 묽은 염산, 황산, 또는 인산을 포함하나, 이에 한정되지 않는다. 별법으로, 염기, 예를 들면, 수산화나트륨으로 처리함으로써 실크 단백질이 분해될 수 있거나, 적합한 프로테아제를 사용하는 효소 분해가 사용될 수 있다.
단백질은 개인 관리 제품의 특정 용도에 유익한 성능 특징을 제공하도록 추가 변형될 수 있다. 개인 관리 제품용으로 단백질을 변형시키는 것은 당업계에 잘 알려져 있다. 예컨대, 통상 사용되는 방법은 US 6,303,752, US 6,284,246 및 US 6,358,501에 기재되어 있다. 변형의 일례로는 수-유 에멀젼 증진을 촉진시키기 위한 에톡실화, 친유성의 상용성을 제공하는 실옥실화 및 비누 및 세제 조성물과의 상용성을 돕는 에스테르화를 포함하나, 이에 한정되지 않는다. 게다가, 실크 단백질은 아민, 옥시란, 시아네이트, 카복실산 에스테르, 실리콘 공중합체, 실록산 에스테르, 4급 아민 지방성 화합물, 우레탄, 폴리아크릴아미드, 디카르복실산 에스테르 및 할로겐화된 에스테르를 포함하나, 이에 한정되지 않는, 작용기로 유도체화될 수 있다. 실크 단백질은 또한 디이민과의 반응에 의해 및 금속 염 형성에 의해 유도체화될 수 있다.
상기의 "폴리펩티드"(및 "단백질")의 정의와 같이, 상기의 유도체화되고/거나 변형된 분자 또한 본원에서는 광범위하게 "폴리펩티드" 및 "단백질"로서 지칭된다.
본 발명의 실크 단백질은 다른 섬유 유형과 함께 방적될 수 있고/거나, 다발화되거나 편조될 수 있다. 일례로 중합성 섬유(예로서, 폴리프로필렌, 나일론, 폴리에스테르), 다른 식물 및 동물 근원의 섬유 및 실크(예로서, 면, 울, 봄빅스 모리 또는 거미 실크) 및 유리 섬유를 포함하나, 이에 한정되지 않는다. 바람직한 실시태양은 10% 폴리프로필렌 섬유와 편조된 실크 섬유이다. 본 발명은 상기 섬유 배합물의 생산을 용이하게 실시함으로써, 일반적으로 의료용, 산업용 또는 상업용 섬유의 제조와 생산에서 추구될 수 있는 것으로, 예로서, 외관, 연성, 중량, 내구성, 발수성, 제조비용 개선과 같은 임의의 바람직한 특징들을 증진시킬 수 있다는 것에 주시하고 있다.
개인 관리 제품
미용화장품 및 피부 관리 조성물은 화장용으로 허용 가능한 매질중 유효량의 실크 단백질을 포함하는 무수 조성물일 수 있다. 이들 조성물의 용도로는 피부 관리, 피부 클렌징, 메이크-업 및 주름 방지 제품을 포함하나, 이에 한정되지 않는다. 미용화장품 및 피부 관리 조성물용 실크 단백질의 유효량은 본원에서 조성물 총 중량에 대하여 약 10-4 내지 약 30 중량%, 그러나, 바람직하게 약 10-3 내지 15 중량%의 비율로서 정의된다. 이러한 비율은 미용화장품 또는 피부 관리 조성물 타입의 작용에 따라 달라질 수 있다. 화장용으로 허용 가능한 매질에 적합한 조성물은 US 6,280,747에 기재되어 있다. 예컨대, 화장용으로 허용 가능한 매질은 일반적으로 조성물 총 중량에 대하여 약 10 내지 약 90 중량%의 비율로 지방 물질을 함유할 수 있으며, 지방산은 1종 이상의 액체, 고체 또는 반-고체 지방 물질을 함유한다. 지방 물질로는 오일, 왁스, 검 및 이른바 페이스트형 지방 물질을 포함하나, 이에 한정되지 않는다. 별법으로, 조성물은 안정적인 분산액, 예를 들면, 유중수 또는 수중유 에멀젼의 형태로 존재할 수 있다. 게다가, 조성물은 항산화제, 방부제, 충진제, 계면활성제, UVA 및/또는 UVB 썬스크린, 방향제, 증점제, 습윤제 및 음이온성, 비이온성 또는 양쪽성 중합체 및 염료 또는 안료를 비롯한, 하나 이상의 종래 미용화장품 또는 피부과학적 첨가제 또는 애주번트를 함유할 수 있다.
유화 미용화장품 및 본 발명의 1종 이상의 실크 단백질을 포함하며 유화된 물질 용도로 생산가능한 유사 약물로는 예컨대, 클렌징 미용화장품(미용 비누, 훼이셜 워시, 샴푸, 린스 등), 모발 관리 제품(모발 염료, 모발 미용화장품 등), 기초 미용화장품(일반 크림, 에멀젼, 면도 크림, 컨디셔너, 코롱, 면도 로션, 미용화장품 오일, 훼이셜 마스크 등), 메이크-업 미용화장품(파운데이션, 눈썹 펜슬, 아이 크림, 아이쉐도우, 마스카라 등), 방향 미용화장품(향수 등), 태닝 및 썬스크린 미용화장품(태닝 및 썬스크린 크림, 태닝 및 썬스크린 로션, 태닝 및 썬스크린오일 등), 손톱용 미용화장품(손톱 크림 등), 아이라이너 미용화장품(아이라이너 등), 입술용 미용화장품(립스틱, 립 크림 등), 구강 관리 제품(치약 등), 목욕용 미용화장품(목욕 제품 등) 등을 포함한다.
미용화장품 조성물은 또한 예를 들면, 매니큐어와 같은, 손톱 관리용 제품의 형태로 존재할 수 있다. 본원에서 매니큐어는 화장용으로 허용 가능한 매질중 유효량의 실크 단백질을 포함하는 손톱 손질 및 착색용 조성물로서 정의된다. 매니큐어 조성물로 사용하기 위한 실크 단백질의 유효량은 본원에서 매니큐어 총 중량에 대하여 약 10-4 내지 약 30 중량%의 비율로서 정의된다. 매니큐어용으로 허용 가능한 매질의 성분은 US 6,280,747에 기재되어 있다. 매니큐어는 전형적으로 용매 및 필름 형성 물질, 예를 들면, 셀룰로스 유도체, 폴리비닐 유도체, 아크릴 중합체 또는 공중합체s, 비닐 공중합체 및 폴리에스테르 중합체와 같은 필름 형성 물질을 함유한다. 조성물은 또한 유기 또는 무기 안료를 함유할 수 있다.
모발 관리용 조성물은 본원에서, 화장용으로 허용 가능한 매질중 유효량의 실크 단백질을 포함하는 것으로서, 샴푸, 컨디셔너, 로션, 에어로졸, 겔 및 무스를 포함하나, 이에 한정되지 않는 모발 손질용 조성물로서 정의된다. 모발 관리 조성물로 사용하기 위한 실크 단백질의 유효량은 본원에서 조성물 총 중량에 대하여 약 10-2 내지 약 90 중량%의 비율로서 정의된다. 모발 관리 조성물용으로 화장용으로 허용 가능한 매질의 성분은 US 2004/0170590, US 6,280,747, US 6,139,851 및 US 6,013,250에 기재되어 있다. 예컨대, 이들 모발 관리 조성물은 수성, 알코올성 또는 수성-알코올성 용액일 수 있고, 알코올은 바람직하게 에탄올 또는 이소프로판올일 수 있고, 수성-알코올성 용액일 경우, 총 중량에 대하여 약 1 내지 약 75 중량% 의 비율로 존재할 수 있다. 게다가, 모발 관리 조성물은 상기 제공된 것과 같은 하나 이상의 종래 미용화장품 또는 피부과학적 첨가제 또는 애주번트를 함유할 수 있다.
모발 착색용 조성물은 본원에서, 화장용으로 허용 가능한 매질중 유효량의 실크 단백질을 포함하는 것으로서, 모발 착색, 염색, 또는 탈색용 조성물로서 정의된다. 모발 착색용 조성물로 사용하기 위한 실크 단백질의 유효량은 본원에서 조성물 총 중량에 대하여 약 10-4 내지 약 60 중량%의 비율로서 정의된다. 모발 착색용 조성물용으로 화장용으로 허용 가능한 매질의 성분은 US 2004/0170590, US 6,398,821 및 US 6,129,770에 기재되어 있다. 예컨대, 모발 착색용 조성물은 일반적으로 무기 과산소-기재 염료 산화제 및 산화 용이성 착색제의 혼합물을 포함한다. 과산소-기재 염료 산화제는 가장 통상적으로 과산화수소이다. 산화적 모발 착색제는 1차 중간체(예컨대, p-페닐렌디아민, p-아미노페놀, p-디아미노피리딘, 하이드록시인돌, 아미노인돌, 아미노티미딘, 또는 시아노페놀)를 2차 중간체(예컨대, 페놀, 레조르시놀, m-아미노페놀, m-페닐렌디아민, 나프톨, 피라졸론, 하이드록시인돌, 카테콜 또는 피라졸)와 산화적으로 커플링시킴으로써 형성된다. 게다가, 모발 착색용 조성물은 산화성 산, 격리제, 안정화제, 증점제, 완충제 담체, 계면활성제, 용매, 항산화제, 중합체, 비-산화성 염료 및 컨디셔너를 함유할 수 있다.
실크 단백질은 또한 미용화장품 및 코팅 조성물에서 사용하기 위한 입자의 분산성을 개선시키기 위하여 안료 및 미용화장품 입자를 코팅하는데 사용될 수 있다. 미용화장품 입자는 본원에서 예를 들면, 미용화장품 조성물에 사용되는 안료 또는 불활성 입자와 같은 미립자 물질로서 정의된다. 적합한 안료 및 미용화장품 입자는 무기 착색 안료, 유기 안료 및 불활성 입자를 포함하나, 이에 한정되지 않는다. 무기 착색 안료로는 이산화티탄, 산화아연 및 철, 마그네슘, 코발트 및 알루미늄 산화물을 포함하나, 이에 한정되지 않는다. 유기 안료로는 D&C 레드 번호 36호, D&C 오렌지 번호 17호, D&C 레드 번호 7호, 11호, 31호 및 34호의 칼슘 레이트, D&C 레드 번호 12호의 바륨 레이크, D&C 레드 번호 13호의 스트론튬 레이크, FD&C 옐로우 번호 5호의 알루미늄 레이크 및 탄소 블랙 입자를 포함하나, 이에 한정되지 않는다. 불활성 입자로는 탄산칼슘, 알루미늄규산염, 칼슘규산염, 마그네슘규산염, 운모, 활석, 황산바륨, 황산칼슘, 분말형 나일론(Nylon)™, 과불소화 알칸 및 다른 불활성 플라스틱을 포함하나, 이에 한정되지 않는다.
실크 단백질은 또한 치실에 사용될 수 있다(예컨대, US 2005/0161058을 참조할 수 있다). 치실은 단일필라멘트 사(yarn) 또는 다중필라멘트 사일 수 있고, 상기 섬유는 꼬여 있거나, 그렇지 않을 수 있다. 치실은 개별 조각으로서 패킹되어 있거나, 임의의 원하는 길이대로 조각을 절단할 수 있도록 하는 커터를 포함하는 롤로 캐핑될 수 있다. 치실은 스트립 및 쉬트 등을 포함하나, 이에 한정되지 않는, 미세섬유 이외의 다양한 형상으로 제공될 수 있다. 치실은 상이한 물질, 예를 들면, 제한하는 것은 아니지만, 왁스, 치실용 폴리테트라플루오로에틸렌 단일필라멘트 사로 코팅될 수 있다.
실크 단백질은 또한 비누에 사용될 수 있다(예컨대, US 2005/0130857을 참조할 수 있다).
안료 및 미용화장품 입자 코팅제
안료 및 미용화장품 입자 코팅제로 사용하기 위한 실크 단백질의 유효량은 본원에서 입자의 건식 중량에 대하여 약 10-4 내지 약 50 중량%, 바람직하게는, 약 0.25 내지 약 15 중량%의 비율로서 정의된다. 사용되는 실크 단백질의 최적량은 코팅되는 안료 또는 미용화장품 입자의 유형에 따라 달라진다. 예컨대, 무기 착색 안료와 함께 사용되는 실크 단백질의 양은 바람직하게 약 0.01% 내지 20 중량% 사이이다. 유기 안료의 경우, 실크 단백질의 바람직한 양은 약 1% 내지 약 15 중량% 사이인 반면, 불활성 입자의 경우, 바람직한 양은 약 0.25% 내지 약 3 중량% 사이이다. 코팅되는 안료 및 입자의 제조 방법은 US 5,643,672에 기재되어 있다. 이들 방법은 실크 단백질 수용액을 텀블링 또는 혼합시키면서 입자에 첨가하는 것, 실크 단백질 및 입자 슬러리를 형성하고 건조시키는 것, 입자 상에서 실크 단백질 용액을 분무 건조시키거나, 실크 단백질 및 입자 슬러리를 동결건조시키는 것을 포함한다. 이들 코팅된 안료 및 미용화장품 입자가 미용화장품 제제, 페인트, 잉크 등에 사용될 수 있다.
생체 의학 제품
실크 단백질은 상처 치유를 촉진시키기 위한, 붕대 상의 코팅제로서 사용될 수 있다. 이러한 적용을 위해, 붕대 재료는 유효량의 실크 단백질로 코팅된다. 상처-치유용 붕대를 위한 실크 단백질의 유효량은 본원에서 붕대 재료에 대하여 약 10-4 내지 약 30 중량%의 비율로서 정의된다. 코팅되는 재료는 임의로 연성, 생물학적으로 불활성, 다공성 피륙 또는 섬유일 수 있다. 일례로 면, 실크, 레이온, 아세테이트, 아크릴, 폴리에틸렌, 폴리에스테르 및 그의 조합을 포함하나, 이에 한정되지 않는다. 피륙 또는 섬유를 코팅하는 것은 당업계에 알려져 있는 다수의 방법에 의해 수행될 수 있다. 예컨대, 코팅시키고자 하는 물질을, 실크 단백질을 함유하는 수용액에 침지시킬 수 있다. 별법으로, 분무 총을 사용하여 피복시키고자 하는 물질의 표면 상에 실크 단백질을 함유하는 용액을 분무시킬 수 있다. 게다가, 롤러 코트 인쇄 공정을 사용하여 실크 단백질을 함유하는 용액을 표면 상에 코팅시킬 수 있다. 상처 붕대는 요오드, 요오드화칼륨, 포비돈요오드, 아크리놀, 과산화수소, 염화벤즈알코늄 및 클로로헥시딘; 치료 촉진제, 예를 들면, 알란토인, 염산디부카인 및 클로로페닐아민 말산염; 혈관수축제, 예를 들면, 염화나파졸린; 수렴제, 예를 들면, 산화아연; 및 크러스트 발생제, 예를 들면, 붕산을 포함하나, 이에 한정되지 않는 다른 첨가제를 포함할 수 있다.
본 발명의 실크 단백질은 또한 상처 드레싱 물질로서 필름 형태로 사용될 수 있다. 무정형 필름 형태의 상처 드레싱 물질로서의 실크 단백질의 용도는 US 6,175,053에 기재되어 있다. 무정형 필름은 유효량의 실크 단백질을 포함하며, 결정도가 10% 미만인 조밀한 비다공성 필름을 포함한다. 상처 관리용 필름을 위해, 실크 단백질의 유효량은 본원에서 약 1 내지 99 중량% 사이로 정의된다. 필름은 또한 상기 기술된 것과 같은, 다른 단백질, 예를 들면, 세리신 및 소독제, 치료 촉진제, 혈관수축제, 수렴제 및 크러스트 발생제를 포함하나, 이에 한정되지 않는 다른 성분들을 함유할 수 있다. 다른 단백질, 예를 들면, 세리신은 조성물의 1 내지 99 중량%를 포함할 수 있다. 열거된 다른 성분들의 양은 조성물의 총 약 30 중량% 미만, 더욱 바람직하게 약 0.5 내지 20 중량% 미만이 바람직하다. 상처 드레싱 필름은 수용액중 상기 언급한 물질을 용해시키고, 여과 또는 원심분리에 의해 불용성 물질을 제거하고, 예를 들면, 아크릴 판과 같은 매끄러운 고체 표면상에 용액을 캐스팅한 후 건조시킴으로써 제조될 수 있다.
본 발명의 실크 단백질은 또한 봉합사에 사용될 수 있다(예컨대, US 2005/0055051을 참조할 수 있다). 그러한 봉합사는 초고분자량 섬유 및 실크 섬유로 제조된 편조 재킷을 특징으로 할 수 있다. 폴리에틸렌이 강도를 제공한다. 폴리에스테르 섬유는 고분자량 폴리에틸렌과 직조됨으로써 고정시키는 성질을 개선시킬 수 있다. 실크는 봉합 인식 및 표시가 개선되었음을 추적할 수 있도록 하는 대비색으로 제공될 수 있다. 실크는 또한 다른 섬유보다도 더 조직에 대하여 순응성을 띠고, 이로써 봉합사 끝단과 주변 조직 사이의 유해한 상호작용에 관하여 걱정할 필요없이, 끝단을 매듭에 가깝게 자를 수 있다. 고강도 봉합사의 성질을 취급하는 것은 또한 봉합사를 코팅하는 다양한 물질을 사용함으로써 증진될 수 있다. 봉합사는 유리하게는 에치본드(Ethibond) 번호 5호 봉합사의 강도를 갖지만, 직경, 촉감 및 고정능은 번호 2호 봉합사의 것을 갖는다. 결과적으로, 봉합사는 대부분의 정형외과 수술, 예를 들면, 회전 근개 회복, 아킬레스건 회복, 슬개 건 회복, ACL/PCL 재건술, 엉덩이 및 어깨 재건술 및 봉합 고정 장치내에 또는 그와 함께 사용되는 대체술에 대하여 이상적인 것이다. 봉합사는 코팅되지 않을 수 있거나, 예컨대, 브레이드의 윤활성, 매듭 보호, 또는 내마모성을 개선시키기 위하여 왁스(밀랍, 석랍, 폴리에틸렌 왁스, 또는 기타), 실리콘(다우 코닝(Dow Corning) 실리콘 유체 202A 또는 기타), 실리콘 고무, PBA(부틸레이트 산), 에틸 셀룰로스(Filodel) 또는 다른 코팅제로 코팅시킬 수 있다.
본 발명의 실크 단백질은 또한 스텐트에 사용될 수 있다(예컨대, US 2004/0199241를 참조할 수 있다). 예컨대, 관내 스텐트 및 이식편을 포함하는 스텐트 이식편을 제공하며, 여기에서, 스텐트 이식편은 실크를 포함한다. 실크는 스텐트 이식편을 받는 숙주에서 반응을 유도하며, 여기에서, 반응이 실크 스텐트 이식편과, 실크 스텐트 이식편의 실크에 인접한 숙주 조직 사이의 부착을 증진시킬 수 있다. 실크는 임의의 다양한 수단들중 임의의 것, 예로서, 실크를 이식편으로 섞어 짜거나, 실크를 이식편에 부착시킴으로써(예로서, 접착제에 의해 또는 봉합사에 의해) 이식편에 접착시킬 수 있다. 실크는 실, 편조, 쉬트, 분말 등의 형태로 존재할 수 있다. 스텐트 이식편 상의 실크의 위치에 있어서, 실크는 스텐트 외면에만 접착될 수 있고/거나, 실크는 숙주에서 이웃 조직에 대한 원위 부위를 안정하게 하는데 도움을 주기 위하여 스텐트 이식편의 원위 부위에 접착될 수 있다. 본 발명과 관련하여, 원하는 치료 부위와 성질에 따라 매우 다양한 스텐트 이식편이 사용될 수 있다. 스텐트 이식편은 예컨대, 분지형 또는 관상 이식편, 원통형 또는 첨형, 자가-확장형 또는 풍선-확자형, 단일체, 또는 모듈러 등일 수 있다.
실크 이외에도, 스텐트 이식편은 실크중 일부 또는 모두 위에 코팅제를 함유할 수 있는데, 상기 코팅제는 스텐트 이식편이 숙주내로 삽입될 때 분해됨으로써, 실크와 숙주 사이의 접촉을 지연시킬 수 있다. 적합한 코팅제로는 제한없이 젤라틴, 분해성 폴리에스테르(예로서, PLGA, PLA, MePEG-PLGA, PLGA-PEG-PLGA 및 그의 공중합체 및 혼화물), 셀룰로스 및 셀룰로스 유도체(예로서, 하이드록시프로필 셀룰로스), 다당질(예로서, 하이알유론산, 덱스트란, 황산덱스트란, 키노산), 지질, 지방산, 당 에스테르, 핵산 에스테르, 폴리무수물, 폴리오르토에스테르 및 폴리비닐알코올(PVA: polyvinylalcohol)을 포함한다. 실크를 함유하는 스텐트 이식편은 생물학적 활성제(약물)를 함유할 수 있는데, 여기에서, 상기 약제는 스텐트 이식편으로 방출되고, 스텐트 이식편이 삽입되는 숙주에서 세포 반응의 증진을 유도하고/거나(예로서, 세포 또는 세포외 기질 침전), 섬유소성 반응의 증진을 유도한다.
본 발명의 실크 단백질은 또한 생체외에서 인대 및 건 생산을 위한 매트릭스에 사용될 수 있다(예컨대, US 2005/0089552를 참조할 수 있다). 실크-섬유-기재 매트릭스를 다능성 세포, 예를 들면, 골수 간질 세포(BMSC: bone marrow stromal cell)에 시딩할 수 있다. 생명공학 기술로 만들어진 인대 또는 건은 유리하게는 가해지는 기계적 힘 방향의 세포 배향 및/또는 매트릭스 권축 패턴과, 상기와 같은 힘이 가해질 경우, 기계적 힘 또는 자극에 의해 생성되는 기계적 하중의 축을 따라 I형 콜라겐, II형 콜라겐 및 섬유결합소 단백질을 비롯한 인대 및 건 특이 마커가 생산되는 것도 특징으로 한다. 바람직한 실시태양에서, 인대 또는 건은 나선형 구조로 배열된 섬유 다발이 존재하는 것을 특징으로 한다. 생산될 수 있는 인대 또는 건의 몇몇 일례로는 전방 십자 인대, 후방 십자 인대, 회전 근개 건, 팔꿈치 및 무릎의 내측 측부 인대, 손의 굽힘 건, 팔목 측부 인대 및 턱 또는 턱 관절 건 및 인대를 포함한다. 본 발명의 방법으로 생산될 수 있는 다른 조직은 연골(관절 및 반월상 모두), 골, 근육, 피부 및 혈관을 포함한다.
본 발명의 실크 단백질은 또한 하이드로겔에 사용될 수 있다(예컨대, US 2005/0266992를 참조할 수 있다). 실크 견섬유 하이드로겔은 조직 공학용 스캐폴드, 세포 배양용 기판, 상처 및 화상 드레싱, 연조직 치환체, 골 충진제 및,약제학적 또는 생물학적으로 활성인 화합물에 대한 지지체로서 사용할 수 있도록 하는 개공 구조를 특징으로 할 수 있다.
실크 단백질은 또한 피부과학적 조성물에 사용될 수 있다(예컨대, US 2005/0019297을 참조할 수 있다). 추가로, 본 발명의 실크 단백질 및 그의 유도체는 지효성 조성물에 사용될 수 있다(예컨대, US 2004/0005363을 참조할 수 있다).
직물
본 발명의 실크 단백질은 또한 직물로 추후에 사용되는 섬유 표면상에 적용될 수 있다. 이는 섬유 상에 단층의 단백질 필름을 제공함으로써 매끄러운 마감재를 얻을 수 있다. US 6,416,558 및 US 5,232,611에는 마감용 코트를 섬유에 가하는 것이 기재되어 있다. 이들 개시물에 기재되어 있는 방법은 섬유를 마감처리함으로써 우수한 촉감과 매끄러운 표면을 제공할 수 있도록 하는 다양한 일례들을 제공한다. 이러한 적용을 위해, 섬유를 유효량의 실크 단백질로 코팅한다. 직물용 섬유 코팅제를 위한 실크 단백질의 유효량은 본원에서 섬유재에 대하여 약 1 내지 약 99 중량%의 비율로서 정의된다. 섬유재로는 면직물 섬유, 폴리에스테르, 예를 들면, 레이온 및 라이크라(Lycra)™, 나일론, 양모 및 천연 실크를 비롯한 다른 천연 섬유를 포함하나, 이에 한정되지 않는다. 실크 단백질을 섬유 상에 적용시키는데 적합한 조성물은 공-용매, 예를 들면, 에탄올, 이소프로판올, 헥사플루오라놀, 이소티오시아노우라네이트 및 물과 함께 혼합되어 용액 또는 마이크로에멀젼을 형성할 수 있는 다른 극성 용매를 포함할 수 있다. 실크 단백질을 함유하는 용액을 섬유 상에 분무할 수 있거나, 섬유를 용액 내로 침지시킬 수 있다. 반드시 그러하지는 않지만, 코팅된 물질을 순간 건조시키는 것이 바람직하다. 대체 프로토콜은 실크 단백질 조성물을 직조 섬유 상에 적용시키는 것이다. 이러한 적용의 이상적인 실시태양은 예를 들면, 스타킹용으로 사용되는 연신성 위브를 코팅하기 위하여 실크 단백질을 사용하는 것이다.
복합재
실크 섬유는 패널 판지 및 다른 건축 자재 또는 성형 가구로서 및 목재와 입자 판지를 대신하는 벤치톱을 제조하기 위하여 폴리우레탄, 다른 수지 또는 열가소성 충진제에 첨가될 수 있다. 복합물은 또한 건물 및 자동차 건설, 특히, 옥사 및 문짝에 사용될 수 있다. 실크 섬유는 수지가 상기 자재를 더욱 강하게 만들고, 다른 입자 판자 및 복합 물질과 강도가 동일하거나 그보다 우수하지만 구조물의 중량은 보다 경량으로 할 수 있도록 강화시킨다. 실크 섬유는 분리된 것일 수 있고, 합성 복합물-형성 수지에 첨가될 수 있거나, 식물-유래의 단백질, 전분 및 오일과 함께 배합되어 사용됨으로써 생물학적-기재의 복합 물질을 생산할 수 있다. 상기 물질의 생산 공정은 JP 2004284246, US 2005175825, US 4,515,737, JP 47020312 및 WO 2005/017004에 기재되어 있다.
종이용 첨가제
본 발명의 실크의 섬유 성질이 제지에 강도와 질감을 가할 수 있다. 여분의 매끄러운 수제 종이를 제조하기 위하여 면 펄프에 실크사로 반문을 형성하여 제조된 실크지는 선물용 포장지, 노트북 커버, 쇼핑백용으로 사용된다. 본 발명의 실크 단백질을 포함할 수 있는 종이 제품에 관한 생산 공정은 일반적으로 JP 2000139755에 기재되어 있다.
고급재
본 발명의 실크는 상당한 인성을 갖고, 젖었을 때에 이러한 성질을 유지한다는 점에서 다른 실크보다도 뛰어나다[Hepburn et al., 1979].
의류 직물 산업에서 상당한 성장을 이룬 분야는 산업용 및 지능형 직물이다. 건강에 좋고, 고가치로 기능성이며, 환경 친화성인 개인용 섬유 제품에 대한 수요가 증가하고 있다. 섬유, 예를 들면, 젖었을 때 성질이 변하지 않는, 특히, 그의 강도와 연신성을 유지시키는 본 발명의 섬유는 스포츠복 및 레저복 뿐만 아니라, 작업복 및 보호 의류를 위한 기능성 의류에 유용하다.
무기와 감시 기술의 발전으로 개인 보호 장치 및 전투-분야와 관련된 시스템 및 구조에서 혁신이 일어났다. 예를 들면, 장기간 노출에 대한 물질의 내구성, 중무기 및 외부 환경으로부터의 보호와 같은 종래 요건 이외에도, 본 발명의 실크 직물은 탄도 발사체, 화약 및 화학 물질에 내성을 띠도록 공정처리될 수 있다. 상기 물질의 생산 공정은 WO 2005/045122 및 US 2005268443에 기재되어 있다.
실시예 1 - 말기의 최종 영 침샘 cDNA의 제조 및 분석
실크를 트립신으로 분해하여 수득한 펩티드의 이온 포착 연속 질량 스펙트럼(MS/MS) 단편화 패턴을 말기의 최종 영 유충의 침샘으로부터 단리된 cDNA에 의해 코딩된 단백질의 예측된 질량 스펙트럼 데이타와 매치시켜 진정 세요아목 및 풀잠자리목(아피스 멜리페라, 봄부스 테레스트리스, 미르메시아 포르피카타, 오에코필라 스마라그디나, 말라다 시그나타) 실크에서 발견된 단백질을 동정하였다. 이러한 꿀벌에 대한 분석으로 어떤 단백질도 결손되어 있지 않다는 것을 확인하기 위하여 펩티드 질량 스펙트럼 데이타 또한 6개의 리딩 프레임 모두에서 Ame13 꿀벌 게놈 서열의 벌 게놈 프로젝트 및 번역에 의해 예측된 아피스 멜리페라 단백질의 실제 트립신 분해물과 비교하였다.
꿀벌
가내 꿀벌통으로부터 아피스 멜리페라 유충을 수득하였다. 앞서, 아피스 멜 리페라에서의 실크 생산은 최종 영 후반부 동안 침샘으로 한정되는 것으로 나타났다[Silva-Zacarin et al., 2003]. 이 기간 동안, RNA는 상기 샘의 뒤 끝단부에 더욱 풍부해진다[Flower and Kenchington, 1967]. 인산염 완충처리된 염수에 침지된 말기의 5번째 영 아피스 멜리페라로부터 50개의 침샘을 입방체 모양의 세포 부위로 절개하였다. 절개된 샘의 뒤 끝단부를 즉시 RNAlater®(미국 텍사스주 오스틴에 소재하는 Ambion)에 놓음으로써 mRNA를 안정화시킨 후, 4℃에 저장하였다.
앰비온(Ambion)(미국 텍사스주 오스틴에 소재)으로부터 입수한 PCR 키트용 RNAqueous를 사용하여 말기의 최종 영 침샘으로부터 총 RNA(35㎍)를 단리시켰다. 제조사의 설명서에 따라, 인비트로겐(Invitrogen)(USA 캘리포니아주 캘즈배드에 소재)로부터 입수한 마이크로-패스트트랙(Micro-FastTrack)™ 2.0 mRNA 단리용 키트를 사용하여 총 RNA로부터 전령 RNA를 단리시키고, 단리된 mRNA는 10ul RNAse 유리수(free water)로 용출시켰다.
표준 프로토콜을 하기와 같이 변형시켜 인비트로겐(미국 캘리포니아주 칼스배드 소재)의 클론마이너(CloneMiner)™ cDNA 라이브러리 작제 키트를 사용하여 아피스 멜리페라 유충으로부터 단리된 mRNA로부터 cDNA 라이브러리를 작제하였다: 제1 가닥 합성을 위해 0.5㎕의 바이오틴-attB2-올리고(dT) 프라이머를 6pmol.㎕-1로 및 0.5㎕의 dNTPs를 각각 2mM로 10㎕의 mRNA에 가하였다. 65℃에서 5분 동안, 이어서, 45℃에서 2분 동안 인큐베이션시킨 후, 2㎕ 5 X 제1 가닥 완충액, 1㎕의 0.1M DTT 및 0.5㎕ 수퍼스크립(Superscript)™ II RT를 200U.㎕-1로 가하였다. 제2 가닥 합성을 위해, 시약 모두의 총 용량을 2등분하고, 에탄온 침전 후, cDNA를 5㎕의 DEPC-처리된 물에 재현탁시켰다. 총 용량 10㎕중 aatB1 어댑터(1㎕)를 16℃에서 48시간 동안 2㎕ 5X 어댑터 완충액, 1㎕ 0.1M DTT 및 1㎕ T4 DNA 리가제(1U.㎕-1)와 함께 5㎕ cDNA에 결찰시키고, 16시간 후에 추가의 0.5㎕ T4 DNA 리가제(1U.㎕-1)를 가하였다. 에탄올로 침전되는 300-500㎕로 용출시키면서 cDNA는 샘플을 사용하여 제조사의 설명서에 따라 크기 분별하고, 재현탁시키고, 권고에 따라 제공된 E. 콜라이 DH10B™ T1 파지 내성 세포로 형질전환시켰다. cDNA 라이브러리는 대략 1% 원래의 벡터와 함께 대략 1,200,000개의 콜로니 형성 단위(cfu: colony forming unit)를 포함하였다. 평균 삽입체 크기는 1.3 ± 1.4 kbp였다.
82개의 클론을 무작위로 선별하고, 게놈랩™ DTCS 퀵 스타트 키트(GenomeLab™ DTCS Quick start kit) (BeckmanCoulter, 미국 캘리포니아주 플러톤 소재)를 사용하여 서열화하고, CEQ8000 바이오래드(Biorad) 서열기로 이동시켰다. 이를 54개의 군으로 집단화하였다(표 2). 실크 단백질을 코딩하는 cDNA의 동정은 하기에 기술한다.
다른 종
앰비온(미국 텍사스주 오스틴 소재)으로부터 입수한 PCR 키트용 RNAqueous를 사용하여 4마리의 뒤영벌(봄부스 테레스트리스)(2㎍ RNA), 4마리의 불독 개미(미르메시아 포르피카타)(3㎍ RNA), 대략 100마리의 바느질 개미(오에코필라 스마라그디나(0.4㎍ RNA) 및 대략 50마리의 녹색 풀잠자리(말라다 시그나타)의 말기 유충 입 술샘으로부터 총 RNA를 단리시켰다. mRNA를 인비트로겐(미국 캘리포니아주 캘스배드)로부터 입수한 마이크로-패스트트랙™ 2.0 mRNA 단리용 키트를 사용하여 총 RNA로부터 최종 용량 10㎕의 물로 단리시켰다. cDNA 라이브러리는 인비트로겐(미국 캘리포니아주 캘스배드)의 클론마이너™ cDNA 키트를 사용하여 mRNA로부터 작제하고, 하기와 같이 표준 프로토콜을 변형하였다: 제1 가닥 합성을 위해 3pmol의 바이오틴-attB2-올리고(dT) 프라이머 및 1nmol의 각각의 dNTPs를 10㎕ mRNA에 가하였다. 65℃에서 5분 동안, 이어서, 45℃에서 2분 후에, 2㎕ 5 X 제1 가닥 완충액, 50nmol DTT 및 100U 수퍼스크립™ II RT를 가하였다.
표 2. SDS로 처리한 벌집 실크의 트립신 분해로부터 얻은 펩티드의 A. 멜리페라(A. mellifera) 최종 영 침샘 cDNA 및 MS 이온 트랩 단편화 패턴
제2 가닥 합성을 위해, 시약 모두의 총 용량을 제조사의 권고량으로부터 2등분하고, 에탄온 침전 후, cDNA를 5㎕의 DEPC-처리된 물에 재현탁시켰다. 총 용량 10㎕중 aatB1 어댑터(1㎕)를 16℃에서 12시간 동안 2㎕ 5X 어댑터 완충액, 50nmol DTT 및 1U T4 DNA 리가제와 함께 5㎕ cDNA에 결찰시켰다. cDNA 라이브러리는 불독 개미 및 뒤영벌 라이브러리의 경우 1% 미만의 원래의 벡터와 함께 및 녹색 개미 라이브러리의 경우 80% 초과의 원래의 벡터와 함께 대략 2.4 x 107개(뒤영벌), 5.O x 107개(불독 개미) 및 6000개(녹색 개미) 콜로니 형성 단위(cfu)를 포함하였다. 라이브러리내 평균 삽입체 크기는 1.3Kbp였다.
뒤영벌 및 불독 개미로부터 얻은 100개 초과의 무작위 클론, 꿀벌로부터의 82개의 클론 및 풀잠자리로부터의 60개의 클론으로부터 서열 데이타를 수득하였다. 미세한 녹색 개미(길이 대략 1mm)로부터 침샘을 수득하는데 갖는 기술상의 어려움으로 인해 이러한 종으로부터 얻은 라이브러리의 효율은 감소되었고, 따라서, 오직 40개의 서열만을 조사하였다. 동정된 실크 단백질에 관한 요약은 표 3으로 제공한다.
표 3. 진정 세요아목 실크 단백질의 동정 및 성질
실시예 2 - 천연 실크 제조 및 프로테옴 분석
유충 제거 후의 꿀벌 벌집, 유충 제거 후의 뒤영벌 고치, 유충 제거 후의 불독 개미 고치, 또는 바느질 개미 실크 구조물을 온수에서 3회에 걸쳐 철저하게 세척하여 수용성 오염물을 제거하고, 클로로포름에서 3회에 걸쳐 철저하게 세척하여 왁스를 제거하였다. 클로로포름은 증류수에서 세정하여 제거하고, 이러한 실크의 하위세트는 분석을 위해 유지시켰다. 누에 실크에서 고무 성질을 제거하는 표준 방법인 0.05% 탄산나트륨 용액에서 30분 동안 비등시켜 벌목(개미 및 벌) 실크 샘플의 하위세트를 추가로 세척한 후, 증류수에서 세정하였다. 풀잠자리 실크는 증류수 에서만 세정하였다. 0.05% 탄산나트륨 용액에서 30분 동안 비등시켜 풀잠자리 실크 샘플의 하위세트에서 고무 성질을 제거하였다.
꿀벌 물질의 하위세트를 95℃에서 밤새도록 2% SDS에 적신 후 증류수에서 3회에 걸쳐 세척하였다. 뜨거운 SDS 용액에서 추출하여 대부분의 단백질을 가용화시켰지만, 이 경우, 실크 구조물은 그의 그의 구조를 유지하였다.
하기 기술하는 바와 같이, 액체 크로마토그래피에 이어 연속 질량 분광법(LCMS: liquid chromatography followed by tandem mass spectrometry)에 의해 깨끗한 실크를 분석하였다.
세정된 실크 조각은 160ng의 서열화 등급 트립신(Promega)을 함유하는 25mM의 중탄산암모늄 20㎕이 첨가되는 각 웰의 바닥을 통해, C18 역상 크로마토그래피 매질의 플러그를 포함하는 96 웰 마이크로타이터 트레이인 밀리포어(Millipore) '집플레이트(zipplate)'의 웰에 놓았다. 이어서, 트레이를 30℃의 습윤화된 비닐 봉지에서 밤새도록 인큐베이션시켰다.
각 웰의 측면에 아세토니트릴(1O㎕)을 피펫팅하고, 상기 플레이타를 37℃에서 15분 동안 인큐베이션시켜 C18 물질을 습윤화시켰다. 포름산 용액(130㎕, 1% v/v)을 각 웰에 가하고, 30분 후, 저감 진공하에 플레이트의 베이스를 통해 각 웰로부터 용액을 천천히 인발함으로써 분해된 벌의 단백질로부터 유래된 펩티드를 포획하였다. 100㎕의 포름산 용액을 통해 인발하여 C18 물질을 2회에 걸쳐 세척하였다. C18 물질상에 직접 피펫팅된 70% 메탄올중의 6㎕의 1% 포름산으로 펩티드를 용출시키고, 즉시 내재 마이크로타이터 트레이에 대한 C18 플러그를 통해 원심분리하 였다. 증발에 의해 각 웰의 용적이 약 2-배로 감소될 때까지 상기 플레이를 진공하에 놓았다. 포름산 용액(10㎕)을 각 웰에 가하고, 트레이를 애질런트 1100 모세관 액체 크로마토그래피 시스템의 웰 플레이트 샘플러로 옮겼다.
실크 추출물로부터 유래된 펩티드(8㎕)를 1분 동안 0.1% 포름산/5% 아세토니트릴의 유속을 20㎕.분-1으로 하여 애질런트 조르박스(Zorbax) SB-C18 5㎛ 150 x 0.5mm 칼럼에 결합시킨 후, 아세토니트릴의 농도를 증가시키면서 1분간에 걸쳐 0.1% 포름산/20% 아세토니트릴에 5㎕.분-1으로, 이어서, 28분간에 걸쳐 0.1% 포름산/50% 아세토니트릴에, 이어서, 1분간에 걸쳐 0.1% 포름산/95% 아세토니트릴에 용출시켰다. 칼럼을 5분간에 걸쳐 20㎕.분-1으로 0.1% 포름산/95%-100% 아세토니트릴을 사용하여 세척한 후, 다음 웰로부터 유래된 펩티드를 샘플링하기 앞서 7분 동안 0.1% 포름산/5% 아세토니트릴로 재평형화하였다.
미세분무기가 설비된 기기의 전기분무 이온 소스를 통해 칼럼으로부터의 용출액을 애질런트 XCT 이온 트랩 질량 분광계로 도입시켰다. 간략하면, 펩티드가 칼럼으로부터 용출됨에 따라 이온 트랩은 전체 스펙트럼 양성 이온 스캔(100-2200m/z)을 수집하고, 이어서, 오직 단일 전하만을 수반하는 이온이 선택되는 것을 방지하면서, 전체 스펙트럼에서 관찰되는 2개의 MS/MS 이온 스캔을 수집하였다. 이온을 MS/MS 분석을 위해 선택할 때에는 모든 다른 것은 이온 트랩으로부터 제외시키고, 선택된 이온은 기기에 관하여 권고된 "스마트프래그(SmartFrag)" 및 "펩티드 스캔(Peptide Scan)" 세팅에 따라 이온을 단편화시켰다. 일단 임의의 특정 m/z 값 에 대한 2개의 단편화 스펙트럼이 수집되면 중복 데이타가 수집되지 못하도록 추가의 30초 동안 분석을 위한 선택으로부터 제외시켰다.
전체 실험으로 얻은 질량 스펙트럼 데이타 세트는 cDNA 라이브러리로부터 얻은 단백질 서열에 관한 예측치와 데이타를 매치시키는 애질런트 스펙트럼 밀 소프트웨어를 사용하여 분석하였다. 소프트웨어는 펩티드 단편에 대하여 실험상 관찰된 질량 세트와, 제공된 데이타베이스내의 단백질 서열에 따라 생성될 수 있는 단편의 예측치 사이의 각 매치의 질에 관한 스코어를 생성하였다. 본원에 기록된 서열 매치 모두는 20보다 큰 스코어를 받았고, 디폴트는 유효 매치의 자동, 신뢰 허용에 대하여 세팅하였다.
이러한 분석을 통해, 입술샘에서 고수준으로 발현된 5개의 단백질은 기원이 같은 각각의 벌 종으로부터 유래된 실크와 매치되었고(표 2 및 3에 나타내었다), 입술샘에서 고수준으로 발현된 4개의 단백질은 기원이 같은 각각의 개미 종으로부터 유래된 실크와 매치되었음(표 3에 나타내었다)이 확인되었다. 유충의 입술샘에서 이들 단백질을 코딩하는 전령 RNA가 풍부한 것은 생산되는 단백질이 풍부한 것과 일치하였다(표 3에 전령의 풍부도를 나타냄).
확인 과정에 의해 어떤 꿀벌 실크 단백질도 빠지지 않았음을 확인하기 위하여 본 발명자들은 벌의 완전 게놈 DNA 서열내 전사된 유전자를 인식하고자 하는 컴퓨터 알고리즘에 의해 작성된 꿀벌 게놈 프로젝트로부터 공공연히 이용가능하게 예측된 단백질 서열과 꿀벌 실크 트립신 펩티드 질량 스펙트럼 데이타를 비교하였다. 게다가, 본 발명자들은 꿀벌 게놈 프로젝트(Ame13 공개)에 의해 제공되는 각각의 인접 게놈 DNA 서열의 6개의 가능한 리딩 프레임중 번역 데이타베이스를 작성하였다. 이러한 해독된 DNA 서열은, 상기 서열이 마치 매우 큰 단백질 서열인 것처럼 스펙트럼 밀 소프트웨어에 제시되었다. MS/MS 펩티드 데이타를 매치시킴으로써 1차적으로 유전자 구조를 예측할 필요없이 단리된 벌 단백질중 일부분을 코딩하는, 게놈 서열내 오픈 리딩 프레임을 동정하였다. 이러한 분석에 의해서는 어떠한 추가 단백질도 동정되지 않았다.
실시예 3 - 천연 실크 구조 분석
실시예 2에 기술되어 있는 바와 같이 천연 실크 샘플을 제조하였다. 파이크 미라클(Pike Miracle) 다이아몬드 감쇠 전반사 부속장치를 포함하는 브루커 텐서 37 푸리에 변환 적외선 분광계(Bruker Tensor 37 Fourier transform infrared spectrometer)를 사용하여 실크 샘플을 조사하였다. 꿀벌, 뒤영벌, 녹색 개미, 불독 개미 실크 및 풀잠자리 유충 실크 스펙트럼의 아미드 I 및 II 부위의 분석(도 1)은 이들 실크 모두가 주로 알파-나선형 2차 구조를 갖는다는 것을 나타낸다. 진정 세요아목 종의 실크는 FT-IR 스펙트럼에 있어 1645-1646cm-1에서 우세한 피크를 갖고, 종래의 알파-나선형 신호보다 대략 10cm-1 아래로 이동하였고, 범위는 넓어졌다. α-나선형 신호에 있어 이러한 이동은 꼬인 코일 단백질의 전형적인 특징을 나타낸다[Heimburg et al., 1999]. 고무 성질이 제거된 샘플로부터 얻은 스펙트럼에서는 변화가 없었다.
실시예 4 - 천연 실크의 아미노산 조성은 동정된 실크 단백질의 것과 매우 유사하다
110℃에서 24시간 동안 기상 가수분해한 후, 오스트레일리안 프로테옴 아날리시스 패실러티 리미티드(Australian Proteome Analysis Facility Ltd.)(시드니 맥쿼리 대학 소재)에 의해 워터 AccQTag(Waters AccQTag) 화학 물질을 사용하여 천연 실크의 아미노산 조성을 측정하였다.
SDS로 세척된 실크의 측정된 아미노산 조성은 동정된 실크 단백질 서열로부터 예측된 것과 유사하였다(도 2 및 3).
실시예 5 - 실크 단백질의 구조 분석
예측된 분비 펩티드
실크 단백질에 대하여 예측된 바와 같이, 신호 펩티드를 동정하기 위하여 2개의 모델을 사용하는 시그날P(SignalP) 3.0 신호 예측 프로그램[Bendtsen et al., 2004]은 동정된 실크 유전자 모두가 세포로부터의 분비에 대하여 표적하는 신호 펩티드를 함유하는 단백질을 코딩한다는 것을 예측하였다(데이타는 나타내지 않음). 폴리펩티드의 예측되는 절단 부위는 하기와 같다:
제노스피라1(AmelF1) - 위치 19번과 20번 사이(ASA-GL),
제노스피라2(AmelF2) - 위치 19번과 20번 사이(AEG-RV),
제노스피라3(AmelF3) - 위치 19번과 20번 사이(VHA-GV),
제노스피라4(AmelF4) - 위치 19번과 20번 사이(ASG-AR),
제노신(AmelSAl) - 위치 19번과 20번 사이(VCA-GV),
BBF1 - 위치 19번과 20번 사이(ASA-GQ),
BBF2 - 위치 20번과 21번 사이 (AEG-HV),
BBF3 - 위치 19번과 20번 사이(VHA-GS),
BBF4 - 위치 19번과 20번 사이(ASA-GK),
BAF1 - 위치 19번과 20번 사이(ASA-SG),
BAF2 - 위치 19번과 20번 사이(ASG-RV),
BAF3 - 위치 19번과 20번 사이(ASG-NL),
BAF4 - 위치 19번과 20번 사이(VGA-SE),
GAF1 - 위치 19번과 20번 사이(ADA-SK),
GAF2 - 위치 19번과 20번 사이(ASG-GV),
GAF3 - 위치 19번과 20번 사이(ASG-GV),
GAF4 - 위치 19번과 20번 사이(VGA-SE),
MalF1 - 위치 26번과 27번 사이(SST-AV).
4마리의 개미 모두와 5마리의 벌중 4마리에서의 실크 단백질은 나선형이고, 꼬인 코일을 형성하였다.
단백질 모델링과 패턴 인식 알고리즘으로부터 얻은 결과를 통해 동정된 꿀벌 실크 단백질의 대다수가 꼬인 코일을 형성하는 나선형 단백질임을 확인하게 되었다.
PROFsec[Rost and Sander, 1993] 및 NNPredict([McClelland and Rumelhart, 1988];[Kneller et al., 1990]) 알고리즘을 사용하여 동정된 실크 유전자의 2차 구조를 조사하였다. 이들 알고리즘을 통해 제노스피라1[GB12184-PA](서열 번호 1), 제노스피라2[GB12348-PA](서열 번호 3), 제노스피라3[GB17818-PA](서열 번호 5) 및 제노스피라4[GB19585-PA](서열 번호 7)를 동정하였는데, 이들은 고도의 나선형 단백질로서, 76-85% 사이가 나선형 구조였다(표 4). 제노신[GB15233-PA](서열 번호 10)은 유의적으로 덜한 나선형 구조를 가졌다.
표 4. 나선형, 확장형 및 루프의 퍼센트(%)를 나타내는, PROFsec[Rost and Sander, 1993]에 의해 예측되는 아피스 멜리페라 실크 단백질의 2차 구조
추가의 단백질 모델링과 패턴 인식 알고리즘으로부터 얻은 결과를 통해 동정된 실크 단백질의 대다수가 꼬인 코일을 형성하는 나선형 단백질임을 확인하게 되었다. PredictProtein[Rost et al, 2004] 알고리즘을 사용하여 동정된 실크 유전자의 2차 구조를 조사하였다. 이들 알고리즘을 통해 제노스피라1(서열 번호 1), 제노스피라2(서열 번호 3), 제노스피라3(서열 번호 5), 제노스피라4(서열 번호 7), BBF1(서열 번호 22), BBF2(서열 번호 24), BBF3(서열 번호 26), BBF4(서열 번호 28), BAF1(서열 번호 40), BAF2(서열 번호 42), BAF3(서열 번호 44), BAF4(서열 번호 46), GAF1(서열 번호 56), GAF2(서열 번호 58), GAF3(서열 번호 60), GAF4(서열 번호 62) 및 MalF1(서열 번호 72)을 동정하였는데, 이들은 고도의 나선형 단백질로서, 69-88% 사이가 나선형 구조였다(표 3). 제노신[GB15233-PA](서열 번호 10)은 유의적으로 덜한 나선형 구조를 가졌다. AmelSA1[GB15233-PA](제노신)(서열 번호 10) 및 BBSA1(서열 번호 30)은 유의적으로 덜한 나선형 구조를 가졌다.
나선형 단백질의 수퍼-코일링(꼬인 코일)은 일반적으로 a와 d 위치에 소수성 잔기가 존재하고, 일반적으로 나머지 위치에는 하전된 잔기 또는 극성 잔기가 존재하는, 보통 (abcdefg)n로 지칭되는 특징적인 헵타드 반복부 서열로부터 발생한다. 패턴 인식 프로그램(MARCOIL[Delorenzi and Speed, 2002], COILS[Lupas et al., 1991])을 통해 제노스피라1[GB12184-PA](서열 번호 1), 제노스피라2[GB12348-PA](서열 번호 3), 제노스피라3[GB17818-PA](서열 번호 5) 및 제노스피라4[GB19585-PA](서열 번호 7)(MARCOIL: 표 5; COILS: 도 4) 뿐만 아니라, BBF1(서열 번호 22), BBF2(서열 번호 24), BBF3(서열 번호 26), BBF4(서열 번호 28), BAF1(서열 번호 40), BAF2(서열 번호 42), BAF3(서열 번호 44), BAF4(서열 번호 46), GAF1(서열 번호 56), GAF2(서열 번호 58), GAF3(서열 번호 60), GAF4(서열 번호 62) 및 MalF1(서열 번호 72) (MARCOIL: 표 3)중 꼬인 코일을 대표하는 다수의 헵타드 반복부를 동정하였다.
꿀벌 실크 단백질중 신규한 꼬인 코일 서열의 동정
제노스피라1[GB12184-PA], 제노스피라2[GB12348-PA], 제노스피라3[GB17818-PA], 제노스피라4[GB19585-PA]의 서열내 동정된 아미노산 잔기의 헵타드 반복부는 각각 꼬인 코일 2차 구조를 매우 잘 나타내었다(도 5)(신뢰 수준에 대하여는 표 5를 참조할 수 있다). 헵타드가 연속적으로, 그리고 수없이 많이 발견된다는 사실은 단백질이 매우 규칙적인 구조를 채택하고 있음을 제안한다. 중복 헵타드를 2개의 꿀벌 단백질에서 동정하였다: 제노스피라1의 주 꼬인 코일 부위는 3개의 잔기 오프셋(offset)에 이어, 5개의 잔기 스페이스 및 4개의 연속적인 헵타드를 포함하는 중복 헵타드를 함유하였고; 제노스피라2의 전체 꼬인 코일 부위는 단일 오프셋 및 4개의 잔기 오프셋(3개의 잔기 오프셋과 동일)을 포함하는 다중 중폭 헵타드를 가졌다. 주 헵타드중 다양한 위치의 아미노산 조성을 표 6의 첫번째 칼럼에 나타내고, 바로 옆 칼럼에는 중복 헵타드의 위치를 표시한다.
표 5. MARCOIL[Delorenzi and Speed, 2002] 패턴 인식 알고리즘에 의해 꼬인 코일로서 존재하는 것으로 예측되는 동정된 실크 단백질내 잔기(%)
단백질 | 성숙한 단백질(아미노산) 길이 | 꼬인 코일로서 존재하는 단백질(%) | ||
50% 역치 | 90% 역치 | 99% 역치 | ||
제노스피라3 | 315 | 64% (잔기 68-268) | 34% (잔기 128-223 및 235-246) | 20% (잔기 149-211) |
제노스피라4 | 290 | 73% (잔기 83-293) | 60% (잔기 98-168 및 182-285) | 27% (잔기 113-154 및 212-247) |
제노스피라1 | 316 | 69% (잔기 67-282) | 49% (잔기 103-256) | 18% (잔기 113-169) |
제노스피라2 | 328 | 65% (잔기 89-298) | 54% (잔기 110-283) | 45% (잔기 127-270) |
제노신 | 350 | 26% (잔기 32-127) | 9% (잔기 42-75) | 2% (잔기 59-67) |
놀랍게도, 총괄하여 볼 때 주 헵타드는 신규한 조성물을 갖는데, '소수성' 헵타드 위치 a 및 d에는 특히 알라닌이 고도로 풍부하다(표 6 및 도 5를 참조할 수 있다). 게다가, 많은 헵타드가 동일 헵타드 내에서도 위치 a 및 d, 둘 모두에 알라닌을 갖는다(제노스피라1[GB12184-PA]에서 33%; 제노스피라2[GB12348-PA]에서 36%; 제노스피라3[GB17818-PA]에서 27%; 및 제노스피라4[GB19585-PA]에서 38%; 표 6 및 7을 참조할 수 있다).
표 6. 꿀벌 실크 단백질의 꼬인 코일 부위내 다양한 헵타드 위치에서의 각 아미노산 잔기 갯수 요약
표 7. 꿀벌 실크 단백질 헵타드중 알라닌 잔기 요약
벌목 실크의 꼬인 코일 부위내 다양한 헵타드 위치에서의 아미노산 조성이 도 6 및 7에 요약되어 있다. 상기 언급한 바와 같이, 헵타드내 위치는 신규한 조성을 갖는데 - 다른 꼬인 코일과 비교할 때 벌 및 개미 실크의 '소수성' 헵타드 위치 a 및 d에는 초고수준의 알라닌(평균 58%)과 고수준의 작은 극성 잔기(평균 21%)가 존재한다. 게다가, 위치 e는 특히 작고 소수성이다(표 8, 도 7). 국소 해부학적으로, 상기 위치는 나선형 구조 내의 잔기에 인접하게 위치한다. 그의 조성이 a 및 d와 유사하다는 것은 실크가 α-나선 하나당 3개의 코어 잔기를 갖는 꼬인 코일 구조를 채택하고 있음을 제안한다. 이 코어에 있어서 2개의 잔기보다는 3개의 잔기 코어가 보다 큰 소수성 경계면을 만드는 것이고[Deng et al., 2006] - 이것이 꼬인 코일의 형성과 안정성을 돕는 특성이 된다.
또한, 총괄하여 볼 때 헵타드내 위치 b, c, e, f 및 g는 일반적으로 앞서 특징화된 단백질 꼬인 코일 부위보다 소수성이 크고, 극성은 작고, 하전성도 작다(도 7 및 표 8 및 9를 참조할 수 있다). 그러므로, 역사상, 침이 있는 벌목 실크의 나 선형 함량은 글리신 함량의 감소와 산성 잔기 함량의 증가 결과인 것으로 간주되었지만[Rudall and Kenchington, 1971], 본 발명자들은 신규한 구조의 원인이 되는 것은 글리신/산성 잔기라기 보다는 폴리펩티드 쇄내의 알라닌 잔기의 위치라는 것을 발견하게 되었다.
표 8. a, d 및 e 위치(코어)가 다른 위치보다 더 작고 소수성이 크다는 것을 나타내는, 오솔로그 벌목 실크 단백질과 녹색 풀잠자리 실크 단백질(MalF1)의 각 헵타드 위치의 평균 크기 및 소수성도. 몇몇 경우, b 위치(부분 잠복형) 또한 작고 소수성이다.
실시예 6 - 벌
실크
단백질은 광범위하게 가교
결합될
수 있다
벌 실크 단백질 모두는 많은 리신(6.5%-16.3%)을 함유한다. 벌 실크의 측정 된 아미노산 조성과 동정된 실크 단백질 서열 사이의 비교를 통해 다수의 리신 잔기가 매치되지 않는다는 것이 밝혀졌고, 실크에서는 예상된 것보다 적은 리신이 검출되었다(도 2 및 3). 이는 리신 잔기가 변형됨으로써, 표준 아미노산 분석법으로는 동정되지 않았다는 것을 제안한다. 리신은 다양한 가교 결합: 리실 옥시다제에 의해 촉매화되는 효소적 가교 결합 또는 당화 리신 잔기로부터 생성되는 비효소적 가교 결합을 형성한다고 알려져 있다[Reiser et al., 1992)]. 꿀벌 및 뒤영벌 실크 아미노산 분석에서 리신이 실제보다 적게 표시된 것은 리신 가교 결합이 존재한다는 것과 일치한다.
표 9. 실크 단백질의 꼬인 코일 부위중 다양한 헵타드 위치에 있는 각 부류의 아미노산 잔기 갯수
SDS 폴리아크릴아미드 겔 전기영동(PAGE: polyacrylamide gel electrophoresis)시킨, 공유 가교 결합된 단백질은 가교 결합된 복합체의 분자량에 따라 이동할 것으로 예상된다. 본 발명자들은 말기의 최종 영 꿀벌 입술샘 단백질을 SDS PAGE시키고, 표준 단백질 마커와 관련하여 실크 단백질의 이동성을 측정하였다. 각 동정된 실크 단백질의 단량체에 상응하는 밴드들이 관찰되었지만, 가교 결합된 시스템에서 예상되는 바와 같이, 상기 단백질을 함유하는 고분자 밴드 또한 존재하였다(도 8).
상기 기술한 바와 같이, 꿀벌 입술샘은 조직화된 실크 단백질과 조직화되지 않은 실크 단백질의 혼합물을 함유한다. 관찰된 가교 결합된 단백질은 아마도 샘의 앞쪽 부위의 단백질 군집에 상응하는 것이, 여기에서 실크는 압출을 위해 제조되는 것이다. 모든 단계의 침샘 실크 단백질의 이종 혼합물에서 관찰되는 것보다 세포외 꿀벌 실크가 실질적으로 더 많은 가교 결합된 단백질을 함유한다고 가정하는 것도 합당하다. 결합이 시스테인 가교 결합일 수는 없는데, 이는 실크가 환원적 처리에 의해서는 영향을 받지 않고, 동정된 실크 단백질이 시스테인 잔기를 거의 함유하지 않거나, 전혀 함유하지 않기 때문이었다.
실시예 7 - 진정 세요아목 실크 단백질은 다른 실크 단백질과 유의적으로 상이하다
진정 세요아목 실크는 아미노산 조성(표 10), 관여하는 단백질의 분자량, 2차 구조 및 물리적 성질(표 11 및 12)과 관련하여 기재된 다른 실크 유전자와 유의적으로 상이하다. 나비목 실크는 주로 작은 아미노산 잔기, 알라닌, 세린 및 글리신으로 구성되고(예컨대, 봄빅스 모리의 실크, 표 10), 확장형 베타 2차 구조가 지배적이다. 코테시아 글로머레이트 실크 단백질에는 아스파라긴과 세린이 많고 - 후자의 잔기가 풍부한 것이 나비목실크 세리신(접착체)의 특징이다(표 10). 코테시아 글로머레이트 실크 단백질의 모델링을 통해서는 2차 구조내 나선형 구조 또는 꼬인 코일을 동정하지 못했다. 반대로, 벌, 개미 및 풀잠자리 실크에는 알라닌이 풍부하고(표 10), 이는 꼬인 코일을 형성하는 고수준의 나선형 2차 구조로 구성된다.
표 10. 다양한 곤충으로부터 유래된 실크의 아미노산 조성(가장 풍부한 잔기를 볼드체로 나타냄)
표 11. 곤충 실크 간의 차이
개미 및 벌 실크 | 말라다 실크 | 코테시아 sp. | 나비목, 예를 들면, 봄빅스 모리 | |
가장 풍부한 아미노산 | Ala | Ala | Ser , Asn | Gly , Ala |
견섬유 단백질의 크기 | 25-35kDA | 57kDa | 대략 500kDa | >100kDa |
2차 구조 | 꼬인 코일 | 꼬인 코일 | 아마도 대개는 베타 구조임. 2차 구조 예측 프로그램인 PROFsec 및 MARCOIL은 어떤 나선형 구조도 꼬인 코일 부위도 인식하지 못한다. | β-구조, β-나선구조, α-나선형 구조 및 무정형 부위와 느슨하게 결합되어 있는 β-병풍 구조 |
표 12. 곤충 실크의 가용성
4개의 벌목 종의 실크 단백질의 꼬인 코일 부위에 관한 분기학적 분석(도 9)은 유전자가 기생 말벌로부터의 진정 세요아목 분기 이전의 공통 조상으로부터 진화하였다는 것을 제안한다. 실크 서열은 광범위하게 분기되었고, 본 발명자들은 오직 각 단백질중 꼬인 코일 부위를 포함하는 210개의 아미노산만을 정렬시킬 수 있었다. 본원에서 제공하는 각 실크 단백질의 꼬인 코일 부위 사이의 아미노산 서열 일치도를 표 13에 나타내고, 상응하는 부위의 DNA 일치도를 표 14에 나타낸다. 단백질은 유사한 아미노산 함량(특히, 고수준의 알라닌)과 3차 구조를 갖는 반면, 1차 아미노산 서열 일치도는 매우 낮다. 사실상, 말라다 실크 단백질을 코딩하는 유전자는 독립적으로 진화하였고, 실크 단백질 서열은 그 자체로서 벌목 서열로 정렬될 수 없다. 이는 아미노산 일치도에 있어 상당한 차이가 있을 수 있지만, 이것이 단백질의 생물학적 작용에는 영향을 미치지 않는다는 것을 시사한다.
분기학적 분석을 통해 진정 세요아목 말벌의 실크는 개미 및 벌의 실크와 관련된 단백질로 구성되어 있고, 비록 이들 단백질이 본원에 기술된 단백질과 유사한 조성과 구조를 갖더라도, 이는 고도로 분기된 1차 서열을 가질 수 있을 것으로 예 측된다.
본원에서 제공된 실크 단백질의 아미노산 서열(도 10)을 단백질 데이타베이스와 비교하였지만, 선행 기술에서는 어떤 단백질도 상당 수준의 서열 일치도로 동정되지 못했다(예컨대, 실크 단백질 서열 전반에 걸쳐 30% 초과로 일치하는 것은 없다).
표 13. 개미 및 벌에서 섬유 단백질의 꼬인 코일 부위의 단백질 서열 간의 일치도(%)
표 14. 개미 및 벌에서 섬유 단백질의 꼬인 코일 부위를 코딩하는 뉴클레오티드 서열 간의 일치도(%)
실크 단백질을 코딩하는 오픈 리딩 프레임(도 11에서 제공)을 상기 기술된 것과 유사하게 데이타베이스 서치를 실시하였다. 동정된 관련 분자만을 꿀벌 게놈 프로젝트의 일부로서 공개하였다(www.ncbi.nlm.nih.gov/genome/guide/bee). 오픈 리딩 프레임은 벌 게놈 프로젝트에 의해 예측되었지만, 코딩된 단백질의 작용은 제안되지 못했다. 추가로, mRNA의 오픈 리딩 프레임을 포함하는 폴리뉴클레오티드가 이들 분자중 임의의 어느 것에 대하여 생산되었다는 증거도 없다.
제노스피라1, 제노스피라2, 제노스피라3 및 제노스피라4를 코딩하는 유전자는 전체 단일 오픈 리딩 프레임에 적용되는 엑손을 포함하는 반면, 제노신을 코딩하는 유전자는 1종 이상의 인트론을 포함한다(도 12를 참조할 수 있다).
실시예 8 -
트랜스제닉
식물에서
실크
단백질의 발현
본 발명의 실크 단백질을 코딩하는 식물 발현 벡터는 카나마이신 내성 유전자(NptII)를 함유하는 2진 벡터 백본내 CaMV 35S 프로모터의 하류에 배치된 상기 단백질을 코딩하는 조합 핵산 분자(예컨대, 서열 번호 11 내지 21, 31 내지 39, 48 내지 55, 64 내지 71, 74 또는 75 중 어느 하나에 제시된 폴리뉴클레오티드)로 구성될 수 있다.
서열 번호 11, 13, 15, 17, 19, 31, 33, 35, 37, 48, 50, 52, 54, 64, 66, 68, 70 또는 74중 어느 하나를 포함하는 폴리뉴클레오티드의 경우, 작제물은 추가로 인-프레임 및 실크 단백질을 코딩하는 서열의 상류에 배치된, 예를 들면, 아라비도프시스 탈리아나 액포 염기성 키티나제 신호 펩티드와 같은 신호 펩티드 부위를 포함할 수 있다.
실크 단백질을 코딩하는 폴리펩티드를 수반하는 작제물은 아라비도프시스 탈리아나로 형질전환 전에 전기천공에 의해 애그로박테리움 투메파시엔스로 개별적으로 형질전환된다. 배축 형질전환 방법을 사용함으로써, 카나마이신 배지를 포함하는 선택 배지 상에서 생존할 수 있는 것에 대하여 선별될 수 있는 A. 탈리아나(A. thaliana)를 형질전환시킬 수 있다. 뿌리가 재생물에서 형성된 후, 이를 토양으로 옮겨 1차 트랜스제닉 식물을 확립시킨다.
PCR 선별을 통해 형질전환 과정을 확인할 수 있다. 폴리뉴클레오티드의 혼입과 발현은 트립신으로 분해된 발현 단백질의 PCR, 써던 블롯 분석 및/또는 LC/MS를 사용함으로써 측정될 수 있다.
2개 이상의 상이한 실크 단백질을 코딩하는 작제물이 동일 벡터내 제공될 수 있거나, 다수의 상이한 벡터는 상이한 단백질을 코딩하는 각각의 식물로 형질전환될 수 있다.
식물 발현에 관한 실험상의 일례로, AmelF4(제노스피라4)(서열 번호 76)의 코돈-최적환 버전을 pET14b(Novagen)로 클로닝하여 pET14b-6xHis:F4op를 생성하고, 단백질의 N-말단에 6 x 히스티딘을 갖는 인-프레임 번역 융합체를 형성한다. 단백질 "6 x 히스티딘:F4op"을 코딩하는 서열을 CaMV 35S 프로모터 및 ocs 폴리아데닐화 조절 기구의 조절하에서 pVEC8로 클로닝하여[Wang et al, 1992], pVEC8-35S-6xHis:F4op-ocs를 생성한다. pET14b-6xHis:F4op를 화학적으로-수행 능력을 지닌 E. 콜라이로 형질전환시키고, pVEC8-35S-6xHis:F4op를 애그로박테리움 매개 형질전환에 의해 타바코 잎 디스크로 형질전환시켰다. 항생제 내성 E. 콜라이(유도성 발현) 및 타바코 잎으로부터 단백질을 단리시키고, 검출용 테트라-히스티딘(Tetra-Histidine) 항체(독일 카를스룰에 소재하는 Qiagen)에 대하여 웨스턴 블롯 분석을 실시하였다. 빈 벡터 pET14b 및 pVEC8-35S-ocs는 각 숙주 배경에 대한 음성 조절로 사용하였다. 도 13에 나타내는 바와 같이, 본 실험을 통해 제노스피라4(AmelF4) 단백질을 생산하는 식물을 수득하였다.
실시예 9 -
실크
단백질의 발효 및 정제
꿀벌 유전자 AmelF1-F4(각각 제노스피라1 내지 4) 및 풀잠자리 MalF1 유전자의 실크 코딩 부위를 PCR에 의해 증폭시킨 후 발현 작제물을 작제하고, pET14b 발현 벡터(위스콘신주 매디슨에 소재하는 Novagen)로 클로닝하였다. 이어서 생성된 발현 플라스미드를 E. 콜라이 BL21(DE3) 로제타 세포내로 전기천공시키고, 앰피실린을 함유하는 LB 아가상에서 밤새도록 배양하였다. 이어서, 단일 콜로니를 사용하여 앰피실린을 함유하는 LB 브로쓰에 접종한 후, 37℃에서 밤새도록 배양하였다. 원심분리하여 세포를 수거하고, 세제로 용해시킨다(Bugbuster, Novagen). 봉입체를 철저히 세척하고 6M 구아니디늄에 재용해시켰다.
본 방법을 통해 순도 95% 초과의 꿀벌 단백질과 순도 50% 초과의 풀잠자리 MalF1 단백질을 포함하는 단백질 혼합물을 수득하였다. E. 콜라이 세포의 습식 중량중 50% 이하의 수율이 규칙적으로 수득되었고, 이는 단백질이 이러한 방식으로 쉽게 발현될 수 있다는 것을 시사한다.
가용화된 꿀벌 재조합 단백질을 제조사의 설명에 따라 제고된 탈론(Talon) 수지 칼럼에 적용시켰다. 이어서, 10OmM Tris.HCL, 15OmM 이미다졸 pH 8중 칼럼에 대하여 용출시켰다.
실시예 10 -
실크
단백질의 실로의 공정 과정
하기 절차를 사용하는 다양한 방법들(도 14를 참조할 수 있다)를 사용하여 쉽게 꿀벌 및 풀잠자리 실크 단백질을 실로 제조할 수 있다.
말기의 최종 영 아피스 멜리페라의 침샘의 앞쪽 세그먼트를 인산염 완충처리된 염수하에서 절개하고, 완충액 소적내 평평한 표면으로 옮겼다. 핀셋으로 세그먼트 양 끝단을 잡았다. 일정한 속도로 한쪽 끝단을 소적의 바깥쪽으로 끌어 올려 다른 한쪽으로부터 멀리 떨어지도록 하였다. 이를 통해 대기중에서 신속하게 고형화되는 세사를 인발시킬 수 있었다.
꿀벌 및 풀잠자리 유충 재조합 실크 단백질은 예컨대, 가용성 단백질을 부탄올 용액에 적하하거나, 탈론(Talon) 수지 칼럼 상에서 단백질을 농축시키는 것과 같은 탈수 또는 농축 후에 실 또는 구조물을 형성하였다.
또한, 꿀벌 또는 풀잠자리 재조합 실크 단백질을 유기 용매(예를 들면, 헥 산)과 혼합하여 적당한 구조의 경계면으로 농축시킨 후, 시약(예를 들면, 부탄올)을 가하여 상기 경계면으로부터 뽑아낸 후에 실을 수득하였다. 이러한 방법에 의해 형성된 실은 천연 실크와 유사한 FT-IR 스펙트럼을 가졌고, 이는 실이 동일한 꼬인 코일 구조로 구성되어 있음을 시사하는 것이다.
본원에 기술된 다른 종으로부터 유래된 실크 단백질 또한 이러한 방법에 의해 공정처리할 수 있다.
광범위하게 기술되고 있는 바와 같이, 본 발명의 정신 또는 범주로부터 벗어나지 않으면서 특정 실시태양으로 나타낸 것과 같이 본 발명에 대하여 다수의 변형 및/또는 수정이 이루어질 수 있다는 것을 당업자는 이해할 것이다. 그러므로, 본 실시태양은 모든 점에서 제한적인 것이 아니라 예시적인 것으로 간주되어야 한다.
상기에서 논의된 모든 간행물은 그의 전문이 본원에서 인용된다. 본 명세서에 포함되어 있는 문서, 시험, 물질, 장치, 물품 등에 관한 논의는 단지 본 발명에 관한 내용을 설명하기 위해 포함된 것이다. 이들 사항 중 어느 것도 또는 이들 모두는 본 출원의 각 우선권 주장일 이전에 존재하고 있었던 바, 이것이 선행 기술의 기초중 일부를 형성한다거나, 본 발명의 관련 기술 분야에서 일반 상식인 것으로서 용인되지는 않아야 한다.
참조 문헌
SEQUENCE LISTING
<110> Commonwealth Scientific and Industrial Research
Organization
<120> Silk proteins
<130> 504791
<150> US 60/723,766
<151> 2005-10-05
<160> 77
<170> PatentIn version 3.3
<210> 1
<211> 314
<212> PRT
<213> Apis mellifera
<400> 1
Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val Lys Gly Ser
1 5 10 15
Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg
20 25 30
Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val Leu Gln Ala
35 40 45
Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala Ala Asp Leu
50 55 60
Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser Gln Ala Ala
65 70 75 80
Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln Ala Arg Ala
85 90 95
Gly Leu Glu Ser Val Ser Met Ala Ala Ser Ala Thr Ser Ala Ala Lys
100 105 110
Glu Ala Ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu Ser Thr Ala
115 120 125
Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala Glu Ala Val
130 135 140
Ala Ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala Asn Leu Ala
145 150 155 160
Ala Glu Ala Ser Val Ala Ala Glu Ala Ala Leu Lys Ala Glu Lys Val
165 170 175
Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala Ala Ala Arg
180 185 190
Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala Thr Ala Ser
195 200 205
Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val Ala Val Leu
210 215 220
Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala Ala Ser Ser
225 230 235 240
Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn Val Glu Thr
245 250 255
Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys Gln Val Val Ser Ile
260 265 270
Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser Thr Ser Trp
275 280 285
Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His Ile Asn Leu
290 295 300
Asn Asp Phe Asp Leu Lys Ser Asn Val Phe
305 310
<210> 2
<211> 333
<212> PRT
<213> Apis mellifera
<400> 2
Met Lys Ile Pro Val Leu Leu Ala Thr Cys Leu Tyr Leu Cys Gly Phe
1 5 10 15
Ala Ser Ala Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val
20 25 30
Lys Gly Ser Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser
35 40 45
Gly Leu Arg Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val
50 55 60
Leu Gln Ala Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala
65 70 75 80
Ala Asp Leu Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser
85 90 95
Gln Ala Ala Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln
100 105 110
Ala Arg Ala Gly Leu Glu Ser Val Ser Met Ala Ala Ser Ala Thr Ser
115 120 125
Ala Ala Lys Glu Ala Ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu
130 135 140
Ser Thr Ala Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala
145 150 155 160
Glu Ala Val Ala Ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala
165 170 175
Asn Leu Ala Ala Glu Ala Ser Val Ala Ala Glu Ala Ala Leu Lys Ala
180 185 190
Glu Lys Val Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala
195 200 205
Ala Ala Arg Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala
210 215 220
Thr Ala Ser Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val
225 230 235 240
Ala Val Leu Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala
245 250 255
Ala Ser Ser Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn
260 265 270
Val Glu Thr Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys Gln Val
275 280 285
Val Ser Ile Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser
290 295 300
Thr Ser Trp Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His
305 310 315 320
Ile Asn Leu Asn Asp Phe Asp Leu Lys Ser Asn Val Phe
325 330
<210> 3
<211> 290
<212> PRT
<213> Apis mellifera
<400> 3
Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp Ile Gln Gly
1 5 10 15
Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala Leu Gly Ser
20 25 30
Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu Asn Val Gly
35 40 45
Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser Val Ala Ala
50 55 60
Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly Ala Asn Ala
65 70 75 80
Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser
85 90 95
Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala Ala Glu Ala
100 105 110
Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala Ala Ala Lys
115 120 125
Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala Thr Glu Ala
130 135 140
Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg Ala Ala Ile
145 150 155 160
Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala Ala Ile Ala
165 170 175
Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile Ala Ala Ala
180 185 190
Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val Val Ala Leu
195 200 205
Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala Gln Ala Asn
210 215 220
Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp Ser Gln Ala Ala
225 230 235 240
Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr
245 250 255
Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn Lys Ala Ala
260 265 270
Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His Val Ala Lys
275 280 285
Leu Glu
290
<210> 4
<211> 309
<212> PRT
<213> Apis mellifera
<400> 4
Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Val Trp Gly Leu
1 5 10 15
Ala Glu Gly Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp
20 25 30
Ile Gln Gly Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala
35 40 45
Leu Gly Ser Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu
50 55 60
Asn Val Gly Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser
65 70 75 80
Val Ala Ala Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly
85 90 95
Ala Asn Ala Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile
100 105 110
Lys Ala Ser Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala
115 120 125
Ala Glu Ala Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala
130 135 140
Ala Ala Lys Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala
145 150 155 160
Thr Glu Ala Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg
165 170 175
Ala Ala Ile Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala
180 185 190
Ala Ile Ala Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile
195 200 205
Ala Ala Ala Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val
210 215 220
Val Ala Leu Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala
225 230 235 240
Gln Ala Asn Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp Ser
245 250 255
Gln Ala Ala Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu
260 265 270
Leu Val Thr Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn
275 280 285
Lys Ala Ala Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His
290 295 300
Val Ala Lys Leu Glu
305
<210> 5
<211> 316
<212> PRT
<213> Apis mellifera
<400> 5
Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val Ile Ser Lys
1 5 10 15
Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser Ala Lys Arg
20 25 30
Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu Gln Ser Leu
35 40 45
Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala Ala Ala Val
50 55 60
Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu Arg Ala Ser
65 70 75 80
Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Leu Lys Asn
85 90 95
Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu Ala Ala Leu
100 105 110
Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala Asn Ala Ala
115 120 125
Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg
130 135 140
Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln Lys Arg Thr
145 150 155 160
Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg Gln Leu Gln
165 170 175
Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu Glu Val Ser
180 185 190
Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser Ser Glu Ala
195 200 205
Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser Asp Ala Asp
210 215 220
Gly Ala Glu Arg Ser Ala Ser Thr Glu Ala Gln Ser Ala Ala Lys Ile
225 230 235 240
Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala Ser Glu Asp
245 250 255
Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg Ala Asn Val
260 265 270
Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly Glu Glu Ala
275 280 285
Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu Ala Glu Val
290 295 300
Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe
305 310 315
<210> 6
<211> 335
<212> PRT
<213> Apis mellifera
<400> 6
Met Gln Ile Pro Thr Phe Val Ala Ile Cys Leu Leu Thr Ser Gly Leu
1 5 10 15
Val His Ala Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val
20 25 30
Ile Ser Lys Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser
35 40 45
Ala Lys Arg Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu
50 55 60
Gln Ser Leu Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala
65 70 75 80
Ala Ala Val Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu
85 90 95
Arg Ala Ser Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala
100 105 110
Leu Lys Asn Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu
115 120 125
Ala Ala Leu Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala
130 135 140
Asn Ala Ala Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala
145 150 155 160
Ser Ser Arg Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln
165 170 175
Lys Arg Thr Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg
180 185 190
Gln Leu Gln Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu
195 200 205
Glu Val Ser Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser
210 215 220
Ser Glu Ala Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser
225 230 235 240
Asp Ala Asp Gly Ala Glu Arg Ser Ala Ser Thr Glu Ala Gln Ser Ala
245 250 255
Ala Lys Ile Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala
260 265 270
Ser Glu Asp Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg
275 280 285
Ala Asn Val Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly
290 295 300
Glu Glu Ala Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu
305 310 315 320
Ala Glu Val Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe
325 330 335
<210> 7
<211> 323
<212> PRT
<213> Apis mellifera
<400> 7
Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr Ser Thr Val
1 5 10 15
Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys Asp Glu Leu
20 25 30
Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly Thr Gly Ala
35 40 45
Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile Ser Leu Gly
50 55 60
Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala Ser Gln Ser
65 70 75 80
Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu Thr Asn Lys
85 90 95
Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala Arg Ala Thr
100 105 110
Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr Glu Glu Ala
115 120 125
Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala Ala Ala Glu
130 135 140
Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser Ala Arg Ala
145 150 155 160
Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala Glu Ser Ala
165 170 175
Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala Ala
180 185 190
Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala Asp
195 200 205
Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala Asp
210 215 220
Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala Glu
225 230 235 240
Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val Leu Gln Ala
245 250 255
Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala Ala
260 265 270
Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu Met
275 280 285
Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys Lys Glu Glu
290 295 300
Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu Trp
305 310 315 320
Glu Val Lys
<210> 8
<211> 342
<212> PRT
<213> Apis mellifera
<400> 8
Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Ile Trp Gly Leu
1 5 10 15
Ala Ser Gly Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr
20 25 30
Ser Thr Val Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys
35 40 45
Asp Glu Leu Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly
50 55 60
Thr Gly Ala Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile
65 70 75 80
Ser Leu Gly Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala
85 90 95
Ser Gln Ser Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu
100 105 110
Thr Asn Lys Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala
115 120 125
Arg Ala Thr Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr
130 135 140
Glu Glu Ala Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala
145 150 155 160
Ala Ala Glu Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser
165 170 175
Ala Arg Ala Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala
180 185 190
Glu Ser Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala
195 200 205
Lys Ala Ala Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala
210 215 220
Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala
225 230 235 240
Val Ala Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala
245 250 255
Lys Ala Glu Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val
260 265 270
Leu Gln Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala
275 280 285
Ala Ala Ala Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala
290 295 300
Gly Glu Met Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys
305 310 315 320
Lys Glu Glu Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn
325 330 335
Glu Glu Trp Glu Val Lys
340
<210> 9
<211> 353
<212> PRT
<213> Apis mellifera
<400> 9
Gly Val Asn Thr Glu Leu Lys Lys Asp Gly Glu Leu Lys Glu Glu Ser
1 5 10 15
Tyr Glu Lys Ser Glu Ser Lys Ser Leu Lys Glu Ile Lys Glu Glu Arg
20 25 30
Ala Ser Lys Ser Lys Ser Glu Arg Leu Lys Ile Arg Glu Glu Lys Arg
35 40 45
Glu Glu Glu Glu Lys Ser Lys Ser Leu Asn Leu Val Val Val Arg Glu
50 55 60
Lys Ile Thr Lys Leu Ser Ser Trp Leu Lys Glu Glu Lys Asp Ile Ser
65 70 75 80
Pro Leu Leu Glu Glu Lys Asn Gly Lys Gly Leu Leu Gly Leu Glu Asp
85 90 95
Val Thr Asp Glu Leu Asn Ile Ala Leu Lys Ser Leu Lys Glu Gly Lys
100 105 110
Lys Phe Asp Thr Trp Lys Phe Glu Lys Gly Ser Glu Asp Val Arg Ser
115 120 125
Leu Glu Glu Leu Asp Thr Ser Val Val Glu Leu Leu Lys Leu Ile Lys
130 135 140
Glu Gly Lys Thr Asp His Gly Ala Ile Asp Leu Glu Lys Asn Gly Lys
145 150 155 160
Val Leu Val Asp Leu Glu Lys Ile Ser Glu Asn Ile Leu Glu Thr Cys
165 170 175
Gly Ser Gln Lys Lys Thr Val Glu Val Val Asp Asp Lys Asp Lys Lys
180 185 190
Trp Asn Lys Glu Ser Gly Trp Lys Lys Asn Leu Asn Asp Leu Asp Trp
195 200 205
Lys Lys Asp Leu Asp Lys Asp Lys Val Gly Gly Gly Leu Leu Gly Gly
210 215 220
Leu Ser Gly Leu Leu Asn Ser Leu Lys Ser Glu Lys Gly Leu Leu Gly
225 230 235 240
Leu Leu Asn Lys Asn Gln Ile Glu Leu Leu Ile Pro Leu Ile Ser Glu
245 250 255
Ile Lys Lys Lys Asn Ile Asp Phe Asn Leu Phe Asp Ser Val Asp Ser
260 265 270
Val Glu Arg Asn Leu Asp Leu Lys Leu Phe Thr Ser Ser Val Ser Lys
275 280 285
Val Thr Glu Leu Leu Asn Lys Gly Ile Asp Ile Gln Thr Ile Leu Asn
290 295 300
Ala Lys Asn Gly Asp Glu Phe Asp Leu Ser Gly Lys Glu Leu Lys Asn
305 310 315 320
Val Lys Gly Ile Phe Gly Leu Ile Gly Ser Leu Lys Arg Ser Leu Gly
325 330 335
Leu Glu Asn Ile Leu Asn Leu Pro Phe Lys Arg Ile Pro Leu Leu Lys
340 345 350
Leu
<210> 10
<211> 372
<212> PRT
<213> Apis mellifera
<400> 10
Met Lys Tyr Met Leu Leu Leu Leu Ser Ile Phe Ile Cys Ala His Ile
1 5 10 15
Val Cys Ala Gly Val Asn Thr Glu Leu Lys Lys Asp Gly Glu Leu Lys
20 25 30
Glu Glu Ser Tyr Glu Lys Ser Glu Ser Lys Ser Leu Lys Glu Ile Lys
35 40 45
Glu Glu Arg Ala Ser Lys Ser Lys Ser Glu Arg Leu Lys Ile Arg Glu
50 55 60
Glu Lys Arg Glu Glu Glu Glu Lys Ser Lys Ser Leu Asn Leu Val Val
65 70 75 80
Val Arg Glu Lys Ile Thr Lys Leu Ser Ser Trp Leu Lys Glu Glu Lys
85 90 95
Asp Ile Ser Pro Leu Leu Glu Glu Lys Asn Gly Lys Gly Leu Leu Gly
100 105 110
Leu Glu Asp Val Thr Asp Glu Leu Asn Ile Ala Leu Lys Ser Leu Lys
115 120 125
Glu Gly Lys Lys Phe Asp Thr Trp Lys Phe Glu Lys Gly Ser Glu Asp
130 135 140
Val Arg Ser Leu Glu Glu Leu Asp Thr Ser Val Val Glu Leu Leu Lys
145 150 155 160
Leu Ile Lys Glu Gly Lys Thr Asp His Gly Ala Ile Asp Leu Glu Lys
165 170 175
Asn Gly Lys Val Leu Val Asp Leu Glu Lys Ile Ser Glu Asn Ile Leu
180 185 190
Glu Thr Cys Gly Ser Gln Lys Lys Thr Val Glu Val Val Asp Asp Lys
195 200 205
Asp Lys Lys Trp Asn Lys Glu Ser Gly Trp Lys Lys Asn Leu Asn Asp
210 215 220
Leu Asp Trp Lys Lys Asp Leu Asp Lys Asp Lys Val Gly Gly Gly Leu
225 230 235 240
Leu Gly Gly Leu Ser Gly Leu Leu Asn Ser Leu Lys Ser Glu Lys Gly
245 250 255
Leu Leu Gly Leu Leu Asn Lys Asn Gln Ile Glu Leu Leu Ile Pro Leu
260 265 270
Ile Ser Glu Ile Lys Lys Lys Asn Ile Asp Phe Asn Leu Phe Asp Ser
275 280 285
Val Asp Ser Val Glu Arg Asn Leu Asp Leu Lys Leu Phe Thr Ser Ser
290 295 300
Val Ser Lys Val Thr Glu Leu Leu Asn Lys Gly Ile Asp Ile Gln Thr
305 310 315 320
Ile Leu Asn Ala Lys Asn Gly Asp Glu Phe Asp Leu Ser Gly Lys Glu
325 330 335
Leu Lys Asn Val Lys Gly Ile Phe Gly Leu Ile Gly Ser Leu Lys Arg
340 345 350
Ser Leu Gly Leu Glu Asn Ile Leu Asn Leu Pro Phe Lys Arg Ile Pro
355 360 365
Leu Leu Lys Leu
370
<210> 11
<211> 942
<212> DNA
<213> Apis mellifera
<400> 11
ggtttggagg ggccgggcaa ctcgttgccc gagctcgtga aaggtagcgc atcggccacc 60
gcgtcgaccg ctgtgaccgc tagatcagga cttagagccg gacaagtagc tttagcttcg 120
cagaaggatg ccgtactcca agctcaagct gctgcatccg ccgcgtcaga ggcgcgcgct 180
gctgccgatc tgacggctaa acttagccaa gaatcggcat cagtgcaatc gcaggctgcc 240
gccaaaggga aggaaacgga ggaggcagct gttggtcaag ctagggctgg cctcgagtcg 300
gtgtccatgg ccgcatcagc cacatctgct gccaaagaag catcgaccgc cgccaaagcc 360
gcagcatccg cactatccac agccgtggtg caagcgaaaa tagctgagag ggcagccaaa 420
gctgaagctg ttgcctcgga cgaagccaag gccaaggcga ttgcagcagc caacttggcg 480
gctgaggcca gtgtagccgc agaagcagct ctcaaggccg agaaagtggc cgaagaagcc 540
atcgcaagag cggcctctgc aaaggctgcc gcaagagctg ctgctgccgc tctagcctcc 600
tcgaaggaag cagccacggc cagcgcaaga aacgccgcgg aatccgaggc caggaacgaa 660
gtagctgtat tgatcgccga gattgataaa aagagtaggg aaatcgacgc agccagttcg 720
cttaatgcgc gtgccgctgc caaggcaagc tccaggaacg tagaaacggc gacaatcggg 780
gccaacatca actcttcgaa acaagtcgtg tcaattccag tggaaataaa gaaattctcg 840
gagccggaag tgtcaacatc atggagagaa gatgaagagg ttacgaaaga gaagaaggag 900
cacataaatc tgaacgactt cgacttgaag agcaacgtat tt 942
<210> 12
<211> 999
<212> DNA
<213> Apis mellifera
<400> 12
atgaagattc cagtattgct tgcaacgtgc ctctaccttt gcggatttgc gtccgccggt 60
ttggaggggc cgggcaactc gttgcccgag ctcgtgaaag gtagcgcatc ggccaccgcg 120
tcgaccgctg tgaccgctag atcaggactt agagccggac aagtagcttt agcttcgcag 180
aaggatgccg tactccaagc tcaagctgct gcatccgccg cgtcagaggc gcgcgctgct 240
gccgatctga cggctaaact tagccaagaa tcggcatcag tgcaatcgca ggctgccgcc 300
aaagggaagg aaacggagga ggcagctgtt ggtcaagcta gggctggcct cgagtcggtg 360
tccatggccg catcagccac atctgctgcc aaagaagcat cgaccgccgc caaagccgca 420
gcatccgcac tatccacagc cgtggtgcaa gcgaaaatag ctgagagggc agccaaagct 480
gaagctgttg cctcggacga agccaaggcc aaggcgattg cagcagccaa cttggcggct 540
gaggccagtg tagccgcaga agcagctctc aaggccgaga aagtggccga agaagccatc 600
gcaagagcgg cctctgcaaa ggctgccgca agagctgctg ctgccgctct agcctcctcg 660
aaggaagcag ccacggccag cgcaagaaac gccgcggaat ccgaggccag gaacgaagta 720
gctgtattga tcgccgagat tgataaaaag agtagggaaa tcgacgcagc cagttcgctt 780
aatgcgcgtg ccgctgccaa ggcaagctcc aggaacgtag aaacggcgac aatcggggcc 840
aacatcaact cttcgaaaca agtcgtgtca attccagtgg aaataaagaa attctcggag 900
ccggaagtgt caacatcatg gagagaagat gaagaggtta cgaaagagaa gaaggagcac 960
ataaatctga acgacttcga cttgaagagc aacgtattt 999
<210> 13
<211> 870
<212> DNA
<213> Apis mellifera
<400> 13
cgcgtgatta atcacgagtc cctgaagacg agcgaggata ttcaaggagg atattcagca 60
ggaatagtcg gtgatggatc tgacgcgctt ggctcctcca tagaaaacgc ccaaaaagtc 120
gctcgagcgg ctgaaaacgt gggcttgaat ctggaattgg gcgcaggcgc gcgtgctgcc 180
agtgttgccg ctgctgccca ggccaaaaac acagaggctg cggaagcagg agcaaacgcc 240
gctctggccg ccgccattgc caaacgggag gaagcgatta aagccagcga gatagcaaac 300
caattgttga ccaatgcagc aaaagcggca gaagcgactg tatcggcaac gaagagggca 360
gcacaattga cggctgcagc gaaagaagca accagagctt ctgcagccgc tgctgaagct 420
gctacggagg cccaggtaaa ggctaacgcc gattcaatca tcacgaagag ggctgcgatt 480
gccgaggctc aagctgcggc ggaagctcaa gttaaggcgg caatcgccag aaaatcggca 540
gcgaattttt tggctaaggc tcaaatagcg gctgccgcgg aatccgaggc cacgaaactc 600
gcggccgaag ctgtagtggc actaacaaac gccgaagtcg ccgtgaacca ggctagaaac 660
gcacaggcaa acgcctcgac tcaagcttcc atggctgtta gggtagattc tcaagcagcg 720
aacgctgaag cagccgctgt agcgcaagcc gaaactctct tggttacggc agaagctgtc 780
gcagctgcgg aggctgaggt tgcgaacaaa gccgccacat ttgcaaaaca gatcgtcaac 840
gagaagaaaa tacatgtagc aaagttggaa 870
<210> 14
<211> 927
<212> DNA
<213> Apis mellifera
<400> 14
atgaagattc cagcaatatt cgtcacgtct ctgctggtct ggggattggc cgagggccgc 60
gtgattaatc acgagtccct gaagacgagc gaggatattc aaggaggata ttcagcagga 120
atagtcggtg atggatctga cgcgcttggc tcctccatag aaaacgccca aaaagtcgct 180
cgagcggctg aaaacgtggg cttgaatctg gaattgggcg caggcgcgcg tgctgccagt 240
gttgccgctg ctgcccaggc caaaaacaca gaggctgcgg aagcaggagc aaacgccgct 300
ctggccgccg ccattgccaa acgggaggaa gcgattaaag ccagcgagat agcaaaccaa 360
ttgttgacca atgcagcaaa agcggcagaa gcgactgtat cggcaacgaa gagggcagca 420
caattgacgg ctgcagcgaa agaagcaacc agagcttctg cagccgctgc tgaagctgct 480
acggaggccc aggtaaaggc taacgccgat tcaatcatca cgaagagggc tgcgattgcc 540
gaggctcaag ctgcggcgga agctcaagtt aaggcggcaa tcgccagaaa atcggcagcg 600
aattttttgg ctaaggctca aatagcggct gccgcggaat ccgaggccac gaaactcgcg 660
gccgaagctg tagtggcact aacaaacgcc gaagtcgccg tgaaccaggc tagaaacgca 720
caggcaaacg cctcgactca agcttccatg gctgttaggg tagattctca agcagcgaac 780
gctgaagcag ccgctgtagc gcaagccgaa actctcttgg ttacggcaga agctgtcgca 840
gctgcggagg ctgaggttgc gaacaaagcc gccacatttg caaaacagat cgtcaacgag 900
aagaaaatac atgtagcaaa gttggaa 927
<210> 15
<211> 949
<212> DNA
<213> Apis mellifera
<400> 15
ggcgtcgagg aattcaagtc ctcggcaacc gaggaggtga tcagcaaaaa cttagaagtc 60
gacctgttga aaaatgtgga cactagcgcg aaacgaagag agaacggcgc cccggtgctc 120
ggcaagaaca cacttcaatc cctggagaag atcaagacgt cggcgagcgt gaatgccaaa 180
gcagcagccg tggtgaaagc gtccgctctg gctcttgcag aggcctattt gcgagcgtcc 240
gcattgtcag ccgccgcttc agccaaggca gccgccgccc tgaaaaatgc tcaacaagcg 300
caattaaacg cccaggaaaa gtctttggcc gcgttgaaag ctcagtccga ggaagaggca 360
gcttctgctc gtgcaaacgc agcaaccgcc gcgacacagt cggcactgga acgcgctcaa 420
gcctcctcca ggttagcaac ggtcgcccaa aacgtagcca gcgacttgca gaaacggacc 480
agcaccaagg ccgcggctga agccgctgcc accctcagac aattacagga cgcggaacga 540
acgaaatgga gtgccaacgc tgccttagaa gtctccgccg ctgcagctgc cgcagaaacc 600
aagaccactg cctcctcgga ggccgccaac gccgccgcca aaaaggcggc cgcgatagct 660
tctgacgcgg acggcgcgga aaggtcggca tctaccgagg cacaatcagc tgcgaagatc 720
gagagtgtgg cagccgccga gggatccgcc aactcggcct ctgaggattc ccgggccgct 780
caattggaag cctccaccgc ggcgagagcc aacgtggccg cagctgtcgg ggatggagcg 840
attataggac ttggagagga agcgggtgcc gcggctcagt tgcttgcaca ggcgaaggca 900
ttggccgaag ttagctcgaa atccgaaaat attgaggata aaaaatttt 949
<210> 16
<211> 1006
<212> DNA
<213> Apis mellifera
<400> 16
atgcagatcc caacgtttgt cgccatatgc ttgctcacat cgggcttggt gcacgcaggc 60
gtcgaggaat tcaagtcctc ggcaaccgag gaggtgatca gcaaaaactt agaagtcgac 120
ctgttgaaaa atgtggacac tagcgcgaaa cgaagagaga acggcgcccc ggtgctcggc 180
aagaacacac ttcaatccct ggagaagatc aagacgtcgg cgagcgtgaa tgccaaagca 240
gcagccgtgg tgaaagcgtc cgctctggct cttgcagagg cctatttgcg agcgtccgca 300
ttgtcagccg ccgcttcagc caaggcagcc gccgccctga aaaatgctca acaagcgcaa 360
ttaaacgccc aggaaaagtc tttggccgcg ttgaaagctc agtccgagga agaggcagct 420
tctgctcgtg caaacgcagc aaccgccgcg acacagtcgg cactggaacg cgctcaagcc 480
tcctccaggt tagcaacggt cgcccaaaac gtagccagcg acttgcagaa acggaccagc 540
accaaggccg cggctgaagc cgctgccacc ctcagacaat tacaggacgc ggaacgaacg 600
aaatggagtg ccaacgctgc cttagaagtc tccgccgctg cagctgccgc agaaaccaag 660
accactgcct cctcggaggc cgccaacgcc gccgccaaaa aggcggccgc gatagcttct 720
gacgcggacg gcgcggaaag gtcggcatct accgaggcac aatcagctgc gaagatcgag 780
agtgtggcag ccgccgaggg atccgccaac tcggcctctg aggattcccg ggccgctcaa 840
ttggaagcct ccaccgcggc gagagccaac gtggccgcag ctgtcgggga tggagcgatt 900
ataggacttg gagaggaagc gggtgccgcg gctcagttgc ttgcacaggc gaaggcattg 960
gccgaagtta gctcgaaatc cgaaaatatt gaggataaaa aatttt 1006
<210> 17
<211> 969
<212> DNA
<213> Apis mellifera
<400> 17
gcaagggaag aggtggagac acgggacaag accaagacct cgacagtggt gaaaagcgag 60
aaagtggaag tcgttgctcc cgctaaggat gaacttaaat taacgagcga gcctatcttt 120
ggaagaagag tgggaactgg agcatccgag gtggcatcta gcagcggtga agccatcgcg 180
ataagtcttg gagcagggca gtcagcggca gagtctcagg ccttggccgc ctcgcaatcc 240
aaaacggcag cgaacgccgc cataggcgcg agcgagctta ccaacaaagt tgctgctcta 300
gttgctggcg cgactggtgc gcaggcgaga gctacggccg cctcctcgag cgcgttgaag 360
gccagcttgg cgaccgaaga agcggcggaa gaggccgagg cggccgtggc tgacgccaag 420
gctgccgcgg aaaaggccga atccctggcg aaaaatctcg cgtcggcgag cgctcgcgcg 480
gccctctcct ccgaaagggc gaacgaattg gctcaagctg agagcgctgc agcggccgag 540
gcgcaggcca agacagcagc cgccgccaaa gcagcggaaa tcgcccttaa ggtcgctgag 600
atagcggtga aggcggaagc ggacgcagca gctgccgccg tggcagctgc aaaggcaaga 660
gccgtggcag acgcggccgc tgcccgtgcc gcagccgtga acgccatcgc caaggcggaa 720
gaggaggcct cggcccaagc agagaacgcc gccggtgttt tgcaagcagc cgcctccgcc 780
gcggcggaat cgcgagccgc tgcagctgcc gccgctgcta cctcggaggc agcggctgaa 840
gctggcccgt tggcaggtga gatgaaacca ccgcactgga aatgggaacg gattcctgtg 900
aagaaggagg agtggaaaac gtcaacgaag gaagaatgga aaacgacgaa tgaagaatgg 960
gaggtgaag 969
<210> 18
<211> 1026
<212> DNA
<213> Apis mellifera
<400> 18
atgaagatcc catccatact cgcggtttcc ctgctgatct ggggtttggc aagcggcgca 60
agggaagagg tggagacacg ggacaagacc aagacctcga cagtggtgaa aagcgagaaa 120
gtggaagtcg ttgctcccgc taaggatgaa cttaaattaa cgagcgagcc tatctttgga 180
agaagagtgg gaactggagc atccgaggtg gcatctagca gcggtgaagc catcgcgata 240
agtcttggag cagggcagtc agcggcagag tctcaggcct tggccgcctc gcaatccaaa 300
acggcagcga acgccgccat aggcgcgagc gagcttacca acaaagttgc tgctctagtt 360
gctggcgcga ctggtgcgca ggcgagagct acggccgcct cctcgagcgc gttgaaggcc 420
agcttggcga ccgaagaagc ggcggaagag gccgaggcgg ccgtggctga cgccaaggct 480
gccgcggaaa aggccgaatc cctggcgaaa aatctcgcgt cggcgagcgc tcgcgcggcc 540
ctctcctccg aaagggcgaa cgaattggct caagctgaga gcgctgcagc ggccgaggcg 600
caggccaaga cagcagccgc cgccaaagca gcggaaatcg cccttaaggt cgctgagata 660
gcggtgaagg cggaagcgga cgcagcagct gccgccgtgg cagctgcaaa ggcaagagcc 720
gtggcagacg cggccgctgc ccgtgccgca gccgtgaacg ccatcgccaa ggcggaagag 780
gaggcctcgg cccaagcaga gaacgccgcc ggtgttttgc aagcagccgc ctccgccgcg 840
gcggaatcgc gagccgctgc agctgccgcc gctgctacct cggaggcagc ggctgaagct 900
ggcccgttgg caggtgagat gaaaccaccg cactggaaat gggaacggat tcctgtgaag 960
aaggaggagt ggaaaacgtc aacgaaggaa gaatggaaaa cgacgaatga agaatgggag 1020
gtgaag 1026
<210> 19
<211> 1059
<212> DNA
<213> Apis mellifera
<400> 19
ggcgtaaata cagaattaaa aaaagatggt gaactaaagg aagagtctta tgagaaaagc 60
gagtcaaaga gtttaaaaga aattaaagaa gaacgtgctt caaaatcaaa aagtgaacgt 120
ttgaagattc gtgaagaaaa acgcgaagag gaagaaaaat ccaagagtct gaatctggtc 180
gtggtcagag aaaagattac caaactttct tcatggctca aagaagagaa agatatcagt 240
cctcttttgg aagaaaaaaa tggcaaaggt ctattgggtt tggaagatgt cacggacgag 300
ttaaatatcg ctcttaaatc gttgaaggag ggcaaaaagt ttgatacttg gaaattcgag 360
aaaggtagcg aagacgttcg ttctttggaa gaacttgata cgagcgtcgt tgaactttta 420
aaattaataa aggaaggaaa aactgaccat ggtgctatag atttggagaa gaatggtaag 480
gtacttgtag atttggaaaa aatctcagaa aacatacttg aaacttgtgg atcacaaaag 540
aagactgtgg aagttgtaga tgataaagac aaaaaatgga ataaagaatc aggttggaaa 600
aaaaatctaa atgatctaga ttggaaaaaa gatttagata aagataaagt tggtggcggt 660
ttgcttggcg gtttaagtgg cctcttaaat agtttaaaat cagaaaaagg tcttctaggt 720
cttttgaata agaatcaaat tgagttatta attcctttaa tcagtgagat aaaaaagaaa 780
aatatagatt ttaatctctt cgattctgtt gattctgtcg aaagaaattt agacttgaaa 840
cttttcacaa gttctgtttc aaaagttact gaattattaa ataaaggaat cgatattcaa 900
acaattttga atgcgaaaaa tggagatgaa ttcgatttaa gcggcaaaga attgaaaaac 960
gtcaaaggga tatttggttt gattggaagt ttgaaacgct cattaggatt agaaaatata 1020
ttgaacttac cgtttaaacg tatacctctg cttaaatta 1059
<210> 20
<211> 1116
<212> DNA
<213> Apis mellifera
<400> 20
atgaaataca tgctcttgtt gctatctata ttcatctgtg cacatattgt atgcgcaggc 60
gtaaatacag aattaaaaaa agatggtgaa ctaaaggaag agtcttatga gaaaagcgag 120
tcaaagagtt taaaagaaat taaagaagaa cgtgcttcaa aatcaaaaag tgaacgtttg 180
aagattcgtg aagaaaaacg cgaagaggaa gaaaaatcca agagtctgaa tctggtcgtg 240
gtcagagaaa agattaccaa actttcttca tggctcaaag aagagaaaga tatcagtcct 300
cttttggaag aaaaaaatgg caaaggtcta ttgggtttgg aagatgtcac ggacgagtta 360
aatatcgctc ttaaatcgtt gaaggagggc aaaaagtttg atacttggaa attcgagaaa 420
ggtagcgaag acgttcgttc tttggaagaa cttgatacga gcgtcgttga acttttaaaa 480
ttaataaagg aaggaaaaac tgaccatggt gctatagatt tggagaagaa tggtaaggta 540
cttgtagatt tggaaaaaat ctcagaaaac atacttgaaa cttgtggatc acaaaagaag 600
actgtggaag ttgtagatga taaagacaaa aaatggaata aagaatcagg ttggaaaaaa 660
aatctaaatg atctagattg gaaaaaagat ttagataaag ataaagttgg tggcggtttg 720
cttggcggtt taagtggcct cttaaatagt ttaaaatcag aaaaaggtct tctaggtctt 780
ttgaataaga atcaaattga gttattaatt cctttaatca gtgagataaa aaagaaaaat 840
atagatttta atctcttcga ttctgttgat tctgtcgaaa gaaatttaga cttgaaactt 900
ttcacaagtt ctgtttcaaa agttactgaa ttattaaata aaggaatcga tattcaaaca 960
attttgaatg cgaaaaatgg agatgaattc gatttaagcg gcaaagaatt gaaaaacgtc 1020
aaagggatat ttggtttgat tggaagtttg aaacgctcat taggattaga aaatatattg 1080
aacttaccgt ttaaacgtat acctctgctt aaatta 1116
<210> 21
<211> 1660
<212> DNA
<213> Apis mellifera
<400> 21
atgaaataca tgctcttgtt gctatctata ttcatctgtg cacatattgt atgcgcaggc 60
gtaaatacag aattaaaaaa agatggtgaa ctaaaggaag agtcttatga gaaaagcgag 120
tcaaagagtt taaaagaaat taaagaagaa cgtgcttcaa aatcaaaaag tgaacgtttg 180
aagattcgtg aaggtaattc gtgagattca agattcaaat caattaaatt tgaaaattat 240
gaaagtagta ttgttaaatt ataagataga agattttatc taaaaaataa taaattaagc 300
tttttgtatt tttggatatt gtagatattt ttaatataga attcttataa agttaaaaaa 360
tattttataa attaaacaac tttttattat ttttatgatc taaaaattaa aaatttcaag 420
ttaaagttca aattaaaaat ttgtaaaaaa tatggaaaaa acataaaaat tgaatttgtt 480
gtaatttaaa aaggattttt attatttatt gattaattat gaatataagt tcgaaaaatc 540
ctaaatatta atgtttaaaa ttttaattct taacaaaata tatttaattt aattcttaac 600
aaagatacat ttaaagaatt tcgcaaattt aaaaattagg tttttaattt taagaatcaa 660
atggtaaaaa acattttaaa tttgaaatat ataaaagtaa atcttttaat cgacaaacgg 720
atgaatttat tgattagaaa aacgcgaaga ggaagaaaaa tccaagagtc tgaatctggt 780
cgtggtcaga gaaaagatta ccaaactttc ttcatggctc aaagaagaga aagatatcag 840
tcctcttttg gaagaaaaaa atggcaaagg tctattgggt ttggaagatg tcacggacga 900
gttaaatatc gctcttaaat cgttgaagga gggcaaaaag tttgatactt ggaaattcga 960
gaaaggtagc gaagacgttc gttctttgga agaacttgat acgagcgtcg ttgaactttt 1020
aaaattaata aaggaaggaa aaactgacca tggtgctata gatttggaga agaatggtaa 1080
ggtacttgta gatttggaaa aaatctcaga aaacatactt gaaacttgtg gatcacaaaa 1140
gaagactgtg gaagttgtag atgataaaga caaaaaatgg aataaagaat caggttggaa 1200
aaaaaatcta aatgatctag attggaaaaa agatttagat aaagataaag ttggtggcgg 1260
tttgcttggc ggtttaagtg gcctcttaaa tagtttaaaa tcagaaaaag gtcttctagg 1320
tcttttgaat aagaatcaaa ttgagttatt aattccttta atcagtgaga taaaaaagaa 1380
aaatatagat tttaatctct tcgattctgt tgattctgtc gaaagaaatt tagacttgaa 1440
acttttcaca agttctgttt caaaagttac tgaattatta aataaaggaa tcgatattca 1500
aacaattttg aatgcgaaaa atggagatga attcgattta agcggcaaag aattgaaaaa 1560
cgtcaaaggg atatttggtt tgattggaag tttgaaacgc tcattaggat tagaaaatat 1620
attgaactta ccgtttaaac gtatacctct gcttaaatta 1660
<210> 22
<211> 308
<212> PRT
<213> Bombus terrestris
<400> 22
Gly Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser Ala Ser Ala
1 5 10 15
Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg Ala Gly Gln
20 25 30
Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala Asp Ala Ser
35 40 45
Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Ala Asp Gln Ser Ala Ser
50 55 60
Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala Ala Arg Ala
65 70 75 80
Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala Glu Leu Gln
85 90 95
Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg Glu Ala Ala
100 105 110
Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala Ala Val Gln
115 120 125
Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu Ala Ser Glu
130 135 140
Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala
145 150 155 160
Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile Ala Glu Glu
165 170 175
Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg Ala Ala Ala
180 185 190
Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser Ala Arg Ser
195 200 205
Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu Ile Ser Glu
210 215 220
Leu Asp Lys Lys Ser Arg Glu Val Ala Ala Ser Ala Ser Ala Lys Ala
225 230 235 240
Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr Ala Val Ile
245 250 255
Gly Ala Asn Ile Asn Val Ala Lys Glu Val Leu Ala Ile Pro Ile Glu
260 265 270
Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu Glu Asn Val
275 280 285
Ala Val Ala Ser Ser Glu Ser Glu Val Lys Val Glu Thr Ser Ser Glu
290 295 300
Ala Trp Ser Ile
305
<210> 23
<211> 327
<212> PRT
<213> Bombus terrestris
<400> 23
Met Lys Ile Pro Ala Leu Leu Val Thr Cys Leu Tyr Leu Trp Gly Phe
1 5 10 15
Ala Ser Ala Gly Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser
20 25 30
Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg
35 40 45
Ala Gly Gln Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala
50 55 60
Asp Ala Ser Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Ala Asp Gln
65 70 75 80
Ser Ala Ser Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala
85 90 95
Ala Arg Ala Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala
100 105 110
Glu Leu Gln Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg
115 120 125
Glu Ala Ala Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala
130 135 140
Ala Val Gln Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu
145 150 155 160
Ala Ser Glu Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala Ser Ala Ala
165 170 175
Ala Ala Ala Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile
180 185 190
Ala Glu Glu Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg
195 200 205
Ala Ala Ala Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser
210 215 220
Ala Arg Ser Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu
225 230 235 240
Ile Ser Glu Leu Asp Lys Lys Ser Arg Glu Val Ala Ala Ser Ala Ser
245 250 255
Ala Lys Ala Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr
260 265 270
Ala Val Ile Gly Ala Asn Ile Asn Val Ala Lys Glu Val Leu Ala Ile
275 280 285
Pro Ile Glu Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu
290 295 300
Glu Asn Val Ala Val Ala Ser Ser Glu Ser Glu Val Lys Val Glu Thr
305 310 315 320
Ser Ser Glu Ala Trp Ser Ile
325
<210> 24
<211> 293
<212> PRT
<213> Bombus terrestris
<400> 24
His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro Ala Leu Pro Glu
1 5 10 15
Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser Met Glu Asn Gly
20 25 30
Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu Arg Thr Glu Leu
35 40 45
Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr Lys Gln Ala Lys
50 55 60
Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala Ile Ala Ile Ala
65 70 75 80
Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu Leu Ala Ser Lys
85 90 95
Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala Val Ser Ala Thr
100 105 110
Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala Ala Ala Lys Ala
115 120 125
Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln Val Arg Ala Asn
130 135 140
Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala Glu Ala Lys Ala
145 150 155 160
Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys Lys Ala Ala Ala
165 170 175
Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala Glu Ser Glu Ala
180 185 190
Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala Lys Ala Arg Val
195 200 205
Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala Thr Ala Gln Ala
210 215 220
Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn Ala Glu Ala Ser
225 230 235 240
Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala Glu Ala Val Ser
245 250 255
Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser Trp Gly Glu Glu
260 265 270
Cys His Gln Arg Glu Lys Val Thr Phe Ser Glu Asp Arg Leu Asn Glu
275 280 285
Arg Gln Asp Asn Trp
290
<210> 25
<211> 313
<212> PRT
<213> Bombus terrestris
<400> 25
Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Val Trp Gly Gly
1 5 10 15
Leu Ala Glu Gly His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro
20 25 30
Ala Leu Pro Glu Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser
35 40 45
Met Glu Asn Gly Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu
50 55 60
Arg Thr Glu Leu Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr
65 70 75 80
Lys Gln Ala Lys Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala
85 90 95
Ile Ala Ile Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu
100 105 110
Leu Ala Ser Lys Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala
115 120 125
Val Ser Ala Thr Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala
130 135 140
Ala Ala Lys Ala Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln
145 150 155 160
Val Arg Ala Asn Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala
165 170 175
Glu Ala Lys Ala Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys
180 185 190
Lys Ala Ala Ala Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala
195 200 205
Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala
210 215 220
Lys Ala Arg Val Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala
225 230 235 240
Thr Ala Gln Ala Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn
245 250 255
Ala Glu Ala Ser Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala
260 265 270
Glu Ala Val Ser Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser
275 280 285
Trp Gly Glu Glu Cys His Gln Arg Glu Lys Val Thr Phe Ser Glu Asp
290 295 300
Arg Leu Asn Glu Arg Gln Asp Asn Trp
305 310
<210> 26
<211> 313
<212> PRT
<213> Bombus terrestris
<400> 26
Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val Leu Val Glu
1 5 10 15
Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg Lys Glu Asn
20 25 30
Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu Ala Ser Thr
35 40 45
Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys Val Lys Ala
50 55 60
Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser Ala Ala Phe
65 70 75 80
Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu Ala Thr Gln
85 90 95
Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu Lys Thr Gln
100 105 110
Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala Ala Ala Ala
115 120 125
Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg Ala Ala Thr
130 135 140
Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val Ala Thr Ser
145 150 155 160
Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln Ser Ala Ala
165 170 175
Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala Ala Ala Ala
180 185 190
Ala Ala Ile Glu Ala Lys Ala Thr Ala Ser Ser Glu Ser Thr Ala Ala
195 200 205
Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser Ser Ala Glu
210 215 220
Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile Ala Gly Thr
225 230 235 240
Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn Ser Arg Thr
245 250 255
Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala Ala Ala Ala
260 265 270
Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala Ser Ala Ala
275 280 285
Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala Ser Ala Ser
290 295 300
Leu Gly Ala Ser Glu Lys Asp Lys Lys
305 310
<210> 27
<211> 332
<212> PRT
<213> Bombus terrestris
<400> 27
Met Gln Ile Pro Ala Ile Phe Val Thr Cys Leu Leu Thr Trp Gly Leu
1 5 10 15
Val His Ala Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val
20 25 30
Leu Val Glu Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg
35 40 45
Lys Glu Asn Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu
50 55 60
Ala Ser Thr Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys
65 70 75 80
Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser
85 90 95
Ala Ala Phe Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu
100 105 110
Ala Thr Gln Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu
115 120 125
Lys Thr Gln Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala
130 135 140
Ala Ala Ala Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg
145 150 155 160
Ala Ala Thr Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val
165 170 175
Ala Thr Ser Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln
180 185 190
Ser Ala Ala Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala
195 200 205
Ala Ala Ala Ala Ala Ile Glu Ala Lys Ala Thr Ala Ser Ser Glu Ser
210 215 220
Thr Ala Ala Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser
225 230 235 240
Ser Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile
245 250 255
Ala Gly Thr Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn
260 265 270
Ser Arg Thr Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala
275 280 285
Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala
290 295 300
Ser Ala Ala Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala
305 310 315 320
Ser Ala Ser Leu Gly Ala Ser Glu Lys Asp Lys Lys
325 330
<210> 28
<211> 338
<212> PRT
<213> Bombus terrestris
<400> 28
Gly Lys Pro Leu Ile Ala Asn Ala Gln Ile Gly Lys Val Lys Thr Glu
1 5 10 15
Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly Ser Gln Thr
20 25 30
Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu Ala Leu Ala
35 40 45
Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala Ser Val Thr
50 55 60
Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr Gly Lys Lys
65 70 75 80
Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly Glu Ala Ile
85 90 95
Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala
100 105 110
Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala Asn Ala Gly
115 120 125
Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala Ala Ala Ala
130 135 140
Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys Ala Ser Leu
145 150 155 160
Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala Val Ala Leu Ala
165 170 175
Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr Ala Ala Ala
180 185 190
Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn Glu Leu Ala
195 200 205
Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys Ala Ala Ala
210 215 220
Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys Val Ala Glu Thr Ala Val
225 230 235 240
Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala
245 250 255
Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala Val Asn Ala
260 265 270
Ile Ala Glu Ala Glu Glu Arg Asp Ser Ala Gln Ala Glu Asn Thr Ala
275 280 285
Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln Asp Ser Cys
290 295 300
Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr Ala Trp Trp
305 310 315 320
Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro Arg Asn Arg
325 330 335
Arg Thr
<210> 29
<211> 357
<212> PRT
<213> Bombus terrestris
<400> 29
Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Val Trp Gly Leu
1 5 10 15
Ala Ser Ala Gly Lys Pro Leu Ile Ala Asn Ala Gln Ile Gly Lys Val
20 25 30
Lys Thr Glu Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly
35 40 45
Ser Gln Thr Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu
50 55 60
Ala Leu Ala Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala
65 70 75 80
Ser Val Thr Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr
85 90 95
Gly Lys Lys Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly
100 105 110
Glu Ala Ile Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala
115 120 125
Gln Ala Ala Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala
130 135 140
Asn Ala Gly Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala
145 150 155 160
Ala Ala Ala Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys
165 170 175
Ala Ser Leu Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala Val
180 185 190
Ala Leu Ala Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr
195 200 205
Ala Ala Ala Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn
210 215 220
Glu Leu Ala Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys
225 230 235 240
Ala Ala Ala Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys Val Ala Glu
245 250 255
Thr Ala Val Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala
260 265 270
Ala Lys Ala Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala
275 280 285
Val Asn Ala Ile Ala Glu Ala Glu Glu Arg Asp Ser Ala Gln Ala Glu
290 295 300
Asn Thr Ala Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln
305 310 315 320
Asp Ser Cys Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr
325 330 335
Ala Trp Trp Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro
340 345 350
Arg Asn Arg Arg Thr
355
<210> 30
<211> 422
<212> PRT
<213> Bombus terrestris
<400> 30
Gly Asn Ser Glu Ser Gly Glu Asn Trp Lys Asn Gly Glu Ser Ser Glu
1 5 10 15
Ser Gly Lys Asn Trp Arg Asn Ser Gly Ser Ser Glu Ser Gly Lys Asn
20 25 30
Trp Lys Asn Gly Gly Ser Ser Glu Ser Asn Lys His Trp Lys Asn Gly
35 40 45
Gly Ser Ser Glu Ser Gly Glu Lys Trp Lys Asn Ser Glu Ser Ser Glu
50 55 60
Ser Gly Lys Asn Trp Lys Asn Ser Gly Ser Ser Glu Ser Gly Lys Asn
65 70 75 80
Trp Lys Asn Gly Gly Ser Ser Glu Ser Asn Lys His Trp Lys Ser Gly
85 90 95
Gly Ser Ser Glu Ser Gly Glu Lys Trp Lys Asn Ser Glu Ser Gly Asn
100 105 110
Lys Gly Lys Ser Ser Lys Ser Ser Glu Ser Trp Lys Ser Asn Glu Asn
115 120 125
Ser Lys Asn Asp Gly Ser Trp Lys Ser Ser Glu Glu Ser Glu Lys Trp
130 135 140
Lys Asp Gly Lys Ala Val Ala Glu Asp Ser Val Ser Ile Asn Trp Ala
145 150 155 160
Asp Val Lys Glu Gln Ile Ser Asn Ile Ala Thr Ser Leu Glu Lys Gly
165 170 175
Gly Asn Leu Glu Ala Val Leu Lys Ile Lys Lys Gly Glu Lys Lys Ile
180 185 190
Ser Ser Leu Glu Glu Ile Lys Glu Lys Ile Ser Val Leu Leu Lys Trp
195 200 205
Ile Gln Glu Gly Lys Asp Thr Ser Ser Leu Leu Asp Leu Lys Glu Gly
210 215 220
Ser Lys Asp Ile Ala Ser Leu Lys Glu Ile Lys Gly Lys Ile Leu Leu
225 230 235 240
Ile Val Lys Leu Val Asn Glu Gly Lys Asp Thr Ser Gly Leu Leu Asp
245 250 255
Leu Glu Ala Ser Gly Lys Val Ile Leu Glu Leu Gln Ser Ala Ile Glu
260 265 270
Lys Val Leu Val Lys Ser Glu Lys Val Thr Lys Val Ser Glu Val Ser
275 280 285
Gly Leu Val Lys Ser Lys Thr Val Ser Asp Ile Lys Pro Leu Gln Ala
290 295 300
Val Ile Pro Leu Ile Leu Glu Leu Gln Lys Thr Asp Ile Asn Leu Ser
305 310 315 320
Thr Leu Asn Lys Trp Ser Thr Val Asn Val Asn Ser Ile Asp Lys Glu
325 330 335
Arg Val Thr Lys Thr Val Pro Val Leu Leu Gln Ser Met Lys Gly Gly
340 345 350
Glu Asp Ile Gln Asn Leu Leu Ser Ala Lys Gly Ala Lys Lys Leu Gly
355 360 365
Ile Ser Ala Leu Asp Leu Gln Ala Val Gln Gly Ala Leu Gly Val Val
370 375 380
Gly Lys Leu Ser Ser Gly Gly Ala Leu Asn Ser Lys Gly Leu Leu Asn
385 390 395 400
Leu Lys Asp Gly Ala Ser Val Leu Gly Ala Gly Lys Ile Gly Gly Leu
405 410 415
Ile Pro Leu Pro Lys Leu
420
<210> 31
<211> 927
<212> DNA
<213> Bombus terrestris
<400> 31
ggccagagct cacctctgct cgagatcgtg cagggtagcg cgtcggccac cgcatccacc 60
gctgtgaccg ctagatccgg acttcgtgcc ggtcaggtag ccgtggcctc gcagaaggat 120
gccacacttc aggcagatgc ctcagcggcc gccgcggccg ctgcacgcgc ttccgccgac 180
cagtcggcca gtctagccca acagtcggcg tctttgcagt ccaaagctgc cgccagagca 240
aaatcagccg aggagtcagc ggcagctacg gccaaagccg agttgcaggc agaatccatt 300
gctgcatctg ccagttccaa tgccagagag gctgcagcgt ccgcaaaagc ctccgcatcc 360
gcgatgtcat cggctgccgt gcaggcgaaa ctcgctgaaa agacggccaa gaatcaagct 420
ctggcttccg aagaagccaa actcaaggct gccgccgctg ccagcgcagc agcagcagcc 480
agcgccgccg ccgaggcagc cctgaaagct gagagaatag cggaagaagc catcgccaag 540
gcggccgctg ccaaagcagc cgccagagcc gctgcagccg cgttaaactc cgcgaaggaa 600
gccgccacga gcagcgcaag gagcgccgcc gaagccgaag ctaagagcga agtcgctata 660
ctgatcagcg aactcgacaa gaagagcagg gaagtcgccg cttccgcgtc cgccaaggca 720
cgcgctgctg ctgcggctag ctccagaaac gcagaaacgg ctgttatcgg agctaacatc 780
aatgtggcca aagaggtctt ggcgattccc atcgagccaa agaaacttcc ggagccagag 840
ctggcgttga aagaagagaa tgtcgcggtc gcgagctcag agagtgaagt gaaggtagaa 900
acgagcagcg aagcatggtc aatttaa 927
<210> 32
<211> 984
<212> DNA
<213> Bombus terrestris
<400> 32
atgaagattc cagcactgct cgtaacgtgc ctctaccttt ggggcttcgc gtccgccggc 60
cagagctcac ctctgctcga gatcgtgcag ggtagcgcgt cggccaccgc atccaccgct 120
gtgaccgcta gatccggact tcgtgccggt caggtagccg tggcctcgca gaaggatgcc 180
acacttcagg cagatgcctc agcggccgcc gcggccgctg cacgcgcttc cgccgaccag 240
tcggccagtc tagcccaaca gtcggcgtct ttgcagtcca aagctgccgc cagagcaaaa 300
tcagccgagg agtcagcggc agctacggcc aaagccgagt tgcaggcaga atccattgct 360
gcatctgcca gttccaatgc cagagaggct gcagcgtccg caaaagcctc cgcatccgcg 420
atgtcatcgg ctgccgtgca ggcgaaactc gctgaaaaga cggccaagaa tcaagctctg 480
gcttccgaag aagccaaact caaggctgcc gccgctgcca gcgcagcagc agcagccagc 540
gccgccgccg aggcagccct gaaagctgag agaatagcgg aagaagccat cgccaaggcg 600
gccgctgcca aagcagccgc cagagccgct gcagccgcgt taaactccgc gaaggaagcc 660
gccacgagca gcgcaaggag cgccgccgaa gccgaagcta agagcgaagt cgctatactg 720
atcagcgaac tcgacaagaa gagcagggaa gtcgccgctt ccgcgtccgc caaggcacgc 780
gctgctgctg cggctagctc cagaaacgca gaaacggctg ttatcggagc taacatcaat 840
gtggccaaag aggtcttggc gattcccatc gagccaaaga aacttccgga gccagagctg 900
gcgttgaaag aagagaatgt cgcggtcgcg agctcagaga gtgaagtgaa ggtagaaacg 960
agcagcgaag catggtcaat ttaa 984
<210> 33
<211> 882
<212> DNA
<213> Bombus terrestris
<400> 33
cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat 60
gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag 120
aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc 180
aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct 240
atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc 300
gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc 360
gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag 420
gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc 480
gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct 540
aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa 600
gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct 660
accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc 720
gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc 780
gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg 840
tttagcgaag atcgattaaa cgagagacaa gacaattggt ag 882
<210> 34
<211> 942
<212> DNA
<213> Bombus terrestris
<400> 34
atgaagattc cagcaatact ggttacgtct ctgctggtct ggggtggtct ggccgagggc 60
cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat 120
gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag 180
aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc 240
aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct 300
atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc 360
gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc 420
gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag 480
gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc 540
gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct 600
aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa 660
gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct 720
accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc 780
gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc 840
gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg 900
tttagcgaag atcgattaaa cgagagacaa gacaattggt ag 942
<210> 35
<211> 942
<212> DNA
<213> Bombus terrestris
<400> 35
ggtagcgtgg aactcggtgc ccccaagcag gagtctgtcc tcgtggagca gctcctattg 60
aagaacgtgg agactagtgc gaagcgaaag gagaacggcg caccgaaact cggcgagagc 120
acagctgcgg ctctggctag taccaaggca actgcagccg cagaggctaa ggcatccgcc 180
aaagtgaaag cttctgcctt ggccctcgct gaggctttct tgcgtgcgtc ggcagcgttt 240
gctgctgctt cagccaaagc tgctgccgct gtaaaggaag caacgcaggc acagttgctg 300
gcacaggaga aggctttgat agcgttgaaa actcaatctg agcaacaagc tgcctctgct 360
cgcgcggacg ccgcggctgc cgcagccgta tccgcgctag aacgcgccca ggcctcctcc 420
agagcagcca cgaccgccca agacatctcc agcgatctgg agaaacgtgt cgccacctca 480
gccgctgctg aagcaggtgc caccctcaga gcggaacaat ccgccgcgca atcgaaatgg 540
tccgccgcac tggccgccca aaccgccgct gctgcagccg ctatagaagc aaaggccacc 600
gcttcctcag aaagcaccgc tgccgctact agtaaggccg ccgtgttgac cgctgacact 660
agcagcgcag aagctgccgc tgcagcggag gcacaatccg cttcgcggat cgcaggtaca 720
gcagccaccg agggatccgc caactgggct agcgagaact cgcgtaccgc acaactggaa 780
gcttccgcct cagcgaaggc caccgcagcc gcagctgtcg gagatggagc tattatagga 840
cttgcacggg acgctagtgc cgcagctcag gcagccgcag aagttaaagc cttagctgaa 900
gctagtgcca gcttaggtgc ttcagaaaag gacaagaaat ga 942
<210> 36
<211> 999
<212> DNA
<213> Bombus terrestris
<400> 36
atgcagatcc cagcgatttt cgtcacgtgc ctgctcacat ggggcctggt gcacgcaggt 60
agcgtggaac tcggtgcccc caagcaggag tctgtcctcg tggagcagct cctattgaag 120
aacgtggaga ctagtgcgaa gcgaaaggag aacggcgcac cgaaactcgg cgagagcaca 180
gctgcggctc tggctagtac caaggcaact gcagccgcag aggctaaggc atccgccaaa 240
gtgaaagctt ctgccttggc cctcgctgag gctttcttgc gtgcgtcggc agcgtttgct 300
gctgcttcag ccaaagctgc tgccgctgta aaggaagcaa cgcaggcaca gttgctggca 360
caggagaagg ctttgatagc gttgaaaact caatctgagc aacaagctgc ctctgctcgc 420
gcggacgccg cggctgccgc agccgtatcc gcgctagaac gcgcccaggc ctcctccaga 480
gcagccacga ccgcccaaga catctccagc gatctggaga aacgtgtcgc cacctcagcc 540
gctgctgaag caggtgccac cctcagagcg gaacaatccg ccgcgcaatc gaaatggtcc 600
gccgcactgg ccgcccaaac cgccgctgct gcagccgcta tagaagcaaa ggccaccgct 660
tcctcagaaa gcaccgctgc cgctactagt aaggccgccg tgttgaccgc tgacactagc 720
agcgcagaag ctgccgctgc agcggaggca caatccgctt cgcggatcgc aggtacagca 780
gccaccgagg gatccgccaa ctgggctagc gagaactcgc gtaccgcaca actggaagct 840
tccgcctcag cgaaggccac cgcagccgca gctgtcggag atggagctat tataggactt 900
gcacgggacg ctagtgccgc agctcaggca gccgcagaag ttaaagcctt agctgaagct 960
agtgccagct taggtgcttc agaaaaggac aagaaatga 999
<210> 37
<211> 1017
<212> DNA
<213> Bombus terrestris
<400> 37
ggcaaaccac tcattgccaa tgcgcaaata gggaaggtca agaccgaaac gtcatcgtct 60
tcagagattg agacgttggt atcaggaagc cagacattgg tggcaggaag tgagacattg 120
gcttcagaaa gcgaggcatt ggcgtcaaaa agcgaggcat tgacgtcaga agccgagata 180
gcgagcgtga caacgaagga cgagctcata ctaaagggcg aagctatcac tggaaagaaa 240
ctaggaaccg gggcgtcgga agtagcggcg gcctctgggg aggctatcgc aactaccctt 300
ggcgcgggac aagctgcagc agaggcacaa gcagccgccg ccgcgcaagc aaaatcagca 360
gcggcagctg ccgcgaatgc aggtgaatcc agcaacagtg ctgctgcgtt ggttgctgct 420
gcagctgcag cacaaggaaa agcggctgcc gccgcagcag ccgcgacgaa ggctagctta 480
gaggccgcag acgctgctga ggaagctgag tcggccgtgg ccttggctag ggctgcctcc 540
gcaaaggcgg aagcgctcgc atcgaccgcc gctgctgcga atacccgtgc tgctctccaa 600
gcggaaaaat cgaacgagct ggcgcaagct gaggctgcag ccgccgccga agcccaggct 660
aaagccgccg ctgctgccaa ggcaacacaa ctcgccctta aagttgccga aactgcggtg 720
aaaacggaag cagatgcagc agctgccgcc gttgcggccg caaaagccag agcagtcgca 780
gacgcagccg cgtctcgtgc gaccgcagtg aacgccattg ctgaagcgga agaaagagac 840
tctgcacagg cggagaacac cgctggtgta gcacaagcag cgctcgctgc tgcggaagca 900
caagactcct gcatcggcgc tgccgcgact cctaggcatt cgtcgagcta tgcatggtgg 960
aagcttagga taacatcctt gatcgtcatt ctatcgccac gcaatcgacg tacttaa 1017
<210> 38
<211> 1074
<212> DNA
<213> Bombus terrestris
<400> 38
atgaagattc catcgatact cgcggtgtcc ctgctggttt ggggtctggc cagcgcaggc 60
aaaccactca ttgccaatgc gcaaataggg aaggtcaaga ccgaaacgtc atcgtcttca 120
gagattgaga cgttggtatc aggaagccag acattggtgg caggaagtga gacattggct 180
tcagaaagcg aggcattggc gtcaaaaagc gaggcattga cgtcagaagc cgagatagcg 240
agcgtgacaa cgaaggacga gctcatacta aagggcgaag ctatcactgg aaagaaacta 300
ggaaccgggg cgtcggaagt agcggcggcc tctggggagg ctatcgcaac tacccttggc 360
gcgggacaag ctgcagcaga ggcacaagca gccgccgccg cgcaagcaaa atcagcagcg 420
gcagctgccg cgaatgcagg tgaatccagc aacagtgctg ctgcgttggt tgctgctgca 480
gctgcagcac aaggaaaagc ggctgccgcc gcagcagccg cgacgaaggc tagcttagag 540
gccgcagacg ctgctgagga agctgagtcg gccgtggcct tggctagggc tgcctccgca 600
aaggcggaag cgctcgcatc gaccgccgct gctgcgaata cccgtgctgc tctccaagcg 660
gaaaaatcga acgagctggc gcaagctgag gctgcagccg ccgccgaagc ccaggctaaa 720
gccgccgctg ctgccaaggc aacacaactc gcccttaaag ttgccgaaac tgcggtgaaa 780
acggaagcag atgcagcagc tgccgccgtt gcggccgcaa aagccagagc agtcgcagac 840
gcagccgcgt ctcgtgcgac cgcagtgaac gccattgctg aagcggaaga aagagactct 900
gcacaggcgg agaacaccgc tggtgtagca caagcagcgc tcgctgctgc ggaagcacaa 960
gactcctgca tcggcgctgc cgcgactcct aggcattcgt cgagctatgc atggtggaag 1020
cttaggataa catccttgat cgtcattcta tcgccacgca atcgacgtac ttaa 1074
<210> 39
<211> 1411
<212> DNA
<213> Bombus terrestris
<400> 39
ggaaattcgg aaagcggcga aaattggaag aacggtgaaa gctccgaaag cggcaaaaat 60
tggaggaaca gcggaagctc cgaaagcggc aaaaattgga agaatggcgg aagctcagaa 120
agcaacaaac attggaagaa cggtggaagc tcggaaagcg gcgagaaatg gaaaaacagt 180
gaaagctccg aaagcggcaa aaattggaag aacagcggaa gctccgaaag cggcaaaaat 240
tggaaaaacg gcggaagctc ggaaagcaac aaacattgga agagcggtgg aagctcggaa 300
agtggcgaga aatggaaaaa cagtgaaagc ggaaataaag gcaaaagctc aaaaagcagc 360
gaaagttgga agagcaacga aaactcgaag aacgacggca gctggaagag cagtgaagaa 420
tcagaaaagt ggaaagatgg taaagcagtg gcggaagaca gcgttagtat aaactgggca 480
gatgtcaaag agcagattag caacattgct acatccttag aaaagggtgg taacctcgag 540
gctgtattga aaataaagaa aggagaaaag aaaatttcaa gtttggagga aatcaaggag 600
aaaatctctg tcctactgaa atggattcaa gaaggcaaag atactagcag cctattagat 660
ttgaaagagg gtagcaagga tattgcgtcg ttgaaagaaa tcaaaggaaa gatccttttg 720
attgttaaat tagtgaacga agggaaagac actagtggtc ttttagattt agaagcgagt 780
ggcaaagtaa ttttagaatt gcaaagcgcc atagaaaagg ttctcgtaaa gtcagaaaag 840
gtaaccaaag tatctgaagt ttccggttta gtaaaaagca aaactgtctc ggacataaaa 900
ccgcttcaag cagtaattcc tttaatcctt gaattgcaaa aaacagacat taaccttagt 960
accttaaaca agtggtccac tgttaacgta aattctatag ataaagaacg cgtcacgaaa 1020
acggttccag tgctccttca atccatgaaa ggaggcgaag atattcagaa ccttttgagt 1080
gcgaaaggtg caaagaaact tggcattagt gctttggact tacaggcagt tcaaggagct 1140
cttggcgtgg ttggaaagct aagttcaggt ggtgcgttga actcaaaagg cttgttgaac 1200
ttgaaagacg gcgctagtgt gttaggtgca ggaaaaatcg gaggattaat tcctttaccg 1260
aaactttaag agatagaccg ataaaggcag atatactctc ggaagatttt tttggaagtt 1320
gaatagtccg caaaaaaatt atctctgatt attataattt agcctaaaat attaaataaa 1380
atggagaaat aacgttgaaa tatataaata a 1411
<210> 40
<211> 403
<212> PRT
<213> Myrmecia forficata
<400> 40
Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser Ala Ala Ser Ala Ser Ala
1 5 10 15
Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys Ser Gly Ala
20 25 30
Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile Leu Ser Arg
35 40 45
Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser Ala Ala Val
50 55 60
Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala Glu Glu Gln
65 70 75 80
Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys Asn Ala Glu
85 90 95
Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln Gly Ser Ala
100 105 110
Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val Glu Glu Glu
115 120 125
Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val Ala Ala Ala
130 135 140
Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala Gln Thr Ala
145 150 155 160
Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr Ala Leu Lys
165 170 175
Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala Arg Met Met
180 185 190
Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala Ala Gln Gln
195 200 205
Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala Ile Ala Ala
210 215 220
Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala Lys Ala Ala
225 230 235 240
Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln Ala Asn Ala
245 250 255
Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser Lys Ser Arg
260 265 270
Ala Ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala Ser Lys Ser
275 280 285
Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu Phe Gly Lys
290 295 300
Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg Ser Asn Gly Gly Gln
305 310 315 320
Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala Ser Ala Val Gly
325 330 335
Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp Ser Arg Val
340 345 350
Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala Asp Ala Ser
355 360 365
Ser Ser Ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly Leu Gly Ser
370 375 380
Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser Ala Gly Thr
385 390 395 400
Leu Leu Leu
<210> 41
<211> 422
<212> PRT
<213> Myrmecia forficata
<400> 41
Met Lys Ile Pro Ala Ile Ile Ala Thr Ser Leu Leu Leu Trp Gly Phe
1 5 10 15
Ala Ser Ala Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser Ala Ala Ser
20 25 30
Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys
35 40 45
Ser Gly Ala Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile
50 55 60
Leu Ser Arg Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser
65 70 75 80
Ala Ala Val Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala
85 90 95
Glu Glu Gln Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys
100 105 110
Asn Ala Glu Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln
115 120 125
Gly Ser Ala Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val
130 135 140
Glu Glu Glu Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val
145 150 155 160
Ala Ala Ala Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala
165 170 175
Gln Thr Ala Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr
180 185 190
Ala Leu Lys Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala
195 200 205
Arg Met Met Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala
210 215 220
Ala Gln Gln Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala
225 230 235 240
Ile Ala Ala Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala
245 250 255
Lys Ala Ala Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln
260 265 270
Ala Asn Ala Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser
275 280 285
Lys Ser Arg Ala Ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala
290 295 300
Ser Lys Ser Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu
305 310 315 320
Phe Gly Lys Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg Ser Asn
325 330 335
Gly Gly Gln Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala Ser
340 345 350
Ala Val Gly Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp
355 360 365
Ser Arg Val Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala
370 375 380
Asp Ala Ser Ser Ser Ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly
385 390 395 400
Leu Gly Ser Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser
405 410 415
Ala Gly Thr Leu Leu Leu
420
<210> 42
<211> 392
<212> PRT
<213> Myrmecia forficata
<400> 42
Arg Val Ile Glu Ser Ser Ser Ser Ala Ser Ala Gln Ala Ser Ala Ser
1 5 10 15
Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly Lys Leu Glu
20 25 30
Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu Glu Ser Leu
35 40 45
Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly Leu Asp Val
50 55 60
Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp Val Ala Thr
65 70 75 80
Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly Pro Val Ala
85 90 95
Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr Ser Ala Gln
100 105 110
Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile Ala Ala Met
115 120 125
Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val Thr Thr Lys
130 135 140
Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala Arg Ala Thr
145 150 155 160
Ala Ala Ala Ser Ala Ser Lys Ile Ser Ser Gln Glu Ser Ala Ala Ser
165 170 175
Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala Ala Ser Ile
180 185 190
Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala Ala Val Leu
195 200 205
Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys Ser Leu Ser
210 215 220
Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala Glu Ala Ser
225 230 235 240
Ala Glu Ala Gln Ile Lys Leu Ser Gln Ala Arg Ala Ala Val Ala Arg
245 250 255
Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln Ala Ala Ser
260 265 270
Gln Ile Gln Ser Arg Ala Ser Ala Ser Glu Ser Ala Ala Ser Ala Gln
275 280 285
Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr Ala Asp Ala
290 295 300
Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu Lys Asn Asp
305 310 315 320
Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala Glu Gly Glu
325 330 335
Ala Val Ser Ile Ser Lys Gly His Arg Gly Gly Ile Arg Ser Gly Ser
340 345 350
Ile Ser Glu Ala Ser Ala Glu Ala Ser Ser Asn Val Ser Met Gly Gly
355 360 365
Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala Gly Ala Ser
370 375 380
Ala Gly Ser Ser Ala Asp Ser Leu
385 390
<210> 43
<211> 411
<212> PRT
<213> Myrmecia forficata
<400> 43
Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Ala Trp Gly Leu
1 5 10 15
Ala Ser Gly Arg Val Ile Glu Ser Ser Ser Ser Ala Ser Ala Gln Ala
20 25 30
Ser Ala Ser Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly
35 40 45
Lys Leu Glu Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu
50 55 60
Glu Ser Leu Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly
65 70 75 80
Leu Asp Val Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp
85 90 95
Val Ala Thr Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly
100 105 110
Pro Val Ala Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr
115 120 125
Ser Ala Gln Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile
130 135 140
Ala Ala Met Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val
145 150 155 160
Thr Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala
165 170 175
Arg Ala Thr Ala Ala Ala Ser Ala Ser Lys Ile Ser Ser Gln Glu Ser
180 185 190
Ala Ala Ser Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala
195 200 205
Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala
210 215 220
Ala Val Leu Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys
225 230 235 240
Ser Leu Ser Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala
245 250 255
Glu Ala Ser Ala Glu Ala Gln Ile Lys Leu Ser Gln Ala Arg Ala Ala
260 265 270
Val Ala Arg Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln
275 280 285
Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser Ala Ser Glu Ser Ala Ala
290 295 300
Ser Ala Gln Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr
305 310 315 320
Ala Asp Ala Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu
325 330 335
Lys Asn Asp Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala
340 345 350
Glu Gly Glu Ala Val Ser Ile Ser Lys Gly His Arg Gly Gly Ile Arg
355 360 365
Ser Gly Ser Ile Ser Glu Ala Ser Ala Glu Ala Ser Ser Asn Val Ser
370 375 380
Met Gly Gly Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala
385 390 395 400
Gly Ala Ser Ala Gly Ser Ser Ala Asp Ser Leu
405 410
<210> 44
<211> 375
<212> PRT
<213> Myrmecia forficata
<400> 44
Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser Ala Ser Ala
1 5 10 15
Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu Pro Leu Pro
20 25 30
Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val Phe Asp Ile
35 40 45
Lys Asp Val Val Leu Ser Ala Val Asp Glu Ile Asn Gly Ala Pro Lys
50 55 60
Leu Gly Leu Gly Trp Lys Lys Val Ser Met Gly Val Glu Arg Ala Glu
65 70 75 80
Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile Lys Lys Ile
85 90 95
Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp Ala Ser Ala
100 105 110
Gln Ala Ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala Gln Ala Ser
115 120 125
Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu Ala Leu Ser
130 135 140
Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala Ala Ala Thr
145 150 155 160
Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala Ala Asn Ala
165 170 175
Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn Arg Ser Ala
180 185 190
Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala Ser Ala Leu
195 200 205
Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala Ala Ala Ser
210 215 220
Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr Ala Arg Ala
225 230 235 240
Ala Gly Gln Ala Ser Thr Ala Ala Glu Glu Ala Gln Ser Ala Gln Glu
245 250 255
Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu Glu Lys Ala
260 265 270
Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr Tyr Thr Ala
275 280 285
Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile Asn Ala Leu
290 295 300
Arg Asp Gly Ile Val Val Gly Met Gly Asn Asp Ala Gly Ala Ser Ala
305 310 315 320
Gln Ala Met Ala Gln Val Glu Ala Leu Ala Arg Ala Ser Glu His Lys
325 330 335
Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr Gly Ser Lys
340 345 350
Gly Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser
355 360 365
Ser Arg Leu Gly Lys Asp Trp
370 375
<210> 45
<211> 394
<212> PRT
<213> Myrmecia forficata
<400> 45
Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu
1 5 10 15
Ala Ser Gly Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser
20 25 30
Ala Ser Ala Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu
35 40 45
Pro Leu Pro Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val
50 55 60
Phe Asp Ile Lys Asp Val Val Leu Ser Ala Val Asp Glu Ile Asn Gly
65 70 75 80
Ala Pro Lys Leu Gly Leu Gly Trp Lys Lys Val Ser Met Gly Val Glu
85 90 95
Arg Ala Glu Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile
100 105 110
Lys Lys Ile Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp
115 120 125
Ala Ser Ala Gln Ala Ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala
130 135 140
Gln Ala Ser Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu
145 150 155 160
Ala Leu Ser Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala
165 170 175
Ala Ala Thr Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala
180 185 190
Ala Asn Ala Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn
195 200 205
Arg Ser Ala Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala
210 215 220
Ser Ala Leu Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala
225 230 235 240
Ala Ala Ser Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr
245 250 255
Ala Arg Ala Ala Gly Gln Ala Ser Thr Ala Ala Glu Glu Ala Gln Ser
260 265 270
Ala Gln Glu Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu
275 280 285
Glu Lys Ala Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr
290 295 300
Tyr Thr Ala Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile
305 310 315 320
Asn Ala Leu Arg Asp Gly Ile Val Val Gly Met Gly Asn Asp Ala Gly
325 330 335
Ala Ser Ala Gln Ala Met Ala Gln Val Glu Ala Leu Ala Arg Ala Ser
340 345 350
Glu His Lys Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr
355 360 365
Gly Ser Lys Gly Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala
370 375 380
Glu Ala Ser Ser Arg Leu Gly Lys Asp Trp
385 390
<210> 46
<211> 422
<212> PRT
<213> Myrmecia forficata
<400> 46
Ser Glu Leu Glu Ser Glu Ala Ser Ala Ala Ala Ser Ala Gln Ala Glu
1 5 10 15
Ala Ser Ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser Gln Ala Ser
20 25 30
Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Ser Arg Gly Gly Ser Lys
35 40 45
Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser Glu Ala Lys
50 55 60
Ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly Thr Gly Ile
65 70 75 80
Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly Leu Gly
85 90 95
Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly Gln Ala
100 105 110
Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr Thr Ala Lys
115 120 125
Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile Glu Val Ala
130 135 140
Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala Ala Lys Ala
145 150 155 160
Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala Ala Ala Gly
165 170 175
Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu Arg Arg Ala
180 185 190
Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala Ser Ser Ala
195 200 205
Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg Glu Ala Ala
210 215 220
Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile Glu Gln Glu
225 230 235 240
Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu Asn Ala Glu
245 250 255
Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala Ser Ala Glu
260 265 270
Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val Ala Arg Ala
275 280 285
Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr Asp Ala Gly
290 295 300
Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys Gly Glu Leu
305 310 315 320
Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn Ala Asp Leu
325 330 335
Ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly Gln Val Gln
340 345 350
Glu Val Lys Lys Ile Ser Thr His Lys Gly Gly Trp Gly Trp Gly Lys
355 360 365
Glu Gly Arg Ser Lys Val Ser Ser Asn Ala Ser Ala Arg Ala Ser Ala
370 375 380
Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp Gly Arg Gln
385 390 395 400
Leu Ser Ala Ser Ser Ala Ser Ala Asp Ala Asn Ala Glu Ala Asp Ser
405 410 415
Gln Leu Leu Lys Val Trp
420
<210> 47
<211> 441
<212> PRT
<213> Myrmecia forficata
<400> 47
Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Leu Ile Trp Gly Leu
1 5 10 15
Val Gly Ala Ser Glu Leu Glu Ser Glu Ala Ser Ala Ala Ala Ser Ala
20 25 30
Gln Ala Glu Ala Ser Ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser
35 40 45
Gln Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Ser Arg Gly
50 55 60
Gly Ser Lys Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser
65 70 75 80
Glu Ala Lys Ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly
85 90 95
Thr Gly Ile Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg
100 105 110
Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala
115 120 125
Gly Gln Ala Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr
130 135 140
Thr Ala Lys Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile
145 150 155 160
Glu Val Ala Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala
165 170 175
Ala Lys Ala Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala
180 185 190
Ala Ala Gly Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu
195 200 205
Arg Arg Ala Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala
210 215 220
Ser Ser Ala Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg
225 230 235 240
Glu Ala Ala Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile
245 250 255
Glu Gln Glu Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu
260 265 270
Asn Ala Glu Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala
275 280 285
Ser Ala Glu Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val
290 295 300
Ala Arg Ala Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr
305 310 315 320
Asp Ala Gly Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys
325 330 335
Gly Glu Leu Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn
340 345 350
Ala Asp Leu Ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly
355 360 365
Gln Val Gln Glu Val Lys Lys Ile Ser Thr His Lys Gly Gly Trp Gly
370 375 380
Trp Gly Lys Glu Gly Arg Ser Lys Val Ser Ser Asn Ala Ser Ala Arg
385 390 395 400
Ala Ser Ala Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp
405 410 415
Gly Arg Gln Leu Ser Ala Ser Ser Ala Ser Ala Asp Ala Asn Ala Glu
420 425 430
Ala Asp Ser Gln Leu Leu Lys Val Trp
435 440
<210> 48
<211> 1212
<212> DNA
<213> Myrmecia forficata
<400> 48
agcgggccgc gcttactcgg cggcagatcg gccgcgtccg cgtcggcttc cgcttcggct 60
gaggcgtcgg cgggcggttg gaggaaaagc ggcgcatccg cttccgcttc cgctaaggct 120
ggtagcagca acatcctcag ccgcgtggga gcttcgaggg cggccgcgac gttggtcgct 180
tccgccgcgg tggaggccaa ggcgggtctc cgtgccggca aggcaaccgc cgaggagcag 240
agggaggctt tggaaatgct caccttgtcc gccgacaaga atgccgaggc gcgtatcctg 300
gccgacgaca cggccgttct ggttcaaggc agcgccgagg cacagtcggt cgccgccgcg 360
aagaccgtcg cggtcgagga agagtccgct tccttggatg cggccgcagt tgaagcggag 420
gtcgcagccg ccacgtcgaa atcgtcggct ggccaagcac tccagtccgc acagaccgcc 480
gcatctgctc tcagaacttc cgccaggagc gccttgacgg ccctcaagct ggcacgcctc 540
caaggcgcgg cttctagcaa cgctgccagg atgatggaaa aggcgctggc cgccacccag 600
gacgcaaatg ccgccgccca gcaagctatg gcggccgaga gtgcagccgc agaagcagcg 660
gctatcgcgg cagcgaaaca atcggaggcg agagacgccg gcgccgaggc caaggccgcc 720
atggcagcac tcatcaccgc ccagaggaat ctcgtgcagg ccaatgccag ggcggaaatg 780
gcaagcgagg aagccgaatt ggattcgaag tctagagcgt ccgacgccaa ggtgaacgcc 840
gttgctcgtg cggcctccaa gtccagcata cgcagagatg aacttatcga gatcggcgct 900
gagttcggca aggccagcgg cgaggtgatt tccaccggca cgcgttccaa cggcggtcaa 960
gacgccatcg ccaccgccga ggcatcgagt agcgcgtccg ccgtcggcat caagaaaaca 1020
agcggacact gggggagcgg aaaatggagt cgtgtctcca agggtaaagg atgggcttcc 1080
tcgaatgcgg acgctgacgc cagcagcagc agcatcatca tcggcggtct caaacgcggc 1140
ggcctcggtt cggaagcctc tgcggcagct tccgcagaag cggaagcttc cgccggcaca 1200
ctcctgctgt aa 1212
<210> 49
<211> 1269
<212> DNA
<213> Myrmecia forficata
<400> 49
atgaagatcc cagcgataat cgcaacgtcc cttctcctct ggggtttcgc cagcgccagc 60
gggccgcgct tactcggcgg cagatcggcc gcgtccgcgt cggcttccgc ttcggctgag 120
gcgtcggcgg gcggttggag gaaaagcggc gcatccgctt ccgcttccgc taaggctggt 180
agcagcaaca tcctcagccg cgtgggagct tcgagggcgg ccgcgacgtt ggtcgcttcc 240
gccgcggtgg aggccaaggc gggtctccgt gccggcaagg caaccgccga ggagcagagg 300
gaggctttgg aaatgctcac cttgtccgcc gacaagaatg ccgaggcgcg tatcctggcc 360
gacgacacgg ccgttctggt tcaaggcagc gccgaggcac agtcggtcgc cgccgcgaag 420
accgtcgcgg tcgaggaaga gtccgcttcc ttggatgcgg ccgcagttga agcggaggtc 480
gcagccgcca cgtcgaaatc gtcggctggc caagcactcc agtccgcaca gaccgccgca 540
tctgctctca gaacttccgc caggagcgcc ttgacggccc tcaagctggc acgcctccaa 600
ggcgcggctt ctagcaacgc tgccaggatg atggaaaagg cgctggccgc cacccaggac 660
gcaaatgccg ccgcccagca agctatggcg gccgagagtg cagccgcaga agcagcggct 720
atcgcggcag cgaaacaatc ggaggcgaga gacgccggcg ccgaggccaa ggccgccatg 780
gcagcactca tcaccgccca gaggaatctc gtgcaggcca atgccagggc ggaaatggca 840
agcgaggaag ccgaattgga ttcgaagtct agagcgtccg acgccaaggt gaacgccgtt 900
gctcgtgcgg cctccaagtc cagcatacgc agagatgaac ttatcgagat cggcgctgag 960
ttcggcaagg ccagcggcga ggtgatttcc accggcacgc gttccaacgg cggtcaagac 1020
gccatcgcca ccgccgaggc atcgagtagc gcgtccgccg tcggcatcaa gaaaacaagc 1080
ggacactggg ggagcggaaa atggagtcgt gtctccaagg gtaaaggatg ggcttcctcg 1140
aatgcggacg ctgacgccag cagcagcagc atcatcatcg gcggtctcaa acgcggcggc 1200
ctcggttcgg aagcctctgc ggcagcttcc gcagaagcgg aagcttccgc cggcacactc 1260
ctgctgtaa 1269
<210> 50
<211> 1179
<212> DNA
<213> Myrmecia forficata
<400> 50
cgggtcatcg agtccagctc gtcggcttcc gcacaggcgt cggcatcggc cggctcgaga 60
ggcctgctcg gtaaacggcc gattggcaag ctcgagtggg gcaaggagga gaagaaactc 120
gaagaactcg acgaggaatc gctcaatgag gccgctctga aggtcggcat caagaacggc 180
ggattggatg tcgcgaaggg cgcggcagtc ctcgaggcag cgatgagcga cgtcgcgacc 240
cttacggatc agcgttctct tgtggatctc ggtctcggcc cggtcgcgaa cgaggccgag 300
atcctggcgg aggcgcaggc cgccacgagc gcccaagctg gcgctgtcgc taatagcgcc 360
gcggagcgtg cgatcgcggc gatggagatg gccgacagaa ccgaatatat tgcggcactt 420
gtcaccacca aagccgccaa agctgccgag gccactatgg ccgctactgc ccgtgccacc 480
gccgccgcct cagcctccaa gatatccagt caggaatcag ccgcatcggc cgctaacgcc 540
gccaacgccg aagccaaggc caacgccgct tccataatcg ctaacaaggc gaacgccgtc 600
ctggctgagg ccgccgccgt actcgcagcc actgctgcca aggccaagga atcggcgatg 660
aaatcgctta gcgccgctca ggccgccgcc aaggcacaag ccaggaacgc cgaggcctcc 720
gccgaagctc agatcaaact ttcccaggcc agggccgccg tggcacgcgc tgcagccgat 780
caggccgtct gttcctccca ggctcaggcc gcaagtcaga tacaatcgag ggcatccgca 840
tccgaatccg cggcatcggc acaatcagag accaacaccg ccgcggccga agcggtcgcc 900
accgctgacg ccgaagcggc cgcgcaagct gaagcgtggg tcatgtcgct gaagaacgat 960
ctgtggctgc atctcaacat gaagggtgag gccaaggccg aaggcgaggc cgtttcgatc 1020
agcaaaggac atcgcggcgg tatcaggtcg ggcagcatct cggaagccag cgccgaggca 1080
agcagcaacg tttccatggg cggacgtcat ggacggaagg acctcgtctc tgaagcgtta 1140
gcgggagcat cagcgggcag cagtgccgac tccctttga 1179
<210> 51
<211> 1236
<212> DNA
<213> Myrmecia forficata
<400> 51
atgaagattc cagcgatact cgtgacgtct ctcctcgcct ggggattagc cagcggccgg 60
gtcatcgagt ccagctcgtc ggcttccgca caggcgtcgg catcggccgg ctcgagaggc 120
ctgctcggta aacggccgat tggcaagctc gagtggggca aggaggagaa gaaactcgaa 180
gaactcgacg aggaatcgct caatgaggcc gctctgaagg tcggcatcaa gaacggcgga 240
ttggatgtcg cgaagggcgc ggcagtcctc gaggcagcga tgagcgacgt cgcgaccctt 300
acggatcagc gttctcttgt ggatctcggt ctcggcccgg tcgcgaacga ggccgagatc 360
ctggcggagg cgcaggccgc cacgagcgcc caagctggcg ctgtcgctaa tagcgccgcg 420
gagcgtgcga tcgcggcgat ggagatggcc gacagaaccg aatatattgc ggcacttgtc 480
accaccaaag ccgccaaagc tgccgaggcc actatggccg ctactgcccg tgccaccgcc 540
gccgcctcag cctccaagat atccagtcag gaatcagccg catcggccgc taacgccgcc 600
aacgccgaag ccaaggccaa cgccgcttcc ataatcgcta acaaggcgaa cgccgtcctg 660
gctgaggccg ccgccgtact cgcagccact gctgccaagg ccaaggaatc ggcgatgaaa 720
tcgcttagcg ccgctcaggc cgccgccaag gcacaagcca ggaacgccga ggcctccgcc 780
gaagctcaga tcaaactttc ccaggccagg gccgccgtgg cacgcgctgc agccgatcag 840
gccgtctgtt cctcccaggc tcaggccgca agtcagatac aatcgagggc atccgcatcc 900
gaatccgcgg catcggcaca atcagagacc aacaccgccg cggccgaagc ggtcgccacc 960
gctgacgccg aagcggccgc gcaagctgaa gcgtgggtca tgtcgctgaa gaacgatctg 1020
tggctgcatc tcaacatgaa gggtgaggcc aaggccgaag gcgaggccgt ttcgatcagc 1080
aaaggacatc gcggcggtat caggtcgggc agcatctcgg aagccagcgc cgaggcaagc 1140
agcaacgttt ccatgggcgg acgtcatgga cggaaggacc tcgtctctga agcgttagcg 1200
ggagcatcag cgggcagcag tgccgactcc ctttga 1236
<210> 52
<211> 1128
<212> DNA
<213> Myrmecia forficata
<400> 52
aatctcctta aggagtcgaa agcttccgcg tccgcgtccg cgtccgcttc cgcgagggcc 60
agcggcaaga agaatcttca cgtgttgcca ttaccgaaga aaagcgagca tggcatcgtg 120
atcgacaagt cggtgttcga catcaaggat gtagtgctga gcgcggtcga cgagatcaac 180
ggcgccccga aactcggcct gggatggaag aaggtcagca tgggggtgga gcgcgccgag 240
gcgaacgcag ccgctgccgc cgaggcattg gcgatgatca agaagattgc catggcccgc 300
agcagtgcat acgtccaggc ggcctgggca tcggcccagg catcagctga cgcattggct 360
agcgccaggg tggcacaggc gtctcaggag gctgcggagg caaagggtag agcggcttcc 420
gaggcgctct ccagagccat cgaagcatcc tcgcgagccg atgcggcagc cgctgcgacg 480
ctggacgcga tggaccgcac catggagaac gcgagggcgg caaatgccgc gcaaacgcag 540
gccagcggcc aagctgagaa cgcaaatcgc agcgctgctg ccatcctcgc agctctgcta 600
cgtatcgcgg aggcatccgc gttgaacaac gaggccgcgg tcaacgcggc cgcggccgca 660
gccgcagcgt ctgcccttca ggccaaggct aacgcggctt ctcaagcaac cgccagagcc 720
gcaggacagg cgtcgacggc cgccgaagag gcgcaatccg cccaagaagc cgccgataag 780
aacgcggagc tgaccacggt catgctcgaa aaggctagtg ctgatcaaca ggcggcatcc 840
gctagggctg actactacac cgcctcaacc gaggccgaag ccgctgcaca ggcgtctgct 900
atcaacgcac tcagggacgg aatagttgtc ggaatgggaa atgacgctgg cgcatcggcc 960
caagcgatgg cacaggtaga agctctcgct cgcgccagcg agcacaaggc gttaggcgag 1020
aagaagaagg gcctggtttg gggctacgga agcaagggca gtagctccgc cagcgcatcc 1080
gccagcgcct ccgccgaagc atcctcgaga ctcggaaagg actggtag 1128
<210> 53
<211> 1185
<212> DNA
<213> Myrmecia forficata
<400> 53
atgaagatac cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggaat 60
ctccttaagg agtcgaaagc ttccgcgtcc gcgtccgcgt ccgcttccgc gagggccagc 120
ggcaagaaga atcttcacgt gttgccatta ccgaagaaaa gcgagcatgg catcgtgatc 180
gacaagtcgg tgttcgacat caaggatgta gtgctgagcg cggtcgacga gatcaacggc 240
gccccgaaac tcggcctggg atggaagaag gtcagcatgg gggtggagcg cgccgaggcg 300
aacgcagccg ctgccgccga ggcattggcg atgatcaaga agattgccat ggcccgcagc 360
agtgcatacg tccaggcggc ctgggcatcg gcccaggcat cagctgacgc attggctagc 420
gccagggtgg cacaggcgtc tcaggaggct gcggaggcaa agggtagagc ggcttccgag 480
gcgctctcca gagccatcga agcatcctcg cgagccgatg cggcagccgc tgcgacgctg 540
gacgcgatgg accgcaccat ggagaacgcg agggcggcaa atgccgcgca aacgcaggcc 600
agcggccaag ctgagaacgc aaatcgcagc gctgctgcca tcctcgcagc tctgctacgt 660
atcgcggagg catccgcgtt gaacaacgag gccgcggtca acgcggccgc ggccgcagcc 720
gcagcgtctg cccttcaggc caaggctaac gcggcttctc aagcaaccgc cagagccgca 780
ggacaggcgt cgacggccgc cgaagaggcg caatccgccc aagaagccgc cgataagaac 840
gcggagctga ccacggtcat gctcgaaaag gctagtgctg atcaacaggc ggcatccgct 900
agggctgact actacaccgc ctcaaccgag gccgaagccg ctgcacaggc gtctgctatc 960
aacgcactca gggacggaat agttgtcgga atgggaaatg acgctggcgc atcggcccaa 1020
gcgatggcac aggtagaagc tctcgctcgc gccagcgagc acaaggcgtt aggcgagaag 1080
aagaagggcc tggtttgggg ctacggaagc aagggcagta gctccgccag cgcatccgcc 1140
agcgcctccg ccgaagcatc ctcgagactc ggaaaggact ggtag 1185
<210> 54
<211> 1269
<212> DNA
<213> Myrmecia forficata
<400> 54
agcgagctcg aatcggaagc gagtgcggcg gcgtctgcgc aagcggaagc gtcctcgtct 60
ggtcgctccg gcaaactgtc cgcgtctcag gcttccgcca gcgcgtccgc cagcgcgtca 120
gccggcagca gaggtggcag caaaggtggc tggggccagc tccgccgtgg tgatgttaag 180
agcgaggcga agagcgccgc cgcgatcgcg gtcgaaggag ctaaaatcgg caccggaatc 240
ggaaataccg cgtccgcatc cgcggaggcg ctctcacgag gactcggcat cggacaggcg 300
gccgcggagg cgcaagccgc agccgcaggt caggcagagg tcgccgcgaa atcgtgcgaa 360
cttgccgaca agaccaccgc caaagcggtc gccatggtcg aagcggcagc cgaggccgaa 420
atcgaggtgg ccaatcagga ggtcgcagcc gtcaaattat cgacttgggc cgctaaagca 480
gcaaggatag tcgaggaaga cagcgccgcc gtgagggcgg ctgccggcaa attgcttttg 540
gccgcgagag ctgccgccgc cgccgagaga cgcgccaacg aggaatccga ggcggccaac 600
gaacttgctc aagcgtcatc tgccgctgcc gccgaggccg aagccaaagc gaacgccggc 660
cgtgaggccg ctgccgctgc cttggctatc gccgaggccg ccgtcgccat cgaacaagaa 720
gccgtcattt tggctcgcaa ggcacaagat gcccgtttga atgctgaagc cgcagccgcc 780
gctgcgatga acgcccgtgt catcgcttcc gccgaatccg aggccagtga agatctggag 840
aatcgcgcta gtgtggcgcg tgccagtgcg gccggtgccg ctgaggcaaa ggctatcgcc 900
accgatgccg gcgccactgc cgagatcgcg gcctacagtt gggccaagaa gggcgaactg 960
atcaaccccg gcccgttgcc gaagatcatc agcgtcaacg ccgatctgtc caagagcgag 1020
gtcgaggcca tgaagatcac ccggggtcaa gtacaggaag tcaagaaaat cagcactcac 1080
aaaggtggct ggggatgggg aaaggaagga aggtcgaagg tatcttccaa cgctagtgcc 1140
agagctagtg ccagcgccaa tgcagccgcc ggtagcctcg gcagcaaatg gggaagacaa 1200
ctatccgcat catccgcgtc ggctgacgcc aacgccgaag ccgacagcca gttgctgaaa 1260
gtgtggtga 1269
<210> 55
<211> 1326
<212> DNA
<213> Myrmecia forficata
<400> 55
atgaagattc cagcgatact tgcgacgtcc ctcctcatct ggggtcttgt cggcgccagc 60
gagctcgaat cggaagcgag tgcggcggcg tctgcgcaag cggaagcgtc ctcgtctggt 120
cgctccggca aactgtccgc gtctcaggct tccgccagcg cgtccgccag cgcgtcagcc 180
ggcagcagag gtggcagcaa aggtggctgg ggccagctcc gccgtggtga tgttaagagc 240
gaggcgaaga gcgccgccgc gatcgcggtc gaaggagcta aaatcggcac cggaatcgga 300
aataccgcgt ccgcatccgc ggaggcgctc tcacgaggac tcggcatcgg acaggcggcc 360
gcggaggcgc aagccgcagc cgcaggtcag gcagaggtcg ccgcgaaatc gtgcgaactt 420
gccgacaaga ccaccgccaa agcggtcgcc atggtcgaag cggcagccga ggccgaaatc 480
gaggtggcca atcaggaggt cgcagccgtc aaattatcga cttgggccgc taaagcagca 540
aggatagtcg aggaagacag cgccgccgtg agggcggctg ccggcaaatt gcttttggcc 600
gcgagagctg ccgccgccgc cgagagacgc gccaacgagg aatccgaggc ggccaacgaa 660
cttgctcaag cgtcatctgc cgctgccgcc gaggccgaag ccaaagcgaa cgccggccgt 720
gaggccgctg ccgctgcctt ggctatcgcc gaggccgccg tcgccatcga acaagaagcc 780
gtcattttgg ctcgcaaggc acaagatgcc cgtttgaatg ctgaagccgc agccgccgct 840
gcgatgaacg cccgtgtcat cgcttccgcc gaatccgagg ccagtgaaga tctggagaat 900
cgcgctagtg tggcgcgtgc cagtgcggcc ggtgccgctg aggcaaaggc tatcgccacc 960
gatgccggcg ccactgccga gatcgcggcc tacagttggg ccaagaaggg cgaactgatc 1020
aaccccggcc cgttgccgaa gatcatcagc gtcaacgccg atctgtccaa gagcgaggtc 1080
gaggccatga agatcacccg gggtcaagta caggaagtca agaaaatcag cactcacaaa 1140
ggtggctggg gatggggaaa ggaaggaagg tcgaaggtat cttccaacgc tagtgccaga 1200
gctagtgcca gcgccaatgc agccgccggt agcctcggca gcaaatgggg aagacaacta 1260
tccgcatcat ccgcgtcggc tgacgccaac gccgaagccg acagccagtt gctgaaagtg 1320
tggtga 1326
<210> 56
<211> 372
<212> PRT
<213> Oecophylla smaragdina
<400> 56
Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser Ala Ser Ala
1 5 10 15
Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val Gly Val Gly
20 25 30
Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala Ser Thr Thr
35 40 45
Ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala Ala Leu Asn
50 55 60
Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu Gln Leu Leu
65 70 75 80
Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu Ala Asp Asp
85 90 95
Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser Val Ala Ala
100 105 110
Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu Asp Ala Ala
115 120 125
Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val Ser Ala Gln
130 135 140
Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile Gln Thr Ala
145 150 155 160
Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys Gln Glu Ala
165 170 175
Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu Ala Leu Ser
180 185 190
Arg Ala Ala Ser Ala Ala Thr Gln Arg Ala Val Ala Ala Gln Asn Ala
195 200 205
Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala Ala Gln Ala Glu Ala Arg
210 215 220
Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu Thr Ala Ala
225 230 235 240
Gln Arg Asn Tyr Ala Ala Ala Lys Ala Ser Ala Ser Ala Gly Ser Val
245 250 255
Val Ala Glu Gln Asp Ala Gln Ser Arg Ala Ala Asp Ala Glu Val Asn
260 265 270
Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn Gln Glu Ile
275 280 285
Val Glu Ile Gly Ala Glu Phe Gly Asn Ala Ser Gly Gly Val Ile Ser
290 295 300
Thr Gly Thr Arg Ser Ser Gly Gly Lys Gly Val Ser Val Thr Ala Gly
305 310 315 320
Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser Ser Ser Ser
325 330 335
Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn Trp Gly Leu
340 345 350
Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser Ser Ala Ser
355 360 365
Ser Tyr Ser Ser
370
<210> 57
<211> 391
<212> PRT
<213> Oecophylla smaragdina
<400> 57
Met Lys Ile Pro Ala Ile Ile Ala Thr Thr Leu Leu Leu Trp Gly Phe
1 5 10 15
Ala Asp Ala Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser
20 25 30
Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val
35 40 45
Gly Val Gly Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala
50 55 60
Ser Thr Thr Ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala
65 70 75 80
Ala Leu Asn Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu
85 90 95
Gln Leu Leu Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu
100 105 110
Ala Asp Asp Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser
115 120 125
Val Ala Ala Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu
130 135 140
Asp Ala Ala Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val
145 150 155 160
Ser Ala Gln Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile
165 170 175
Gln Thr Ala Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys
180 185 190
Gln Glu Ala Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu
195 200 205
Ala Leu Ser Arg Ala Ala Ser Ala Ala Thr Gln Arg Ala Val Ala Ala
210 215 220
Gln Asn Ala Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala Ala Gln Ala
225 230 235 240
Glu Ala Arg Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu
245 250 255
Thr Ala Ala Gln Arg Asn Tyr Ala Ala Ala Lys Ala Ser Ala Ser Ala
260 265 270
Gly Ser Val Val Ala Glu Gln Asp Ala Gln Ser Arg Ala Ala Asp Ala
275 280 285
Glu Val Asn Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn
290 295 300
Gln Glu Ile Val Glu Ile Gly Ala Glu Phe Gly Asn Ala Ser Gly Gly
305 310 315 320
Val Ile Ser Thr Gly Thr Arg Ser Ser Gly Gly Lys Gly Val Ser Val
325 330 335
Thr Ala Gly Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser
340 345 350
Ser Ser Ser Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn
355 360 365
Trp Gly Leu Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser
370 375 380
Ser Ala Ser Ser Tyr Ser Ser
385 390
<210> 58
<211> 381
<212> PRT
<213> Oecophylla smaragdina
<400> 58
Gly Val Ile Gly Pro Asp Thr Ser Ser Ser Ser Gln Ala Ser Ala Ser
1 5 10 15
Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala Ser Ile Gly
20 25 30
Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu Ala Val Gly
35 40 45
Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala Val Val Glu
50 55 60
Ser Ala Ile Ser Asp Val Ser Thr Leu Thr Asp Asp Arg Thr Leu Asn
65 70 75 80
Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala Arg Ala Gln
85 90 95
Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala Leu Ile Lys
100 105 110
Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu Tyr Leu Ala
115 120 125
Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Ala Ala
130 135 140
Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys Val Ser Ser
145 150 155 160
Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala Glu Ala Lys
165 170 175
Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala
180 185 190
Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala Gln Gln Ser
195 200 205
Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys Ala Gln Ala
210 215 220
Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile Ala Glu Ala
225 230 235 240
Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val Cys Thr Ser
245 250 255
Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser Ala Ala Glu
260 265 270
Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala Ala Glu Ala
275 280 285
Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln Ala Trp Ala
290 295 300
Glu Ser Phe Lys Arg Glu Leu Ser Ser Val Val Leu Glu Ala Glu Ala
305 310 315 320
Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser Gly Ser Ser
325 330 335
Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly Ala Ser Ser
340 345 350
Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe Ser Glu Ala
355 360 365
Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala
370 375 380
<210> 59
<211> 400
<212> PRT
<213> Oecophylla smaragdina
<400> 59
Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Ala Trp Gly Leu
1 5 10 15
Ala Ser Gly Gly Val Ile Gly Pro Asp Thr Ser Ser Ser Ser Gln Ala
20 25 30
Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala
35 40 45
Ser Ile Gly Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu
50 55 60
Ala Val Gly Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala
65 70 75 80
Val Val Glu Ser Ala Ile Ser Asp Val Ser Thr Leu Thr Asp Asp Arg
85 90 95
Thr Leu Asn Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala
100 105 110
Arg Ala Gln Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala
115 120 125
Leu Ile Lys Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu
130 135 140
Tyr Leu Ala Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala
145 150 155 160
Thr Ala Ala Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys
165 170 175
Val Ser Ser Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala
180 185 190
Glu Ala Lys Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala
195 200 205
Val Leu Ala Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala
210 215 220
Gln Gln Ser Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys
225 230 235 240
Ala Gln Ala Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile
245 250 255
Ala Glu Ala Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val
260 265 270
Cys Thr Ser Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser
275 280 285
Ala Ala Glu Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala
290 295 300
Ala Glu Ala Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln
305 310 315 320
Ala Trp Ala Glu Ser Phe Lys Arg Glu Leu Ser Ser Val Val Leu Glu
325 330 335
Ala Glu Ala Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser
340 345 350
Gly Ser Ser Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly
355 360 365
Ala Ser Ser Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe
370 375 380
Ser Glu Ala Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala
385 390 395 400
<210> 60
<211> 376
<212> PRT
<213> Oecophylla smaragdina
<400> 60
Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala Ser Ala Ser
1 5 10 15
Ala Ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser Lys Asn Val
20 25 30
His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser
35 40 45
Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp Glu Ile Asn
50 55 60
Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser Leu Ala Leu
65 70 75 80
Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala Leu Ala Ile
85 90 95
Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val Arg Ala Ala
100 105 110
Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr Val Arg Ala
115 120 125
Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg Ala Ala Ala
130 135 140
Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala Asp Ala Ala
145 150 155 160
Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln Asp Ala Arg
165 170 175
Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala Glu Asn Ala
180 185 190
Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser Ile Ala Lys
195 200 205
Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asp Ala Ala Ala
210 215 220
Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn Ala Val Ser
225 230 235 240
Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala Ala Glu Glu
245 250 255
Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln Leu Thr Ala
260 265 270
Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala Ser Ala Ser
275 280 285
Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala Ala Leu Ala
290 295 300
Ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly Leu Gly Asn
305 310 315 320
Thr Ala Ser Ser Ser Ala Gln Ala Ser Ala Gln Ala Ser Ala Leu Ala
325 330 335
Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr Lys Ile Gly
340 345 350
Gly Ala Thr Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Gln
355 360 365
Ser Ser Ser Gln Gly Leu Val Tyr
370 375
<210> 61
<211> 395
<212> PRT
<213> Oecophylla smaragdina
<400> 61
Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu
1 5 10 15
Ala Ser Gly Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala
20 25 30
Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser
35 40 45
Lys Asn Val His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile
50 55 60
Asp Lys Ser Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp
65 70 75 80
Glu Ile Asn Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser
85 90 95
Leu Ala Leu Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala
100 105 110
Leu Ala Ile Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val
115 120 125
Arg Ala Ala Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr
130 135 140
Val Arg Ala Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg
145 150 155 160
Ala Ala Ala Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala
165 170 175
Asp Ala Ala Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln
180 185 190
Asp Ala Arg Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala
195 200 205
Glu Asn Ala Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser
210 215 220
Ile Ala Lys Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asp
225 230 235 240
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn
245 250 255
Ala Val Ser Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala
260 265 270
Ala Glu Glu Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln
275 280 285
Leu Thr Ala Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala
290 295 300
Ser Ala Ser Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala
305 310 315 320
Ala Leu Ala Ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly
325 330 335
Leu Gly Asn Thr Ala Ser Ser Ser Ala Gln Ala Ser Ala Gln Ala Ser
340 345 350
Ala Leu Ala Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr
355 360 365
Lys Ile Gly Gly Ala Thr Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala
370 375 380
Ser Ala Gln Ser Ser Ser Gln Gly Leu Val Tyr
385 390 395
<210> 62
<211> 424
<212> PRT
<213> Oecophylla smaragdina
<400> 62
Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser Ala Glu Ala
1 5 10 15
Ser Ala Ser Ser Ser Ala Tyr Gly Ser Lys Tyr Gly Ile Gly Ser Gly
20 25 30
Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser
35 40 45
Ala Ser Ala Ser Ser Ala Pro Ala Ile Glu Gly Val Asn Val Gly Thr
50 55 60
Gly Val Ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly
65 70 75 80
Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly
85 90 95
Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala Lys Ser Thr
100 105 110
Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala Glu Val Asp
115 120 125
Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala Glu Ala Ala
130 135 140
Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu Arg Gly Ala
145 150 155 160
Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys Ala Gln Glu
165 170 175
Arg Ala Asn Glu Asp Ser Ile Glu Ala Asn Glu Leu Ala Gln Ala Thr
180 185 190
Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala Ala Gln Glu
195 200 205
Ala Gly Ala Ser Ala Leu Ala Ile Ala Gln Ala Ala Leu Asn Ile Glu
210 215 220
Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr Arg Leu Arg
225 230 235 240
Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala Ile Ala Ser
245 250 255
Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala Asn Ala Ala
260 265 270
Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val Ala Thr Glu
275 280 285
Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser Glu Lys Gly
290 295 300
Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val Ser Val Thr Ala
305 310 315 320
Gly Leu Thr Gln Asn Glu Ile Ala Gly Ser Gly Ala Ala Ala Ser Ala
325 330 335
Ser Ala Ser Ala Leu Ala Ser Ala Ser Ala Gly Ala Gly Ala Gly Ala
340 345 350
Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val Ala Gly Ala
355 360 365
Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser Ala Gly Ala
370 375 380
Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln Ser Lys Leu
385 390 395 400
His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala
405 410 415
Glu Ala Asn Ser Ser Ala Tyr Ala
420
<210> 63
<211> 443
<212> PRT
<213> Oecophylla smaragdina
<400> 63
Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Phe Val Trp Gly Leu
1 5 10 15
Val Gly Ala Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser
20 25 30
Ala Glu Ala Ser Ala Ser Ser Ser Ala Tyr Gly Ser Lys Tyr Gly Ile
35 40 45
Gly Ser Gly Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala
50 55 60
Ser Ala Ser Ala Ser Ala Ser Ser Ala Pro Ala Ile Glu Gly Val Asn
65 70 75 80
Val Gly Thr Gly Val Ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu
85 90 95
Ser Arg Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala
100 105 110
Ala Ala Gly Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala
115 120 125
Lys Ser Thr Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala
130 135 140
Glu Val Asp Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala
145 150 155 160
Glu Ala Ala Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu
165 170 175
Arg Gly Ala Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys
180 185 190
Ala Gln Glu Arg Ala Asn Glu Asp Ser Ile Glu Ala Asn Glu Leu Ala
195 200 205
Gln Ala Thr Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala
210 215 220
Ala Gln Glu Ala Gly Ala Ser Ala Leu Ala Ile Ala Gln Ala Ala Leu
225 230 235 240
Asn Ile Glu Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr
245 250 255
Arg Leu Arg Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala
260 265 270
Ile Ala Ser Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala
275 280 285
Asn Ala Ala Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val
290 295 300
Ala Thr Glu Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser
305 310 315 320
Glu Lys Gly Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val Ser
325 330 335
Val Thr Ala Gly Leu Thr Gln Asn Glu Ile Ala Gly Ser Gly Ala Ala
340 345 350
Ala Ser Ala Ser Ala Ser Ala Leu Ala Ser Ala Ser Ala Gly Ala Gly
355 360 365
Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val
370 375 380
Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser
385 390 395 400
Ala Gly Ala Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln
405 410 415
Ser Lys Leu His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser
420 425 430
Ala Glu Ala Glu Ala Asn Ser Ser Ala Tyr Ala
435 440
<210> 64
<211> 1119
<212> DNA
<213> Oecophylla smaragdina
<400> 64
agcaagtcgt acctcttagg ctcatccgcg tctgcttccg cttccgcttc cgcctcggca 60
tcagcgggag gaagcaccgg cggcgtcggc gtcggatctg taatatccgg tggcaacaac 120
atcatcagag gagcttcgac cacatccgtg acattggcag ccgccgcagc ggaggccaag 180
gcagctctga atgctggaaa agcgactgtc gaagagcaaa gggaagcgtt acagttgctc 240
accgcgtccg ctgaaaaaaa cgccgaggcg cgttccttgg ccgacgatgc ggccgttcta 300
gttcagggtg ccgctgaggc gcaatcggtc gccgccgcga agacggtcgc ggtcgagcaa 360
ggatccaact ctctggatgc agctgcagcc gaagcggaag ccgccgccgc cgcatccagg 420
gtatcggccc agcaggcact ccaggccgcg cagacctccg ccgccgctat tcaaaccgct 480
gccggtagcg ccctgacggc tctcaaattg gcacgcaaac aggaagcgga atccaataat 540
gccgccgaac aggcaaataa agcattggcc ttaagtcgcg cagccagcgc tgccactcaa 600
cgagccgtgg cagctcagaa cgcggctgcc gcatcagcgg cttcggctgg agccgcacaa 660
gctgaggcaa ggaacgccta cgccaaagcc aaagcagcga tagctgctct tacggccgcc 720
caaagaaatt acgccgcggc caaggctagc gcaagcgcgg gtagcgtggt ggccgaacaa 780
gatgctcaat ctagagcggc cgatgccgag gtgaacgccg ttgcccaagc cgctgcccga 840
gccagcgttc gcaatcagga gatcgttgaa atcggcgcgg aattcggcaa cgccagcggc 900
ggagtgatct cgaccggcac acgttcttcc ggaggcaagg gtgtctccgt taccgctgga 960
gctcaggcta gcgcgtccgc ttccgcgacc tcctcctcct cctcctcctc cggcatcaac 1020
aaaggacatc ccagatgggg gcacaattgg ggtttaggtt cttcggaagc gtcagcaaac 1080
gctgaagccg aaagcagcgc ttcctcttat tcatcttaa 1119
<210> 65
<211> 1176
<212> DNA
<213> Oecophylla smaragdina
<400> 65
atgaagatcc cagcgataat cgcaacgacc ctccttctct ggggtttcgc cgacgccagc 60
aagtcgtacc tcttaggctc atccgcgtct gcttccgctt ccgcttccgc ctcggcatca 120
gcgggaggaa gcaccggcgg cgtcggcgtc ggatctgtaa tatccggtgg caacaacatc 180
atcagaggag cttcgaccac atccgtgaca ttggcagccg ccgcagcgga ggccaaggca 240
gctctgaatg ctggaaaagc gactgtcgaa gagcaaaggg aagcgttaca gttgctcacc 300
gcgtccgctg aaaaaaacgc cgaggcgcgt tccttggccg acgatgcggc cgttctagtt 360
cagggtgccg ctgaggcgca atcggtcgcc gccgcgaaga cggtcgcggt cgagcaagga 420
tccaactctc tggatgcagc tgcagccgaa gcggaagccg ccgccgccgc atccagggta 480
tcggcccagc aggcactcca ggccgcgcag acctccgccg ccgctattca aaccgctgcc 540
ggtagcgccc tgacggctct caaattggca cgcaaacagg aagcggaatc caataatgcc 600
gccgaacagg caaataaagc attggcctta agtcgcgcag ccagcgctgc cactcaacga 660
gccgtggcag ctcagaacgc ggctgccgca tcagcggctt cggctggagc cgcacaagct 720
gaggcaagga acgcctacgc caaagccaaa gcagcgatag ctgctcttac ggccgcccaa 780
agaaattacg ccgcggccaa ggctagcgca agcgcgggta gcgtggtggc cgaacaagat 840
gctcaatcta gagcggccga tgccgaggtg aacgccgttg cccaagccgc tgcccgagcc 900
agcgttcgca atcaggagat cgttgaaatc ggcgcggaat tcggcaacgc cagcggcgga 960
gtgatctcga ccggcacacg ttcttccgga ggcaagggtg tctccgttac cgctggagct 1020
caggctagcg cgtccgcttc cgcgacctcc tcctcctcct cctcctccgg catcaacaaa 1080
ggacatccca gatgggggca caattggggt ttaggttctt cggaagcgtc agcaaacgct 1140
gaagccgaaa gcagcgcttc ctcttattca tcttaa 1176
<210> 66
<211> 1146
<212> DNA
<213> Oecophylla smaragdina
<400> 66
ggagtcatag gtcccgacac gtcctcatcg tcccaggcat cggcatcggc atcggcgtca 60
gcatcggcgt cggcatcatc gtcggcatcg atcggttaca acgaactcca taaatcgatc 120
aatgcgcccg ccttggcggt cggcgtcaag aacggcggag tggatgtcgc caagggcgcg 180
gccgttgtcg aatcagcgat atccgacgta tcgactctaa ccgatgatcg tacgttgaac 240
ggtctcgcta tcatcgggaa tagcgccgag agtctggcaa gagcacaggc ttcctcgagc 300
gccagcgccg gcgcaaaagc caatgctctc atcaaacaat cgatagcggc tatagagatc 360
accgaaaagg cagagtacct tgcgtcgatc gtcgccacca aggcagcgaa ggccgccgag 420
gccacagcgg ccgcgaccgc tcgcgccact gccgtcgccg aggctgccaa ggtttccagc 480
gagcaattcg cggccgaggc acgcgcggcc gccgacgccg aagccaaggc caacgccgct 540
tccatcatcg ccaacaaagc gaacgccgtc ctcgcggagg cagccaccgg acttagcgcc 600
agcgctggca aagcccaaca atcggcgacc agggcgttgc aagccgcacg agctgccgct 660
aaggctcaag ccgaacttac ccagaaagcc gctcaaatct tagtcctcat tgctgaagcc 720
aaagccgccg tgagccgagc aagcgccgat caatccgtct gtacgtccca ggcacaagcc 780
gccagtcaga ttcaatcgag agcctccgcg gccgaatccg cggcatcggc tcaatcggaa 840
gccaacacca ttgcggccga ggcggtcgct agagctgacg ccgaggcggc cagtcaagct 900
caagcgtggg ccgaatcctt caaacgcgaa ctctcgagtg tcgttttgga ggccgaggcc 960
aatgcctcgg ctagtgcctc ggctggtgcc ctggccagtg gtagcagcag ctcgggcgcg 1020
agttccagcg cggatgccag cgccggagcg agcagctatg gatccttggg cggatatcga 1080
cacggcggaa gcttcagcga ggcatcggca gccgcgtcag cggccagtcg cgccgaggct 1140
gcgtaa 1146
<210> 67
<211> 1203
<212> DNA
<213> Oecophylla smaragdina
<400> 67
atgaagattc cagcgatatt cgtgacgtct ctgctcgcct ggggactcgc cagcggcgga 60
gtcataggtc ccgacacgtc ctcatcgtcc caggcatcgg catcggcatc ggcgtcagca 120
tcggcgtcgg catcatcgtc ggcatcgatc ggttacaacg aactccataa atcgatcaat 180
gcgcccgcct tggcggtcgg cgtcaagaac ggcggagtgg atgtcgccaa gggcgcggcc 240
gttgtcgaat cagcgatatc cgacgtatcg actctaaccg atgatcgtac gttgaacggt 300
ctcgctatca tcgggaatag cgccgagagt ctggcaagag cacaggcttc ctcgagcgcc 360
agcgccggcg caaaagccaa tgctctcatc aaacaatcga tagcggctat agagatcacc 420
gaaaaggcag agtaccttgc gtcgatcgtc gccaccaagg cagcgaaggc cgccgaggcc 480
acagcggccg cgaccgctcg cgccactgcc gtcgccgagg ctgccaaggt ttccagcgag 540
caattcgcgg ccgaggcacg cgcggccgcc gacgccgaag ccaaggccaa cgccgcttcc 600
atcatcgcca acaaagcgaa cgccgtcctc gcggaggcag ccaccggact tagcgccagc 660
gctggcaaag cccaacaatc ggcgaccagg gcgttgcaag ccgcacgagc tgccgctaag 720
gctcaagccg aacttaccca gaaagccgct caaatcttag tcctcattgc tgaagccaaa 780
gccgccgtga gccgagcaag cgccgatcaa tccgtctgta cgtcccaggc acaagccgcc 840
agtcagattc aatcgagagc ctccgcggcc gaatccgcgg catcggctca atcggaagcc 900
aacaccattg cggccgaggc ggtcgctaga gctgacgccg aggcggccag tcaagctcaa 960
gcgtgggccg aatccttcaa acgcgaactc tcgagtgtcg ttttggaggc cgaggccaat 1020
gcctcggcta gtgcctcggc tggtgccctg gccagtggta gcagcagctc gggcgcgagt 1080
tccagcgcgg atgccagcgc cggagcgagc agctatggat ccttgggcgg atatcgacac 1140
ggcggaagct tcagcgaggc atcggcagcc gcgtcagcgg ccagtcgcgc cgaggctgcg 1200
taa 1203
<210> 68
<211> 1131
<212> DNA
<213> Oecophylla smargdina
<400> 68
ggtgtcccta aagagttggg aacttccatt tcttccgcgt ccgcatccgc atccgcatcc 60
gcatccgcga ccgcgtcctc cagtagcaag aatgttcact tattaccatt gaaaagcgag 120
catggcatcg taattgacaa gtcaaaattc aacatcagaa aggtagtgtt gagcgcaatc 180
gatgagatca acggcgcgcc caacatcggt ctgggattga aacaggtcag tttggcgctc 240
gcaaaagccc aggctagtgc tcaatcgagc gccgaggcat tggcaatcat caagaaaatc 300
gtcgcgctcc tcatctcggc ctacgtcaga gcagccgagg ccgcggctcg agcatccgcc 360
gaagctttag ctaccgttag ggctgcggaa caagcgcaaa aaattgctga agcgaagggt 420
agagcggctg ctgaggcgct ctccgagtta gtcgaggcgt cccagaaggc cgatgcggcg 480
gccgcgggaa cgacggacgc gatcgaacgc acctaccagg atgccagagc ggccacttcc 540
gcacagacca aggccagcgg cgaagccgag aatgctaatc gcaatgctgc cgccaccctc 600
gcggcggtct tgagcatcgc taaggccgcc tccggtcaag gaggcactcg agccgctgtc 660
gatgcagctg ctgccgctgc cgccgcagcc gctctgcatg ctaaagctaa cgcggtttcg 720
caagctacca gcaaagcagc cgctgaagct agagtcgcgg ctgaggaggc agcatccgcc 780
caggcatccg cctcagcaag cgcacagctg accgcacaat tagaggagaa agtcagcgcc 840
gatcaacaag cagcctccgc cagtactgat acctccgctg ctatagccga ggctgaagct 900
gccgcgttag cgtccaccgt caacgcgatc aacgacggag tggtcatcgg attaggaaat 960
accgccagtt cttctgccca agcttccgca caggccagtg ctctcgctcg cgcaaaaaat 1020
gcgcgcccta aaataaaggg ctggtacaaa atcggaggcg cgacttccgc ttctgcaagc 1080
gcatcggcca gcgcttccgc ccagtcatcc tcgcaaggac tggtatacta g 1131
<210> 69
<211> 1188
<212> DNA
<213> Oecophylla smaragdina
<400> 69
atgaagattc cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggggt 60
gtccctaaag agttgggaac ttccatttct tccgcgtccg catccgcatc cgcatccgca 120
tccgcgaccg cgtcctccag tagcaagaat gttcacttat taccattgaa aagcgagcat 180
ggcatcgtaa ttgacaagtc aaaattcaac atcagaaagg tagtgttgag cgcaatcgat 240
gagatcaacg gcgcgcccaa catcggtctg ggattgaaac aggtcagttt ggcgctcgca 300
aaagcccagg ctagtgctca atcgagcgcc gaggcattgg caatcatcaa gaaaatcgtc 360
gcgctcctca tctcggccta cgtcagagca gccgaggccg cggctcgagc atccgccgaa 420
gctttagcta ccgttagggc tgcggaacaa gcgcaaaaaa ttgctgaagc gaagggtaga 480
gcggctgctg aggcgctctc cgagttagtc gaggcgtccc agaaggccga tgcggcggcc 540
gcgggaacga cggacgcgat cgaacgcacc taccaggatg ccagagcggc cacttccgca 600
cagaccaagg ccagcggcga agccgagaat gctaatcgca atgctgccgc caccctcgcg 660
gcggtcttga gcatcgctaa ggccgcctcc ggtcaaggag gcactcgagc cgctgtcgat 720
gcagctgctg ccgctgccgc cgcagccgct ctgcatgcta aagctaacgc ggtttcgcaa 780
gctaccagca aagcagccgc tgaagctaga gtcgcggctg aggaggcagc atccgcccag 840
gcatccgcct cagcaagcgc acagctgacc gcacaattag aggagaaagt cagcgccgat 900
caacaagcag cctccgccag tactgatacc tccgctgcta tagccgaggc tgaagctgcc 960
gcgttagcgt ccaccgtcaa cgcgatcaac gacggagtgg tcatcggatt aggaaatacc 1020
gccagttctt ctgcccaagc ttccgcacag gccagtgctc tcgctcgcgc aaaaaatgcg 1080
cgccctaaaa taaagggctg gtacaaaatc ggaggcgcga cttccgcttc tgcaagcgca 1140
tcggccagcg cttccgccca gtcatcctcg caaggactgg tatactag 1188
<210> 70
<211> 1275
<212> DNA
<213> Oecophylla smaragdina
<400> 70
agcgaactcg tcggatcgga cgcgagcgcg acggcatctg ctgaagcgtc agcatcgtca 60
tccgcatacg gtagcaagta tggtattggt agtggtgctg tctccggtgc atcagccagc 120
gcctctgcca gcgcgtctgc tagcgcatca gccagcagtg ctcccgcgat cgaaggagta 180
aacgttggca ccggagtcag taacaccgct tccgcgtccg cagaagctct ctcccgtgga 240
ctcggcatcg gacaagcggc tgccgaagcg caagccgctg ccgctggcca agcggcgatc 300
gctgcgaaat cgtgcgcgct agcggccaag agcaccgctc aagcggttgc cctggttgag 360
aaagtggccc gcgccgaggt agatctggcc gaaagcgcga gaaaggctac aagattatcg 420
gcagaagcag ccaaggcagc ggcggaagtc gagaaggacc tcgtcggtct gagaggggct 480
gccggtaaac tgaatctggc tgcgagagcc ggttctaaag cccaagaacg cgccaacgaa 540
gactctatag aggctaacga acttgcccaa gcaacggccg ccgccggtgc cgaggctgaa 600
gccaaggcga atgccgccca ggaggcaggc gcctccgctt tggccatcgc ccaagccgcc 660
cttaacatcg agcaagagac tgttaaattg acccgccagg cccagaatac tcgtctcaga 720
tctgaaaata ttctcgccgc ggccagcaat gcccgcgcca tcgcttccgc tgaggccgag 780
gccagtagtg atttgaataa tcgtgcgaat gcagcgcgtt ccaatgcccg agctgctgcc 840
gagaccagag ccgtagctac cgaagccgct tctaccgccg agatcgcagc ttatagttca 900
tccgagaaag gcgagatcac caatcccggt cctctgccca agatcgtcag tgttaccgca 960
ggtctgaccc agaacgaaat agcgggatca ggagcggccg ctagtgctag tgccagtgct 1020
cttgccagtg ccagtgccgg tgccggtgcc ggtgcaggtg caggagccgg tgcaagtgca 1080
ggagccggtg cagttgcagg tgcaggagcc ggtgcaggag ccggtgctag tgccggagcg 1140
agtgccggag cgaatgccgg tgccggtgcc agcagtttac tcttgccgca gagtaaactc 1200
catccaatct ccaggtcttc cgcctctgcc tccgcttccg ccgaggccga agctaacagt 1260
tcggcgtatg cgtaa 1275
<210> 71
<211> 1332
<212> DNA
<213> Oecophylla smaragdina
<400> 71
atgaagattc cagcgatact tgcgacgtcc cttttcgtct ggggtcttgt cggcgccagc 60
gaactcgtcg gatcggacgc gagcgcgacg gcatctgctg aagcgtcagc atcgtcatcc 120
gcatacggta gcaagtatgg tattggtagt ggtgctgtct ccggtgcatc agccagcgcc 180
tctgccagcg cgtctgctag cgcatcagcc agcagtgctc ccgcgatcga aggagtaaac 240
gttggcaccg gagtcagtaa caccgcttcc gcgtccgcag aagctctctc ccgtggactc 300
ggcatcggac aagcggctgc cgaagcgcaa gccgctgccg ctggccaagc ggcgatcgct 360
gcgaaatcgt gcgcgctagc ggccaagagc accgctcaag cggttgccct ggttgagaaa 420
gtggcccgcg ccgaggtaga tctggccgaa agcgcgagaa aggctacaag attatcggca 480
gaagcagcca aggcagcggc ggaagtcgag aaggacctcg tcggtctgag aggggctgcc 540
ggtaaactga atctggctgc gagagccggt tctaaagccc aagaacgcgc caacgaagac 600
tctatagagg ctaacgaact tgcccaagca acggccgccg ccggtgccga ggctgaagcc 660
aaggcgaatg ccgcccagga ggcaggcgcc tccgctttgg ccatcgccca agccgccctt 720
aacatcgagc aagagactgt taaattgacc cgccaggccc agaatactcg tctcagatct 780
gaaaatattc tcgccgcggc cagcaatgcc cgcgccatcg cttccgctga ggccgaggcc 840
agtagtgatt tgaataatcg tgcgaatgca gcgcgttcca atgcccgagc tgctgccgag 900
accagagccg tagctaccga agccgcttct accgccgaga tcgcagctta tagttcatcc 960
gagaaaggcg agatcaccaa tcccggtcct ctgcccaaga tcgtcagtgt taccgcaggt 1020
ctgacccaga acgaaatagc gggatcagga gcggccgcta gtgctagtgc cagtgctctt 1080
gccagtgcca gtgccggtgc cggtgccggt gcaggtgcag gagccggtgc aagtgcagga 1140
gccggtgcag ttgcaggtgc aggagccggt gcaggagccg gtgctagtgc cggagcgagt 1200
gccggagcga atgccggtgc cggtgccagc agtttactct tgccgcagag taaactccat 1260
ccaatctcca ggtcttccgc ctctgcctcc gcttccgccg aggccgaagc taacagttcg 1320
gcgtatgcgt aa 1332
<210> 72
<211> 562
<212> PRT
<213> Mallada signata
<400> 72
Ala Val Leu Ile Ser Gly Ser Ala Ala Gly Ala Ser Ser His Asn Ala
1 5 10 15
Ala Gly Ala Ala Ala Ala Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala
20 25 30
Ala Gly Leu Gly Ala Ala Ser Gly Ala Ala Arg Arg Asn Val Ala Val
35 40 45
Gly Ala Asn Gly Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg
50 55 60
Arg Ala Gly Ala Ile Gly Leu Asn Gly Ala Ala Gly Ala Asn Val Ala
65 70 75 80
Val Ala Gly Gly Lys Lys Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala
85 90 95
Gly Ala Ser Leu Val Ser Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly
100 105 110
Leu Asn Gly Ala Ala Gly Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys
115 120 125
Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala Asn Val Gly Ala
130 135 140
Ala Ala Ala Lys Lys Asn Gly Ala Ile Gly Leu Asn Ser Ala Ala Ser
145 150 155 160
Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu
165 170 175
Asn Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser
180 185 190
Gly Ala Val Gly Leu Asn Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala
195 200 205
Ala Ala Lys Lys Ser Gly Ala Val Ala Ala Asn Ser Ala Ala Ser Ala
210 215 220
Asn Ala Ala Ala Ala Ala Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn
225 230 235 240
Ala Ala Ala Ser Glu Ser Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala
245 250 255
Ala Val Ala Glu Asn Ala Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu
260 265 270
Arg Lys Asn Ala Leu Ala Ile Ala Ser Asp Ala Ala Ala Val Arg Ala
275 280 285
Asp Ala Ala Ala Ala Ala Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala
290 295 300
Ala Ser Arg Gly Ser Asp Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr
305 310 315 320
Leu Ala Ser Asp Ala Ala Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala
325 330 335
Ser Asp Ala Ala Thr Asp Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn
340 345 350
Ala Ala Thr Ala Arg Ala Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala
355 360 365
Thr Asp Ala Asp Asn Ala Ala Ser Lys Ala Ser Asp Val Ser Ala Ile
370 375 380
Glu Ala Asp Asn Ala Ala Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr
385 390 395 400
Asn Arg Ala Ala Glu Ala Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala
405 410 415
Ala Ala Asn Ala Ala Asp Ala Ala Ala Gln Cys Asn Asn Lys Val Ala
420 425 430
Arg Val Ser Asp Ala Leu Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly
435 440 445
Ser Asp Ala Ala Ala Glu Ala Gln Asp Ala Val Ala Arg Ala Ser Asp
450 455 460
Ala Ala Ala Ala Gln Ala Asp Gly Val Ala Ile Ala Val Asn Gly Ala
465 470 475 480
Thr Ala Arg Asp Ser Ala Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala
485 490 495
Gln Ala Lys Ala Ala Gly Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg
500 505 510
Ala Gly Ala Ala Arg Gly Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala
515 520 525
Gly Gly Leu Ala Ala Gly Ser Asn Ala Gly Ile Ala Ala Gly Ala Ala
530 535 540
Ser Gly Leu Ala Arg Gly Ala Ala Ala Glu Val Cys Ala Ala Arg Ile
545 550 555 560
Ala Leu
<210> 73
<211> 588
<212> PRT
<213> Mallada signata
<400> 73
Met Ala Ala Ser Asn Lys Ile Ile Phe Ser Phe Leu Ala Ile Val Leu
1 5 10 15
Leu Gln Leu Ala Thr His Cys Ser Ser Thr Ala Val Leu Ile Ser Gly
20 25 30
Ser Ala Ala Gly Ala Ser Ser His Asn Ala Ala Gly Ala Ala Ala Ala
35 40 45
Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala Ala Gly Leu Gly Ala Ala
50 55 60
Ser Gly Ala Ala Arg Arg Asn Val Ala Val Gly Ala Asn Gly Ala Ala
65 70 75 80
Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg Arg Ala Gly Ala Ile Gly
85 90 95
Leu Asn Gly Ala Ala Gly Ala Asn Val Ala Val Ala Gly Gly Lys Lys
100 105 110
Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala Gly Ala Ser Leu Val Ser
115 120 125
Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly Leu Asn Gly Ala Ala Gly
130 135 140
Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys Gly Gly Ala Ile Gly Leu
145 150 155 160
Asn Ala Gly Ala Ser Ala Asn Val Gly Ala Ala Ala Ala Lys Lys Asn
165 170 175
Gly Ala Ile Gly Leu Asn Ser Ala Ala Ser Ala Asn Ala Ala Ala Ala
180 185 190
Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala
195 200 205
Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly Ala Val Gly Leu Asn
210 215 220
Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly
225 230 235 240
Ala Val Ala Ala Asn Ser Ala Ala Ser Ala Asn Ala Ala Ala Ala Ala
245 250 255
Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn Ala Ala Ala Ser Glu Ser
260 265 270
Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala Ala Val Ala Glu Asn Ala
275 280 285
Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu Arg Lys Asn Ala Leu Ala
290 295 300
Ile Ala Ser Asp Ala Ala Ala Val Arg Ala Asp Ala Ala Ala Ala Ala
305 310 315 320
Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala Ala Ser Arg Gly Ser Asp
325 330 335
Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr Leu Ala Ser Asp Ala Ala
340 345 350
Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala Ser Asp Ala Ala Thr Asp
355 360 365
Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn Ala Ala Thr Ala Arg Ala
370 375 380
Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala Thr Asp Ala Asp Asn Ala
385 390 395 400
Ala Ser Lys Ala Ser Asp Val Ser Ala Ile Glu Ala Asp Asn Ala Ala
405 410 415
Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr Asn Arg Ala Ala Glu Ala
420 425 430
Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala Ala Ala Asn Ala Ala Asp
435 440 445
Ala Ala Ala Gln Cys Asn Asn Lys Val Ala Arg Val Ser Asp Ala Leu
450 455 460
Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly Ser Asp Ala Ala Ala Glu
465 470 475 480
Ala Gln Asp Ala Val Ala Arg Ala Ser Asp Ala Ala Ala Ala Gln Ala
485 490 495
Asp Gly Val Ala Ile Ala Val Asn Gly Ala Thr Ala Arg Asp Ser Ala
500 505 510
Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala Gln Ala Lys Ala Ala Gly
515 520 525
Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg Ala Gly Ala Ala Arg Gly
530 535 540
Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala Gly Gly Leu Ala Ala Gly
545 550 555 560
Ser Asn Ala Gly Ile Ala Ala Gly Ala Ala Ser Gly Leu Ala Arg Gly
565 570 575
Ala Ala Ala Glu Val Cys Ala Ala Arg Ile Ala Leu
580 585
<210> 74
<211> 1689
<212> DNA
<213> Mallada signata
<400> 74
gctgtattga tttctggttc ggctgctggt gcttcctcac acaatgctgc tggtgcagct 60
gcagcagcca gagctgcctt aggcgcttct ggggctgcag gtttaggtgc tgcatctggt 120
gctgcaagaa gaaacgtagc agttggtgct aacggtgccg ccgccgctag tgctgcagct 180
gcagctgcca gacgagctgg cgctattggc ctaaatggag cagctggagc taatgtagct 240
gtcgctggtg gcaaaaaagg aggtgctgct ggattaaatg ctggcgctgg tgcttcttta 300
gtatctgcag ctgcaagacg aaatggagcc cttggactta acggtgcagc tggagcaaat 360
ctcgcagcag ctggtggcaa aaaaggaggt gctattggat taaacgctgg agcatcagcc 420
aatgttggtg ccgctgctgc caagaaaaat ggagccatag gacttaactc agctgcttca 480
gctaatgctg ccgctgccgc tgctaaaaaa ggtggagcca ttggattgaa tgctggagct 540
tcagcaaatg ctgctgctgc cgctgccaag aagagtggag ctgttggatt aaatgctgga 600
gcttctgcta acgctgctgc tgctgctgcc aagaaaagtg gagctgttgc tgccaattcc 660
gctgcttcag caaatgcagc tgctgctgca caaaagaaag ccgctgctga tgccgcaaat 720
gctgctgctt ctgaaagtgc tgctgctgct gcagccaaga aagccgccgc tgttgctgaa 780
aatgcagctg ccaccgccaa tgccgcttca gctttacgta aaaatgcatt agccattgcc 840
agtgatgcag cagctgtccg tgctgatgcc gctgccgccg ccgctgacga tgctgctaaa 900
gctaacaacg ctgcttcccg tggaagtgat ggtttaactg cccgcgccaa tgccgccact 960
ttagccagtg atgctgcccg tagagctagc aatgcagcaa cagctgccag cgatgctgcc 1020
actgaccgat tgaacgccgc caccgctgct agcaacgctg ccactgctcg tgcaaatgcc 1080
gccacacgtg ccgatgatgc cgccactgat gccgacaatg ctgcttcaaa ggccagtgat 1140
gtatcagcta ttgaagccga caacgctgca cgagctgctg atgctgatgc tatcgctacc 1200
aaccgtgccg ctgaagcaag cgatgctgct gctattgccg ctgatgccgc tgccaatgct 1260
gctgatgccg ctgcccaatg taataacaaa gttgcccgag taagtgatgc cttagctctc 1320
gccgctaatg ctgctgcccg aggatctgat gccgccgctg aagctcaaga tgctgttgcc 1380
agagcaagtg acgctgccgc tgcccaagct gatggtgttg ccattgccgt aaatggagct 1440
actgcgagag actcagcaat tgaagccgct gctactgctg gagctgccca agctaaagcc 1500
gctggacgtg ctggagctgc tgcagctggt ttaagagctg gtgccgctag aggtgctgcc 1560
gctggtagtg cccgcggtct agctggagga ttagctgcag gttccaatgc tggaatcgcg 1620
gctggtgcag cttctggatt agcaagaggc gcagctgctg aagtttgcgc agctagaata 1680
gcattgtaa 1689
<210> 75
<211> 1767
<212> DNA
<213> Mallada signata
<400> 75
atggcagcgt cgaacaaaat catcttcagc tttttagcta ttgttctatt acaacttgcc 60
acacactgtt catcaacagc tgtattgatt tctggttcgg ctgctggtgc ttcctcacac 120
aatgctgctg gtgcagctgc agcagccaga gctgccttag gcgcttctgg ggctgcaggt 180
ttaggtgctg catctggtgc tgcaagaaga aacgtagcag ttggtgctaa cggtgccgcc 240
gccgctagtg ctgcagctgc agctgccaga cgagctggcg ctattggcct aaatggagca 300
gctggagcta atgtagctgt cgctggtggc aaaaaaggag gtgctgctgg attaaatgct 360
ggcgctggtg cttctttagt atctgcagct gcaagacgaa atggagccct tggacttaac 420
ggtgcagctg gagcaaatct cgcagcagct ggtggcaaaa aaggaggtgc tattggatta 480
aacgctggag catcagccaa tgttggtgcc gctgctgcca agaaaaatgg agccatagga 540
cttaactcag ctgcttcagc taatgctgcc gctgccgctg ctaaaaaagg tggagccatt 600
ggattgaatg ctggagcttc agcaaatgct gctgctgccg ctgccaagaa gagtggagct 660
gttggattaa atgctggagc ttctgctaac gctgctgctg ctgctgccaa gaaaagtgga 720
gctgttgctg ccaattccgc tgcttcagca aatgcagctg ctgctgcaca aaagaaagcc 780
gctgctgatg ccgcaaatgc tgctgcttct gaaagtgctg ctgctgctgc agccaagaaa 840
gccgccgctg ttgctgaaaa tgcagctgcc accgccaatg ccgcttcagc tttacgtaaa 900
aatgcattag ccattgccag tgatgcagca gctgtccgtg ctgatgccgc tgccgccgcc 960
gctgacgatg ctgctaaagc taacaacgct gcttcccgtg gaagtgatgg tttaactgcc 1020
cgcgccaatg ccgccacttt agccagtgat gctgcccgta gagctagcaa tgcagcaaca 1080
gctgccagcg atgctgccac tgaccgattg aacgccgcca ccgctgctag caacgctgcc 1140
actgctcgtg caaatgccgc cacacgtgcc gatgatgccg ccactgatgc cgacaatgct 1200
gcttcaaagg ccagtgatgt atcagctatt gaagccgaca acgctgcacg agctgctgat 1260
gctgatgcta tcgctaccaa ccgtgccgct gaagcaagcg atgctgctgc tattgccgct 1320
gatgccgctg ccaatgctgc tgatgccgct gcccaatgta ataacaaagt tgcccgagta 1380
agtgatgcct tagctctcgc cgctaatgct gctgcccgag gatctgatgc cgccgctgaa 1440
gctcaagatg ctgttgccag agcaagtgac gctgccgctg cccaagctga tggtgttgcc 1500
attgccgtaa atggagctac tgcgagagac tcagcaattg aagccgctgc tactgctgga 1560
gctgcccaag ctaaagccgc tggacgtgct ggagctgctg cagctggttt aagagctggt 1620
gccgctagag gtgctgccgc tggtagtgcc cgcggtctag ctggaggatt agctgcaggt 1680
tccaatgctg gaatcgcggc tggtgcagct tctggattag caagaggcgc agctgctgaa 1740
gtttgcgcag ctagaatagc attgtaa 1767
<210> 76
<211> 975
<212> DNA
<213> Artificial
<220>
<223> Honeybee silk protein (Xenospira4) open reading frame optimized
for plant expression (before sub-cloned into pET14b and pVEC8)
<400> 76
atggctagag aagaggttga gactagggat aagactaaga cttctactgt ggtgaagtct 60
gagaaggttg aagttgtggc tccagctaag gatgagctta agttgacttc tgagccaatt 120
ttcggaagaa gagtgggaac tggagcttct gaagtggctt cttctagtgg agaggctatt 180
gctatttctc ttggagctgg acaatcagca gcagagtctc aagctcttgc tgcttctcag 240
tctaagactg ctgctaacgc tgctattggt gcttctgagc ttactaacaa ggtggcagct 300
cttgttgctg gtgctactgg tgctcaagct agagctactg ctgcttcttc ttctgctctt 360
aaggcttctc ttgctactga agaggctgct gaagaagctg aagctgctgt tgcagatgct 420
aaagcagctg ctgagaaggc tgagtctctt gctaagaacc ttgcttctgc tagtgctaga 480
gctgctcttt cttctgagag ggctaatgag cttgctcagg ctgaaagtgc tgcagctgct 540
gaagctcaag ctaagaccgc tgctgctgcc aaagcagctg agattgctct taaggtggca 600
gagattgctg taaaagctga ggcagatgct gccgccgcag ccgtggcagc tgcaaaagct 660
agagctgtgg ctgatgcagc agccgccagg gctgctgctg ttaacgctat tgctaaggct 720
gaagaagagg cttcagctca agctgagaac gcagctggtg ttcttcaagc agctgcaagt 780
gctgctgctg agtcaagagc agcagcagcc gctgccgcag ctacttctga agcagcagct 840
gaagcaggac cacttgctgg tgaaatgaag ccaccacatt ggaagtggga gaggattcca 900
gtgaagaaag aagagtggaa aacttctaca aaagaggaat ggaaaactac taacgaagag 960
tgggaggtga agtga 975
<210> 77
<211> 324
<212> PRT
<213> Artificial
<220>
<223> Honeybee silk protein (Xenospira4) encoded by open reading frame
optimized for plant expression (without translational fusion)
<400> 77
Met Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr Ser Thr
1 5 10 15
Val Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys Asp Glu
20 25 30
Leu Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly Thr Gly
35 40 45
Ala Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile Ser Leu
50 55 60
Gly Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala Ser Gln
65 70 75 80
Ser Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu Thr Asn
85 90 95
Lys Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala Arg Ala
100 105 110
Thr Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr Glu Glu
115 120 125
Ala Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala Ala Ala
130 135 140
Glu Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser Ala Arg
145 150 155 160
Ala Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala Glu Ser
165 170 175
Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala
180 185 190
Ala Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala
195 200 205
Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala
210 215 220
Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala
225 230 235 240
Glu Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val Leu Gln
245 250 255
Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala
260 265 270
Ala Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu
275 280 285
Met Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys Lys Glu
290 295 300
Glu Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu
305 310 315 320
Trp Glu Val Lys
Claims (45)
- 적어도 일부가 꼬인 코일 구조를 갖는, 실질적으로 정제된 실크 폴리펩티드 및/또는 재조합 실크 폴리펩티드.
- 제1항에 있어서, 상기 꼬인 코일 구조를 갖는 폴리펩티드의 일부가 헵타드(heptad) 서열 abcdefg를 10 카피 이상 포함하며, 위치 a 및 d에 있는 아미노산 중 25% 이상이 알라닌 잔기인 폴리펩티드.
- 제1항에 있어서, 상기 꼬인 코일 구조를 갖는 폴리펩티드의 일부가 헵타드 서열 abcdefg를 10 카피 이상 포함하며, 위치 a, d 및 e에 있는 아미노산 중 25% 이상이 알라닌 잔기인 폴리펩티드.
- 제1항 내지 제3항 중 어느 한 항에 있어서,i) 서열 번호 1, 서열 번호 2, 서열 번호 22, 서열 번호 23, 서열 번호 40, 서열 번호 41, 서열 번호 56 및 서열 번호 57 중 어느 하나에 제시된 아미노산 서열;ii) 서열 번호 1, 서열 번호 2, 서열 번호 22, 서열 번호 23, 서열 번호 40, 서열 번호 41, 서열 번호 56 및 서열 번호 57 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함하는 폴리펩티드.
- 제1항 내지 제3항 중 어느 한 항에 있어서,i) 서열 번호 3, 서열 번호 4, 서열 번호 24, 서열 번호 25, 서열 번호 42, 서열 번호 43, 서열 번호 58 및 서열 번호 59 중 어느 하나에 제시된 아미노산 서열;ii) 서열 번호 3, 서열 번호 4, 서열 번호 24, 서열 번호 25, 서열 번호 42, 서열 번호 43, 서열 번호 58 및 서열 번호 59 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함하는 폴리펩티드.
- 제1항 내지 제3항 중 어느 한 항에 있어서,i) 서열 번호 5, 서열 번호 6, 서열 번호 26, 서열 번호 27, 서열 번호 44, 서열 번호 45, 서열 번호 60 및 서열 번호 61 중 어느 하나에 제시된 아미노산 서열;ii) 서열 번호 5, 서열 번호 6, 서열 번호 26, 서열 번호 27, 서열 번호 44, 서열 번호 45, 서열 번호 60 및 서열 번호 61 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함하는 폴리펩티드.
- 제1항 내지 제3항 중 어느 한 항에 있어서,i) 서열 번호 7, 서열 번호 8, 서열 번호 28, 서열 번호 29, 서열 번호 46, 서열 번호 47, 서열 번호 62 및 서열 번호 63 중 어느 하나에 제시된 아미노산 서열;ii) 서열 번호 7, 서열 번호 8, 서열 번호 28, 서열 번호 29, 서열 번호 46, 서열 번호 47, 서열 번호 62 및 서열 번호 63 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함하는 폴리펩티드.
- 제1항 내지 제3항 중 어느 한 항에 있어서,i) 서열 번호 72 또는 서열 번호 73에 제시된 아미노산 서열;ii) 서열 번호 72 및/또는 서열 번호 73에 30% 이상 일치하는 아미노산 서열; 및iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함하는 폴리펩티드.
- i) 서열 번호 9, 서열 번호 10 및 서열 번호 30 중 어느 하나에 제시된 아미노산 서열;ii) 서열 번호 9, 서열 번호 10 및 서열 번호 30 중 어느 하나 이상에 30% 이상 일치하는 아미노산 서열; 및iii) i) 또는 ii)의 생물학적 활성 단편으로부터 선택되는 서열을 포함하는, 실질적으로 정제된 실크 폴리펩티드 및/또는 재조합 실크 폴리펩티드.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 벌목(Hymenoptera) 또는 풀잠자리목(Neuroptera) 종으로부터 정제될 수 있는 폴리펩티드.
- 제10항에 있어서, 상기 벌목 종이 아피스 멜리페라(Apis mellifera), 오에코필라 스마라그디나(Oecophylla smaragdina), 미르메시아 포리카타(Myrmecia foricata) 또는 봄부스 테레스트리스(Bombus terrestris)인 폴리펩티드.
- 제10항에 있어서, 상기 풀잠자리목 종이 말라다 시그나타(Mallada signata)인 폴리펩티드.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 1종 이상의 다른 폴리펩티드에 융합되어 있는 폴리펩티드.
- 적어도 일부가 꼬인 코일 구조를 갖는, 실크 폴리펩티드를 코딩하는 단리된 폴리뉴클레오티드 및/또는 외인성 폴리뉴클레오티드.
- 제14항에 있어서,i) 서열 번호 11, 서열 번호 12, 서열 번호 31, 서열 번호 32, 서열 번호 48, 서열 번호 49, 서열 번호 64 및 서열 번호 65 중 어느 하나에 제시된 뉴클레오티드 서열;ii) 제1항 내지 제4항 또는 제10항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;iii) 서열 번호 11, 서열 번호 12, 서열 번호 31, 서열 번호 32, 서열 번호 48, 서열 번호 49, 서열 번호 64 및 서열 번호 65 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함하는 폴리뉴클레오티드.
- 제14항에 있어서,i) 서열 번호 13, 서열 번호 14, 서열 번호 33, 서열 번호 34, 서열 번호 50, 서열 번호 51, 서열 번호 66 및 서열 번호 67 중 어느 하나에 제시된 뉴클레오티드 서열;ii) 제1항 내지 제3항, 제5항 또는 제10항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;iii) 서열 번호 13, 서열 번호 14, 서열 번호 33, 서열 번호 34, 서열 번호 50, 서열 번호 51, 서열 번호 66 및 서열 번호 67 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함하는 폴리뉴클레오티드.
- 제14항에 있어서,i) 서열 번호 15, 서열 번호 16, 서열 번호 35, 서열 번호 36, 서열 번호 52, 서열 번호 53, 서열 번호 68 및 서열 번호 69 중 어느 하나에 제시된 뉴클레오티드 서열;ii) 제1항 내지 제3항, 제6항 또는 제10항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;iii) 서열 번호 15, 서열 번호 16, 서열 번호 35, 서열 번호 36, 서열 번호 52, 서열 번호 53, 서열 번호 68 및 서열 번호 69 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함하는 폴리뉴클레오티드.
- 제14항에 있어서,i) 서열 번호 17, 서열 번호 18, 서열 번호 37, 서열 번호 38, 서열 번호 54, 서열 번호 55, 서열 번호 70, 서열 번호 71 및 서열 번호 76 중 어느 하나에 제시된 뉴클레오티드 서열;ii) 제1항 내지 제3항, 제7항 또는 제10항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;iii) 서열 번호 17, 서열 번호 18, 서열 번호 37, 서열 번호 38, 서열 번호 54, 서열 번호 55, 서열 번호 70, 서열 번호 71 및 서열 번호 76 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함하는 폴리뉴클레오티드.
- 제14항에 있어서,i) 서열 번호 74 또는 서열 번호 75에 제시된 뉴클레오티드 서열;ii) 제1항 내지 제3항, 제8항 또는 제10항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;iii) 서열 번호 74 및/또는 서열 번호 75에 30% 이상 일치하는 뉴클레오티드 서열; 및iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함하는 폴리뉴클레오티드.
- i) 서열 번호 19, 서열 번호 20, 서열 번호 21 및 서열 번호 39 중 어느 하나에 제시된 뉴클레오티드 서열;ii) 제1항 내지 제3항 또는 제9항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 코딩하는 뉴클레오티드 서열;iii) 서열 번호 19, 서열 번호 20, 서열 번호 21 및 서열 번호 39 중 어느 하나 이상에 30% 이상 일치하는 뉴클레오티드 서열; 및iv) 엄격한 조건하에서 i) 내지 iii) 중 어느 하나에 혼성화하는 서열로부터 선택되는 서열을 포함하는, 단리된 폴리뉴클레오티드 및/또는 외인성 폴리뉴클레오티드.
- 제14항 내지 제20항 중 어느 한 항에 따른 폴리뉴클레오티드 1종 이상을 포함하는 벡터.
- 제21항에 있어서, 발현 벡터인 벡터.
- 제14항 내지 제20항 중 어느 한 항에 따른 폴리뉴클레오티드 1종 이상 및/또는 제21항 또는 제22항의 벡터 1종 이상을 포함하는 숙주 세포.
- 제23항에 있어서, 박테리아, 효모 또는 식물 세포인 숙주 세포.
- 제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드를 제조하는 방법으로서, 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드가 발현될 수 있도록 하는 조건하에서 제23항 또는 제24항에 따른 숙주 세포, 또는 제22항의 벡터를 배양하는 단계 및 발현된 폴리펩티드를 회수하는 단계를 포함하는 방법.
- 제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상을 코딩하는 외인성 폴리뉴클레오티드를 포함하는 트랜스제닉(transgenic) 식물.
- 제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상을 코딩하는 외인성 폴리뉴클레오티드를 포함하는, 인간을 제외한 트랜스제닉 동물.
- 제1항 내지 제12항 중 어느 한 항에 따른 폴리펩티드에 특이적으로 결합하는 항체.
- 제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상을 포함하는 실크 섬유.
- 제29항에 있어서, 상기 폴리펩티드 중 적어도 일부가 가교 결합된 것인 섬유.
- 제30항에 있어서, 상기 폴리펩티드의 리신 잔기 중 적어도 일부가 가교 결합된 것인 섬유.
- 제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 2종 이상을 포함하는 공중합체.
- 제32항에 있어서, 제4항의 폴리펩티드, 제5항의 폴리펩티드, 제6항의 폴리펩티드 및 제7항의 폴리펩티드를 포함하는 공중합체.
- 제33항에 있어서, 제9항의 폴리펩티드를 추가로 포함하는 공중합체.
- 제33항 또는 제34항에 있어서, 상기 폴리펩티드 중 적어도 일부가 가교 결합된 것인 공중합체.
- 제35항에 있어서, 상기 폴리펩티드의 리신 잔기 중 적어도 일부가 가교 결합된 것인 공중합체.
- 제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상, 제29항 내지 제31항 중 어느 한 항에 따른 실크 섬유 및/또는 제32항 내지 제36항 중 어느 한 항에 따른 공중합체를 포함하는 제품.
- 제37항에 있어서, 개인 관리 제품, 직물, 플라스틱 및 생체 의학 제품으로 구성된 군으로부터 선택되는 제품.
- 제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상, 제29항 내지 제31항 중 어느 한 항에 따른 실크 섬유 및/또는 제32항 내지 제36항 중 어느 한 항에 따른 공중합체 및 1종 이상의 허용 가능한 담체를 포함하는 조성물.
- 제39항에 있어서, 약물을 추가로 포함하는 조성물.
- 제39항에 있어서, 의약, 의료 장치 또는 미용화장품(cosmetic)으로서 사용하기 위한 조성물.
- 제14항 내지 제20항 중 어느 한 항에 따른 폴리뉴클레오티드 1종 이상 및 허용 가능한 담체 1종 이상을 포함하는 조성물.
- 질병 치료 또는 예방용 약물 및 약제학적으로 허용 가능한 담체를 포함하는 조성물을 투여하는 단계를 포함하는 질병을 치료 또는 예방하는 방법으로서, 상기 약제학적으로 허용 가능한 담체는 제1항 내지 제13항 중 어느 한 항에 따른 폴리펩 티드 1종 이상, 제29항 내지 제31항 중 어느 한 항에 따른 실크 섬유 및/또는 제32항 내지 제36항 중 어느 한 항에 따른 공중합체로부터 선택되는 것인 방법.
- 질병 치료 또는 예방용 약제의 제조를 위한, 제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상, 제29항 내지 제31항 중 어느 한 항에 따른 실크 섬유 및/또는 제32항 내지 제36항 중 어느 한 항에 따른 공중합체 및 약물의 용도.
- 제1항 내지 제13항 중 어느 한 항에 따른 폴리펩티드 1종 이상, 제14항 내지 제20항 중 어느 한 항에 따른 폴리뉴클레오티드 1종 이상, 제21항 또는 제22항의 벡터 1종 이상, 제29항 내지 제31항 중 어느 한 항에 따른 실크 섬유 1종 이상 및/또는 제32항 내지 제36항 중 어느 한 항에 따른 공중합체를 포함하는 키트.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US72376605P | 2005-10-05 | 2005-10-05 | |
US60/723,766 | 2005-10-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20080056255A true KR20080056255A (ko) | 2008-06-20 |
Family
ID=37905912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087010225A KR20080056255A (ko) | 2005-10-05 | 2006-10-04 | 실크 단백질 |
Country Status (15)
Country | Link |
---|---|
US (4) | US9409959B2 (ko) |
EP (2) | EP1931702B1 (ko) |
JP (2) | JP5748392B2 (ko) |
KR (1) | KR20080056255A (ko) |
CN (1) | CN101321777B (ko) |
AU (1) | AU2006299740B2 (ko) |
BR (1) | BRPI0616894B8 (ko) |
CA (1) | CA2624667C (ko) |
DK (1) | DK1931702T3 (ko) |
ES (1) | ES2403733T3 (ko) |
HK (1) | HK1119718A1 (ko) |
NZ (1) | NZ567202A (ko) |
RU (1) | RU2467015C2 (ko) |
WO (1) | WO2007038837A1 (ko) |
ZA (1) | ZA200803178B (ko) |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6358101A (ja) * | 1986-08-29 | 1988-03-12 | Hitachi Ltd | 位置検出装置 |
ES2638301T3 (es) | 2004-05-14 | 2017-10-19 | Ethicon Llc | Dispositivos de sutura |
ES2403733T3 (es) | 2005-10-05 | 2013-05-21 | Commonwealth Scientific And Industrial Research Organisation | Proteínas de seda |
JP2010509645A (ja) | 2006-11-03 | 2010-03-25 | トラスティーズ オブ タフツ カレッジ | ナノパターンが形成されたバイオポリマー光学デバイスおよびその製造方法 |
EP2101975A2 (en) * | 2006-11-03 | 2009-09-23 | Trustees of Tufts College | Biopolymer sensor and method of manufacturing the same |
CA2704304C (en) | 2006-11-03 | 2015-01-13 | Trustees Of Trufts College | Biopolymer optical waveguide and method of manufacturing the same |
US20080255612A1 (en) | 2007-04-13 | 2008-10-16 | Angiotech Pharmaceuticals, Inc. | Self-retaining systems for surgical procedures |
US20110177997A1 (en) * | 2007-08-06 | 2011-07-21 | Sutherland Tara D | Cross-Beta Silk Genes |
EP2197501B8 (en) | 2007-09-27 | 2012-10-03 | Ethicon, LLC | Self-retaining sutures including tissue retainers having improved strength |
WO2009070233A1 (en) * | 2007-11-26 | 2009-06-04 | Waters Technologies Corporation | Internal standards and methods for use in quantitatively measuring analytes in a sample |
WO2009086172A2 (en) | 2007-12-19 | 2009-07-09 | Angiotech Pharmaceuticals, Inc. | Self-retaining sutures with heat-contact mediated retainers |
US8916077B1 (en) | 2007-12-19 | 2014-12-23 | Ethicon, Inc. | Self-retaining sutures with retainers formed from molten material |
US8118834B1 (en) | 2007-12-20 | 2012-02-21 | Angiotech Pharmaceuticals, Inc. | Composite self-retaining sutures and method |
EP2242430B1 (en) | 2008-01-30 | 2016-08-17 | Ethicon, LLC | Apparatus and method for forming self-retaining sutures |
WO2009105663A2 (en) | 2008-02-21 | 2009-08-27 | Angiotech Pharmaceuticals, Inc. | Method and apparatus for elevating retainers on self-retaining sutures |
US8641732B1 (en) | 2008-02-26 | 2014-02-04 | Ethicon, Inc. | Self-retaining suture with variable dimension filament and method |
CN102056552B (zh) | 2008-04-15 | 2013-07-03 | 伊西康有限责任公司 | 具有双向保持器或单向保持器的自保持缝合线 |
US8932328B2 (en) | 2008-11-03 | 2015-01-13 | Ethicon, Inc. | Length of self-retaining suture and method and device for using the same |
WO2011006133A2 (en) * | 2009-07-10 | 2011-01-13 | Trustees Of Tufts College | Bioengineered silk protein-based nucleic acid delivery systems |
AU2010286333B2 (en) * | 2009-08-26 | 2017-01-05 | Commonwealth Scientific And Industrial Research Organisation | Processes for producing silk dope |
JP6313541B2 (ja) * | 2009-12-08 | 2018-04-18 | アーエムシルク ゲーエムベーハー | シルクタンパク質コーティング |
WO2011090628A2 (en) | 2009-12-29 | 2011-07-28 | Angiotech Pharmaceuticals, Inc. | Bidirectional self-retaining sutures with laser-marked and/or non-laser marked indicia and methods |
AU2011248116B2 (en) | 2010-05-04 | 2014-09-11 | Ethicon, Llc | Laser cutting system and methods for creating self-retaining sutures |
CA2801271C (en) | 2010-06-11 | 2018-10-30 | Ethicon, Llc | Suture delivery tools for endoscopic and robot-assisted surgery and methods |
WO2012061658A2 (en) | 2010-11-03 | 2012-05-10 | Angiotech Pharmaceuticals, Inc. | Drug-eluting self-retaining sutures and methods relating thereto |
US9675341B2 (en) | 2010-11-09 | 2017-06-13 | Ethicon Inc. | Emergency self-retaining sutures and packaging |
JP6125488B2 (ja) | 2011-03-23 | 2017-05-10 | エシコン・エルエルシーEthicon LLC | 自己保持可変ループ縫合材 |
US20130172931A1 (en) | 2011-06-06 | 2013-07-04 | Jeffrey M. Gross | Methods and devices for soft palate tissue elevation procedures |
BR112014011811A8 (pt) | 2011-11-16 | 2018-01-16 | Commw Scient Ind Res Org | genes de seda semelhantes a colágeno |
WO2013142901A1 (en) * | 2012-03-26 | 2013-10-03 | Commonwealth Scientific And Industrial Research Organisation | Silk polypeptides |
EP3182985B1 (en) | 2014-08-20 | 2020-01-08 | Silk Technologies Ltd. | Fibroin-derived protein composition |
US10870875B2 (en) * | 2014-11-17 | 2020-12-22 | Commonwealth Scientific And Industrial Research Organisation | Metalloprotein compositions |
EA035551B1 (ru) * | 2014-12-02 | 2020-07-06 | Силк Терапьютикс, Инк. | Изделие |
CN108135975A (zh) | 2015-07-14 | 2018-06-08 | 丝绸医疗公司 | 丝性能服装和产品及其制备方法 |
MX2018005416A (es) | 2015-11-03 | 2018-08-16 | Colgate Palmolive Co | Cerdas y cepillos dentales que cuenten con estas. |
US10953132B2 (en) | 2016-04-08 | 2021-03-23 | Cornell University | Method to enhance wound healing using silk-derived protein |
SG11201901137UA (en) | 2016-08-12 | 2019-03-28 | Silk Technologies Ltd | Silk-derived protein for treating inflammation |
US20190269791A1 (en) | 2016-10-17 | 2019-09-05 | Pfizer Inc. | Anti-edb antibodies and antibody-drug conjugates |
EP3688018A4 (en) | 2017-09-27 | 2021-07-07 | Evolved by Nature, Inc. | SILK COVERED FABRICS, RELATED PRODUCTS AND PREPARATION PROCESSES |
CN112789063B (zh) | 2018-10-05 | 2022-10-25 | 国立大学法人广岛大学 | 半月板再生用材料 |
MX2021004303A (es) | 2018-10-23 | 2021-05-27 | Unilever Ip Holdings B V | Composiciones cosmeticas que comprenden fibroina de seda de bajo peso molecular. |
CN110016438B (zh) * | 2019-01-29 | 2021-04-13 | 西北大学 | 一种真菌菌株及其菌丝体的液体培养方法 |
US11976196B2 (en) * | 2021-04-14 | 2024-05-07 | Cambridge Crops, Inc. | Silk packaging applications |
Family Cites Families (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS4720312U (ko) | 1971-01-21 | 1972-11-07 | ||
DE3121241C2 (de) | 1980-05-28 | 1984-07-19 | Dainippon Ink And Chemicals, Inc., Tokio/Tokyo | Verfahren zum Herstellen eines Verbundkunststoffrohres aus thermoplastischem Harz |
US4943674A (en) | 1987-05-26 | 1990-07-24 | Calgene, Inc. | Fruit specific transcriptional factors |
GB8607679D0 (en) | 1986-03-27 | 1986-04-30 | Winter G P | Recombinant dna product |
JPH0723585B2 (ja) | 1989-11-06 | 1995-03-15 | 信越化学工業株式会社 | ウール処理剤 |
US5989894A (en) | 1990-04-20 | 1999-11-23 | University Of Wyoming | Isolated DNA coding for spider silk protein, a replicable vector and a transformed cell containing the DNA |
DE69131969T2 (de) * | 1990-04-20 | 2000-06-15 | The University Of Wyoming, Laramie | Für Spinnenseideprotein kodierende DNS, DNS enthaltender Vektor, transformierte Zelle und Produkte davon |
FR2695558B1 (fr) | 1992-09-11 | 1994-10-21 | Oreal | Composition cosmétique contenant des particules solides revêtues avec un polymère amphotère. |
CA2164692C (en) | 1993-06-15 | 2003-02-04 | Stephen R. Fahnestock | Recombinant spider silk analogs |
AU697440B2 (en) | 1994-12-07 | 1998-10-08 | Novozymes A/S | Polypeptide with reduced allergenicity |
US5939288A (en) | 1995-06-07 | 1999-08-17 | Iowa State University Research Foundation, Inc. | Plant secretory signal peptides and nectarins |
ES2217319T3 (es) | 1995-06-26 | 2004-11-01 | HANS SCHWARZKOPF & HENKEL GMBH & CO. KG | Colorantes del cabello con al menos un acondicionador. |
US6013250A (en) | 1995-06-28 | 2000-01-11 | L'oreal S. A. | Composition for treating hair against chemical and photo damage |
WO1997008315A1 (en) * | 1995-08-22 | 1997-03-06 | Basel Richard M | Cloning methods for high strength spider silk proteins |
US5792294A (en) | 1995-11-16 | 1998-08-11 | Otis Elevator Company | Method of replacing sheave liner |
US6398821B1 (en) | 1996-12-23 | 2002-06-04 | The Procter & Gamble Company | Hair coloring compositions |
JP3545588B2 (ja) | 1997-03-24 | 2004-07-21 | 株式会社資生堂 | 毛髪化粧料 |
KR100431659B1 (ko) | 1997-06-18 | 2004-05-17 | 독립행정법인농업생물자원연구소 | 견 피브로인 및 견 세리신을 주성분으로 하는 창상피복재 및 그의 제조방법 |
DK1002064T3 (da) | 1997-06-25 | 2008-02-04 | Novozymes As | Modificeret polypeptid |
US6284246B1 (en) | 1997-07-30 | 2001-09-04 | The Procter & Gamble Co. | Modified polypeptides with high activity and reduced allergenicity |
FR2774588B1 (fr) | 1998-02-11 | 2000-05-05 | Oreal | Composition cosmetique ou dermatologique contenant au moins une proteine de soie d'arachnides naturelle, recombinante ou un analogue |
DE19848002A1 (de) | 1998-10-17 | 2000-04-20 | Goldschmidt Ag Th | Polypeptid-Polysiloxan-Copolymere |
JP2000139755A (ja) | 1998-11-12 | 2000-05-23 | Miki Tokushu Seishi Kk | あぶらとり紙及びその製造方法 |
JP2000328460A (ja) | 1999-05-24 | 2000-11-28 | Dow Corning Toray Silicone Co Ltd | 水系繊維処理剤および繊維の処理方法 |
EP1074617A3 (en) * | 1999-07-29 | 2004-04-21 | Research Association for Biotechnology | Primers for synthesising full-length cDNA and their use |
JP4570188B2 (ja) * | 1999-11-24 | 2010-10-27 | 独立行政法人 日本原子力研究開発機構 | 絹繊維を微粉末化及び水溶化する方法 |
US6608242B1 (en) * | 2000-05-25 | 2003-08-19 | E. I. Du Pont De Nemours And Company | Production of silk-like proteins in plants |
GB0108181D0 (en) | 2001-04-02 | 2001-05-23 | Xiros Plc | Silk-based fibre |
WO2002099082A2 (en) | 2001-06-06 | 2002-12-12 | University Of Wyoming | Expression of spider silk proteins in higher plants |
US7521228B2 (en) | 2001-08-29 | 2009-04-21 | The University Of Wyoming | Spider silk protein encoding nucleic acids, polypeptides, antibodies and methods of use thereof |
ITVR20010098A1 (it) | 2001-09-11 | 2003-03-11 | Consorzio Per Gli Studi Uni | Procedimento per l'ottenimento di idrogeli di fibroina di seta. |
US20050055051A1 (en) | 2001-09-13 | 2005-03-10 | Grafton R. Donald | High strength suture with silk trace |
US6902932B2 (en) | 2001-11-16 | 2005-06-07 | Tissue Regeneration, Inc. | Helically organized silk fibroin fiber bundles for matrices in tissue engineering |
US7014807B2 (en) | 2002-01-09 | 2006-03-21 | E.I. Dupont De Nemours And Company | Process of making polypeptide fibers |
AU2003202949A1 (en) | 2002-01-11 | 2003-07-30 | Ali Alwattari | Methods and apparatus for spinning spider silk protein |
JPWO2003100065A1 (ja) * | 2002-05-23 | 2005-09-22 | 国立大学法人東京農工大学 | 絹タンパク質、及び、機能性を付与した遺伝子組換え絹様タンパク質の大量生産方法 |
US7516525B2 (en) | 2002-06-13 | 2009-04-14 | Texas Tech University | Process for making chemical protective wipes and such wipes |
JP3772207B2 (ja) | 2002-06-19 | 2006-05-10 | 独立行政法人農業生物資源研究所 | 生分解性生体高分子材料、その製造方法、およびこの高分子材料からなる機能性素材 |
GB0218977D0 (en) * | 2002-08-15 | 2002-09-25 | Univ York | Polypeptide |
US20040132978A1 (en) | 2002-11-12 | 2004-07-08 | Fahnestock Stephen R. | Method for purifying and recovering silk proteins in soluble form and uses thereof |
US20040199241A1 (en) | 2002-12-30 | 2004-10-07 | Angiotech International Ag | Silk stent grafts |
NO316350B1 (no) | 2003-02-07 | 2004-01-12 | Hiform As | Laminat og framgangsmåte for framstilling av et fiberarmert laminert motstandselement |
US7060260B2 (en) | 2003-02-20 | 2006-06-13 | E.I. Du Pont De Nemours And Company | Water-soluble silk proteins in compositions for skin care, hair care or hair coloring |
US7115388B2 (en) | 2003-03-14 | 2006-10-03 | National Institute Of Agrobiological Sciences | Production of functional polypeptides originating from silk protein and use thereof |
JP4357859B2 (ja) | 2003-03-24 | 2009-11-04 | トヨタ自動車株式会社 | 繊維複合樹脂品及びその製造方法 |
RU2236843C1 (ru) * | 2003-08-05 | 2004-09-27 | Злобин Виктор Сергеевич | Лечебно-косметическое средство |
DE10336509A1 (de) | 2003-08-08 | 2005-03-03 | Ledertech Gmbh | Verbundmaterial für thermisch formbare Schuhkomponenten auf organischer Faserbasis |
US20070082197A1 (en) | 2003-11-04 | 2007-04-12 | Ko Frank K | Electrospun carbon nanotube reinforced silk fibers |
US7314851B2 (en) | 2003-12-11 | 2008-01-01 | The Foundation for the Promotion of Supplementary Occupations and Related Techniques of her Majesty Queen Sirikit | Silk soap comprising sericin protein |
JP4815108B2 (ja) | 2003-12-26 | 2011-11-16 | イビデン株式会社 | ハニカム構造体 |
US20050161058A1 (en) | 2004-01-26 | 2005-07-28 | Israel Yerushalmy | Spider silk dental floss |
ES2403733T3 (es) * | 2005-10-05 | 2013-05-21 | Commonwealth Scientific And Industrial Research Organisation | Proteínas de seda |
-
2006
- 2006-10-04 ES ES06790323T patent/ES2403733T3/es active Active
- 2006-10-04 BR BRPI0616894A patent/BRPI0616894B8/pt active IP Right Grant
- 2006-10-04 JP JP2008533823A patent/JP5748392B2/ja active Active
- 2006-10-04 CN CN200680045666.2A patent/CN101321777B/zh active Active
- 2006-10-04 AU AU2006299740A patent/AU2006299740B2/en active Active
- 2006-10-04 WO PCT/AU2006/001453 patent/WO2007038837A1/en active Application Filing
- 2006-10-04 KR KR1020087010225A patent/KR20080056255A/ko not_active Application Discontinuation
- 2006-10-04 CA CA2624667A patent/CA2624667C/en active Active
- 2006-10-04 RU RU2008117631/10A patent/RU2467015C2/ru active
- 2006-10-04 EP EP06790323A patent/EP1931702B1/en active Active
- 2006-10-04 EP EP11166330A patent/EP2395014A3/en not_active Withdrawn
- 2006-10-04 NZ NZ567202A patent/NZ567202A/en unknown
- 2006-10-04 US US12/089,045 patent/US9409959B2/en active Active
- 2006-10-04 DK DK06790323.7T patent/DK1931702T3/da active
-
2008
- 2008-04-10 ZA ZA200803178A patent/ZA200803178B/xx unknown
- 2008-12-08 HK HK08113300.0A patent/HK1119718A1/xx unknown
-
2012
- 2012-03-30 US US13/436,474 patent/US8481681B2/en active Active
-
2014
- 2014-09-08 JP JP2014182186A patent/JP6339459B2/ja active Active
-
2016
- 2016-06-29 US US15/197,541 patent/US20170051025A1/en not_active Abandoned
-
2020
- 2020-07-17 US US16/931,710 patent/US20210094989A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP2395014A3 (en) | 2012-07-11 |
JP2009509550A (ja) | 2009-03-12 |
EP1931702A1 (en) | 2008-06-18 |
US20120245103A1 (en) | 2012-09-27 |
CA2624667C (en) | 2018-01-09 |
AU2006299740B2 (en) | 2012-07-05 |
US20210094989A1 (en) | 2021-04-01 |
DK1931702T3 (da) | 2013-04-15 |
CA2624667A1 (en) | 2007-04-12 |
BRPI0616894A2 (pt) | 2011-07-05 |
CN101321777A (zh) | 2008-12-10 |
BRPI0616894B1 (pt) | 2017-05-23 |
EP1931702A4 (en) | 2009-01-21 |
ES2403733T3 (es) | 2013-05-21 |
CN101321777B (zh) | 2015-10-21 |
WO2007038837A1 (en) | 2007-04-12 |
US8481681B2 (en) | 2013-07-09 |
RU2008117631A (ru) | 2009-11-10 |
BRPI0616894B8 (pt) | 2021-07-27 |
AU2006299740A1 (en) | 2007-04-12 |
US9409959B2 (en) | 2016-08-09 |
HK1119718A1 (en) | 2009-03-13 |
JP6339459B2 (ja) | 2018-06-06 |
US20100100975A1 (en) | 2010-04-22 |
JP2015002746A (ja) | 2015-01-08 |
EP1931702B1 (en) | 2013-01-02 |
ZA200803178B (en) | 2009-08-26 |
US20170051025A1 (en) | 2017-02-23 |
JP5748392B2 (ja) | 2015-07-15 |
EP2395014A2 (en) | 2011-12-14 |
RU2467015C2 (ru) | 2012-11-20 |
NZ567202A (en) | 2012-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210094989A1 (en) | Silk Proteins | |
KR101932771B1 (ko) | 실크 도프의 제조 방법 | |
CN108531505A (zh) | 在昆虫害虫中下调基因表达 | |
CN110452908A (zh) | 在昆虫害虫中下调基因表达 | |
CN101679975A (zh) | 来自Nephilengys Cruentata蜘蛛、黄带粉趾食鸟蛛和Parawixia Bistriata蜘蛛的网的蛋白 | |
AU2012339619B2 (en) | Collagen-like silk genes | |
AU2013239320B2 (en) | Silk polypeptides | |
US20110177997A1 (en) | Cross-Beta Silk Genes | |
NZ626091B2 (en) | Collagen-like silk genes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |