KR101707712B1 - Npp1 융합 단백질 - Google Patents
Npp1 융합 단백질 Download PDFInfo
- Publication number
- KR101707712B1 KR101707712B1 KR1020137026773A KR20137026773A KR101707712B1 KR 101707712 B1 KR101707712 B1 KR 101707712B1 KR 1020137026773 A KR1020137026773 A KR 1020137026773A KR 20137026773 A KR20137026773 A KR 20137026773A KR 101707712 B1 KR101707712 B1 KR 101707712B1
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ser
- pro
- lys
- gly
- Prior art date
Links
- 102000037865 fusion proteins Human genes 0.000 title claims description 100
- 108020001507 fusion proteins Proteins 0.000 title claims description 100
- 101150011046 NPP1 gene Proteins 0.000 claims abstract description 84
- 101100080092 Phytophthora capsici NLP1 gene Proteins 0.000 claims abstract description 83
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 72
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 56
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 54
- 229920001184 polypeptide Polymers 0.000 claims abstract description 53
- 230000008685 targeting Effects 0.000 claims abstract description 43
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 38
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 38
- 230000003197 catalytic effect Effects 0.000 claims abstract description 11
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 23
- 125000000539 amino acid group Chemical group 0.000 claims description 20
- 230000000694 effects Effects 0.000 claims description 17
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 16
- 239000013604 expression vector Substances 0.000 claims description 16
- 210000004899 c-terminal region Anatomy 0.000 claims description 8
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 claims description 6
- 102000004861 Phosphoric Diester Hydrolases Human genes 0.000 claims description 6
- 102000004190 Enzymes Human genes 0.000 claims description 5
- 108090000790 Enzymes Proteins 0.000 claims description 5
- 108010009413 Pyrophosphatases Proteins 0.000 claims description 5
- 102000009609 Pyrophosphatases Human genes 0.000 claims description 5
- 235000003704 aspartic acid Nutrition 0.000 claims description 5
- 239000000178 monomer Substances 0.000 claims description 5
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 4
- 108060003951 Immunoglobulin Proteins 0.000 claims description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 3
- 238000010367 cloning Methods 0.000 claims description 3
- 235000018417 cysteine Nutrition 0.000 claims description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 3
- 102000018358 immunoglobulin Human genes 0.000 claims description 3
- 239000000710 homodimer Substances 0.000 claims description 2
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 claims 2
- 239000013599 cloning vector Substances 0.000 claims 1
- 239000013598 vector Substances 0.000 abstract description 37
- 230000004927 fusion Effects 0.000 abstract description 6
- 108090000623 proteins and genes Proteins 0.000 description 46
- 125000003729 nucleotide group Chemical group 0.000 description 41
- 239000002773 nucleotide Substances 0.000 description 38
- 210000004027 cell Anatomy 0.000 description 37
- 102000004169 proteins and genes Human genes 0.000 description 36
- 235000018102 proteins Nutrition 0.000 description 35
- 108091028043 Nucleic acid sequence Proteins 0.000 description 33
- 125000003275 alpha amino acid group Chemical group 0.000 description 33
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 28
- 230000014509 gene expression Effects 0.000 description 27
- 108020004414 DNA Proteins 0.000 description 26
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 26
- 238000009482 thermal adhesion granulation Methods 0.000 description 25
- 235000001014 amino acid Nutrition 0.000 description 24
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 23
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 23
- 108010092114 histidylphenylalanine Proteins 0.000 description 23
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 22
- 150000001413 amino acids Chemical class 0.000 description 22
- 108010036413 histidylglycine Proteins 0.000 description 21
- 108010034529 leucyl-lysine Proteins 0.000 description 21
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 20
- 238000000034 method Methods 0.000 description 20
- 230000001105 regulatory effect Effects 0.000 description 20
- 239000012634 fragment Substances 0.000 description 19
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 18
- 201000010099 disease Diseases 0.000 description 18
- 108010031719 prolyl-serine Proteins 0.000 description 18
- PGTISAJTWZPFGN-PEXQALLHSA-N His-Gly-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O PGTISAJTWZPFGN-PEXQALLHSA-N 0.000 description 17
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 17
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 17
- 108010077515 glycylproline Proteins 0.000 description 17
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 16
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 16
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 16
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 16
- 230000009261 transgenic effect Effects 0.000 description 16
- 208000004434 Calcinosis Diseases 0.000 description 15
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 15
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 15
- 230000002308 calcification Effects 0.000 description 15
- 108010057821 leucylproline Proteins 0.000 description 15
- 108010051242 phenylalanylserine Proteins 0.000 description 15
- 241000271566 Aves Species 0.000 description 14
- 241000287828 Gallus gallus Species 0.000 description 14
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 14
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 14
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 14
- 108010012581 phenylalanylglutamate Proteins 0.000 description 14
- 108091026890 Coding region Proteins 0.000 description 13
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 13
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 13
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 13
- 108010062796 arginyllysine Proteins 0.000 description 13
- 235000013330 chicken meat Nutrition 0.000 description 13
- 108010078144 glutaminyl-glycine Proteins 0.000 description 13
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 13
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 13
- 108010090894 prolylleucine Proteins 0.000 description 13
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 13
- 108010065395 Neuropep-1 Proteins 0.000 description 12
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 12
- YVXIAOOYAKBAAI-SZMVWBNQSA-N Trp-Leu-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 YVXIAOOYAKBAAI-SZMVWBNQSA-N 0.000 description 12
- 108010016616 cysteinylglycine Proteins 0.000 description 12
- 108010077112 prolyl-proline Proteins 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- OZRFYUJEXYKQDV-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-carboxypropanoyl)amino]-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]butanedioic acid Chemical compound OC(=O)CC(N)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(O)=O OZRFYUJEXYKQDV-UHFFFAOYSA-N 0.000 description 11
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 11
- 241000880493 Leptailurus serval Species 0.000 description 11
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 11
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 11
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 11
- 108010077245 asparaginyl-proline Proteins 0.000 description 11
- 108010081551 glycylphenylalanine Proteins 0.000 description 11
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 11
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 11
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 11
- 108091033319 polynucleotide Proteins 0.000 description 11
- 239000002157 polynucleotide Substances 0.000 description 11
- 102000040430 polynucleotide Human genes 0.000 description 11
- 238000013518 transcription Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- 108010020532 tyrosyl-proline Proteins 0.000 description 11
- 108010073969 valyllysine Proteins 0.000 description 11
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 10
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 10
- NJPQBTJSYCKCNS-HVTMNAMFSA-N Glu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N NJPQBTJSYCKCNS-HVTMNAMFSA-N 0.000 description 10
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 10
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 10
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 10
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 10
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 10
- 206010057190 Respiratory tract infections Diseases 0.000 description 10
- 108010047857 aspartylglycine Proteins 0.000 description 10
- 239000000872 buffer Substances 0.000 description 10
- 108010003700 lysyl aspartic acid Proteins 0.000 description 10
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 9
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 9
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 9
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 9
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 9
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 9
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 9
- VXLXATVURDNDCG-CIUDSAMLSA-N Cys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N VXLXATVURDNDCG-CIUDSAMLSA-N 0.000 description 9
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 9
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 9
- JHVCZQFWRLHUQR-DCAQKATOSA-N His-Arg-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JHVCZQFWRLHUQR-DCAQKATOSA-N 0.000 description 9
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 9
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 9
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 9
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 9
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 9
- HGKJFNCLOHKEHS-FXQIFTODSA-N Met-Cys-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(O)=O HGKJFNCLOHKEHS-FXQIFTODSA-N 0.000 description 9
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 9
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 9
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 9
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 9
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 9
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 9
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 9
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 9
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 9
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 9
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 9
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 9
- 108010087924 alanylproline Proteins 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 9
- 108010054155 lysyllysine Proteins 0.000 description 9
- 239000008194 pharmaceutical composition Substances 0.000 description 9
- 230000001177 retroviral effect Effects 0.000 description 9
- 108010048818 seryl-histidine Proteins 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 9
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 8
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 8
- SJPZTWAYTJPPBI-GUBZILKMSA-N Asn-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SJPZTWAYTJPPBI-GUBZILKMSA-N 0.000 description 8
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 8
- WQLJRNRLHWJIRW-KKUMJFAQSA-N Asn-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)O WQLJRNRLHWJIRW-KKUMJFAQSA-N 0.000 description 8
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 8
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 8
- RQYMKRMRZWJGHC-BQBZGAKWSA-N Asp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N RQYMKRMRZWJGHC-BQBZGAKWSA-N 0.000 description 8
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 8
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 8
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 8
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 8
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 8
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 8
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 8
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 8
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 8
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 8
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 8
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 8
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 8
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 8
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 8
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 8
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 8
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 8
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 8
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 8
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 8
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 8
- HONVOXINDBETTI-KKUMJFAQSA-N Lys-Tyr-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CS)C(O)=O)CC1=CC=C(O)C=C1 HONVOXINDBETTI-KKUMJFAQSA-N 0.000 description 8
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 8
- 241000124008 Mammalia Species 0.000 description 8
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 8
- DJDFBVNNDAUPRW-GUBZILKMSA-N Met-Glu-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O DJDFBVNNDAUPRW-GUBZILKMSA-N 0.000 description 8
- 241000286209 Phasianidae Species 0.000 description 8
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 8
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 8
- YMTMNYNEZDAGMW-RNXOBYDBSA-N Phe-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N YMTMNYNEZDAGMW-RNXOBYDBSA-N 0.000 description 8
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 8
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 8
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 8
- PUQRDHNIOONJJN-AVGNSLFASA-N Pro-Lys-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PUQRDHNIOONJJN-AVGNSLFASA-N 0.000 description 8
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 8
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 8
- LNGFWVPNKLWATF-ZVZYQTTQSA-N Trp-Val-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LNGFWVPNKLWATF-ZVZYQTTQSA-N 0.000 description 8
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 8
- YKCXQOBTISTQJD-BZSNNMDCSA-N Tyr-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YKCXQOBTISTQJD-BZSNNMDCSA-N 0.000 description 8
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 8
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 8
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 8
- 108010060035 arginylproline Proteins 0.000 description 8
- 208000035475 disorder Diseases 0.000 description 8
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 8
- 108010018625 phenylalanylarginine Proteins 0.000 description 8
- 108010070643 prolylglutamic acid Proteins 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- 108010084932 tryptophyl-proline Proteins 0.000 description 8
- 108010003137 tyrosyltyrosine Proteins 0.000 description 8
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 7
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 7
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 7
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 7
- QFTRCUPCARNIPZ-XHNCKOQMSA-N Gln-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)C(=O)O QFTRCUPCARNIPZ-XHNCKOQMSA-N 0.000 description 7
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 7
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 7
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 7
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 7
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 7
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 7
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 7
- 238000007792 addition Methods 0.000 description 7
- 108010005233 alanylglutamic acid Proteins 0.000 description 7
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 7
- 108010089804 glycyl-threonine Proteins 0.000 description 7
- 108010085325 histidylproline Proteins 0.000 description 7
- 108010009298 lysylglutamic acid Proteins 0.000 description 7
- 108010064235 lysylglycine Proteins 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 6
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 6
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 6
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 6
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 6
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 6
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 6
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 6
- NSTBNYOKCZKOMI-AVGNSLFASA-N Asn-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O NSTBNYOKCZKOMI-AVGNSLFASA-N 0.000 description 6
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 6
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 6
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 6
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 6
- JKPGHIQCHIIRMS-AVGNSLFASA-N Gln-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N JKPGHIQCHIIRMS-AVGNSLFASA-N 0.000 description 6
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 6
- UDEPRBFQTWGLCW-CIUDSAMLSA-N Glu-Pro-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O UDEPRBFQTWGLCW-CIUDSAMLSA-N 0.000 description 6
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 6
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 6
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 6
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 6
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 6
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 6
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 6
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 6
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 6
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 6
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 6
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 6
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 6
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 6
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 6
- XBCWOTOCBXXJDG-BZSNNMDCSA-N Leu-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XBCWOTOCBXXJDG-BZSNNMDCSA-N 0.000 description 6
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 6
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 6
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 6
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 6
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 6
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 6
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 6
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 6
- KKFVKBWCXXLKIK-AVGNSLFASA-N Lys-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCCN)N KKFVKBWCXXLKIK-AVGNSLFASA-N 0.000 description 6
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 6
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 6
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 6
- RMLWDZINJUDMEB-IHRRRGAJSA-N Met-Tyr-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RMLWDZINJUDMEB-IHRRRGAJSA-N 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 241000714177 Murine leukemia virus Species 0.000 description 6
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 6
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 6
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 6
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 6
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 6
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 6
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 6
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 6
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 6
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 6
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 6
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 6
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 6
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 6
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 6
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 6
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 6
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 6
- XEVHXNLPUBVQEX-DVJZZOLTSA-N Thr-Trp-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N)O XEVHXNLPUBVQEX-DVJZZOLTSA-N 0.000 description 6
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 6
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 6
- MDDYTWOFHZFABW-SZMVWBNQSA-N Trp-Gln-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 MDDYTWOFHZFABW-SZMVWBNQSA-N 0.000 description 6
- RWTFCAMQLFNPTK-UMPQAUOISA-N Trp-Val-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)=CNC2=C1 RWTFCAMQLFNPTK-UMPQAUOISA-N 0.000 description 6
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 6
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 6
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 6
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 6
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 6
- 108010092854 aspartyllysine Proteins 0.000 description 6
- 108010068265 aspartyltyrosine Proteins 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 108010012058 leucyltyrosine Proteins 0.000 description 6
- 108010051110 tyrosyl-lysine Proteins 0.000 description 6
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 5
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 5
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 5
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 5
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 5
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 5
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 5
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 5
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 5
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 5
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 5
- ZIKWRNJXFIQECJ-CIUDSAMLSA-N Cys-Cys-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZIKWRNJXFIQECJ-CIUDSAMLSA-N 0.000 description 5
- RWGDABDXVXRLLH-ACZMJKKPSA-N Cys-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N RWGDABDXVXRLLH-ACZMJKKPSA-N 0.000 description 5
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 5
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 5
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 5
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 5
- LWYUQLZOIORFFJ-XKBZYTNZSA-N Glu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O LWYUQLZOIORFFJ-XKBZYTNZSA-N 0.000 description 5
- DJTXYXZNNDDEOU-WHFBIAKZSA-N Gly-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)C(=O)N DJTXYXZNNDDEOU-WHFBIAKZSA-N 0.000 description 5
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 5
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 5
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 5
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 5
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 5
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 5
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 5
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 5
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 5
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 5
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 5
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 5
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 5
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 5
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 5
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 5
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 5
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 5
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 5
- KCFKKAQKRZBWJB-ZLUOBGJFSA-N Ser-Cys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O KCFKKAQKRZBWJB-ZLUOBGJFSA-N 0.000 description 5
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 5
- HAUVENOGHPECML-BPUTZDHNSA-N Ser-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 HAUVENOGHPECML-BPUTZDHNSA-N 0.000 description 5
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 5
- XXNLGZRRSKPSGF-HTUGSXCWSA-N Thr-Gln-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O XXNLGZRRSKPSGF-HTUGSXCWSA-N 0.000 description 5
- UDNVOQMPQBEITB-MEYUZBJRSA-N Thr-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UDNVOQMPQBEITB-MEYUZBJRSA-N 0.000 description 5
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 5
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 5
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 5
- YTUABZMPYKCWCQ-XQQFMLRXSA-N Val-His-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N YTUABZMPYKCWCQ-XQQFMLRXSA-N 0.000 description 5
- 108010047495 alanylglycine Proteins 0.000 description 5
- 235000013601 eggs Nutrition 0.000 description 5
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 5
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 5
- 108010025306 histidylleucine Proteins 0.000 description 5
- 108010091871 leucylmethionine Proteins 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 5
- 108010044292 tryptophyltyrosine Proteins 0.000 description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 4
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 4
- JTWOBPNAVBESFW-FXQIFTODSA-N Arg-Cys-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N JTWOBPNAVBESFW-FXQIFTODSA-N 0.000 description 4
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 4
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 4
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 4
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 4
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 4
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 4
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 4
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 4
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 4
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 4
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 4
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 4
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 4
- 241000714230 Avian leukemia virus Species 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- XRJFPHCGGQOORT-JBDRJPRFSA-N Cys-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N XRJFPHCGGQOORT-JBDRJPRFSA-N 0.000 description 4
- ZEXHDOQQYZKOIB-ACZMJKKPSA-N Cys-Glu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZEXHDOQQYZKOIB-ACZMJKKPSA-N 0.000 description 4
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 4
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 4
- OZSBRCONEMXYOJ-AVGNSLFASA-N Cys-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N OZSBRCONEMXYOJ-AVGNSLFASA-N 0.000 description 4
- CNAMJJOZGXPDHW-IHRRRGAJSA-N Cys-Pro-Phe Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O CNAMJJOZGXPDHW-IHRRRGAJSA-N 0.000 description 4
- RJPKQCFHEPPTGL-ZLUOBGJFSA-N Cys-Ser-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RJPKQCFHEPPTGL-ZLUOBGJFSA-N 0.000 description 4
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 4
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 4
- LKVCNGLNTAPMSZ-JYJNAYRXSA-N Gln-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N LKVCNGLNTAPMSZ-JYJNAYRXSA-N 0.000 description 4
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 4
- DBNLXHGDGBUCDV-KKUMJFAQSA-N Gln-Phe-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O DBNLXHGDGBUCDV-KKUMJFAQSA-N 0.000 description 4
- CMFBOXUBWMZZMD-BPUTZDHNSA-N Gln-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N CMFBOXUBWMZZMD-BPUTZDHNSA-N 0.000 description 4
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 4
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 4
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 4
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 4
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 4
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 4
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 4
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 4
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 4
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 4
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 4
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 4
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 4
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 4
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 4
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 4
- QAMFAYSMNZBNCA-UWVGGRQHSA-N His-Gly-Met Chemical compound CSCC[C@H](NC(=O)CNC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O QAMFAYSMNZBNCA-UWVGGRQHSA-N 0.000 description 4
- YAJQKIBLYPFAET-NAZCDGGXSA-N His-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N)O YAJQKIBLYPFAET-NAZCDGGXSA-N 0.000 description 4
- 101000812677 Homo sapiens Nucleotide pyrophosphatase Proteins 0.000 description 4
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 4
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 4
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 4
- MGUTVMBNOMJLKC-VKOGCVSHSA-N Ile-Trp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C(C)C)C(=O)O)N MGUTVMBNOMJLKC-VKOGCVSHSA-N 0.000 description 4
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 4
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 4
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 4
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 4
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 4
- IIKJNQWOQIWWMR-CIUDSAMLSA-N Leu-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N IIKJNQWOQIWWMR-CIUDSAMLSA-N 0.000 description 4
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 4
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 4
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 4
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 4
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 4
- SUYRAPCRSCCPAK-VFAJRCTISA-N Leu-Trp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUYRAPCRSCCPAK-VFAJRCTISA-N 0.000 description 4
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 4
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 4
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 4
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 4
- MIROMRNASYKZNL-ULQDDVLXSA-N Lys-Pro-Tyr Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MIROMRNASYKZNL-ULQDDVLXSA-N 0.000 description 4
- ZAJNRWKGHWGPDQ-SDDRHHMPSA-N Met-Arg-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N ZAJNRWKGHWGPDQ-SDDRHHMPSA-N 0.000 description 4
- JYPITOUIQVSCKM-IHRRRGAJSA-N Met-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCSC)N JYPITOUIQVSCKM-IHRRRGAJSA-N 0.000 description 4
- LBNFTWKGISQVEE-AVGNSLFASA-N Met-Leu-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCSC LBNFTWKGISQVEE-AVGNSLFASA-N 0.000 description 4
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 102100039306 Nucleotide pyrophosphatase Human genes 0.000 description 4
- 108010058846 Ovalbumin Proteins 0.000 description 4
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 4
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 4
- WGXOKDLDIWSOCV-MELADBBJSA-N Phe-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O WGXOKDLDIWSOCV-MELADBBJSA-N 0.000 description 4
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 4
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 4
- RORUIHAWOLADSH-HJWJTTGWSA-N Phe-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 RORUIHAWOLADSH-HJWJTTGWSA-N 0.000 description 4
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 4
- JDMKQHSHKJHAHR-UHFFFAOYSA-N Phe-Phe-Leu-Tyr Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)CC1=CC=CC=C1 JDMKQHSHKJHAHR-UHFFFAOYSA-N 0.000 description 4
- 239000002202 Polyethylene glycol Substances 0.000 description 4
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 4
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 4
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 4
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 4
- SBYVDRLQAGENMY-DCAQKATOSA-N Pro-Asn-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O SBYVDRLQAGENMY-DCAQKATOSA-N 0.000 description 4
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 4
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 4
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 4
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 4
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 4
- ZHYMUFQVKGJNRM-ZLUOBGJFSA-N Ser-Cys-Asn Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O ZHYMUFQVKGJNRM-ZLUOBGJFSA-N 0.000 description 4
- KMWFXJCGRXBQAC-CIUDSAMLSA-N Ser-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N KMWFXJCGRXBQAC-CIUDSAMLSA-N 0.000 description 4
- SWIQQMYVHIXPEK-FXQIFTODSA-N Ser-Cys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O SWIQQMYVHIXPEK-FXQIFTODSA-N 0.000 description 4
- DGHFNYXVIXNNMC-GUBZILKMSA-N Ser-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGHFNYXVIXNNMC-GUBZILKMSA-N 0.000 description 4
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 4
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 4
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 4
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 4
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 4
- -1 Thr and Ala Chemical class 0.000 description 4
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 4
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 4
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 4
- NJNCVQYFNKZMAH-JYBASQMISA-N Trp-Thr-Cys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CS)C(O)=O)=CNC2=C1 NJNCVQYFNKZMAH-JYBASQMISA-N 0.000 description 4
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 4
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 4
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 4
- YMUQBRQQCPQEQN-CXTHYWKRSA-N Tyr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YMUQBRQQCPQEQN-CXTHYWKRSA-N 0.000 description 4
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 4
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 4
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 4
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 4
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 4
- CHWRZUGUMAMTFC-IHRRRGAJSA-N Val-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CNC=N1 CHWRZUGUMAMTFC-IHRRRGAJSA-N 0.000 description 4
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 4
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 4
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 4
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 239000000539 dimer Substances 0.000 description 4
- 235000011180 diphosphates Nutrition 0.000 description 4
- 239000003937 drug carrier Substances 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 238000001802 infusion Methods 0.000 description 4
- 108010027338 isoleucylcysteine Proteins 0.000 description 4
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 4
- 108010056582 methionylglutamic acid Proteins 0.000 description 4
- 229920001223 polyethylene glycol Polymers 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 108010005652 splenotritin Proteins 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- 241001430294 unidentified retrovirus Species 0.000 description 4
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 3
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 3
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 3
- 241000024188 Andala Species 0.000 description 3
- 241000272517 Anseriformes Species 0.000 description 3
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 3
- STHNZYKCJHWULY-AVGNSLFASA-N Arg-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O STHNZYKCJHWULY-AVGNSLFASA-N 0.000 description 3
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 3
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 3
- ICDDSTLEMLGSTB-GUBZILKMSA-N Asn-Met-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ICDDSTLEMLGSTB-GUBZILKMSA-N 0.000 description 3
- UYRPHDGXHKBZHJ-CIUDSAMLSA-N Asn-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N UYRPHDGXHKBZHJ-CIUDSAMLSA-N 0.000 description 3
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 3
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 3
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 3
- ILQCHXURSRRIRY-YUMQZZPRSA-N Asp-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N ILQCHXURSRRIRY-YUMQZZPRSA-N 0.000 description 3
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 3
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 3
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 3
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 241000195493 Cryptophyta Species 0.000 description 3
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 3
- KGIHMGPYGXBYJJ-SRVKXCTJSA-N Cys-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CS KGIHMGPYGXBYJJ-SRVKXCTJSA-N 0.000 description 3
- SMEYEQDCCBHTEF-FXQIFTODSA-N Cys-Pro-Ala Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O SMEYEQDCCBHTEF-FXQIFTODSA-N 0.000 description 3
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 3
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 3
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 3
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 3
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 3
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 3
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 3
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 3
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 3
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 3
- PYUCNHJQQVSPGN-BQBZGAKWSA-N Gly-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)CN=C(N)N PYUCNHJQQVSPGN-BQBZGAKWSA-N 0.000 description 3
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 3
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 3
- SAPLASXFNUYUFE-CQDKDKBSSA-N His-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N SAPLASXFNUYUFE-CQDKDKBSSA-N 0.000 description 3
- FFKJUTZARGRVTH-KKUMJFAQSA-N His-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FFKJUTZARGRVTH-KKUMJFAQSA-N 0.000 description 3
- JATYGDHMDRAISQ-KKUMJFAQSA-N His-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O JATYGDHMDRAISQ-KKUMJFAQSA-N 0.000 description 3
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 3
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 3
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 3
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 3
- 206010022489 Insulin Resistance Diseases 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 3
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 3
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 3
- NHRINZSPIUXYQZ-DCAQKATOSA-N Leu-Met-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)O)N NHRINZSPIUXYQZ-DCAQKATOSA-N 0.000 description 3
- AUNMOHYWTAPQLA-XUXIUFHCSA-N Leu-Met-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AUNMOHYWTAPQLA-XUXIUFHCSA-N 0.000 description 3
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 3
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 3
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 3
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 3
- VLMNBMFYRMGEMB-QWRGUYRKSA-N Lys-His-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 VLMNBMFYRMGEMB-QWRGUYRKSA-N 0.000 description 3
- ZMMDPRTXLAEMOD-BZSNNMDCSA-N Lys-His-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZMMDPRTXLAEMOD-BZSNNMDCSA-N 0.000 description 3
- AHFOKDZWPPGJAZ-SRVKXCTJSA-N Lys-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N AHFOKDZWPPGJAZ-SRVKXCTJSA-N 0.000 description 3
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 3
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 3
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 3
- XATKLFSXFINPSB-JYJNAYRXSA-N Lys-Tyr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O XATKLFSXFINPSB-JYJNAYRXSA-N 0.000 description 3
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 3
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 3
- DCHHUGLTVLJYKA-FXQIFTODSA-N Met-Asn-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DCHHUGLTVLJYKA-FXQIFTODSA-N 0.000 description 3
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 3
- OOLVTRHJJBCJKB-IHRRRGAJSA-N Met-Tyr-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OOLVTRHJJBCJKB-IHRRRGAJSA-N 0.000 description 3
- NBEFNGUZUOUGFG-KKUMJFAQSA-N Met-Tyr-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NBEFNGUZUOUGFG-KKUMJFAQSA-N 0.000 description 3
- 102000016943 Muramidase Human genes 0.000 description 3
- 108010014251 Muramidase Proteins 0.000 description 3
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 3
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 3
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 3
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 3
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 3
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 3
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 3
- YSUZKYSRAFNLRB-ULQDDVLXSA-N Pro-Gln-Trp Chemical compound N([C@@H](CCC(=O)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 YSUZKYSRAFNLRB-ULQDDVLXSA-N 0.000 description 3
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 3
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 3
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 3
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 3
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 3
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 3
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 3
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 3
- KJKQUQXDEKMPDK-FXQIFTODSA-N Ser-Met-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O KJKQUQXDEKMPDK-FXQIFTODSA-N 0.000 description 3
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 3
- FZEUTKVQGMVGHW-AVGNSLFASA-N Ser-Phe-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZEUTKVQGMVGHW-AVGNSLFASA-N 0.000 description 3
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 3
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 3
- DDDLIMCZFKOERC-SVSWQMSJSA-N Thr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N DDDLIMCZFKOERC-SVSWQMSJSA-N 0.000 description 3
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 3
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 3
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- HQVKQINPFOCIIV-BVSLBCMMSA-N Trp-Arg-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 HQVKQINPFOCIIV-BVSLBCMMSA-N 0.000 description 3
- JVTHMUDOKPQBOT-NSHDSACASA-N Trp-Gly-Gly Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O)=CNC2=C1 JVTHMUDOKPQBOT-NSHDSACASA-N 0.000 description 3
- YCQKQFKXBPJXRY-PMVMPFDFSA-N Trp-Tyr-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CCCCN)C(=O)O)N YCQKQFKXBPJXRY-PMVMPFDFSA-N 0.000 description 3
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 3
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 3
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 3
- QKXAEWMHAAVVGS-KKUMJFAQSA-N Tyr-Pro-Glu Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O QKXAEWMHAAVVGS-KKUMJFAQSA-N 0.000 description 3
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 3
- CLEGSEJVGBYZBJ-MEYUZBJRSA-N Tyr-Thr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CLEGSEJVGBYZBJ-MEYUZBJRSA-N 0.000 description 3
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 3
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 3
- MYLNLEIZWHVENT-VKOGCVSHSA-N Val-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N MYLNLEIZWHVENT-VKOGCVSHSA-N 0.000 description 3
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 3
- SBJCTAZFSZXWSR-AVGNSLFASA-N Val-Met-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SBJCTAZFSZXWSR-AVGNSLFASA-N 0.000 description 3
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 3
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 3
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 3
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 210000001367 artery Anatomy 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 108010060199 cysteinylproline Proteins 0.000 description 3
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 3
- 239000003085 diluting agent Substances 0.000 description 3
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000008176 lyophilized powder Substances 0.000 description 3
- 229960000274 lysozyme Drugs 0.000 description 3
- 235000010335 lysozyme Nutrition 0.000 description 3
- 239000004325 lysozyme Substances 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 230000011164 ossification Effects 0.000 description 3
- 210000003101 oviduct Anatomy 0.000 description 3
- 108010073101 phenylalanylleucine Proteins 0.000 description 3
- 244000144977 poultry Species 0.000 description 3
- 235000013594 poultry meat Nutrition 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 210000000278 spinal cord Anatomy 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- 210000004881 tumor cell Anatomy 0.000 description 3
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 3
- 108010078580 tyrosylleucine Proteins 0.000 description 3
- 108010052774 valyl-lysyl-glycyl-phenylalanyl-tyrosine Proteins 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 2
- UMCMPZBLKLEWAF-BCTGSCMUSA-N 3-[(3-cholamidopropyl)dimethylammonio]propane-1-sulfonate Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCC[N+](C)(C)CCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 UMCMPZBLKLEWAF-BCTGSCMUSA-N 0.000 description 2
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 2
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 2
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 2
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 2
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 2
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 2
- 241000272525 Anas platyrhynchos Species 0.000 description 2
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 2
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 2
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 2
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 2
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 2
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 2
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 2
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 2
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 2
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 2
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 2
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 2
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 2
- LGCVSPFCFXWUEY-IHPCNDPISA-N Asn-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N LGCVSPFCFXWUEY-IHPCNDPISA-N 0.000 description 2
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 2
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 2
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 2
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 2
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 2
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 2
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 2
- SBMGKDLRJLYZCU-BIIVOSGPSA-N Cys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N)C(=O)O SBMGKDLRJLYZCU-BIIVOSGPSA-N 0.000 description 2
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 2
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 2
- KEBJBKIASQVRJS-WDSKDSINSA-N Cys-Gln-Gly Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N KEBJBKIASQVRJS-WDSKDSINSA-N 0.000 description 2
- JXVFJOMFOLFPMP-KKUMJFAQSA-N Cys-Leu-Tyr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JXVFJOMFOLFPMP-KKUMJFAQSA-N 0.000 description 2
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 2
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 2
- BCWIFCLVCRAIQK-ZLUOBGJFSA-N Cys-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O BCWIFCLVCRAIQK-ZLUOBGJFSA-N 0.000 description 2
- UOEYKPDDHSFMLI-DCAQKATOSA-N Cys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N UOEYKPDDHSFMLI-DCAQKATOSA-N 0.000 description 2
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 2
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 2
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 2
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 2
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 2
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 2
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 2
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 2
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 2
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 2
- GTFYQOVVVJASOA-ACZMJKKPSA-N Glu-Ser-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N GTFYQOVVVJASOA-ACZMJKKPSA-N 0.000 description 2
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 2
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 2
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 2
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 2
- TVQGUFGDVODUIF-LSJOCFKGSA-N His-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N TVQGUFGDVODUIF-LSJOCFKGSA-N 0.000 description 2
- FLYSHWAAHYNKRT-JYJNAYRXSA-N His-Gln-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLYSHWAAHYNKRT-JYJNAYRXSA-N 0.000 description 2
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 2
- LYDKQVYYCMYNMC-SRVKXCTJSA-N His-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LYDKQVYYCMYNMC-SRVKXCTJSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 2
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 2
- BLFXHAFTNYZEQE-VKOGCVSHSA-N Ile-Trp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BLFXHAFTNYZEQE-VKOGCVSHSA-N 0.000 description 2
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 2
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 2
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 2
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 2
- BYEBKXRNDLTGFW-CIUDSAMLSA-N Lys-Cys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O BYEBKXRNDLTGFW-CIUDSAMLSA-N 0.000 description 2
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 2
- DAOSYIZXRCOKII-SRVKXCTJSA-N Lys-His-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O DAOSYIZXRCOKII-SRVKXCTJSA-N 0.000 description 2
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 2
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 2
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 2
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 2
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 2
- FXYXBEZMRACDDR-KKUMJFAQSA-N Phe-His-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FXYXBEZMRACDDR-KKUMJFAQSA-N 0.000 description 2
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 2
- FQUUYTNBMIBOHS-IHRRRGAJSA-N Phe-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FQUUYTNBMIBOHS-IHRRRGAJSA-N 0.000 description 2
- FENSZYFJQOFSQR-FIRPJDEBSA-N Phe-Phe-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FENSZYFJQOFSQR-FIRPJDEBSA-N 0.000 description 2
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 2
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 2
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 2
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 2
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 2
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 2
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 2
- JFBJPBZSTMXGKL-JYJNAYRXSA-N Pro-Met-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JFBJPBZSTMXGKL-JYJNAYRXSA-N 0.000 description 2
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 2
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 2
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 2
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 2
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 108020005091 Replication Origin Proteins 0.000 description 2
- UEJYSALTSUZXFV-SRVKXCTJSA-N Rigin Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UEJYSALTSUZXFV-SRVKXCTJSA-N 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 2
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 2
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 2
- UCXDHBORXLVBNC-ZLUOBGJFSA-N Ser-Asn-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O UCXDHBORXLVBNC-ZLUOBGJFSA-N 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 2
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 2
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 2
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 2
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 2
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 2
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 2
- DSLHSTIUAPKERR-XGEHTFHBSA-N Thr-Cys-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O DSLHSTIUAPKERR-XGEHTFHBSA-N 0.000 description 2
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 2
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 2
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 2
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 2
- NBIIPOKZPUGATB-BWBBJGPYSA-N Thr-Ser-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O NBIIPOKZPUGATB-BWBBJGPYSA-N 0.000 description 2
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- 102000004338 Transferrin Human genes 0.000 description 2
- 108090000901 Transferrin Proteins 0.000 description 2
- DQDXHYIEITXNJY-BPUTZDHNSA-N Trp-Gln-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N DQDXHYIEITXNJY-BPUTZDHNSA-N 0.000 description 2
- VMXLNDRJXVAJFT-JYBASQMISA-N Trp-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O VMXLNDRJXVAJFT-JYBASQMISA-N 0.000 description 2
- SSSDKJMQMZTMJP-BVSLBCMMSA-N Trp-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 SSSDKJMQMZTMJP-BVSLBCMMSA-N 0.000 description 2
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 2
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 2
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 2
- GZUIDWDVMWZSMI-KKUMJFAQSA-N Tyr-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GZUIDWDVMWZSMI-KKUMJFAQSA-N 0.000 description 2
- ZMKDQRJLMRZHRI-ACRUOGEOSA-N Tyr-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N ZMKDQRJLMRZHRI-ACRUOGEOSA-N 0.000 description 2
- AOIZTZRWMSPPAY-KAOXEZKKSA-N Tyr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O AOIZTZRWMSPPAY-KAOXEZKKSA-N 0.000 description 2
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 2
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 2
- LMSBRIVOCYOKMU-NRPADANISA-N Val-Gln-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N LMSBRIVOCYOKMU-NRPADANISA-N 0.000 description 2
- PTFPUAXGIKTVNN-ONGXEEELSA-N Val-His-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N PTFPUAXGIKTVNN-ONGXEEELSA-N 0.000 description 2
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 208000005475 Vascular calcification Diseases 0.000 description 2
- 108010046516 Wheat Germ Agglutinins Proteins 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 150000001510 aspartic acids Chemical class 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 210000005119 human aortic smooth muscle cell Anatomy 0.000 description 2
- 229910052588 hydroxylapatite Inorganic materials 0.000 description 2
- 208000011111 hypophosphatemic rickets Diseases 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- RWOAVOYBVRQNIZ-BFHYXJOUSA-N p-nitrophenyl thymidine 5'-monophosphate Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OC=2C=CC(=CC=2)[N+]([O-])=O)[C@@H](O)C1 RWOAVOYBVRQNIZ-BFHYXJOUSA-N 0.000 description 2
- XYJRXVWERLGGKC-UHFFFAOYSA-D pentacalcium;hydroxide;triphosphate Chemical compound [OH-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O XYJRXVWERLGGKC-UHFFFAOYSA-D 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 239000012581 transferrin Substances 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 239000008215 water for injection Substances 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- IESDGNYHXIOKRW-YXMSTPNBSA-N (2s)-2-[[(2s)-1-[(2s)-6-amino-2-[[(2s,3r)-2-amino-3-hydroxybutanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IESDGNYHXIOKRW-YXMSTPNBSA-N 0.000 description 1
- DIBLBAURNYJYBF-XLXZRNDBSA-N (2s)-2-[[(2s)-2-[[2-[[(2s)-6-amino-2-[[(2s)-2-amino-3-methylbutanoyl]amino]hexanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 DIBLBAURNYJYBF-XLXZRNDBSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- NWUYHJFMYQTDRP-UHFFFAOYSA-N 1,2-bis(ethenyl)benzene;1-ethenyl-2-ethylbenzene;styrene Chemical compound C=CC1=CC=CC=C1.CCC1=CC=CC=C1C=C.C=CC1=CC=CC=C1C=C NWUYHJFMYQTDRP-UHFFFAOYSA-N 0.000 description 1
- XWTNPSHCJMZAHQ-QMMMGPOBSA-N 2-[[2-[[2-[[(2s)-2-amino-4-methylpentanoyl]amino]acetyl]amino]acetyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(=O)NCC(O)=O XWTNPSHCJMZAHQ-QMMMGPOBSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 244000198134 Agave sisalana Species 0.000 description 1
- 235000011624 Agave sisalana Nutrition 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 1
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- 241000272814 Anser sp. Species 0.000 description 1
- 208000037411 Aortic calcification Diseases 0.000 description 1
- WESHVRNMNFMVBE-FXQIFTODSA-N Arg-Asn-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N WESHVRNMNFMVBE-FXQIFTODSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- IGULQRCJLQQPSM-DCAQKATOSA-N Arg-Cys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IGULQRCJLQQPSM-DCAQKATOSA-N 0.000 description 1
- OBFTYSPXDRROQO-SRVKXCTJSA-N Arg-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCN=C(N)N OBFTYSPXDRROQO-SRVKXCTJSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 208000031104 Arterial Occlusive disease Diseases 0.000 description 1
- 200000000007 Arterial disease Diseases 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- WQSCVMQDZYTFQU-FXQIFTODSA-N Asn-Cys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WQSCVMQDZYTFQU-FXQIFTODSA-N 0.000 description 1
- BKDDABUWNKGZCK-XHNCKOQMSA-N Asn-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O BKDDABUWNKGZCK-XHNCKOQMSA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- UBGGJTMETLEXJD-DCAQKATOSA-N Asn-Leu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O UBGGJTMETLEXJD-DCAQKATOSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- VOGCFWDZYYTEOY-DCAQKATOSA-N Asn-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N VOGCFWDZYYTEOY-DCAQKATOSA-N 0.000 description 1
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- AKPLMZMNJGNUKT-ZLUOBGJFSA-N Asp-Asp-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O AKPLMZMNJGNUKT-ZLUOBGJFSA-N 0.000 description 1
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 1
- BIVYLQMZPHDUIH-WHFBIAKZSA-N Asp-Gly-Cys Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)C(=O)O BIVYLQMZPHDUIH-WHFBIAKZSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 238000003650 Calcium Assay Kit Methods 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 108010026206 Conalbumin Proteins 0.000 description 1
- CVOZXIPULQQFNY-ZLUOBGJFSA-N Cys-Ala-Cys Chemical compound C[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CS)C(O)=O CVOZXIPULQQFNY-ZLUOBGJFSA-N 0.000 description 1
- DCJNIJAWIRPPBB-CIUDSAMLSA-N Cys-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N DCJNIJAWIRPPBB-CIUDSAMLSA-N 0.000 description 1
- OCEHKDFAWQIBHH-FXQIFTODSA-N Cys-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N OCEHKDFAWQIBHH-FXQIFTODSA-N 0.000 description 1
- CLDCTNHPILWQCW-CIUDSAMLSA-N Cys-Arg-Glu Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N CLDCTNHPILWQCW-CIUDSAMLSA-N 0.000 description 1
- WVJHEDOLHPZLRV-CIUDSAMLSA-N Cys-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N WVJHEDOLHPZLRV-CIUDSAMLSA-N 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- OXOQBEVULIBOSH-ZDLURKLDSA-N Cys-Gly-Thr Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O OXOQBEVULIBOSH-ZDLURKLDSA-N 0.000 description 1
- LKUCSUGWHYVYLP-GHCJXIJMSA-N Cys-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N LKUCSUGWHYVYLP-GHCJXIJMSA-N 0.000 description 1
- BLGNLNRBABWDST-CIUDSAMLSA-N Cys-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BLGNLNRBABWDST-CIUDSAMLSA-N 0.000 description 1
- ZXCAQANTQWBICD-DCAQKATOSA-N Cys-Lys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N ZXCAQANTQWBICD-DCAQKATOSA-N 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000287227 Fringillidae Species 0.000 description 1
- 101710177291 Gag polyprotein Proteins 0.000 description 1
- 208000033173 Generalized arterial calcification of infancy Diseases 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 1
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 1
- WPJDPEOQUIXXOY-AVGNSLFASA-N Gln-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WPJDPEOQUIXXOY-AVGNSLFASA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 1
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- HLYCMRDRWGSTPZ-CIUDSAMLSA-N Glu-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CS)C(=O)O HLYCMRDRWGSTPZ-CIUDSAMLSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- ZAPFAWQHBOHWLL-GUBZILKMSA-N Glu-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N ZAPFAWQHBOHWLL-GUBZILKMSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- CGWHAXBNGYQBBK-JBACZVJFSA-N Glu-Trp-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)C1=CC=C(O)C=C1 CGWHAXBNGYQBBK-JBACZVJFSA-N 0.000 description 1
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- SUDUYJOBLHQAMI-WHFBIAKZSA-N Gly-Asp-Cys Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O SUDUYJOBLHQAMI-WHFBIAKZSA-N 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- SJLKKOZFHSJJAW-YUMQZZPRSA-N Gly-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN SJLKKOZFHSJJAW-YUMQZZPRSA-N 0.000 description 1
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- SOFSRBYHDINIRG-QTKMDUPCSA-N His-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N)O SOFSRBYHDINIRG-QTKMDUPCSA-N 0.000 description 1
- MAABHGXCIBEYQR-XVYDVKMFSA-N His-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MAABHGXCIBEYQR-XVYDVKMFSA-N 0.000 description 1
- WMKXFMUJRCEGRP-SRVKXCTJSA-N His-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N WMKXFMUJRCEGRP-SRVKXCTJSA-N 0.000 description 1
- CYHWWHKRCKHYGQ-GUBZILKMSA-N His-Cys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N CYHWWHKRCKHYGQ-GUBZILKMSA-N 0.000 description 1
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 1
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 1
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 1
- WZBLRQQCDYYRTD-SIXJUCDHSA-N His-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N WZBLRQQCDYYRTD-SIXJUCDHSA-N 0.000 description 1
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 1
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 1
- WHKLDLQHSYAVGU-ACRUOGEOSA-N His-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WHKLDLQHSYAVGU-ACRUOGEOSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 1
- HZWWOGWOBQBETJ-CUJWVEQBSA-N His-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O HZWWOGWOBQBETJ-CUJWVEQBSA-N 0.000 description 1
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 101001085900 Homo sapiens Ribosomal RNA processing protein 1 homolog B Proteins 0.000 description 1
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- LEDRIAHEWDJRMF-CFMVVWHZSA-N Ile-Asn-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LEDRIAHEWDJRMF-CFMVVWHZSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- FCWFBHMAJZGWRY-XUXIUFHCSA-N Ile-Leu-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N FCWFBHMAJZGWRY-XUXIUFHCSA-N 0.000 description 1
- XDUVMJCBYUKNFJ-MXAVVETBSA-N Ile-Lys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N XDUVMJCBYUKNFJ-MXAVVETBSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- OAQJOXZPGHTJNA-NGTWOADLSA-N Ile-Trp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N OAQJOXZPGHTJNA-NGTWOADLSA-N 0.000 description 1
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 1
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 1
- 102100034353 Integrase Human genes 0.000 description 1
- 206010048858 Ischaemic cardiomyopathy Diseases 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 244000207740 Lemna minor Species 0.000 description 1
- 235000006439 Lemna minor Nutrition 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- YSKSXVKQLLBVEX-SZMVWBNQSA-N Leu-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 YSKSXVKQLLBVEX-SZMVWBNQSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 1
- DDEMUMVXNFPDKC-SRVKXCTJSA-N Leu-His-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N DDEMUMVXNFPDKC-SRVKXCTJSA-N 0.000 description 1
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 1
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- GOVDTWNJCBRRBJ-DCAQKATOSA-N Lys-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N GOVDTWNJCBRRBJ-DCAQKATOSA-N 0.000 description 1
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- ZVXSESPJMKNIQA-YXMSTPNBSA-N Lys-Thr-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZVXSESPJMKNIQA-YXMSTPNBSA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- FPQMQEOVSKMVMA-ACRUOGEOSA-N Lys-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCCCN)N)O FPQMQEOVSKMVMA-ACRUOGEOSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 1
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 241001460678 Napo <wasp> Species 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 101710199133 Nucleotide pyrophosphatase/phosphodiesterase Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108010055817 Peptide-N4-(N-acetyl-beta-glucosaminyl) Asparagine Amidase Proteins 0.000 description 1
- 102000000447 Peptide-N4-(N-acetyl-beta-glucosaminyl) Asparagine Amidase Human genes 0.000 description 1
- YMORXCKTSSGYIG-IHRRRGAJSA-N Phe-Arg-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N YMORXCKTSSGYIG-IHRRRGAJSA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- CUMXHKAOHNWRFQ-BZSNNMDCSA-N Phe-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CUMXHKAOHNWRFQ-BZSNNMDCSA-N 0.000 description 1
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 1
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- ZIQQNOXKEFDPBE-BZSNNMDCSA-N Phe-Lys-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N ZIQQNOXKEFDPBE-BZSNNMDCSA-N 0.000 description 1
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 1
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- APXXVISUHOLGEE-ILWGZMRPSA-N Phe-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CC=CC=C4)N)C(=O)O APXXVISUHOLGEE-ILWGZMRPSA-N 0.000 description 1
- 229920000805 Polyaspartic acid Polymers 0.000 description 1
- 108010020346 Polyglutamic Acid Proteins 0.000 description 1
- 229920000388 Polyphosphate Polymers 0.000 description 1
- 235000001855 Portulaca oleracea Nutrition 0.000 description 1
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- LCWXSALTPTZKNM-CIUDSAMLSA-N Pro-Cys-Glu Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O LCWXSALTPTZKNM-CIUDSAMLSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 1
- ZTMLZUNPFDGPKY-VKOGCVSHSA-N Pro-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ZTMLZUNPFDGPKY-VKOGCVSHSA-N 0.000 description 1
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- JIWJRKNYLSHONY-KKUMJFAQSA-N Pro-Phe-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JIWJRKNYLSHONY-KKUMJFAQSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 1
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- 241000287531 Psittacidae Species 0.000 description 1
- 208000004531 Renal Artery Obstruction Diseases 0.000 description 1
- 206010038378 Renal artery stenosis Diseases 0.000 description 1
- 241000220010 Rhode Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102100029627 Ribosomal RNA processing protein 1 homolog A Human genes 0.000 description 1
- 101000995829 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Nucleotide pyrophosphatase Proteins 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 1
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 1
- 241000272534 Struthio camelus Species 0.000 description 1
- 241000271567 Struthioniformes Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 1
- ODSAPYVQSLDRSR-LKXGYXEUSA-N Thr-Cys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O ODSAPYVQSLDRSR-LKXGYXEUSA-N 0.000 description 1
- ZLNWJMRLHLGKFX-SVSWQMSJSA-N Thr-Cys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZLNWJMRLHLGKFX-SVSWQMSJSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- FDALPRWYVKJCLL-PMVVWTBXSA-N Thr-His-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O FDALPRWYVKJCLL-PMVVWTBXSA-N 0.000 description 1
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 1
- CJEHCEOXPLASCK-MEYUZBJRSA-N Thr-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=C(O)C=C1 CJEHCEOXPLASCK-MEYUZBJRSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 102100023935 Transmembrane glycoprotein NMB Human genes 0.000 description 1
- 108030003004 Triphosphatases Proteins 0.000 description 1
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- FQNUWOHNGJWNLM-QWRGUYRKSA-N Tyr-Cys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FQNUWOHNGJWNLM-QWRGUYRKSA-N 0.000 description 1
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- GZOCMHSZGGJBCX-ULQDDVLXSA-N Tyr-Lys-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O GZOCMHSZGGJBCX-ULQDDVLXSA-N 0.000 description 1
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 1
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- XJFXZQKJQGYFMM-GUBZILKMSA-N Val-Cys-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N XJFXZQKJQGYFMM-GUBZILKMSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 1
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- BZWUSZGQOILYEU-STECZYCISA-N Val-Ile-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BZWUSZGQOILYEU-STECZYCISA-N 0.000 description 1
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 1
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 206010072810 Vascular wall hypertrophy Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 230000001668 ameliorated effect Effects 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 208000004900 arterial calcification of infancy Diseases 0.000 description 1
- 208000021328 arterial occlusion Diseases 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000000306 component Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 108010067341 ectonucleotide pyrophosphatase phosphodiesterase 1 Proteins 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000000408 embryogenic effect Effects 0.000 description 1
- 210000002308 embryonic cell Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 108010078428 env Gene Products Proteins 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000003284 homeostatic effect Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000009027 insemination Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 239000003456 ion exchange resin Substances 0.000 description 1
- 229920003303 ion-exchange polymer Polymers 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000006193 liquid solution Substances 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000003094 microcapsule Substances 0.000 description 1
- 150000004712 monophosphates Chemical class 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 230000000414 obstructive effect Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 229940092253 ovalbumin Drugs 0.000 description 1
- 108010043846 ovoinhibitor Proteins 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 108010089520 pol Gene Products Proteins 0.000 description 1
- 108010064470 polyaspartate Proteins 0.000 description 1
- 229920002643 polyglutamic acid Polymers 0.000 description 1
- 239000001205 polyphosphate Substances 0.000 description 1
- 235000011176 polyphosphates Nutrition 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 210000003370 receptor cell Anatomy 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 208000007442 rickets Diseases 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000009450 sialylation Effects 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003381 solubilizing effect Effects 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012090 tissue culture technique Methods 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 108091007466 transmembrane glycoproteins Proteins 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 표적화 모이어티에 융합된 NPP1의 촉매 도메인을 함유하는 신규한 융합 폴리펩티드, 융합 폴리펩티드를 인코딩하는 핵산, 통합된 핵산을 함유하는 벡터, 벡터로 형질전환된 숙주 세포 및 융합 폴리펩티드를 포함하는 약학적 조성물을 제공한다.
Description
관련 출원
본 출원은 2010년 3월 12일에 출원된 미국 가출원 번호 61/340,066호의 이익을 주장하는, 2011년 3월 11일에 출원된 PCT/US2011/028233호의 이익을 주장한다. 상기 출원의 전체 교시내용은 참조로서 본원에 포함된다.
발명의 배경
엑토누클레오티드 피로포스파타제/포스포디에스테라제 1(NPP1/ENPP1/PC-1)은 동종이합체를 형성하는 타입 II 막횡단 당단백질이다. 상기 단백질은 누클레오티드 및 누클레오티드 당의 포스포디에스테르 결합 및 누클레오티드 및 누클레오티드 당의 피로포스페이트 결합을 포함하는 다양한 기질을 분해한다. NPP1 단백질은 누클레오시드 5' 트리포스프타제(triphosphtase)를 상응하는 모노포스페이트로 가수분해하고, 디아데노신 폴리포스페이트로 또한 가수분해하는 작용을 한다. NPP1 유전자에서의 돌연변이는 특발성 영아 동맥 석회화(idiopathic infantile arterial calcification, IIAC), 인슐린 내성, 저인산혈구루병, 및 척추의 후종인대의 골화와 관련되어 있다.
희귀한 보통염색체 열성이며 거의 항상 치명적인 장애인 IIAC는 근육동맥의 내부 탄력층의 석회화 및 근내막 증식으로 인한 협착증을 특징으로 한다. 전세계적으로 보고된 160명을 초과하는 IIAC 환자가 있다. 상기 질병의 증상은 가장 흔하게는 어린 영아에서 나타나며, 상기 질병은 일반적으로 허혈성 심근병증, 및 신동맥협착을 포함하는 폐쇄성 동맥병증의 다른 합병증으로 인해 생후 6개월까지 치명적이다. IIAC의 12명을 초과하는 보고된 환자에서, 큰 관절의 관절주위 석회화가 또한 영아에서 발생하였다. 문헌[Rutsch et al. (2003)]에는 ENPP1에서의 돌연변이가 생애 초기에 자발적 관절주위 및 대동맥 석회화, 및 병에 걸린 개체에서 누클레오티드 피로포스파타제/포스포디에스테라제의 전신 저하를 특징으로 하는 IIAC와 관련되어 있음이 보고되어 있다.
NPP1 단백질에서의 결함이 IIAC와 같은 심각한 질병과 연관되어 있으나, 상기 질병에 걸린 사람들에 대한 당 분야에서 이용 가능한 치료제가 없다. 따라서, IIAC, 인슐린 내성, 저인산혈구루병, 및 척추의 후종인대의 골화의 치료를 위한 효과적이고 안전한 조성물, 제형 및 약제가 긴급히 필요하다.
본 발명은 NPP1 융합 단백질을 제공하는 것을 목적으로 한다.
발명의 개요
본 발명은 표적화 모이어티(targeting moiety)에 융합된 NPP1의 트렁케이션된 도메인(즉, NPP1 성분)의 융합 단백질을 포함한다. 표적화 모이어티는 임상적 또는 생물학적으로 중요한 부위(예를 들어, 석회화의 저하를 필요로 하는 피검체의 석회화 부위)에 NPP1 융합 단백질을 표적화시키는 것의 효율을 향상시키는 작용을 한다. 본 발명을 임의의 특정 이론 또는 작용 메커니즘으로 제한하고자 하는 것은 아니지만, NPP1 성분은 피로포스페이트(PPi)의 형성을 향상시키고/시키거나, 피로포스페이트를 분해시켜 가용성 포스페이트(Pi)를 생성시키고/시키거나, 아데노신 모노포스페이트(AMP) 및/또는 아데노신의 이용가용성을 증가시킴으로써 석회화를 억제하는 작용을 하는 것으로 생각된다. 표적화 모이어티가 임의의 유용한 위치에서 NPP1 성분의 N-말단 및/또는 C-말단에 부착될 수 있는 것으로 생각된다. 또한, 본원에 개시된 NPP1 융합 단백질은 Fc 단편, PEG, 폴리펩티드 링커 또는 효소 활성, 안정성 또는 표적화를 향상시키는 다른 추가 폴리펩티드 중 하나 이상을 또한 포함할 수 있다.
본 발명의 융합 단백질은 피검체에서 매우 다양한 질환을 치료하는데 사용될 수 있다. 본 발명의 융합 단백질의 투여에 의해 유리하게 치료될 수 있는 임의의 질환이 본 발명의 범위 내에 포함된다. 예를 들어, 하나 이상의 석회화 구조를 감소시키고/시키거나 제거하고/하거나, 피검체, 예를 들어, 포유동물, 예를 들어, 인간 환자에서 석회화 구조가 형성되는 것을 예방함으로써 개선될 수 있는 질환의 치료가 본 발명의 범위에 포함된다. 동맥 폐색과 같은 질환이 본 발명의 융합 단백질을 이용한 치료에 고려된다. 한 특히 유용한 구체예에서, 치료 질환은 영아의 특발성 동맥 석회화 및 영아의 동맥 중막 석회화로도 알려진 영아의 전신 동맥 석회화이다. 인슐린 내성, 저인산혈구루병, 및 척추의 후종인대의 골화와 같은 질환이 또한 치료에 고려된다.
본 발명의 융합 단백질은 세포 배양(예를 들어, CHO 세포, COS 세포, HEK203), 박테리아, 예를 들어, 에스케리키아 콜리(Escherichia coli, E. coli) 및 포유동물 및 조류(예를 들어, 닭, 메추라기, 오리 및 칠면조)를 포함하나 이에 제한되지는 않는 트랜스제닉 동물을 포함하나 이에 제한되지는 않는 임의의 유용한 단백질 발현 시스템에서 생성될 수 있다.
약학적 조성물(또는 약학적 제형)의 제조는 당 분야에 널리 공지되어 있고, 이러한 약학적 조성물이 본 발명의 융합 단백질에 따른 사용에 고려된다.
일반적으로, 피검체에 투여되는 융합 단백질의 투여량은 수용자의 연령, 건강 및 체중, 동시 치료의 유형, 치료 빈도 등과 같은 공지된 요인에 따라 다양할 것이다. 보통, 활성 성분(즉, 융합 단백질)의 투여량은 체중 킬로그램 당 약 0.0001 내지 약 50 밀리그램일 수 있다. 정확한 투여량, 투여 빈도 및 치료의 기간은 치료 단백질 투여 분야에서 숙련된 의사에 의해 결정될 수 있다.
도 1은 야생형 NPP1 단백질의 아미노산 서열을 예시한다. 세포질 및 막 영역은 밑줄로 표시된다. 잠재적 N-당화 부위는 굵은 글씨로 표시된다. 이탤릭체의 PSCAKE는 시스테인 풍부 영역을 포함하는 가용성 NPP1의 시작부이다.
도 2는 표적 모이어티가 부착되지 않은 NPP1 단백질("sssNPP1")의 촉매 도메인(들)의 아미노산 서열을 예시한다.
도 3은 TAGsssNPP1의 아미노산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 sssNPP1의 N-말단에 융합된다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다.
도 4는 sssNPP1의 C-말단에 융합된 10개의 연속적 아스파르트산 잔기의 표적화 모이어티를 함유하는 TAGsssNPP1의 아미노산 서열을 예시한다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다.
도 5는 TAGssNPP1 융합 단백질의 핵산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 ssNPP1의 N-말단에 융합된다.
도 6은 TAGssNPP1 융합 단백질의 아미노산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 ssNPP1의 N-말단에 융합된다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다.
도 7은 ssNPP1의 핵산 서열을 예시한다.
도 8은 ssNPP1의 아미노산 서열을 예시한다. 신호 펩티드는 밑줄로 표시된다.
도 9는 sNPP1의 핵산 서열을 예시한다.
도 10은 sNPP1의 아미노산 서열을 예시한다. 신호 펩티드는 밑줄로 표시된다.
도 11은 TAGsNPP1의 핵산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 sNPP1의 N-말단에 융합된다.
도 12는 TAGsNPP1의 아미노산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 ssNPP1의 N-말단에 융합된다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다.
도 13은 TAGsNPP1의 핵산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 sNPP1의 C-말단에 융합된다.
도 14는 TAGsNPP1의 아미노산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 sNPP1의 N-말단에 융합된다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다.
도 15는 링커 펩티드의 아미노산 서열을 예시한다.
도 16은 면역글로불린 Fc 세그먼트의 아미노산 서열을 예시한다.
도 17은 펩티드 링커를 통해 sssNPP1의 N-말단에 융합된 8개의 연속적 아스파르트산 잔기의 표적화 모이어티를 함유하는 TAGsssNPP1의 아미노산 서열을 예시한다. Fc 세그먼트는 표적 모이어티의 N-말단에 융합된다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다. 펩티드 링커는 이탤릭체로 표시된다.
도 18은 펩티드 링커를 통해 sssNPP1의 C-말단에 융합된 8개의 연속적 아스파르트산 잔기의 표적화 모이어티를 함유하는 TAGsssNPP1의 아미노산 서열을 예시한다. Fc 세그먼트는 sssNPP1의 N-말단에 융합된다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다. 펩티드 링커는 이탤릭체로 표시된다.
도 19는 TAGsNPP1 작제물을 함유하는 발현 벡터(즉, pTT22)의 개략적 대표도이다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 sNPP1의 C-말단에 융합된다.
도 20은 TAGsNPP1의 웨스턴 블롯 분석을 예시한다. 환원 조건; NR, 비-환원 조건.
도 21은 HEK293 세포로부터 생성되고 분리된 TAGsNPP1의 효소 활성을 나타낸다.
도 22A 내지 도 22C는 본원에 기재된 TAGNPP1 융합 단백질 작제물의 개략도를 예시한다.
도 23은 가용성 sNPP1(WT), TAGsNPP1(sNPP1 C-말단에 융합된 D8), 및 sNPP1-Fc로 처리된 인간 대동맥 평활근 세포의 석회화 수준을 나타낸다.
도 24는 TAGsNPP1 작제물을 함유하는 발현 벡터(즉, pTT22)의 개략적 대표도를 도시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티(D8)가 sNPP1의 C-말단에 융합된다.
도 25는 TAGsNPP1 융합 단백질의 핵산 서열을 도시한다.
도 26은 TAGsNPP1 융합 단백질의 아미노산 서열을 도시한다.
도 27은 sNPP1-Fc 융합 작제물을 함유하는 발현 벡터(즉, pTT22)의 개략적 대표도를 도시한다.
도 28은 sNPP1-Fc 융합 단백질의 핵산 서열을 도시한다.
도 29은 sNPP1-Fc 융합 단백질의 아미노산 서열을 도시한다.
도 2는 표적 모이어티가 부착되지 않은 NPP1 단백질("sssNPP1")의 촉매 도메인(들)의 아미노산 서열을 예시한다.
도 3은 TAGsssNPP1의 아미노산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 sssNPP1의 N-말단에 융합된다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다.
도 4는 sssNPP1의 C-말단에 융합된 10개의 연속적 아스파르트산 잔기의 표적화 모이어티를 함유하는 TAGsssNPP1의 아미노산 서열을 예시한다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다.
도 5는 TAGssNPP1 융합 단백질의 핵산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 ssNPP1의 N-말단에 융합된다.
도 6은 TAGssNPP1 융합 단백질의 아미노산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 ssNPP1의 N-말단에 융합된다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다.
도 7은 ssNPP1의 핵산 서열을 예시한다.
도 8은 ssNPP1의 아미노산 서열을 예시한다. 신호 펩티드는 밑줄로 표시된다.
도 9는 sNPP1의 핵산 서열을 예시한다.
도 10은 sNPP1의 아미노산 서열을 예시한다. 신호 펩티드는 밑줄로 표시된다.
도 11은 TAGsNPP1의 핵산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 sNPP1의 N-말단에 융합된다.
도 12는 TAGsNPP1의 아미노산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 ssNPP1의 N-말단에 융합된다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다.
도 13은 TAGsNPP1의 핵산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 sNPP1의 C-말단에 융합된다.
도 14는 TAGsNPP1의 아미노산 서열을 예시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 sNPP1의 N-말단에 융합된다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다.
도 15는 링커 펩티드의 아미노산 서열을 예시한다.
도 16은 면역글로불린 Fc 세그먼트의 아미노산 서열을 예시한다.
도 17은 펩티드 링커를 통해 sssNPP1의 N-말단에 융합된 8개의 연속적 아스파르트산 잔기의 표적화 모이어티를 함유하는 TAGsssNPP1의 아미노산 서열을 예시한다. Fc 세그먼트는 표적 모이어티의 N-말단에 융합된다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다. 펩티드 링커는 이탤릭체로 표시된다.
도 18은 펩티드 링커를 통해 sssNPP1의 C-말단에 융합된 8개의 연속적 아스파르트산 잔기의 표적화 모이어티를 함유하는 TAGsssNPP1의 아미노산 서열을 예시한다. Fc 세그먼트는 sssNPP1의 N-말단에 융합된다. 신호 펩티드는 밑줄로 표시되고, 표적화 모이어티는 굵은 글씨로 표시된다. 펩티드 링커는 이탤릭체로 표시된다.
도 19는 TAGsNPP1 작제물을 함유하는 발현 벡터(즉, pTT22)의 개략적 대표도이다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티가 sNPP1의 C-말단에 융합된다.
도 20은 TAGsNPP1의 웨스턴 블롯 분석을 예시한다. 환원 조건; NR, 비-환원 조건.
도 21은 HEK293 세포로부터 생성되고 분리된 TAGsNPP1의 효소 활성을 나타낸다.
도 22A 내지 도 22C는 본원에 기재된 TAGNPP1 융합 단백질 작제물의 개략도를 예시한다.
도 23은 가용성 sNPP1(WT), TAGsNPP1(sNPP1 C-말단에 융합된 D8), 및 sNPP1-Fc로 처리된 인간 대동맥 평활근 세포의 석회화 수준을 나타낸다.
도 24는 TAGsNPP1 작제물을 함유하는 발현 벡터(즉, pTT22)의 개략적 대표도를 도시한다. 8개의 연속적 아스파르트산 잔기의 표적화 모이어티(D8)가 sNPP1의 C-말단에 융합된다.
도 25는 TAGsNPP1 융합 단백질의 핵산 서열을 도시한다.
도 26은 TAGsNPP1 융합 단백질의 아미노산 서열을 도시한다.
도 27은 sNPP1-Fc 융합 작제물을 함유하는 발현 벡터(즉, pTT22)의 개략적 대표도를 도시한다.
도 28은 sNPP1-Fc 융합 단백질의 핵산 서열을 도시한다.
도 29은 sNPP1-Fc 융합 단백질의 아미노산 서열을 도시한다.
발명의 상세한 설명
본 발명은 가용성이고, NPP1의 트렁케이션된 생물학적 활성 도메인(들)(즉, 피로포스파타제 및/또는 포스포디에스테라제 활성을 위해 자연 발생 NPP1의 적어도 하나의 세포외 촉매 도메인을 함유하는 NPP1 성분) 및 하나 이상의 표적화 모이어티(즉, "TAG")를 함유하는 신규한 인간 NPP1 융합 단백질을 제공한다. 본 발명의 NPP1 융합 단백질은 적어도 피로포스파타제 및/또는 포스포디에스테라제 활성을 수행하는데 필수적인 NPP1 도메인을 포함한다. 따라서, 본 발명은 하나 이상의 표적화 모이어티에 융합된 SEQ ID NO:1의 아미노산 잔기 A205 내지 L591을 포함하는 분리된 융합 단백질을 특징으로 한다. 표적화 모이어티는 당 분야에 널리 공지된 방법에 의해 NPP1 성분에 재조합적으로 융합되거나 화학적으로 결합(예를 들어, 공유 결합, 이온 결합, 소수성 결합 및 반데르발스힘)될 수 있고, NPP1 성분을 특정 표적 부위로 유도할 수 있으며, 여기에서 부착된 NPP1 성분은 본 발명의 융합 단백질이 투여되는 피검체에서 원하는 효과(예를 들어, PPi와 같은 기질을 용해화시키거나 PPi와 같은 기질의 형성을 방지하는 것과 같은 반응의 촉매작용)를 갖게 될 것이다.
TAGNPP1s
본 발명의 모든 NPP1 융합 단백질("TAGNPP1s")은 자연 발생 인간 NPP1의 N-말단 세포질 및 막횡단 도메인이 제거되었다. 임의로, 본 발명의 TAGNPP1s 융합 단백질은 또한 다양한 길이의 야생형 NPP1의 C-말단 트렁케이션을 함유할 수 있다. 전장 야생형 NPP1의 아미노산 서열은 SEQ ID NO:1에 나열되어 있다.
한 구체예에서, 융합 단백질은 폴리펩티드의 N-말단 또는 C-말단 상의 TAG에 융합된 SEQ ID NO:1의 아미노산 잔기 A205 내지 L591("sssNPP1")을 포함하는 폴리펩티드("TAGsssNPP1")를 함유한다. 한 구체예에서, 융합 단백질은 N-말단 또는 C-말단 상의 TAG에 융합된 SEQ ID NO:1의 아미노산 잔기 A205 내지 D925("ssNPP1")를 포함하는 폴리펩티드("TAGssNPP1")를 포함한다. 한 구체예에서, 융합 단백질은 폴리펩티드의 N-말단 또는 C-말단 상의 TAG에 융합된 SEQ ID NO:1의 아미노산 잔기 P99 내지 D925("sNPP1")를 포함하는 폴리펩티드("TAGsNPP1")를 포함한다. 적어도 SEQ ID NO:1의 아미노산 잔기 A205 내지 L591을 포함하는 sNPP1의 임의의 연속적 단편이 또한 고려되며, 이러한 폴리펩티드 단편은 N-말단 또는 C-말단 상의 TAG에 융합된다.
세포 배양물 또는 트랜스제닉 동물에서 발현되는 경우, TAGNPP1 융합 단백질은 이의 N-말단에서 신호 펩티드(또는 선도 서열)을 추가로 포함할 수 있다. 신호 펩티드는 TAGNPP1 융합 단백질을 발현하는 세포의 세포하 소기관을 통해 TAGNPP1 융합 단백질의 운반을 번역동시적으로 또는 번역후에 유도함으로써, TAGNPP1 융합 단백질의 번역후 변형을 결정한다. 신호 펩티드는 융합 단백질의 번역동시적 또는 번역후 단계에서 분해되므로, TAGNNP1 융합 단백질은 일반적으로 일단 분비되고 분리되는 경우에 신호 펩티드가 결여되어 있는 것이 이해되어야 한다. 따라서, TAGNPP1 융합 단백질을 인코딩하는 핵산 서열에 관한 구체예에서, 선도 서열이 또한 본 발명에서 사용되는 것이 고려된다. 예를 들어, SEQ ID NO:2에 나열된 누클레오티드 서열은 이의 5' 말단에 TAGNNP1에 대한 선도 서열의 예를 함유한다.
본원에 개시된 융합 단백질 각각은 하나 이상의 표적화 모이어티("TAG")와 함께 고려된다. 본 발명에 따른 TAG 성분은 4개 이상의 음성으로 하전된 아미노산, 예를 들어, 아스파르트산 및 글루탐산을 포함한다. TAG 성분은 음성으로 하전된 아미노산 잔기, 예를 들어, 약 4 내지 약 20개의 아미노산 잔기 길이인 아스파르트산 및/또는 글루탐산의 스트레치(stretch)일 수 있다. TAG는 NPP1 성분의 N-말단 또는 C-말단에 융합될 수 있다. TAG는 또한 NPP1 성분의 N-말단 및 C-말단 둘 모두에 융합될 수 있다. 따라서, TAGsNPP1 융합 단백질의 아미노산 서열은, 예를 들어, NPP1 성분의 C-말단 단부를 통한 PSCAKE, 및 NPP1 성분의 N-말단 및/또는 C-말단 단부에 하나 이상의 표적화 모이어티(예를 들어, 폴리글루탐산 태그 또는 폴리아스파르트산 태그)를 포함한다. C-말단에 융합된 TAG를 갖는 NPP1 성분을 포함하는 융합 단백질이 특히 유용한 구체예이다. 한 매우 특정한 구체예에서, 도면에서 TAGsNPP1 및 TAGssNPP1에 대한 예시적 서열에서 관찰될 수 있는 바와 같이 8개의 아스파르트산의 스트레치를 갖는 TAG가 사용되나, 임의의 유용한 수의 음성으로 하전된 아미노산 잔기(예를 들어, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 또는 18개)가 본 발명에 따라 사용될 수 있다. TAG 성분은 도면에서 "A"로 표시된다.
본 발명은 또한 본원에 기재된 다양한 TAGNPP1 융합 단백질을 인코딩하는 폴리누클레오티드를 포함한다. 따라서, 임의의 TAGNPP1 융합 단백질의 아미노산 서열을 인코딩하는 임의의 핵산 서열이 상응하는 TAGNPP1 융합 단백질을 발현하는 재조합 분자를 발생시키는데 사용될 수 있다. 한 특정 구체예에서, 본 발명은 도 2에 제시된 바와 같이 SEQ ID NO:2의 핵산 서열을 포함하는 폴리누클레오티드를 포함한다.
특정한 특이적 구체예 내에서, 융합 단백질은 본원에 기재된 바와 같은 다수의 폴리펩티드를 포함하거나, 본원에 기재된 바와 같은 적어도 하나의 폴리펩티드 및 관련되지 않은 서열을 포함한다. 특정한 바람직한 폴리펩티드는, 예를 들어, 이합체화 및 안정성을 도울 수 있거나, 융합 단백질의 응집을 최소화시킬 수 있다. 예를 들어, 추가 폴리펩티드는 혈청에서의 안정성을 증가시키는 면역글로불린 G1의 Fc 영역일 수 있다. Fc 세그먼트의 사용은 당 분야에 널리 공지되어 있고, 전체 교시내용이 온전히 참조로서 본원에 포함되는 미국 특허 번호 7,902,151호; 및 미국 특허 번호 7,858,297호에 기재되어 있다. 야생형 NPP1의 시스테인 풍부 영역(즉, PSCAKE 내지 NEPQCP; SEQ ID NO:1의 P99 내지 P204의 아미노산 서열)이 TAGNPP1 융합 단백질의 이합체화를 촉진하기 위해 이용될 수 있다.
또 다른 구체예에서, 폴리에틸렌 글리콜(PEG)이 TAGNPP1 융합 단백질에 컨쥬게이션될 수 있다. 응집 및 면역원성을 최소화시키거나, 단백질의 용해도를 증가시키거나, 임상적 또는 생물학적으로 중요한 원하는 부위로 단백질이 표적화되는 것을 가능케 하기 위해 다른 폴리펩티드가 선택될 수 있다.
TAGNPP1은 또한 융합 단백질의 확인, 합성, 또는 정제의 용이성을 위해, 또는 TAGNPP1의 활성 및 표적화를 향상시킬 수 있는 NPP1 성분의 고유 구조를 보다 잘 보존시키기 위해 적절한 폴리펩티드 링커 또는 다른 서열에 융합되거나 컨쥬게이션될 수 있다. 특히, 각각의 폴리펩티드가 이의 이차 및 삼차 구조로 폴딩되는 것을 보장하기에 충분한 거리로 제 1 및 제 2 폴리펩티드 성분을 분리시키기 위해 펩티드 링커 서열이 이용될 수 있다. 이러한 펩티드 링커 서열이 당 분야에 널리 공지된 표준 기술을 이용하여 NPP1 성분과 TAG 성분 사이의 융합 단백질로 통합된다. 적합한 펩티드 링커 서열은 유연한 연장된 형태를 채택하는 이들의 능력, 및 NPP1, TAG 또는 본원에 기재된 다른 이차 폴리펩티드(예를 들어, Fc) 상의 기능성 부분과 상호작용할 수 있는 이차 구조를 채택하지 않는 이들의 능력을 기초로 하여 선택될 수 있다. 바람직한 펩티드 링커 서열은 Gly, His, Asn 및 Ser 잔기를 함유한다. 유용한 펩티드 링커는 폴리-Gly, 폴리-His, 폴리-Asn, 또는 폴리-Ser을 포함하나, 이에 제한되지는 않는다. 다른 중성에 가까운 아미노산, 예를 들어, Thr 및 Ala가 또한 링커 서열에서 사용될 수 있다. 링커로서 유용하게 사용될 수 있는 아미노산 서열은 문헌[Maratea et al., Gene 40:39-46, 1985; Murphy et al., Proc. Natl. Acad Sci. USA 83:8258-8262, 1986; U.S. Pat. No. 4,935,233 및 U.S. Pat. No. 4,751,180]에 개시된 것을 포함한다. 링커 서열은 1 내지 약 20개의 아미노산 잔기 길이일 수 있다. 바람직하게는, 폴리펩티드 링커는 약 8 내지 약 12개의 아미노산 길이이다. 한 바람직한 구체예에서, 본 발명에서 사용되는 펩티드 링커는 GGGGSGGGGS(SEQ ID NO:15)이나, Gly, Ser, His, 또는 Asn의 임의의 기능적 조합이 이용될 수 있다.
융합 단백질은 또한 관련되지 않은 폴리펩티드와 함께 본 발명의 TAGNPP1을 포함할 수 있다. 바람직하게는, 관련되지 않은 폴리펩티드는 임상적 또는 생물학적으로 중요한 부위(예를 들어, 석회화 부위)로의 융합 단백질의 표적화를 향상시킬 수 있다. 예를 들어, 뼈에 대한 높은 친화성을 갖는 펩티드가 전체 교시내용이 참조로서 본원에 포함되는 미국 특허 번호 7,323,542호에 기재되어 있다.
TAGNPP1은 당 분야에 널리 공지된 재조합 기술 또는 화학적 컨쥬게이션을 포함하는 표준 방법을 이용하여 제조될 수 있다. 본 발명의 핵산 및 단백질을 분리시키고 특성규명하는데 유용한 기술은 당업자에게 널리 공지되어 있고, 과도한 실험 없이 사용하기에 적합한 프로토콜을 선택하기 위해 표준 분자생물학 및 생화학 매뉴얼이 참고될 수 있다. 예를 들어, 내용이 온전히 참조로서 본원에 포함되는 문헌[Sambrook et al, 1989, "Molecular Cloning: A Laboratory Manual," 2nd ed., Cold Spring Harbor]을 참조하라. 간단히, 폴리펩티드 성분을 인코딩하는 DNA 서열이 개별적으로 어셈블리될 수 있고, 적절한 발현 벡터로 라이게이션될 수 있다. 예를 들어, NPP1 성분을 인코딩하는 DNA 서열의 3' 말단이 펩티드 링커와 함께 또는 펩티드 링커 없이 TAG PEG, 또는 Fc와 같은 제 2의 폴리펩티드 성분을 인코딩하는 DNA 서열의 5' 말단에 라이게이션되어, 서열의 해독틀이 동일 위상에 존재한다. 이는 두 성분 폴리펩티드의 생물학적 활성을 보유하는 단일한 융합 단백질로의 번역을 가능케 한다. 라이게이션된 DNA 서열은 프로모터를 포함하는 적합한 전사 또는 번역 조절 성분에 작동 가능하게 연결된다. DNA의 발현을 담당하는 조절 성분은 신호 펩티드를 인코딩하는 선도 서열과 같은 제 1 폴리펩티드를 인코딩하는 DNA 서열에 대해 5'에만 위치된다. 유사하게, 번역 및 전사 종료 신호를 중단시키는데 필요한 정지 코돈은 제 2 폴리펩티드를 인코딩하는 DNA 서열에 대해 3'에만 존재한다.
본 발명은 또한 TAGNPP1 변이체를 포함한다. 바람직한 TAGNPP1 변이체는 SEQ ID NO:1의 아미노산 서열 A205 내지 L591과 80%, 85%, 90%, 95%, 더욱 바람직하게는 96%의 아미노산 서열 동일성을 갖는 것이다. 가장 바람직한 TAGNPP1 변이체는 SEQ ID NO:1의 아미노산 서열 A205 내지 L591과 적어도 97%의 아미노산 서열 동일성을 갖는 것이다.
본 발명은 또한 SEQ ID NO:2의 상보체 또는 이의 변이체를 포함하는 폴리누클레오티드 서열에 관한 것이다. 또한, 본 발명은 엄격한 조건하에서 SEQ ID NO:2에 하이브리드화되는 폴리누클레오티드 서열을 또한 특징으로 하며, 상기 서열의 안티센스 서열은 SEQ ID NO:2와 85%, 90%, 95%, 97%, 98%, 또는 99% 동일하다. 하이브리드화 조건은 문헌[Wahl, G. M. and S. L. Berger (1987; Methods Enzymol. 152:399-407) 및 Kimmel, A. R. (1987; Methods Enzymol. 152:507-511)]에 교시된 바와 같이 핵산 결합 복합체 또는 프로브의 융해 온도(Tm)를 기초로 하며, 이는 규정된 엄격성에서 이용될 수 있다.
본 발명은 또한 폴리펩티드를 인코딩하는 핵산 서열, 올리고누클레오티드, 펩티드 핵산(PNA), 이들의 단편, 부분 또는 안티센스 분자를 고려한다.
TAGNPP1 및 이의 변이체를 인코딩하는 누클레오티드 서열은 바람직하게는 적절히 선택된 엄격성 조건하에서 TAGNPP1의 누클레오티드 서열에 하이브리드화될 수 있으나, 실질적으로 상이한 코돈 사용빈도(codon usage)를 갖는 TAGNPP1 또는 이의 유도체를 인코딩하는 누클레오티드 서열을 생성시키는 것이 유리할 수 있다. 코돈은 특정 코돈이 숙주에 의해 이용되는 빈도에 따라 특정 원핵생물 또는 진핵생물 숙주에서 펩티드의 발현이 발생하는 속도를 증가시키도록 선택될 수 있다. 인코딩되는 아미노산 서열을 변경시킴이 없이 TAGNPP1 및 이의 유도체를 인코딩하는 누클레오티드 서열을 실질적으로 변경시키는 다른 이유는 더욱 요망되는 특성, 예를 들어, 보다 큰 반감기를 갖는 RNA 전사물의 생성을 포함한다.
본 발명에 의해 포함되는 TAGNPP1을 인코딩하는 변경된 핵산 서열은 TAGNPP1의 동일물 또는 기능성 동등물을 인코딩하는 폴리누클레오티드를 발생시키는 다양한 누클레오티드의 결실, 삽입, 또는 치환을 포함한다. 인코딩된 단백질은 또한 침묵 변화를 발생시키고, 기능적으로 동등한 TAGNPP1을 발생시키는 아미노산 잔기의 결실, 삽입, 또는 치환을 함유할 수 있다. 계획적인 아미노산 치환은 TAGNPP1의 생물학적 활성이 보유되는 한 잔기의 극성, 전하, 용해도, 소수성, 친수성, 및/또는 양친매성 특성에서의 유사성을 기초로 하여 이루어질 수 있다. 예를 들어, 양성으로 하전된 아미노산 잔기는 Lys 및 Arg를 포함하고; 음성으로 하전된 아미노산 잔기는 Asp 및 Glu를 포함하며; 유사한 친수성을 갖는 하전되지 않은 극성 머리 기를 갖는 아미노산은 Leu, Ile, 및 Val; Gly 및 Ala; Asp 및 Gln; Ser 및 Thr; Phe 및 Tyr을 포함할 수 있다.
발현 벡터
TAGNPP1을 인코딩하는 서열 및 적절한 전사 및 번역 조절 성분을 함유하는 발현 벡터를 작제하기 위해 당업자에게 널리 공지된 방법이 사용될 수 있다. 이들 방법은 시험관내 재조합 DNA 기술, 합성 기술, 및 생체내 유전자 재조합을 포함한다. 이러한 기술은, 예를 들어, 교시내용이 온전히 참조로서 본원에 포함되는 문헌[Sambrook, J. et al. (1989) Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, Plainview, N.Y., 및 Ausubel, F. M. et al. (1989) Current Protocols in Molecular Biology, John Wiley & Sons, New York, N.Y.]에 기재되어 있다.
TAGNPP1을 인코딩하는 서열을 함유하고 발현하도록 하기 위해 다양한 발현 벡터/숙주 시스템이 사용될 수 있다. 이들은 미생물, 예를 들어, 재조합 박테리오파지, 플라스미드, 또는 코스미드 DNA 발현 벡터로 형질전환된 박테리아; 효모 발현 벡터로 형질전환된 효모; 바이러스 발현 벡터(예를 들어, 배큘로바이러스) 또는 박테리아 발현 벡터(예를 들어, Ti 또는 pBR322 플라스미드)로 감염된 곤충 세포 시스템; 또는 동물 세포 시스템(예를 들어, pTT22 벡터)을 포함하나, 이에 제한되지는 않는다.
조절 성분 또는 조절 서열은 전사 및 번역을 수행하기 위해 숙주 세포 단백질과 상호작용하는 벡터의 번역되지 않는 영역, 즉, 인핸서, 프로모터, 5' 및 3' 비번역 영역을 포함할 수 있다. 상기 성분들은 이들의 강도 및 특이성에서 다양할 수 있다. 사용되는 벡터 시스템 및 숙주에 따라, 조직 특이적, 항시성 및 유도성 프로모터를 포함하는 임의의 수의 적합한 전사 및 번역 성분이 사용될 수 있다. 예를 들어, 박테리아 시스템에서 클로닝하는 경우, 유도성 프로모터, 예를 들어, Bluescript™ 파지미드(Stratagene, LaJolla, California) 또는 pSport1™ 플라스미드(Gibco BRL) 등의 하이브리드 lacZ 프로모터가 사용될 수 있다. 포유동물 세포 시스템에서, 포유동물 유전자 또는 포유동물 바이러스로부터의 프로모터가 바람직하다. TAGNPP1을 인코딩하는 서열의 다수의 카피를 함유하는 세포주를 생성시키는 것이 필요한 경우, SV40 또는 EBV를 기초로 한 벡터가 적절한 선택 가능한 마커와 함께 사용될 수 있다. 조류 발현 시스템이 사용되는 경우, 다양한 TAGNPP1 작제물을 발현시키기에 적합한 벡터는 전체 교시내용이 온전히 참조로서 본원에 포함되는 미국 특허 번호 6,730,822호; 미국 특허 번호 6,825,396호; 미국 특허 번호 6,875,588호; 미국 특허 번호 7,294,507호; 미국 특허 번호 7,521,591호; 미국 특허 번호 7,534,929호; 및 미국 특허 출원 일련 번호 11/376,023호에 기재되어 있다. 간단히, TAGNPP1을 발현시키기 위해 조류 발현 시스템이 사용되는 경우, 적합한 난관(oviduct)-특이적 프로모터, 비제한적인 예로, 난점질 프로모터, 난알부민 프로모터, 리소자임 프로모터, 콘알부민(conalbumin) 프로모터, 난백뮤신 프로모터, 난트랜스페린 프로모터 및 이들 프로모터 각각의 기능성 부분이 고려된다. 적합한 비특이적 프로모터는, 비제한적인 예로, 사이토메갈로바이러스(CMV) 프로모터, MDOT 프로모터 및 라우스-육종 바이러스(RSV) 프로모터, 뮤린 백혈병 바이러스(MLV) 프로모터, 마우스 유암 바이러스(MMTV) 프로모터 및 SV40 프로모터 및 이들 프로모터 각각의 기능성 부분을 포함할 수 있다. 본 발명에서 유용할 수 있는 다른 프로모터의 비제한적인 예는, 비제한적으로, Pol III 프로모터(예를 들어, 타입 1, 타입 2 및 타입 3 Pol III 프로모터), 예를 들어, H1 프로모터, U6 프로모터, tRNA 프로모터, RNase MPR 프로모터 및 이들 프로모터 각각의 기능성 부분을 포함한다. 통상적으로, 사용되는 프로모터에 따라 본 발명에서 사용하기 위해 기능성 종료자 서열이 선택된다.
숙주 세포
본 발명은, 예를 들어, 개시내용이 참조로서 본원에 온전히 포함되는 미국 특허 번호 7,534,929호와 같이 당 분야에 널리 공지된 바와 같은, 트랜스제닉 조류(예를 들어, 트랜스제닉 닭)에서의 가용성 TAGNPP1의 생성을 포함한다. 표적화 모이어티를 갖거나 갖지 않는 NPP1 성분(예를 들어, ssNPP1, sNPP1, TAGsNPP1 및 TAGssNPP1)의 조류 시스템(예를 들어, 조류 난관)에서의 생성이 본 발명의 범위에 포함된다. 또한, 비제한적으로, 트랜스제닉 조류, 트랜스제닉 포유동물, 세포 배양물(예를 들어, CHO 세포, HEK293 세포, 및 COS 세포), 박테리아, 예를 들어, E. coli, 트랜스제닉 동물, 예를 들어, 포유동물 및 조류(예를 들어, 닭, 메추라기, 오리 및 칠면조)를 포함하는 임의의 유용한 단백질 발현 시스템, 및 덕 위드(duck weed)를 포함하는 식물 시스템에서 생성된 TAGNPP1이 본원에서 고려된다.
숙주 세포 계통은 삽입된 서열의 발현을 조절하거나, 원하는 방식으로 발현된 TAGNPP1을 처리하는 능력에 대해 선택될 수 있다. TAGNNP1의 폴리펩티드의 상기 변형은 아세틸화, 카르복실화, 시알릴화, 당화, 인산화, 지질화, 및 아실화를 포함하나, 이에 제한되지는 않는다. 상기 번역후 활성을 위한 특이적 세포 기구 및 특징적 메커니즘을 갖는 다양한 숙주 세포, 예를 들어, CHO, COS, HeLa, MDCK, HEK293, 및 W138이 본 발명의 융합 단백질의 정확한 변형 및 가공을 보장하기 위해 선택될 수 있다. 조류 종양 세포주가 또한 본 발명의 폴리펩티드를 발현시키기 위한 숙주 세포로서 고려된다. 본 발명에서 사용될 수 있는 유용한 조류 세포주의 예(예를 들어, 조류 난관 종양 세포주)가 전체 교시내용이 참조로서 본원에 포함되는 미국 특허 공개 번호 2009/0253176호에 기재되어 있다.
TAGNPP1의 생성
TAGNPP1은 다양한 널리 공지된 기술 중 임의의 기술을 이용하여 생성될 수 있다. 상기 기재된 바와 같이 DNA 서열에 의해 인코딩된 TAGNPP1은 본원에 기재되거나 당업자에게 널리 공지된 다양한 발현 벡터 중 임의의 벡터를 이용하여 DNA 서열로부터 용이하게 제조될 수 있다. 발현은 본 발명의 재조합 폴리펩티드를 인코딩하는 DNA 분자를 함유하는 발현 벡터로 형질전환되거나 트랜스펙션된 임의의 적절한 숙주 세포에서 달성될 수 있다. 배양 배지로 재조합 융합 단백질 또는 폴리펩티드를 분비하는 적합한 숙주/벡터 시스템으로부터의 상층액이 시판되는 필터를 이용하여 먼저 농축될 수 있다. 농축 후, 농축물이 적합한 정제 매트릭스, 예를 들어, 친화성 매트릭스 또는 이온 교환 수지에 적용될 수 있다. 하나 이상의 역상 HPLC 단계가 재조합 폴리펩티드를 추가로 정제하기 위해 사용될 수 있다.
재조합 단백질의 고수율 생성을 위해, 안정적 발현이 바람직하다. TAGNPP1을 안정적으로 발현하는 세포주가 동일한 벡터 또는 별개의 벡터 상에 바이러스 복제 기점 및/또는 내인성 발현 성분 및/또는 선택 가능한 마커 유전자를 함유하는 발현 벡터를 이용하여 형질전환될 수 있다. 벡터의 도입 후, 세포는 이들이 선택 배지로 교환되기 전에 강화 배지에서 1-2일 동안 성장하는 것이 허용될 수 있다. 선택가능한 마커의 목적은 선택에 대한 내성을 부여하는 것이며, 이의 존재는 도입된 서열을 성공적으로 발현하는 세포의 성장 및 회수를 가능케 한다. 안정적으로 형질전환된 세포의 내성 클론은 세포 유형에 대해 적절한 조직 배양 기술을 이용하여 증식될 수 있다. 포유동물 세포주에서 외인성 단백질을 생성시키는 방법은 당 분야에 널리 공지되어 있다. 조류 세포에서 TAGNPP1 융합 단백질과 같은 이종성 폴리펩티드의 생성을 위한 본 발명의 상기 및 다른 양태 및 구체예의 예시적 예는 각각이 온전히 참조로서 본원에 포함되는 2002년 8월 8일에 U.S. 2002/0108132-A1호로 공개된 2001년 6월 8일에 출원된 미국 특허 출원 일련 번호 09/877,374호, 및 2002년 9월 18일에 출원된 미국 특허 출원 일련 번호 10/251,364호에 충분히 개시되어 있다. 조류 종양 세포주에서 외인성 단백질을 생성시키는 예는 또한 전체 교시내용이 온전히 참조로서 본원에 포함되는 미국 특허 공개 번호 2009/0253176호에 기재되어 있다.
본 발명은 특히 트랜스제닉 조류 시스템에서의 본원에 개시된 TAGNPP1 단백질의 생성을 고려한다. 한 특히 유용한 구체예에서, 본 발명은 본 발명에 따라 닭과 같은 트랜스제닉 조류의 난관에서 생성될 수 있는 TAGNPP1의 생성에 주목한다. 트랜스제닉 조류 발현 시스템에서 외인성 단백질을 생성시키는 예는 또한 전체 교시내용이 온전히 참조로서 본원에 포함되는 미국 특허 번호 6,730,822호에 기재되어 있다. 간단히, 닭 난관에서 인코딩 서열의 발현을 유도하는 조직-특이적 또는 항상성 프로모터에 작동 가능하게 연결된 TAGNPP1 융합 단백질을 인코딩하는 핵산 서열을 함유하는 상기 기재된 적합한 조류 벡터가 닭 단계 X 배아 세포에 도입된다. 형질전환된 배아 세포가 살아있는 병아리를 부화시키는데 도움이 되는 조건하에서 인큐베이션된다. 살아있는 병아리는 성숙한 키메라 닭으로 양육되고, 이는 자연적으로 또는 인공수정을 통해 비-트랜스제닉 닭과 교배된다. 트랜스제닉 닭은 단백질을 인코딩하는 서열의 점라인 통합에 대해 자손을 스크리닝함으로써 확인된다. 트랜스제닉 자손은 또 다른 트랜스제닉 또는 비-트랜스제닉 닭과 교배되어 TAGNPP1 융합 단백질을 함유하는 계란을 생성할 수 있다. 이후, TAGNPP1은 당 분야에 널리 공지된 방법에 의해 분리되고 정제된다. 따라서, 본 발명은 트랜스제닉 조류에 의해 생성된 재조합 TAGNPP1 융합 단백질을 제공한다.
약학적 조성물
본 발명은 또한 분리되고 실질적으로 정제된 TAGNPP1 또는 이의 약학적으로 허용되는 염을 포함하는 약학적 조성물을 특징으로 한다. 본 발명의 약학적 조성물은 또한 약학적으로 허용되는 담체 또는 부형제를 포함할 수 있다. 복합 분자를 포함하는 상기 담체를 포함하는 조성물은 전체 교시내용이 참조로서 본원에 포함되는 널리 공지된 통상적 방법(예를 들어, Remington's Pharmaceutical Sciences, 14th Ed., Mack Publishing Co., Easton, Pa. 참조)에 의해 제형화된다. 담체는 희석제를 포함할 수 있다. 한 구체예에서, 약학적 담체는 액체일 수 있고, 융합 단백질은 용액의 형태일 수 있다. 약학적 담체는 왁스, 지방, 또는 알콜일 수 있다. 또 다른 구체예에서, 약학적으로 허용되는 담체는 분말, 동결건조된 분말, 또는 정제 형태의 고체일 수 있다. 한 구체예에서, 담체는 리포솜 또는 미세캡슐을 포함할 수 있다.
약학적 조성물은 희석제와의 재구성 후 주사를 위한 멸균의 동결건조된 분말의 형태일 수 있다. 희석제는 주사용수, 주사용 정균수, 또는 멸균 염수일 수 있다. 동결건조된 분말은 건조 형태의 단백질을 생성시키기 위해 융합 단백질의 용액을 동결 건조시킴으로써 생성될 수 있다. 당 분야에서 공지된 바와 같이, 동결건조된 단백질은 일반적으로 단백질의 액체 용액보다 증가된 안정성 및 긴 저장기간을 갖는다.
정의:
본원에서 사용되는 제형, 조성물 또는 성분과 관련하여 본원에서 사용되는 용어 "허용되는"은 치료받는 피검체의 전반적 건강에 지속적인 유해한 효과를 갖지 않는 것을 의미한다.
본원에서 사용되는 용어 "투여" 또는 "투여하는"은 치료가 필요한 피검체에게 본 발명의 융합 단백질을 제공하는 것을 말한다.
본원에서 사용되는 "변경"은 하이브리드화 검정을 이용하여 검출될 수 있는 결실, 삽입, 및 점돌연변이를 포함하는 TAGNPP1을 인코딩하는 폴리누클레오티드의 서열 내에서의 임의의 변경을 포함한다.
용어 "동물"은 조류 및 포유동물, 예를 들어, 래트, 마우스 및 인간을 포함하는 모든 척추동물을 포함하는 것으로 본원에서 사용된다. 이는 또한 배아 및 태아 단계를 포함하는 모든 발달 단계의 개별적 동물을 포함한다.
융합 단백질 분자의 아미노산 서열을 나타내기 위해 "아미노산 서열"이 본원에서 언급되는 경우, "아미노산 서열" 및 유사 용어, 예를 들어, "폴리펩티드" 또는 "단백질"은 아미노산 서열을 언급된 단백질 또는 폴리펩티드 분자와 관련된 완전한 아미노산 서열로 제한하는 것을 의미하는 것이 아니다.
본원에서 사용되는 용어 "조류"는 분류학적 부류 아바(ava)의 유기체, 비제한적인 예로, 닭, 칠면조, 오리, 거위, 메추라기, 꿩, 앵무새, 피리새류, 매, 까마귀 및 타조, 에뮤 및 화식조를 포함하는 주금류와 같은 유기체의 임의의 종, 아종 또는 계통을 나타낸다. 상기 용어는 갈루스 갈루스(Gallus gallus), 또는 닭(예를 들어, 화이트 레그혼(White Leghorn), 브라운 레그혼(Brown Leghorn), 베어드-락(Barred-Rock), 서섹스(Sussex), 뉴 햄프셔(New Hampshire), 로드 아일랜드(Rhode Island), 오스트랄로프(Ausstralorp), 미놀카(Minorca), 암록스(Amrox), 캘리포니아 그레이(California Gray), 이탈리안 파트리지-컬러드(Italian Partridge-colored))의 다양한 공지된 계통, 뿐만 아니라 칠면조, 꿩, 메추라기, 오리, 타조 및 상업적 양으로 통상적으로 양육되는 다른 가금의 계통을 포함한다.
특정 레트로바이러스를 기초로 하거나 이로부터 유래되거나, 특정 레트로바이러스의 누클레오티드 서열을 기초로 하는 레트로바이러스 벡터에서와 같은 구 "기초로 하는" 또는 "~로부터 유래된"은 레트로바이러스 벡터의 유전체가 특정 레트로바이러스의 유전체의 누클레오티드 서열의 많은 부분을 함유하는 것을 의미한다. 상기 많은 부분은 특정 유전자 또는 누클레오티드 서열, 예를 들어, gag, pol 및/또는 env 단백질을 인코딩하는 누클레오티드 서열 또는 바이러스 유전체의 다른 구조성 또는 기능성 누클레오티드 서열, 예를 들어, LTR을 인코딩하는 서열일 수 있거나, 실질적으로 완전한 레트로바이러스 유전체, 예를 들어, 레트로바이러스 유전체의 대부분(예를 들어, 60% 이상 또는 70% 이상 또는 80% 이상 또는 90% 이상) 또는 모두일 수 있으며, 이는 당업자의 지식에 따라 명세서 내의 문맥으로부터 명백할 것이다. 레트로바이러스를 기초로 하거나 이로부터 유래되는 레트로바이러스 벡터의 예는 문헌[Cosset et al., Journal of Virology (1991) vol 65, p 3388-3394]에 개시된 바와 같이 ALV 레트로바이러스를 기초로 하는 NL 레트로바이러스 벡터(예를 들어, NLB)이다.
본원에서 사용되는 용어 "생물학적 활성"은 자연 발생 NPP1 단백질의 피로포스파타제/포스포디에스테라제의 구조적, 조절 또는 생화학적 기능을 갖는 융합 단백질을 나타낸다.
본원에서 사용되는 "작제물"은 자연원으로부터 분리된 누클레오티드 서열의 하나 이상의 세그먼트로부터 어셈블리되거나, 화학적으로 합성되는 DNA와 같은 선형 또는 원형 누클레오티드 서열, 또는 이들의 조합물을 나타낸다.
본원에서 사용되는 용어 "상보성"은 서로 특이적 상호작용을 형성할 수 있는 2개의 핵산 분자를 나타낸다. 특이적 상호작용에서, 2개의 핵산 가닥이 반대 극성인 경우 핵산의 한 가닥 내의 아데닌 염기는 제 2의 핵산 가닥 내의 티민과 2개의 수소결합을 형성할 수 있다. 또한, 특이적 상호작용에서, 2개의 핵산 가닥이 반대 극성인 경우 핵산의 한 가닥 내의 구아닌 염기는 제 2의 핵산 가닥 내의 시토신과 3개의 수소결합을 형성할 수 있다. 본원에서 언급되는 바와 같은 상보성 핵산은 변형된 염기를 추가로 포함할 수 있고, 여기서 변형된 아데닌은 티민 또는 변형된 티민과 수소결합을 형성할 수 있고, 변형된 시토신은 구아닌 또는 변형된 구아닌과 수소결합을 형성할 수 있다.
본원에서 사용되는 "결실"은 하나 이상의 아미노산 또는 누클레오티드 잔기가 각각 부재하는 아미노산 또는 누클레오티드 서열에서의 변화를 나타낸다.
본원에서 사용되는 용어 "발현된" 또는 "발현"은 유전자의 2개의 핵산 가닥 중 하나의 영역과 적어도 부분적으로 상보적인 RNA 핵산 분자를 제공하는 유전자로부터의 전사를 나타낸다. 본원에서 사용되는 용어 "발현된" 또는 "발현"은 또한 단백질 또는 펩티드를 생성시키는 RNA의 번역을 나타낼 수 있다.
본원에서 사용되는 용어 "발현 벡터"는 적어도 하나의 폴리펩티드를 코딩하는 누클레오티드 서열에 작동 가능하게 연결된 유전자 발현 조절 영역, 예를 들어, 프로모터 또는 프로모터 성분을 포함하는 핵산 벡터를 나타낸다.
"기능성 부분" 또는 "기능성 단편"은 상호교환적으로 사용되고, 본원에서 사용되는 바와 같이 전체 기능을 전체적 또는 부분적으로 수행할 수 있는 전체의 부분 또는 단편을 의미한다. 예를 들어, 분자의 생물학적 기능성 부분은 전체 또는 온전한 분자의 생물학적 기능을 수행하는 분자의 부분을 의미한다. 예를 들어, 유전자 발현 조절 영역의 기능성 부분은 생물학적 시스템 내에서 유전자 발현을 전체적으로 또는 부분적으로 조절하거나 제어하는(예를 들어, 전체적으로 또는 부분적으로 촉진하는) 특정 유전자 발현 조절 영역의 단편 또는 부분이다(예를 들어, 프로모터). 기능성 부분은 임의의 유용한 크기일 수 있다.
본원에서 사용되는 용어 "유전자 발현 조절 영역"은 코딩 서열과 관련되고, 코딩 서열의 발현을 전체적으로 또는 부분적으로 조절하는, 예를 들어, 코딩 서열의 전사를 전체적 또는 부분적으로 조절하는 누클레오티드 서열을 나타낸다. 유전자 발현 조절 영역은 자연 발생원으로부터 분리될 수 있거나, 화학적으로 합성될 수 있고, 적절한 세포 내에서 조절된 전사를 가능케 하는 핵산 벡터로 통합될 수 있다. "유전자 발현 조절 영역"은 mRNA로 전사될 수 있는 코딩 서열의 5' 말단 영역에 존재하는 핵산 서열의 영역 앞에 존재할 수 있으나, 앞에 존재하는 것으로 제한되지는 않는다.
용어 "이종성", "외인성" 및 "외래"는 본원에서 상호교환적으로 사용되고, 일반적으로 특정 유기체 또는 특정 세포, 조직 또는 유기체 내에 함유되거나 유기체에 의해 생성되는 다른 성분에서 일반적으로 발견되지 않는 핵산 또는 단백질과 같은 생체분자를 나타낸다. 예를 들어, 난(egg)에 대해 이종성이거나 외인성인 단백질은 난에서 일반적으로 발견되지 않는 단백질이다. 핵산, 예를 들어, DNA 및 RNA와 관련하여 본원에서 사용되는 용어 "이종성", "외인성" 및 "외래"는 상호교환적으로 사용되며, 이는 존재하는 염색체, 유전체 또는 세포의 일부로서 자연 발생하지 않거나, 자연적으로 발생하는 위치(들) 및/또는 양과 상이한 위치(들) 및/또는 양으로 발견되는 핵산을 나타낸다. 이는 유전체, 염색체 또는 세포에 대해 내인성이 아니고, 유전체, 염색체 또는 세포로 외인적으로 도입된 핵산일 수 있다. 이종성 DNA의 예는 유전자 발현 조절 영역을 포함하는 DNA 및 생성물 또는 생성물들, 예를 들어, RNA 또는 단백질 생성물을 인코딩하는 DNA를 포함하나, 이에 제한되지는 않는다. 이종성 DNA의 예는 조류로부터 분리된 후, 이후, 예를 들어, 조류 유전체로의 재도입 후에 사용되는 바와 같은 본원에 개시된 유전자 발현 조절 영역 또는 프로모터를 포함하나, 이에 제한되지는 않는다.
본원에서 사용되는 용어 "분리된 핵산"은, 예를 들어, (a) 자연적으로 발생하는 유전체 분자의 일부의 서열을 갖지만, 자연 발생하는 종의 유전체 내의 분자의 일부의 측면에 존재하는 서열의 적어도 하나의 측면에 존재하지 않는 DNA; (b) 생성된 벡터 또는 유전체 DNA가 핵산이 수득되는 자연 발생 DNA와 동일하지 않도록 하는 방식으로 벡터 또는 원핵생물 또는 진핵생물의 유전체 DNA로 통합되는 핵산; (c) 독립된 분자, 예를 들어, cDNA, 유전체 단편, 중합효소 연쇄 반응(PCR), 리가제 연쇄 반응(LCR) 또는 화학적 합성에 의해 생성된 단편, 또는 제한 단편; (d) 하이브리드 유전자, 즉, 융합 단백질을 인코딩하는 유전자의 일부인 재조합 누클레오티드 서열; 및 (e) 자연 발생되지 않는 하이브리드 서열의 일부인 재조합 누클레오티드 서열을 포함한다. 본 발명의 분리된 핵산 분자는, 예를 들어, 자연 대립유전자 변이체, 뿐만 아니라 누클레오티드 결실, 삽입, 역전, 또는 치환에 의해 변형된 핵산 분자를 포함할 수 있다.
본원에서 사용되는 "삽입" 또는 "첨가"는 TAGNPP1 분자와 비교시 하나 이상의 아미노산 또는 누클레오티드 잔기의 첨가를 각각 발생시키는 아미노산 또는 누클레오티드 서열에서의 변화를 나타낸다.
본원에서 사용되는 용어 "핵산"은 누클레오티드 및 누클레오시드의 임의의 선형 또는 연속적 어레이, 예를 들어, cDNA, 유전체 DNA, mRNA, tRNA, 올리고누클레오티드, 올리고누클레오시드 및 이들의 유도체를 나타낸다. 논의의 용이함을 위해, 비자연 발생 핵산이 작제물로 본원에서 언급될 수 있다. 핵산은 발현, 클로닝, 코스미드 및 형질전환 벡터를 포함하는 박테리아 플라스미드 벡터, 예를 들어, 동물 바이러스 벡터, 비제한적인 예로, 변형된 아데노바이러스, 인플루엔자 바이러스, 폴리오 바이러스, 폭스 바이러스, 레트로바이러스, 예를 들어, 조류 백혈증 바이러스(ALV) 레트로바이러스 벡터, 뮤린 백혈병 바이러스(MLV) 레트로바이러스 벡터, 및 렌티바이러스 벡터 등 및 이들의 단편을 포함할 수 있다. 또한, 핵산은 조류 백혈증 바이러스(ALV) 레트로바이러스 벡터, 뮤린 백혈병 바이러스(MLV) 레트로바이러스 벡터, 또는 렌티바이러스 벡터 및 이들의 단편의 LTR일 수 있다. 핵산은 또한 NL 벡터, 예를 들어, NLB, NLD 및 NLA 및 이들의 단편 및 합성 올리고누클레오티드, 예를 들어, 화학적으로 합성된 DNA 또는 RNA를 포함할 수 있다. 핵산은 변형되거나 유도체화된 누클레오티드 및 누클레오시드, 비제한적인 예로, 할로겐화된 누클레오티드, 비제한적인 예로, 5-브로모우라실, 및 유도체화된 누클레오티드, 예를 들어, 비오틴-표지된 누클레오티드를 포함할 수 있다.
본원에서 사용되는 "핵산 서열"은 올리고누클레오티드, 누클레오티드, 또는 폴리누클레오티드, 및 이들의 단편 또는 일부, 및 단일-가닥 또는 이중-가닥일 수 있고, 센스 또는 안티센스 가닥인 유전체 또는 합성 기원의 DNA 또는 RNA를 나타낸다.
용어 "작동 가능하게 연결된"은 성분들의 배열을 나타내며, 여기서 상기 기재된 성분들은 이들의 일반적인 기능을 수행하도록 배열된다. 코딩 서열에 작동 가능하게 연결된 유전자 발현 조절 영역 또는 프로모터(예를 들어, 프로모터 성분)는 코딩 서열을 발현시킬 수 있다. 조절 서열은 이들이 코딩 서열의 발현을 유도하는 기능을 하는 한 코딩 서열과 연속적일 필요는 없다. 따라서, 예를 들어, 사이에 존재하는 아직 번역되지 않은 전사된 서열이 프로모터 서열과 코딩 서열 사이에 존재할 수 있고, 프로모터 서열은 여전히 코딩 서열에 "작동 가능하게 연결된" 것으로 간주될 수 있다.
본원에서 사용되는 용어 "난관 특이적 프로모터"는 기능성인, 즉, 새의 난관 세포에서 크게, 예를 들어, 주로(즉, 난관 세포에서 생성되는 특정 프로모터 유형에 의해 동물에서 생성되는 전사 생성물의 50% 이상) 또는 배타적으로 코딩 서열의 전사를 제공하는 프로모터 및 프로모터 성분을 나타낸다. 유용한 난관 특이적 프로모터의 예는 난알부민 프로모터, 난점질 프로모터, 오보인히비터(ovoinhibitor) 프로모터, 리소자임 프로모터 및 난트랜스페린 프로모터 및 이들 프로모터의 기능성 부분, 예를 들어, 프로모터 성분을 포함하나, 이에 제한되지는 않는다.
용어 "폴리누클레오티드", "올리고누클레오티드", "누클레오티드 서열" 및 "핵산 서열"은 본원에서 상호교환적으로 사용될 수 있고, 이는 코딩 서열, 즉, 적절한 조절 또는 제어 서열의 제어하에 위치되는 경우 시험관내 또는 생체 내에서 폴리펩티드로 전사되고 번역되는 폴리누클레티드(들) 또는 핵산 서열(들); 조절 서열, 예를 들어, 번역 시작 및 정지 코돈, 프로모터 서열, 리보솜 결합 부위, 아데닐중합체형성 신호, 전사 인자 결합 부위, 전사 종료 서열, 업스트림 및 다운스트림 조절 도메인, 인핸서, 사일런서(silencer), 전사 인자(들)이 결합하고, 유전자의 프로모터의 활성을 양성(유도)으로 또는 음성(억제)으로 변경시키는 DNA 서열 등을 포함하나, 이에 제한되지는 않는다. 길이 또는 합성 기원에 대한 제한이 본원에 기재된 용어에 의해 제안되지는 않는다.
본원에서 사용되는 용어 "폴리펩티드" 및 "단백질"은 상호교환적으로 사용될 수 있고, 이는 펩티드 결합을 통해 연결된 연속적 어레이의 3개 이상의 아미노산의 아미노산들의 중합체를 나타낸다. 용어 "폴리펩티드"는 단백질, 예를 들어, 융합 단백질, 단백질 단편, 단백질 유사체, 올리고펩티드 등을 포함한다. 용어 "폴리펩티드"는 핵산에 의해 인코딩되거나, 재조합 기술을 통해 생성(예를 들어, 트랜스제닉 새로부터 분리됨)되거나, 화학적으로 합성되는 상기 정의된 바와 같은 폴리펩티드를 포함한다.
본원에서 사용되는 바와 같은 용어 "프로모터"는 조류 세포에서 RNA 중합효소에 의한 전사 개시를 개시시키는데 유용한 DNA 서열을 나타낸다. "프로모터 성분"은 단독으로 또는 다른 DNA 서열과 함께 전사를 수행하거나 촉진할 수 있는 DNA 서열이다. 본원에 개시되고 청구된 특이적 프로모터 성분, 예를 들어, 난알부민 프로모터 성분, 난점질 프로모터 성분 및 리소자임 프로모터 성분 및 다른 프로모터 및 프로모터 성분은 특이적 프로모터 서열을 기재하지 않는다. 오히려, 이들은 코딩 서열의 전사를 수행하거나 촉진하는데 유용한 각각의 프로모터의 임의의 서열 또는 서열 단편을 포함한다. 예를 들어, 난점질 프로모터 성분은 참조로서 본원에 온전히 포함되는 2007년 5월 17일에 공개된 미국 공개 번호 11/649,543호에 개시된 약 1.8 kb, 약 3.9 kb 및 약 10 kb의 난점질 프로모터를 포함하나, 이에 제한되지는 않는다. "프로모터 성분"은 또한 RNA 전사를 개시시키는 작용을 하는 재배열된 유전자 발현 조절 영역 및 RNA 전사를 개시시키는 작용을 하는 자연 발생 DNA 서열 및/또는 합성 DNA 서열로 구성된 하이브리드 DNA 분자를 포함할 수 있다.
본원에서 사용되는 용어 "재조합 핵산" 및 "재조합 DNA"는 진핵생물 또는 원핵생물 세포에서 자연 발견되지 않는 적어도 2개의 핵산 서열의 조합물을 나타낸다. 핵산 서열은 핵산 벡터, 유전자 발현 조절 성분, 복제 기점, 발현되는 경우 항생제 내성을 부여하는 적합한 유전자 서열, 단백질-인코딩 서열 등을 포함할 수 있으나, 이에 제한되지는 않는다. 용어 "재조합 폴리펩티드" 또는 "재조합 단백질"은 재조합 DNA 기술에 의해 생성되어, 위치, 순도 또는 구조에 있어서 자연 발생 폴리펩티드와 상이한 폴리펩티드를 포함하는 것을 의미한다. 일반적으로, 이러한 재조합 폴리펩티드는 일반적으로 자연적으로 관찰되는 것과 상이한 양으로 세포에 존재할 것이다.
본원에서 사용되는 용어 "엄격한 조건"은 약 Tm-5℃(프로브의 융해 온도(Tm)보다 5℃ 아래) 내지 Tm 보다 약 20℃ 내지 25℃ 아래 범위 내에서 발생하는 "엄격성"이다. 당업자에 의해 이해되는 바와 같이, 동일하거나 관련된 폴리누클레오티드 서열을 확인하거나 검출하기 위해 하이브리드화의 엄격성이 변경될 수 있다.
본원에서 사용되는 용어 "피검체" 또는 "환자"는 포유동물 및 비포유동물을 포함한다. 포유동물의 예는 인간, 침팬지, 유인원, 원숭이, 소, 말, 양, 염소, 돼지, 토끼, 개, 고양이, 래트, 마우스, 기니아 피그 등을 포함하나, 이에 제한되지는 않는다. 비포유동물의 예는 새, 어류 등을 포함하나, 이에 제한되지는 않는다.
본원에서 사용되는 "치환"은 하나 이상의 아미노산 또는 누클레오티드의 상이한 아미노산 또는 누클레오티드 각각에 의한 대체를 나타낸다.
본원에서 사용되는 용어 "치료적 유효량"은 상기 양을 투여받지 않은 상응하는 피검체와 비교하여 질병, 장애, 또는 부작용의 개선된 치료, 치유, 예방, 또는 개선, 또는 질병 또는 장애의 진행 속도의 감소를 발생시키는 화합물의 임의의 양을 나타낸다. 상기 용어는 또한 이의 범위 내에 정상적인 생리학적 기능을 향상시키는데 효과적인 양을 포함한다.
본원에서 사용되는 용어 "TAGNPP1", "융합 단백질", "TAGNPP1 폴리펩티드" 및 "표적화 모이어티에 융합된 NPP1 성분"은 상호교환적으로 사용된다.
본원에서 사용되는 용어 "치료하다", "치료하는" 또는 "치료"는 질병 또는 질환 증상을 경감시키거나, 감소시키거나, 개선시키거나, 추가 증상을 예방하거나, 증상의 근본 원인을 개선시키거나, 예방하거나, 질병 또는 질환을 억제하거나, 질병 또는 질환의 발생을 억제하거나, 질병 또는 질환을 경감시키거나, 질병 또는 질환의 퇴축을 야기시키거나, 질병 또는 질환에 의해 야기되는 질환을 경감시키거나, 질병 또는 질환의 증상을 예방적 및/또는 치료적으로 중지시키는 방법을 나타낸다.
본원에서 사용되는 TAGNPP1의 "변이체"는 하나 이상의 아미노산에 의해 변경되는 아미노산 서열을 나타낸다. 바람직하게는, 변이체는 보존성 치환을 함유한다. "보존성 치환"은 아미노산이 유사한 특성을 갖는 또 다른 아미노산으로 치환되어, 펩티드 화학의 당업자가 폴리펩티드의 이차 구조 및 하이드로패틱 성질(hydropathic nature)이 실질적으로 변화되지 않는 것을 예상할 수 있는 것이다. 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 친양매성 특성에서의 유사성을 기초로 하여 이루어질 수 있다. 예를 들어, 음성으로 하전된 아미노산은 Asp 및 Glu를 포함하고; 양성으로 하전된 아미노산은 리신 및 아르기닌을 포함하고; 유사한 친수성 값을 갖는 하전되지 않은 극성 머리 기를 갖는 아미노산은 Leu, Ile 및 Val; Gly 및 Ala; Asp 및 Gln; 및 Ser, Thr, Phe 및 Tyr을 포함한다. 보존성 변화를 나타낼 수 있는 아미노산의 다른 군은 Ala, Pro, Gly, Glu, Asp, Gln, Asn, Ser, Thr; (2) Cys, Ser, Tyr, Thr; (3) Val, Ile, Leu, Met, Ala, Phe; (4) Lys, Arg, His; 및 (5) Phe, Tyr, Trp, His를 포함한다. 변이체는 또한 또는 대안적으로 비보존성 변화를 함유할 수 있다. 한 바람직한 구체예에서, 변이체 폴리펩티드는 5개의 아미노산 또는 그 미만의 아미노산의 치환, 결실 또는 첨가에 의해, 또는, 예를 들어, Gly의 Trp에 의한 대체에 의해 자연 서열과 상이하다. 변이체는 또한(또는 대안적으로), 예를 들어, NPP1 성분의 면역원성, 이차 구조 및 하이드로패틱 성질(hydropathic nature)에 최소한의 영향을 미치는 아미노산의 결실 또는 첨가에 의해 변형될 수 있다. 어떤 아미노산 잔기가 생물학적 또는 면역학적 활성을 파괴함이 없이 치환되거나, 삽입되거나, 결실될 수 있는 것을 결정하는데 있어서의 지침은 당 분야에 널리 공지된 컴퓨터 프로그램을 이용하여 발견될 수 있다.
본원에서 사용되는 용어 "벡터" 및 "핵산 벡터"는 세포로 트랜스펙션되거나 형질전환될 수 있고, 숙주 세포 유전체와 독립적으로 또는 숙주 세포 유전체 내에서 복제할 수 있는 자연 또는 합성의 단일 또는 이중 가닥 플라스미드 또는 바이러스 핵산 분자를 나타낸다. 원형 이중 가닥 벡터는 벡터의 누클레오티드 서열을 기초로 하여 적절한 제한 효소를 이용한 처리에 의해 선형화될 수 있다. 핵산은 벡터를 제한 효소로 절단하고, 원하는 단편들을 함께 라이게이션시킴으로써 벡터에 삽입될 수 있다.
융합 단백질과 관련하여 본원에서 사용되는 용어 "일부"는 상기 단백질의 단편을 나타낸다. 단편은 4개의 아미노산 잔기 내지 전체 아미노산 서열에서 하나의 아미노산이 빠진 크기의 범위일 수 있다. 따라서, "SEQ ID NO:1의 아미노산 서열의 적어도 일부를 포함하는" 단백질은 전장 TAGNPP1 및 이의 단편을 포함한다.
본원에서 사용되는 "형질전환" 또는 "트랜스펙션"은 당 분야에 널리 공지된 다양한 방법을 이용하여 외인성 DNA가 진입하고 수용체 세포를 변화시키는 과정을 기재한다. 형질전환은 외래 핵산 서열의 원핵생물 또는 진핵생물 숙주 세포로의 삽입을 위한 임의의 공지된 방법에 의존할 수 있다. 상기 방법은 형질전환되는 숙주 세포를 기초로 하여 선택되고, 이는 전기천공, 입자 분사법(particle bombardment), 바이러스 감염, 및 리포펙션(lipofection)을 포함할 수 있으나, 이에 제한되지는 않는다. 이러한 "형질전환된" 세포는 삽입된 DNA가 자율적으로 복제하는 플라스미드로서 또는 숙주 염색체의 일부로서 복제될 수 있는 안정적으로 형질전환된 세포를 포함한다. 이들은 또한 제한된 기간 동안 삽입된 DNA 또는 RNA를 일시적으로 발현하는 세포를 포함한다.
실시예
본 발명은 하기 실시예에 의해 추가로 예시된다. 이러한 실시예는 단지 예시 목적을 위한 것으로, 본 발명을 어떠한 방식으로든 제한하고자 하는 것이 아니며, 본 발명을 어떠한 방식으로든 제한하는 것으로 간주되어선 안 된다.
실시예 I
sNPP1에 융합된 8개의 연속적 아스파르트산을 갖는 표적화 모이어티를 함유하는 TAGsNNP1 작제물을 EcoRI 및 HindIII 부위를 이용하여 pTT22 벡터에 라이게이션시켰다(pTT22-sNPP1.D8; 도 19). pTT22-sNPP1.D8을 HEK203E 세포에 트랜스펙션시키고, 형질전환체를 배양하여 TAGsNNP1을 발현시켰다. TAGsNNP1을 당 분야에 널리 공지된 바와 같이 배양 배지로부터 분리시키고, 부분적으로 정제하였다. 정제 후, TAGsNPP1의 피로포스파제/포스포디에스테라제 활성을 티미딘 5' 모노포스페이트 p-니트로페닐 에스테르를 가수분해시키는 이의 능력에 대해 측정하였다. 간단히, TAGsNPP1을 50 mM Tris, 250 mM NaCl, pH 9.5 중에서 1 ng/μL로 희석시켰다. 1 ng/μL TAGsNPP1의 50 μL를 함유하는 플레이트에서, 50 μL의 10 mM 티미딘 5' 모노포스페이트 p-니트로페닐 에스테르(Sigma™, Catalog #T4510) 기질을 첨가하였다. TAGsNPP1의 효소 활성을 5분 동안 동역학 모드로 405 nm(흡광도)에서 측정하였다. 도 21에 제시된 바와 같이, TAGsNPP1의 활성은 TAGsNPP1을 함유하지 않는 대조군에서 관찰된 수준을 초과하는 것으로 검출되었다. 특히, HEK203D6으로부터 생성된 TAGsNPP1은 효소 활성의 가장 높은 수준을 나타내었다. 이러한 결과는 표적화 모이어티에 융합된 트렁케이션된 NPP1(즉, D8)이 누클레아제로서의 이의 정상 기능을 충분히 유지한 것을 강하게 암시하였다.
실시예 II
본 비제한적 예언적 실시예는 TAGNPP1 융합 단백질을 포함하는 제형을 투여함으로써 특발성 영아 동맥 석회화를 치료하는 방법을 기재한다.
임상의는 환자가 동맥에서 높은 수준의 석회화를 갖는 것을 확인하기 위해 진단 시험을 이용한다. 유전적 시험은 또한 문헌[Rutsch et al. (2003), Nature Genetics 34:379-81]에 기재된 바와 같이 NPP1 결함에 대해 수행될 수 있다.
본 발명의 약학적 조성물은 바람직하게는 정맥내 투여되나, 피내, 근내 또는 경구 투여가 특정 상황에서 이용된다.
임상의는 환자의 성별, 연령, 건강, 및 체중에 따라 변할 수 있는 용량을 결정한다. 적절한 투여량 또는 투여 경로의 결정은 보통의 의사의 기술 내에 충분히 포함된다.
TAGNPP1을 함유하는 제형이 매주 주 당 약 10 ㎎/㎏ 내지 약 1000 ㎎/㎏으로 주입될 수 있다. 10-30 ㎎/㎏이 1회 투여될 수 있다. 주입 기간 동안, 환자는 면밀히 관찰되고, 적절한 임상적 개재가 유해 사례의 경우에 수행된다. 치료는 적어도 1개월 또는 환자의 생애 동안 지속된다. 48시간의 기간이 각각의 주입에 대해 허용될 수 있다. 시간이 지남에 따라 주입 속도를 증가시키는 주입 스케줄이 유해 사례를 감소시키거나 배제시킨다. 영아에 대한 주입은 다음과 같은 스케줄에 따라 투여될 수 있다: 각 기간에서 60분 동안 5-10 cc/hr.
또 한편으로, 연속적 정맥내 투여가 요망되는 경우, 서방형 시스템의 통상적 예는 1-100 ㎎/㎏의 효과적인 TAGNPP1 단백질이 1일 이상 동안 연속적으로 방출될 수 있는 것을 포함한다.
실시예 III
가용성 TAGsNPP1-D8의 정제
TAGsNPP1의 가용성 형태(C-말단 태깅된 D8)(SEQ ID NO:20 및 도 26 참조)를 HEK293 적응용 배지로부터 정제하였다. 적응용 배지(500㎖)를 하이드록시아파타이트(HA)-완충액 A(10mM Na3PO4, pH 6.8)로 평형화시키고, 0.2μm Sartobran P Size 8 MidiCap Filter(Sartorius Stedim)로 여과시켰다. 20㎖ HA-Ultrogel 컬럼(Pall Life Sciences)을 5 컬럼 부피(CV)의 완충액 A로 평형화시킨 후, 여과된 적응용 배지를 3㎖/분으로 로딩하였다. 컬럼을 완충액 A를 이용하여 UV 기준선으로 세척하였다. 단백질을 5㎖ 분획을 수거하면서 각각 2.5CV의 HA-완충액 B(150mM Na3PO4, pH 6.8), HA-완충액 C(250mM Na3PO4, pH 6.8), 및 HA-완충액 D(500mM Na3PO4, pH 6.8)를 이용하여 단계적으로 용리시켰다. HA-컬럼으로부터의 활성 분획을 풀링(50㎖)시키고, WGA-완충액 A(20mM Tris, pH 8.0, 150mM NaCl, 0.7% CHAPS)로 평형화시켰다. 여과 후, 6-7㎎의 전체 단백질(15-18㎖)을 5CV의 WGA-완충액 A로 평형화된 1㎖ 밀 배아 응집소(WGA) 중력 컬럼(EMD Chemicals)에 로딩하였다. 컬럼을 7CV의 WGA-완충액 A로 세척한 후, 단백질을 5x1㎖ WGA-완충액 B(20mM Tris, pH 8.0, 150mM NaCl, 500mM N-아세틸글루코사민, 0.7% CHAPS 완충액)으로 용리시켰다. WGA-완충액 B를 10분 동안 실온에서 컬럼과 함께 인큐베이션시킨 후, 1㎖ 분획을 수거하였다. 시작 물질 모두가 WGA-컬럼에 의해 정제될 때까지 상기 과정을 반복하였다(전체 4회 수행). 활성 분획(29㎖)을 풀링시키고, 100,000 분자량 컷오프(cut off)(MWCO) Vivaspin-15(Sartorius Stedim)를 이용하여 1.2㎖로 농축시키고, 동시에 PBS로 완충액 교환하였다.
활성 sNPP1-D8(TAGsNPP1)을 HPLC를 기초로 하여 91.5%로 정제하였다. 최종 풀을 SDS-PAGE에 의해 분석하는 경우, 이합체 밴드는 비환원 조건하에서 ~210kD에 상응하였고, 환원 조건하에서, 단량체 밴드는 ~105kD에 상응하였다.
실시예 IV
인간 대동맥 평활근 세포를 48웰 플레이트에 웰 당 1x104개의 세포로 플레이팅하고, 표준 조건하에서 둘베코 변형 이글 배지(Dulbecco's Modified Eagle Medium, DMEM)에서 유지시켰다. 2일 후, DMEM에 NaPO4 및 ATP를 각각 3.8 mM 및 50 uM로 보충하였다. sNPP1(WT; 도 9), C-말단에 융합된 8개의 연속적 아스파르트산 잔기를 갖는 TAGsNPP1(D8)(도 26) 및 sNPP1-Fc(도 29)를 1 ㎍/㎖로 보충하였다. 배지를 격일에 동일 배지로 대체하였다. 5일 후, 배지를 배양물로부터 제거하고, 100 ㎕의 0.6N HCl로 대체하고, 용액으로 칼슘 포스페이트를 용해시키면서 실온에서 16-20 시간 동안 인큐베이션하였다. 이후, 칼슘 수준을 Cayman Chemical Company(Ann Arbor, MI)사로부터의 Calcium Assay Kit(#700550)를 이용하여 비색 칼슘-크레졸프탈레인 반응에 의해 정량하였다.
도 23에 제시된 바와 같이, TAGsNPP1은 sNPP1(WT)의 석회화에 비해 석회화에 대한 증가된 억제를 나타내었고, 이는 TAGsNPP1에 함유된 D8 도메인이 석회화 부위로의 증가된 귀소(homing) 능력 및/또는 향상된 억제 효과를 제공하는 것을 암시한다.
실시예 V
sNPP1-Fc의 효소 활성 검정
1 ㎍의 sNPP1-Fc(도 29)의 첨가는 70% 순도를 기초로 하였다(즉, ~1.1 ㎍의 sNPP1-Fc를 본 검정에서 사용하였다). HPLC 크기 배제 컬럼(SEC)은 sNPP1-Fc가 ~78% 순도임을 나타낸다. 비환원 겔은 예상 크기(~250kD)의 이합체를 나타내었다. 이합체 밴드는 DTT로 처리하는 경우에 예상 단량체 크기(~125kD)로 감소되었다. 웨스턴 블롯 분석으로 이합체 및 단량체 밴드를 확인하였다. PNGase F를 이용한 sNPP1-Fc 샘플의 처리는 단량체 밴드를 ~125kD으로부터 ~100kD으로 감소시켰고, 이는 sNPP1-Fc가 12개의 N-글리칸 부위를 함유한 것을 고려한 예상 분자량이다. 78% 순도에서, 최종 정량은 ~0.808 ㎎의 sNPP1-Fc(2.2 ㎍/㎖의 적응용 배지)를 생성시켰다. sNPP1-Fc의 효소 활성을 당 분야에 공지된 바와 같이 결정하였다.
상기 명세서 내의 각 실시예는 본 발명의 설명의 목적으로 제공되며, 본 발명을 제한하지는 않는다. 사실, 다양한 변형, 조합, 추가, 결실 및 변화가 본 발명의 범위 또는 사상을 벗어남이 없이 본 발명에서 이루어질 수 있음이 당업자에게 자명할 것이다. 예를 들어, 한 구체예의 일부로서 예시되거나 기재된 특징은 또 다른 구체예에서 사용되어 또 다른 추가 구체예를 발생시킬 수 있다. 본 발명은 상기 변형, 조합, 추가, 결실, 및 변화를 포함하는 것으로 의도된다.
본원에 인용된 모든 간행물, 특허, 특허 출원, 인터넷 사이트, 및 등록 번호/데이터베이스 서열(폴리누클레오티드 및 폴리펩티드 서열 둘 모두를 포함함)은 각각의 개별적인 간행물, 특허, 특허 출원, 인터넷 사이트, 및 등록 번호/데이터베이스 서열이 참조로서 포함되는 것으로 명확하고 개별적으로 지정되는 것과 동일한 정도로 모든 목적상 이들의 전체내용이 참조로서 본원에 포함된다.
SEQUENCE LISTING
<110> Synageva BioPharma Corp.
<120> NPP1 Fusion Proteins
<130> SYN-077CIPWO
<140> PCT/US2011/051858
<141> 2011-09-15
<150> PCT/US2011/028233
<151> 2011-03-11
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 925
<212> PRT
<213> Homo sapiens
<400> 1
Met Glu Arg Asp Gly Cys Ala Gly Gly Gly Ser Arg Gly Gly Glu Gly
1 5 10 15
Gly Arg Ala Pro Arg Glu Gly Pro Ala Gly Asn Gly Arg Asp Arg Gly
20 25 30
Arg Ser His Ala Ala Glu Ala Pro Gly Asp Pro Gln Ala Ala Ala Ser
35 40 45
Leu Leu Ala Pro Met Asp Val Gly Glu Glu Pro Leu Glu Lys Ala Ala
50 55 60
Arg Ala Arg Thr Ala Lys Asp Pro Asn Thr Tyr Lys Val Leu Ser Leu
65 70 75 80
Val Leu Ser Val Cys Val Leu Thr Thr Ile Leu Gly Cys Ile Phe Gly
85 90 95
Leu Lys Pro Ser Cys Ala Lys Glu Val Lys Ser Cys Lys Gly Arg Cys
100 105 110
Phe Glu Arg Thr Phe Gly Asn Cys Arg Cys Asp Ala Ala Cys Val Glu
115 120 125
Leu Gly Asn Cys Cys Leu Asp Tyr Gln Glu Thr Cys Ile Glu Pro Glu
130 135 140
His Ile Trp Thr Cys Asn Lys Phe Arg Cys Gly Glu Lys Arg Leu Thr
145 150 155 160
Arg Ser Leu Cys Ala Cys Ser Asp Asp Cys Lys Asp Lys Gly Asp Cys
165 170 175
Cys Ile Asn Tyr Ser Ser Val Cys Gln Gly Glu Lys Ser Trp Val Glu
180 185 190
Glu Pro Cys Glu Ser Ile Asn Glu Pro Gln Cys Pro Ala Gly Phe Glu
195 200 205
Thr Pro Pro Thr Leu Leu Phe Ser Leu Asp Gly Phe Arg Ala Glu Tyr
210 215 220
Leu His Thr Trp Gly Gly Leu Leu Pro Val Ile Ser Lys Leu Lys Lys
225 230 235 240
Cys Gly Thr Tyr Thr Lys Asn Met Arg Pro Val Tyr Pro Thr Lys Thr
245 250 255
Phe Pro Asn His Tyr Ser Ile Val Thr Gly Leu Tyr Pro Glu Ser His
260 265 270
Gly Ile Ile Asp Asn Lys Met Tyr Asp Pro Lys Met Asn Ala Ser Phe
275 280 285
Ser Leu Lys Ser Lys Glu Lys Phe Asn Pro Glu Trp Tyr Lys Gly Glu
290 295 300
Pro Ile Trp Val Thr Ala Lys Tyr Gln Gly Leu Lys Ser Gly Thr Phe
305 310 315 320
Phe Trp Pro Gly Ser Asp Val Glu Ile Asn Gly Ile Phe Pro Asp Ile
325 330 335
Tyr Lys Met Tyr Asn Gly Ser Val Pro Phe Glu Glu Arg Ile Leu Ala
340 345 350
Val Leu Gln Trp Leu Gln Leu Pro Lys Asp Glu Arg Pro His Phe Tyr
355 360 365
Thr Leu Tyr Leu Glu Glu Pro Asp Ser Ser Gly His Ser Tyr Gly Pro
370 375 380
Val Ser Ser Glu Val Ile Lys Ala Leu Gln Arg Val Asp Gly Met Val
385 390 395 400
Gly Met Leu Met Asp Gly Leu Lys Glu Leu Asn Leu His Arg Cys Leu
405 410 415
Asn Leu Ile Leu Ile Ser Asp His Gly Met Glu Gln Gly Ser Cys Lys
420 425 430
Lys Tyr Ile Tyr Leu Asn Lys Tyr Leu Gly Asp Val Lys Asn Ile Lys
435 440 445
Val Ile Tyr Gly Pro Ala Ala Arg Leu Arg Pro Ser Asp Val Pro Asp
450 455 460
Lys Tyr Tyr Ser Phe Asn Tyr Glu Gly Ile Ala Arg Asn Leu Ser Cys
465 470 475 480
Arg Glu Pro Asn Gln His Phe Lys Pro Tyr Leu Lys His Phe Leu Pro
485 490 495
Lys Arg Leu His Phe Ala Lys Ser Asp Arg Ile Glu Pro Leu Thr Phe
500 505 510
Tyr Leu Asp Pro Gln Trp Gln Leu Ala Leu Asn Pro Ser Glu Arg Lys
515 520 525
Tyr Cys Gly Ser Gly Phe His Gly Ser Asp Asn Val Phe Ser Asn Met
530 535 540
Gln Ala Leu Phe Val Gly Tyr Gly Pro Gly Phe Lys His Gly Ile Glu
545 550 555 560
Ala Asp Thr Phe Glu Asn Ile Glu Val Tyr Asn Leu Met Cys Asp Leu
565 570 575
Leu Asn Leu Thr Pro Ala Pro Asn Asn Gly Thr His Gly Ser Leu Asn
580 585 590
His Leu Leu Lys Asn Pro Val Tyr Thr Pro Lys His Pro Lys Glu Val
595 600 605
His Pro Leu Val Gln Cys Pro Phe Thr Arg Asn Pro Arg Asp Asn Leu
610 615 620
Gly Cys Ser Cys Asn Pro Ser Ile Leu Pro Ile Glu Asp Phe Gln Thr
625 630 635 640
Gln Phe Asn Leu Thr Val Ala Glu Glu Lys Ile Ile Lys His Glu Thr
645 650 655
Leu Pro Tyr Gly Arg Pro Arg Val Leu Gln Lys Glu Asn Thr Ile Cys
660 665 670
Leu Leu Ser Gln His Gln Phe Met Ser Gly Tyr Ser Gln Asp Ile Leu
675 680 685
Met Pro Leu Trp Thr Ser Tyr Thr Val Asp Arg Asn Asp Ser Phe Ser
690 695 700
Thr Glu Asp Phe Ser Asn Cys Leu Tyr Gln Asp Phe Arg Ile Pro Leu
705 710 715 720
Ser Pro Val His Lys Cys Ser Phe Tyr Lys Asn Asn Thr Lys Val Ser
725 730 735
Tyr Gly Phe Leu Ser Pro Pro Gln Leu Asn Lys Asn Ser Ser Gly Ile
740 745 750
Tyr Ser Glu Ala Leu Leu Thr Thr Asn Ile Val Pro Met Tyr Gln Ser
755 760 765
Phe Gln Val Ile Trp Arg Tyr Phe His Asp Thr Leu Leu Arg Lys Tyr
770 775 780
Ala Glu Glu Arg Asn Gly Val Asn Val Val Ser Gly Pro Val Phe Asp
785 790 795 800
Phe Asp Tyr Asp Gly Arg Cys Asp Ser Leu Glu Asn Leu Arg Gln Lys
805 810 815
Arg Arg Val Ile Arg Asn Gln Glu Ile Leu Ile Pro Thr His Phe Phe
820 825 830
Ile Val Leu Thr Ser Cys Lys Asp Thr Ser Gln Thr Pro Leu His Cys
835 840 845
Glu Asn Leu Asp Thr Leu Ala Phe Ile Leu Pro His Arg Thr Asp Asn
850 855 860
Ser Glu Ser Cys Val His Gly Lys His Asp Ser Ser Trp Val Glu Glu
865 870 875 880
Leu Leu Met Leu His Arg Ala Arg Ile Thr Asp Val Glu His Ile Thr
885 890 895
Gly Leu Ser Phe Tyr Gln Gln Arg Lys Glu Pro Val Ser Asp Ile Leu
900 905 910
Lys Leu Lys Thr His Leu Pro Thr Phe Ser Gln Glu Asp
915 920 925
<210> 2
<211> 387
<212> PRT
<213> Artificial sequence
<220>
<223> NPP1 catalytic domain (sssNPP1)
<400> 2
Ala Gly Phe Glu Thr Pro Pro Thr Leu Leu Phe Ser Leu Asp Gly Phe
1 5 10 15
Arg Ala Glu Tyr Leu His Thr Trp Gly Gly Leu Leu Pro Val Ile Ser
20 25 30
Lys Leu Lys Lys Cys Gly Thr Tyr Thr Lys Asn Met Arg Pro Val Tyr
35 40 45
Pro Thr Lys Thr Phe Pro Asn His Tyr Ser Ile Val Thr Gly Leu Tyr
50 55 60
Pro Glu Ser His Gly Ile Ile Asp Asn Lys Met Tyr Asp Pro Lys Met
65 70 75 80
Asn Ala Ser Phe Ser Leu Lys Ser Lys Glu Lys Phe Asn Pro Glu Trp
85 90 95
Tyr Lys Gly Glu Pro Ile Trp Val Thr Ala Lys Tyr Gln Gly Leu Lys
100 105 110
Ser Gly Thr Phe Phe Trp Pro Gly Ser Asp Val Glu Ile Asn Gly Ile
115 120 125
Phe Pro Asp Ile Tyr Lys Met Tyr Asn Gly Ser Val Pro Phe Glu Glu
130 135 140
Arg Ile Leu Ala Val Leu Gln Trp Leu Gln Leu Pro Lys Asp Glu Arg
145 150 155 160
Pro His Phe Tyr Thr Leu Tyr Leu Glu Glu Pro Asp Ser Ser Gly His
165 170 175
Ser Tyr Gly Pro Val Ser Ser Glu Val Ile Lys Ala Leu Gln Arg Val
180 185 190
Asp Gly Met Val Gly Met Leu Met Asp Gly Leu Lys Glu Leu Asn Leu
195 200 205
His Arg Cys Leu Asn Leu Ile Leu Ile Ser Asp His Gly Met Glu Gln
210 215 220
Gly Ser Cys Lys Lys Tyr Ile Tyr Leu Asn Lys Tyr Leu Gly Asp Val
225 230 235 240
Lys Asn Ile Lys Val Ile Tyr Gly Pro Ala Ala Arg Leu Arg Pro Ser
245 250 255
Asp Val Pro Asp Lys Tyr Tyr Ser Phe Asn Tyr Glu Gly Ile Ala Arg
260 265 270
Asn Leu Ser Cys Arg Glu Pro Asn Gln His Phe Lys Pro Tyr Leu Lys
275 280 285
His Phe Leu Pro Lys Arg Leu His Phe Ala Lys Ser Asp Arg Ile Glu
290 295 300
Pro Leu Thr Phe Tyr Leu Asp Pro Gln Trp Gln Leu Ala Leu Asn Pro
305 310 315 320
Ser Glu Arg Lys Tyr Cys Gly Ser Gly Phe His Gly Ser Asp Asn Val
325 330 335
Phe Ser Asn Met Gln Ala Leu Phe Val Gly Tyr Gly Pro Gly Phe Lys
340 345 350
His Gly Ile Glu Ala Asp Thr Phe Glu Asn Ile Glu Val Tyr Asn Leu
355 360 365
Met Cys Asp Leu Leu Asn Leu Thr Pro Ala Pro Asn Asn Gly Thr His
370 375 380
Gly Ser Leu
385
<210> 3
<211> 420
<212> PRT
<213> Artificial sequence
<220>
<223> D8 fused to NPP1 catalytic domain (TAGsssNPP1)
<400> 3
Ile Gly Val Leu Leu Thr Gln Arg Thr Leu Leu Ser Leu Val Leu Ala
1 5 10 15
Leu Leu Phe Pro Ser Met Ala Ser Met Asp Asp Asp Asp Asp Asp Asp
20 25 30
Asp Ala Gly Phe Glu Thr Pro Pro Thr Leu Leu Phe Ser Leu Asp Gly
35 40 45
Phe Arg Ala Glu Tyr Leu His Thr Trp Gly Gly Leu Leu Pro Val Ile
50 55 60
Ser Lys Leu Lys Lys Cys Gly Thr Tyr Thr Lys Asn Met Arg Pro Val
65 70 75 80
Tyr Pro Thr Lys Thr Phe Pro Asn His Tyr Ser Ile Val Thr Gly Leu
85 90 95
Tyr Pro Glu Ser His Gly Ile Ile Asp Asn Lys Met Tyr Asp Pro Lys
100 105 110
Met Asn Ala Ser Phe Ser Leu Lys Ser Lys Glu Lys Phe Asn Pro Glu
115 120 125
Trp Tyr Lys Gly Glu Pro Ile Trp Val Thr Ala Lys Tyr Gln Gly Leu
130 135 140
Lys Ser Gly Thr Phe Phe Trp Pro Gly Ser Asp Val Glu Ile Asn Gly
145 150 155 160
Ile Phe Pro Asp Ile Tyr Lys Met Tyr Asn Gly Ser Val Pro Phe Glu
165 170 175
Glu Arg Ile Leu Ala Val Leu Gln Trp Leu Gln Leu Pro Lys Asp Glu
180 185 190
Arg Pro His Phe Tyr Thr Leu Tyr Leu Glu Glu Pro Asp Ser Ser Gly
195 200 205
His Ser Tyr Gly Pro Val Ser Ser Glu Val Ile Lys Ala Leu Gln Arg
210 215 220
Val Asp Gly Met Val Gly Met Leu Met Asp Gly Leu Lys Glu Leu Asn
225 230 235 240
Leu His Arg Cys Leu Asn Leu Ile Leu Ile Ser Asp His Gly Met Glu
245 250 255
Gln Gly Ser Cys Lys Lys Tyr Ile Tyr Leu Asn Lys Tyr Leu Gly Asp
260 265 270
Val Lys Asn Ile Lys Val Ile Tyr Gly Pro Ala Ala Arg Leu Arg Pro
275 280 285
Ser Asp Val Pro Asp Lys Tyr Tyr Ser Phe Asn Tyr Glu Gly Ile Ala
290 295 300
Arg Asn Leu Ser Cys Arg Glu Pro Asn Gln His Phe Lys Pro Tyr Leu
305 310 315 320
Lys His Phe Leu Pro Lys Arg Leu His Phe Ala Lys Ser Asp Arg Ile
325 330 335
Glu Pro Leu Thr Phe Tyr Leu Asp Pro Gln Trp Gln Leu Ala Leu Asn
340 345 350
Pro Ser Glu Arg Lys Tyr Cys Gly Ser Gly Phe His Gly Ser Asp Asn
355 360 365
Val Phe Ser Asn Met Gln Ala Leu Phe Val Gly Tyr Gly Pro Gly Phe
370 375 380
Lys His Gly Ile Glu Ala Asp Thr Phe Glu Asn Ile Glu Val Tyr Asn
385 390 395 400
Leu Met Cys Asp Leu Leu Asn Leu Thr Pro Ala Pro Asn Asn Gly Thr
405 410 415
His Gly Ser Leu
420
<210> 4
<211> 422
<212> PRT
<213> Artificial sequence
<220>
<223> D10 fused to NPP1 catalytic domain
<400> 4
Ile Gly Val Leu Leu Thr Gln Arg Thr Leu Leu Ser Leu Val Leu Ala
1 5 10 15
Leu Leu Phe Pro Ser Met Ala Ser Met Ala Gly Phe Glu Thr Pro Pro
20 25 30
Thr Leu Leu Phe Ser Leu Asp Gly Phe Arg Ala Glu Tyr Leu His Thr
35 40 45
Trp Gly Gly Leu Leu Pro Val Ile Ser Lys Leu Lys Lys Cys Gly Thr
50 55 60
Tyr Thr Lys Asn Met Arg Pro Val Tyr Pro Thr Lys Thr Phe Pro Asn
65 70 75 80
His Tyr Ser Ile Val Thr Gly Leu Tyr Pro Glu Ser His Gly Ile Ile
85 90 95
Asp Asn Lys Met Tyr Asp Pro Lys Met Asn Ala Ser Phe Ser Leu Lys
100 105 110
Ser Lys Glu Lys Phe Asn Pro Glu Trp Tyr Lys Gly Glu Pro Ile Trp
115 120 125
Val Thr Ala Lys Tyr Gln Gly Leu Lys Ser Gly Thr Phe Phe Trp Pro
130 135 140
Gly Ser Asp Val Glu Ile Asn Gly Ile Phe Pro Asp Ile Tyr Lys Met
145 150 155 160
Tyr Asn Gly Ser Val Pro Phe Glu Glu Arg Ile Leu Ala Val Leu Gln
165 170 175
Trp Leu Gln Leu Pro Lys Asp Glu Arg Pro His Phe Tyr Thr Leu Tyr
180 185 190
Leu Glu Glu Pro Asp Ser Ser Gly His Ser Tyr Gly Pro Val Ser Ser
195 200 205
Glu Val Ile Lys Ala Leu Gln Arg Val Asp Gly Met Val Gly Met Leu
210 215 220
Met Asp Gly Leu Lys Glu Leu Asn Leu His Arg Cys Leu Asn Leu Ile
225 230 235 240
Leu Ile Ser Asp His Gly Met Glu Gln Gly Ser Cys Lys Lys Tyr Ile
245 250 255
Tyr Leu Asn Lys Tyr Leu Gly Asp Val Lys Asn Ile Lys Val Ile Tyr
260 265 270
Gly Pro Ala Ala Arg Leu Arg Pro Ser Asp Val Pro Asp Lys Tyr Tyr
275 280 285
Ser Phe Asn Tyr Glu Gly Ile Ala Arg Asn Leu Ser Cys Arg Glu Pro
290 295 300
Asn Gln His Phe Lys Pro Tyr Leu Lys His Phe Leu Pro Lys Arg Leu
305 310 315 320
His Phe Ala Lys Ser Asp Arg Ile Glu Pro Leu Thr Phe Tyr Leu Asp
325 330 335
Pro Gln Trp Gln Leu Ala Leu Asn Pro Ser Glu Arg Lys Tyr Cys Gly
340 345 350
Ser Gly Phe His Gly Ser Asp Asn Val Phe Ser Asn Met Gln Ala Leu
355 360 365
Phe Val Gly Tyr Gly Pro Gly Phe Lys His Gly Ile Glu Ala Asp Thr
370 375 380
Phe Glu Asn Ile Glu Val Tyr Asn Leu Met Cys Asp Leu Leu Asn Leu
385 390 395 400
Thr Pro Ala Pro Asn Asn Gly Thr His Gly Ser Leu Asp Asp Asp Asp
405 410 415
Asp Asp Asp Asp Asp Asp
420
<210> 5
<211> 2265
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence encoding D8 NPP1 fusion protein
<400> 5
atgggtgtac tgctcacaca gaggacgctg ctcagtctgg tccttgcact cctgtttcca 60
agcatggcga gcatggatga cgatgatgac gacgatgacg cagggtttga aacgcctcct 120
acactcttgt tttctttgga tggattcagg gcagaatatt tgcacacttg gggtggactt 180
cttcctgtta ttagcaaact caaaaaatgt ggaacatata ctaaaaacat gagaccggtg 240
tatccaacaa aaactttccc caatcactac agcattgtca ccggattgta tccagaatct 300
catggcataa tcgacaataa gatgtatgat cccaaaatga atgcttcctt ttcacttaaa 360
agtaaagaga aatttaatcc ggagtggtac aaaggagaac caatttgggt cacagctaag 420
tatcaaggcc tcaagtctgg cacatttttc tggccaggat cagatgtgga aattaacgga 480
attttcccag acatctataa aatgtataat ggttcagtgc catttgaaga aaggattttg 540
gctgttcttc agtggctgca gcttccaaaa gatgaaagac cacactttta cactttgtat 600
ttggaagaac cagattcttc aggtcattca tatggaccag tcagcagtga agtcatcaaa 660
gccttgcaga gggttgatgg tatggttggt atgctgatgg atggtctgaa agagctgaac 720
ttgcacagat gcctgaacct catccttatt tcagatcatg gcatggaaca aggcagttgt 780
aagaaataca tatatctgaa taagtatttg ggggatgtta aaaatattaa agttatctat 840
ggacctgcag ctcgattgag accctctgat gtcccagata aatactattc atttaactat 900
gaaggcattg cccgaaatct ttcttgccgg gaaccaaacc agcacttcaa accttatctg 960
aaacatttct tgcctaagcg tttgcacttt gctaagagtg atagaattga gcccttgaca 1020
ttctatttgg accctcagtg gcaacttgca ttgaatccct cagaaaggaa atattgtgga 1080
agtggatttc atggctctga caatgtgttt tcaaatatgc aagccctctt tgttggctat 1140
ggacctggat tcaagcatgg cattgaggct gacacctttg aaaacattga agtctataac 1200
ttgatgtgtg atttgctgaa tttgacaccg gctcctaata acggaactca tggaagtctt 1260
aaccaccttc tgaagaatcc tgtttatacg ccaaagcatc ccaaagaagt gcaccccctg 1320
gtgcagtgcc ccttcacaag aaaccccaga gataaccttg gctgctcatg taacccttcc 1380
attttgccga ttgaggattt tcaaacacag ttcaatctga ccgtggcaga agagaagatt 1440
attaagcatg aaactttgcc ctatggaaga cctagagttc tccagaagga aaacaccatc 1500
tgtcttcttt cccagcacca gtttatgagt ggatacagcc aagacatctt gatgcccctt 1560
tggacatcct ataccgtgga cagaaatgac agtttctcta cggaagactt ctccaactgt 1620
ctgtaccagg actttagaat tcctcttagt cctgtccata aatgttcatt ttataaaaat 1680
aacaccaaag tgagttacgg gttcctctcc ccaccacaac tgaataagaa ttcaagtgga 1740
atatattctg aagccttgct tactacaaat atagtgccaa tgtaccagag ttttcaagtt 1800
atatggcgct actttcatga caccctcttg cgaaagtatg cagaagaaag aaatggtgtc 1860
aatgtcgtca gtggtcctgt gtttgacttt gattatgatg gacgttgtga ttccttggag 1920
aatttgaggc aaaaaagaag agtcatccgt aaccaagaaa ttttgattcc aactcatttc 1980
ttcattgtgc tgacaagctg taaagataca tctcagacgc ctttgcactg tgaaaacctg 2040
gacaccttgg ctttcatttt gcctcacagg actgataaca gcgagagctg tgtgcatggg 2100
aagcatgact cctcatgggt tgaagaattg ttgatgttgc acagagcacg gatcacagac 2160
gtcgagcaca tcactggact cagcttttat caacaaagaa aagagccagt ttcagacatt 2220
ttgaagttga aaacacattt gccaaccttt agccaagaag attga 2265
<210> 6
<211> 754
<212> PRT
<213> Artificial Sequence
<220>
<223> D8 NPP1 fusion protein
<400> 6
Ile Gly Val Leu Leu Thr Gln Arg Thr Leu Leu Ser Leu Val Leu Ala
1 5 10 15
Leu Leu Phe Pro Ser Met Ala Ser Met Asp Asp Asp Asp Asp Asp Asp
20 25 30
Asp Ala Gly Phe Glu Thr Pro Pro Thr Leu Leu Phe Ser Leu Asp Gly
35 40 45
Phe Arg Ala Glu Tyr Leu His Thr Trp Gly Gly Leu Leu Pro Val Ile
50 55 60
Ser Lys Leu Lys Lys Cys Gly Thr Tyr Thr Lys Asn Met Arg Pro Val
65 70 75 80
Tyr Pro Thr Lys Thr Phe Pro Asn His Tyr Ser Ile Val Thr Gly Leu
85 90 95
Tyr Pro Glu Ser His Gly Ile Ile Asp Asn Lys Met Tyr Asp Pro Lys
100 105 110
Met Asn Ala Ser Phe Ser Leu Lys Ser Lys Glu Lys Phe Asn Pro Glu
115 120 125
Trp Tyr Lys Gly Glu Pro Ile Trp Val Thr Ala Lys Tyr Gln Gly Leu
130 135 140
Lys Ser Gly Thr Phe Phe Trp Pro Gly Ser Asp Val Glu Ile Asn Gly
145 150 155 160
Ile Phe Pro Asp Ile Tyr Lys Met Tyr Asn Gly Ser Val Pro Phe Glu
165 170 175
Glu Arg Ile Leu Ala Val Leu Gln Trp Leu Gln Leu Pro Lys Asp Glu
180 185 190
Arg Pro His Phe Tyr Thr Leu Tyr Leu Glu Glu Pro Asp Ser Ser Gly
195 200 205
His Ser Tyr Gly Pro Val Ser Ser Glu Val Ile Lys Ala Leu Gln Arg
210 215 220
Val Asp Gly Met Val Gly Met Leu Met Asp Gly Leu Lys Glu Leu Asn
225 230 235 240
Leu His Arg Cys Leu Asn Leu Ile Leu Ile Ser Asp His Gly Met Glu
245 250 255
Gln Gly Ser Cys Lys Lys Tyr Ile Tyr Leu Asn Lys Tyr Leu Gly Asp
260 265 270
Val Lys Asn Ile Lys Val Ile Tyr Gly Pro Ala Ala Arg Leu Arg Pro
275 280 285
Ser Asp Val Pro Asp Lys Tyr Tyr Ser Phe Asn Tyr Glu Gly Ile Ala
290 295 300
Arg Asn Leu Ser Cys Arg Glu Pro Asn Gln His Phe Lys Pro Tyr Leu
305 310 315 320
Lys His Phe Leu Pro Lys Arg Leu His Phe Ala Lys Ser Asp Arg Ile
325 330 335
Glu Pro Leu Thr Phe Tyr Leu Asp Pro Gln Trp Gln Leu Ala Leu Asn
340 345 350
Pro Ser Glu Arg Lys Tyr Cys Gly Ser Gly Phe His Gly Ser Asp Asn
355 360 365
Val Phe Ser Asn Met Gln Ala Leu Phe Val Gly Tyr Gly Pro Gly Phe
370 375 380
Lys His Gly Ile Glu Ala Asp Thr Phe Glu Asn Ile Glu Val Tyr Asn
385 390 395 400
Leu Met Cys Asp Leu Leu Asn Leu Thr Pro Ala Pro Asn Asn Gly Thr
405 410 415
His Gly Ser Leu Asn His Leu Leu Lys Asn Pro Val Tyr Thr Pro Lys
420 425 430
His Pro Lys Glu Val His Pro Leu Val Gln Cys Pro Phe Thr Arg Asn
435 440 445
Pro Arg Asp Asn Leu Gly Cys Ser Cys Asn Pro Ser Ile Leu Pro Ile
450 455 460
Glu Asp Phe Gln Thr Gln Phe Asn Leu Thr Val Ala Glu Glu Lys Ile
465 470 475 480
Ile Lys His Glu Thr Leu Pro Tyr Gly Arg Pro Arg Val Leu Gln Lys
485 490 495
Glu Asn Thr Ile Cys Leu Leu Ser Gln His Gln Phe Met Ser Gly Tyr
500 505 510
Ser Gln Asp Ile Leu Met Pro Leu Trp Thr Ser Tyr Thr Val Asp Arg
515 520 525
Asn Asp Ser Phe Ser Thr Glu Asp Phe Ser Asn Cys Leu Tyr Gln Asp
530 535 540
Phe Arg Ile Pro Leu Ser Pro Val His Lys Cys Ser Phe Tyr Lys Asn
545 550 555 560
Asn Thr Lys Val Ser Tyr Gly Phe Leu Ser Pro Pro Gln Leu Asn Lys
565 570 575
Asn Ser Ser Gly Ile Tyr Ser Glu Ala Leu Leu Thr Thr Asn Ile Val
580 585 590
Pro Met Tyr Gln Ser Phe Gln Val Ile Trp Arg Tyr Phe His Asp Thr
595 600 605
Leu Leu Arg Lys Tyr Ala Glu Glu Arg Asn Gly Val Asn Val Val Ser
610 615 620
Gly Pro Val Phe Asp Phe Asp Tyr Asp Gly Arg Cys Asp Ser Leu Glu
625 630 635 640
Asn Leu Arg Gln Lys Arg Arg Val Ile Arg Asn Gln Glu Ile Leu Ile
645 650 655
Pro Thr His Phe Phe Ile Val Leu Thr Ser Cys Lys Asp Thr Ser Gln
660 665 670
Thr Pro Leu His Cys Glu Asn Leu Asp Thr Leu Ala Phe Ile Leu Pro
675 680 685
His Arg Thr Asp Asn Ser Glu Ser Cys Val His Gly Lys His Asp Ser
690 695 700
Ser Trp Val Glu Glu Leu Leu Met Leu His Arg Ala Arg Ile Thr Asp
705 710 715 720
Val Glu His Ile Thr Gly Leu Ser Phe Tyr Gln Gln Arg Lys Glu Pro
725 730 735
Val Ser Asp Ile Leu Lys Leu Lys Thr His Leu Pro Thr Phe Ser Gln
740 745 750
Glu Asp
<210> 7
<211> 2238
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence encoding ssNPP1 protein
<400> 7
atgggtgtac tgctcacaca gaggacgctg ctcagtctgg tccttgcact cctgtttcca 60
agcatggcga gcatggcagg gtttgaaacg cctcctacac tcttgttttc tttggatgga 120
ttcagggcag aatatttgca cacttggggt ggacttcttc ctgttattag caaactcaaa 180
aaatgtggaa catatactaa aaacatgaga ccggtgtatc caacaaaaac tttccccaat 240
cactacagca ttgtcaccgg attgtatcca gaatctcatg gcataatcga caataagatg 300
tatgatccca aaatgaatgc ttccttttca cttaaaagta aagagaaatt taatccggag 360
tggtacaaag gagaaccaat ttgggtcaca gctaagtatc aaggcctcaa gtctggcaca 420
tttttctggc caggatcaga tgtggaaatt aacggaattt tcccagacat ctataaaatg 480
tataatggtt cagtgccatt tgaagaaagg attttggctg ttcttcagtg gctgcagctt 540
ccaaaagatg aaagaccaca cttttacact ttgtatttgg aagaaccaga ttcttcaggt 600
cattcatatg gaccagtcag cagtgaagtc atcaaagcct tgcagagggt tgatggtatg 660
gttggtatgc tgatggatgg tctgaaagag ctgaacttgc acagatgcct gaacctcatc 720
cttatttcag atcatggcat ggaacaaggc agttgtaaga aatacatata tctgaataag 780
tatttggggg atgttaaaaa tattaaagtt atctatggac ctgcagctcg attgagaccc 840
tctgatgtcc cagataaata ctattcattt aactatgaag gcattgcccg aaatctttct 900
tgccgggaac caaaccagca cttcaaacct tatctgaaac atttcttgcc taagcgtttg 960
cactttgcta agagtgatag aattgagccc ttgacattct atttggaccc tcagtggcaa 1020
cttgcattga atccctcaga aaggaaatat tgtggaagtg gatttcatgg ctctgacaat 1080
gtgttttcaa atatgcaagc cctctttgtt ggctatggac ctggattcaa gcatggcatt 1140
gaggctgaca cctttgaaaa cattgaagtc tataacttga tgtgtgattt gctgaatttg 1200
acaccggctc ctaataacgg aactcatgga agtcttaacc accttctgaa gaatcctgtt 1260
tatacgccaa agcatcccaa agaagtgcac cccctggtgc agtgcccctt cacaagaaac 1320
cccagagata accttggctg ctcatgtaac ccttccattt tgccgattga ggattttcaa 1380
acacagttca atctgaccgt ggcagaagag aagattatta agcatgaaac tttgccctat 1440
ggaagaccta gagttctcca gaaggaaaac accatctgtc ttctttccca gcaccagttt 1500
atgagtggat acagccaaga catcttgatg cccctttgga catcctatac cgtggacaga 1560
aatgacagtt tctctacgga agacttctcc aactgtctgt accaggactt tagaattcct 1620
cttagtcctg tccataaatg ttcattttat aaaaataaca ccaaagtgag ttacgggttc 1680
ctctccccac cacaactgaa taagaattca agtggaatat attctgaagc cttgcttact 1740
acaaatatag tgccaatgta ccagagtttt caagttatat ggcgctactt tcatgacacc 1800
ctcttgcgaa agtatgcaga agaaagaaat ggtgtcaatg tcgtcagtgg tcctgtgttt 1860
gactttgatt atgatggacg ttgtgattcc ttggagaatt tgaggcaaaa aagaagagtc 1920
atccgtaacc aagaaatttt gattccaact catttcttca ttgtgctgac aagctgtaaa 1980
gatacatctc agacgccttt gcactgtgaa aacctggaca ccttggcttt cattttgcct 2040
cacaggactg ataacagcga gagctgtgtg catgggaagc atgactcctc atgggttgaa 2100
gaattgttga tgttgcacag agcacggatc acagacgtcg agcacatcac tggactcagc 2160
ttttatcaac aaagaaaaga gccagtttca gacattttga agttgaaaac acatttgcca 2220
acctttagcc aagaagat 2238
<210> 8
<211> 746
<212> PRT
<213> Artificial sequence
<220>
<223> ssNPP1 protein
<400> 8
Ile Gly Val Leu Leu Thr Gln Arg Thr Leu Leu Ser Leu Val Leu Ala
1 5 10 15
Leu Leu Phe Pro Ser Met Ala Ser Met Ala Gly Phe Glu Thr Pro Pro
20 25 30
Thr Leu Leu Phe Ser Leu Asp Gly Phe Arg Ala Glu Tyr Leu His Thr
35 40 45
Trp Gly Gly Leu Leu Pro Val Ile Ser Lys Leu Lys Lys Cys Gly Thr
50 55 60
Tyr Thr Lys Asn Met Arg Pro Val Tyr Pro Thr Lys Thr Phe Pro Asn
65 70 75 80
His Tyr Ser Ile Val Thr Gly Leu Tyr Pro Glu Ser His Gly Ile Ile
85 90 95
Asp Asn Lys Met Tyr Asp Pro Lys Met Asn Ala Ser Phe Ser Leu Lys
100 105 110
Ser Lys Glu Lys Phe Asn Pro Glu Trp Tyr Lys Gly Glu Pro Ile Trp
115 120 125
Val Thr Ala Lys Tyr Gln Gly Leu Lys Ser Gly Thr Phe Phe Trp Pro
130 135 140
Gly Ser Asp Val Glu Ile Asn Gly Ile Phe Pro Asp Ile Tyr Lys Met
145 150 155 160
Tyr Asn Gly Ser Val Pro Phe Glu Glu Arg Ile Leu Ala Val Leu Gln
165 170 175
Trp Leu Gln Leu Pro Lys Asp Glu Arg Pro His Phe Tyr Thr Leu Tyr
180 185 190
Leu Glu Glu Pro Asp Ser Ser Gly His Ser Tyr Gly Pro Val Ser Ser
195 200 205
Glu Val Ile Lys Ala Leu Gln Arg Val Asp Gly Met Val Gly Met Leu
210 215 220
Met Asp Gly Leu Lys Glu Leu Asn Leu His Arg Cys Leu Asn Leu Ile
225 230 235 240
Leu Ile Ser Asp His Gly Met Glu Gln Gly Ser Cys Lys Lys Tyr Ile
245 250 255
Tyr Leu Asn Lys Tyr Leu Gly Asp Val Lys Asn Ile Lys Val Ile Tyr
260 265 270
Gly Pro Ala Ala Arg Leu Arg Pro Ser Asp Val Pro Asp Lys Tyr Tyr
275 280 285
Ser Phe Asn Tyr Glu Gly Ile Ala Arg Asn Leu Ser Cys Arg Glu Pro
290 295 300
Asn Gln His Phe Lys Pro Tyr Leu Lys His Phe Leu Pro Lys Arg Leu
305 310 315 320
His Phe Ala Lys Ser Asp Arg Ile Glu Pro Leu Thr Phe Tyr Leu Asp
325 330 335
Pro Gln Trp Gln Leu Ala Leu Asn Pro Ser Glu Arg Lys Tyr Cys Gly
340 345 350
Ser Gly Phe His Gly Ser Asp Asn Val Phe Ser Asn Met Gln Ala Leu
355 360 365
Phe Val Gly Tyr Gly Pro Gly Phe Lys His Gly Ile Glu Ala Asp Thr
370 375 380
Phe Glu Asn Ile Glu Val Tyr Asn Leu Met Cys Asp Leu Leu Asn Leu
385 390 395 400
Thr Pro Ala Pro Asn Asn Gly Thr His Gly Ser Leu Asn His Leu Leu
405 410 415
Lys Asn Pro Val Tyr Thr Pro Lys His Pro Lys Glu Val His Pro Leu
420 425 430
Val Gln Cys Pro Phe Thr Arg Asn Pro Arg Asp Asn Leu Gly Cys Ser
435 440 445
Cys Asn Pro Ser Ile Leu Pro Ile Glu Asp Phe Gln Thr Gln Phe Asn
450 455 460
Leu Thr Val Ala Glu Glu Lys Ile Ile Lys His Glu Thr Leu Pro Tyr
465 470 475 480
Gly Arg Pro Arg Val Leu Gln Lys Glu Asn Thr Ile Cys Leu Leu Ser
485 490 495
Gln His Gln Phe Met Ser Gly Tyr Ser Gln Asp Ile Leu Met Pro Leu
500 505 510
Trp Thr Ser Tyr Thr Val Asp Arg Asn Asp Ser Phe Ser Thr Glu Asp
515 520 525
Phe Ser Asn Cys Leu Tyr Gln Asp Phe Arg Ile Pro Leu Ser Pro Val
530 535 540
His Lys Cys Ser Phe Tyr Lys Asn Asn Thr Lys Val Ser Tyr Gly Phe
545 550 555 560
Leu Ser Pro Pro Gln Leu Asn Lys Asn Ser Ser Gly Ile Tyr Ser Glu
565 570 575
Ala Leu Leu Thr Thr Asn Ile Val Pro Met Tyr Gln Ser Phe Gln Val
580 585 590
Ile Trp Arg Tyr Phe His Asp Thr Leu Leu Arg Lys Tyr Ala Glu Glu
595 600 605
Arg Asn Gly Val Asn Val Val Ser Gly Pro Val Phe Asp Phe Asp Tyr
610 615 620
Asp Gly Arg Cys Asp Ser Leu Glu Asn Leu Arg Gln Lys Arg Arg Val
625 630 635 640
Ile Arg Asn Gln Glu Ile Leu Ile Pro Thr His Phe Phe Ile Val Leu
645 650 655
Thr Ser Cys Lys Asp Thr Ser Gln Thr Pro Leu His Cys Glu Asn Leu
660 665 670
Asp Thr Leu Ala Phe Ile Leu Pro His Arg Thr Asp Asn Ser Glu Ser
675 680 685
Cys Val His Gly Lys His Asp Ser Ser Trp Val Glu Glu Leu Leu Met
690 695 700
Leu His Arg Ala Arg Ile Thr Asp Val Glu His Ile Thr Gly Leu Ser
705 710 715 720
Phe Tyr Gln Gln Arg Lys Glu Pro Val Ser Asp Ile Leu Lys Leu Lys
725 730 735
Thr His Leu Pro Thr Phe Ser Gln Glu Asp
740 745
<210> 9
<211> 2556
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence encoding sNPP1
<400> 9
atgggtgtac tgctcacaca gaggacgctg ctcagtctgg tccttgcact cctgtttcca 60
agcatggcga gcatgccaag ttgtgccaaa gaagttaaaa gttgcaaagg tcgctgtttc 120
gagagaacat ttgggaactg tcgctgtgat gctgcctgtg ttgagcttgg aaactgctgt 180
ttggattacc aggagacgtg catagaacca gaacatatat ggacttgcaa caaattcagg 240
tgtggtgaga aaagattgac cagaagcctc tgtgcctgtt cagatgattg caaggacaag 300
ggcgactgct gcatcaacta cagttcagtg tgtcaaggtg agaaaagttg ggtggaagaa 360
ccatgtgaga gcattaatga gccacagtgc ccagcagggt ttgaaacgcc tcctacactc 420
ttgttttctt tggatggatt cagggcagaa tatttgcaca cttggggtgg acttcttcct 480
gttattagca aactcaaaaa atgtggaaca tatactaaaa acatgagacc ggtgtatcca 540
acaaaaactt tccccaatca ctacagcatt gtcaccggat tgtatccaga atctcatggc 600
ataatcgaca ataagatgta tgatcccaaa atgaatgctt ccttttcact taaaagtaaa 660
gagaaattta atccggagtg gtacaaagga gaaccaattt gggtcacagc taagtatcaa 720
ggcctcaagt ctggcacatt tttctggcca ggatcagatg tggaaattaa cggaattttc 780
ccagacatct ataaaatgta taatggttca gtgccatttg aagaaaggat tttggctgtt 840
cttcagtggc tgcagcttcc aaaagatgaa agaccacact tttacacttt gtatttggaa 900
gaaccagatt cttcaggtca ttcatatgga ccagtcagca gtgaagtcat caaagccttg 960
cagagggttg atggtatggt tggtatgctg atggatggtc tgaaagagct gaacttgcac 1020
agatgcctga acctcatcct tatttcagat catggcatgg aacaaggcag ttgtaagaaa 1080
tacatatatc tgaataagta tttgggggat gttaaaaata ttaaagttat ctatggacct 1140
gcagctcgat tgagaccctc tgatgtccca gataaatact attcatttaa ctatgaaggc 1200
attgcccgaa atctttcttg ccgggaacca aaccagcact tcaaacctta tctgaaacat 1260
ttcttgccta agcgtttgca ctttgctaag agtgatagaa ttgagccctt gacattctat 1320
ttggaccctc agtggcaact tgcattgaat ccctcagaaa ggaaatattg tggaagtgga 1380
tttcatggct ctgacaatgt gttttcaaat atgcaagccc tctttgttgg ctatggacct 1440
ggattcaagc atggcattga ggctgacacc tttgaaaaca ttgaagtcta taacttgatg 1500
tgtgatttgc tgaatttgac accggctcct aataacggaa ctcatggaag tcttaaccac 1560
cttctgaaga atcctgttta tacgccaaag catcccaaag aagtgcaccc cctggtgcag 1620
tgccccttca caagaaaccc cagagataac cttggctgct catgtaaccc ttccattttg 1680
ccgattgagg attttcaaac acagttcaat ctgaccgtgg cagaagagaa gattattaag 1740
catgaaactt tgccctatgg aagacctaga gttctccaga aggaaaacac catctgtctt 1800
ctttcccagc accagtttat gagtggatac agccaagaca tcttgatgcc cctttggaca 1860
tcctataccg tggacagaaa tgacagtttc tctacggaag acttctccaa ctgtctgtac 1920
caggacttta gaattcctct tagtcctgtc cataaatgtt cattttataa aaataacacc 1980
aaagtgagtt acgggttcct ctccccacca caactgaata agaattcaag tggaatatat 2040
tctgaagcct tgcttactac aaatatagtg ccaatgtacc agagttttca agttatatgg 2100
cgctactttc atgacaccct cttgcgaaag tatgcagaag aaagaaatgg tgtcaatgtc 2160
gtcagtggtc ctgtgtttga ctttgattat gatggacgtt gtgattcctt ggagaatttg 2220
aggcaaaaaa gaagagtcat ccgtaaccaa gaaattttga ttccaactca tttcttcatt 2280
gtgctgacaa gctgtaaaga tacatctcag acgcctttgc actgtgaaaa cctggacacc 2340
ttggctttca ttttgcctca caggactgat aacagcgaga gctgtgtgca tgggaagcat 2400
gactcctcat gggttgaaga attgttgatg ttgcacagag cacggatcac agacgtcgag 2460
cacatcactg gactcagctt ttatcaacaa agaaaagagc cagtttcaga cattttgaag 2520
ttgaaaacac atttgccaac ctttagccaa gaagat 2556
<210> 10
<211> 852
<212> PRT
<213> Artificial seqeunce
<220>
<223> sNPP1 protein
<400> 10
Ile Gly Val Leu Leu Thr Gln Arg Thr Leu Leu Ser Leu Val Leu Ala
1 5 10 15
Leu Leu Phe Pro Ser Met Ala Ser Met Pro Ser Cys Ala Lys Glu Val
20 25 30
Lys Ser Cys Lys Gly Arg Cys Phe Glu Arg Thr Phe Gly Asn Cys Arg
35 40 45
Cys Asp Ala Ala Cys Val Glu Leu Gly Asn Cys Cys Leu Asp Tyr Gln
50 55 60
Glu Thr Cys Ile Glu Pro Glu His Ile Trp Thr Cys Asn Lys Phe Arg
65 70 75 80
Cys Gly Glu Lys Arg Leu Thr Arg Ser Leu Cys Ala Cys Ser Asp Asp
85 90 95
Cys Lys Asp Lys Gly Asp Cys Cys Ile Asn Tyr Ser Ser Val Cys Gln
100 105 110
Gly Glu Lys Ser Trp Val Glu Glu Pro Cys Glu Ser Ile Asn Glu Pro
115 120 125
Gln Cys Pro Ala Gly Phe Glu Thr Pro Pro Thr Leu Leu Phe Ser Leu
130 135 140
Asp Gly Phe Arg Ala Glu Tyr Leu His Thr Trp Gly Gly Leu Leu Pro
145 150 155 160
Val Ile Ser Lys Leu Lys Lys Cys Gly Thr Tyr Thr Lys Asn Met Arg
165 170 175
Pro Val Tyr Pro Thr Lys Thr Phe Pro Asn His Tyr Ser Ile Val Thr
180 185 190
Gly Leu Tyr Pro Glu Ser His Gly Ile Ile Asp Asn Lys Met Tyr Asp
195 200 205
Pro Lys Met Asn Ala Ser Phe Ser Leu Lys Ser Lys Glu Lys Phe Asn
210 215 220
Pro Glu Trp Tyr Lys Gly Glu Pro Ile Trp Val Thr Ala Lys Tyr Gln
225 230 235 240
Gly Leu Lys Ser Gly Thr Phe Phe Trp Pro Gly Ser Asp Val Glu Ile
245 250 255
Asn Gly Ile Phe Pro Asp Ile Tyr Lys Met Tyr Asn Gly Ser Val Pro
260 265 270
Phe Glu Glu Arg Ile Leu Ala Val Leu Gln Trp Leu Gln Leu Pro Lys
275 280 285
Asp Glu Arg Pro His Phe Tyr Thr Leu Tyr Leu Glu Glu Pro Asp Ser
290 295 300
Ser Gly His Ser Tyr Gly Pro Val Ser Ser Glu Val Ile Lys Ala Leu
305 310 315 320
Gln Arg Val Asp Gly Met Val Gly Met Leu Met Asp Gly Leu Lys Glu
325 330 335
Leu Asn Leu His Arg Cys Leu Asn Leu Ile Leu Ile Ser Asp His Gly
340 345 350
Met Glu Gln Gly Ser Cys Lys Lys Tyr Ile Tyr Leu Asn Lys Tyr Leu
355 360 365
Gly Asp Val Lys Asn Ile Lys Val Ile Tyr Gly Pro Ala Ala Arg Leu
370 375 380
Arg Pro Ser Asp Val Pro Asp Lys Tyr Tyr Ser Phe Asn Tyr Glu Gly
385 390 395 400
Ile Ala Arg Asn Leu Ser Cys Arg Glu Pro Asn Gln His Phe Lys Pro
405 410 415
Tyr Leu Lys His Phe Leu Pro Lys Arg Leu His Phe Ala Lys Ser Asp
420 425 430
Arg Ile Glu Pro Leu Thr Phe Tyr Leu Asp Pro Gln Trp Gln Leu Ala
435 440 445
Leu Asn Pro Ser Glu Arg Lys Tyr Cys Gly Ser Gly Phe His Gly Ser
450 455 460
Asp Asn Val Phe Ser Asn Met Gln Ala Leu Phe Val Gly Tyr Gly Pro
465 470 475 480
Gly Phe Lys His Gly Ile Glu Ala Asp Thr Phe Glu Asn Ile Glu Val
485 490 495
Tyr Asn Leu Met Cys Asp Leu Leu Asn Leu Thr Pro Ala Pro Asn Asn
500 505 510
Gly Thr His Gly Ser Leu Asn His Leu Leu Lys Asn Pro Val Tyr Thr
515 520 525
Pro Lys His Pro Lys Glu Val His Pro Leu Val Gln Cys Pro Phe Thr
530 535 540
Arg Asn Pro Arg Asp Asn Leu Gly Cys Ser Cys Asn Pro Ser Ile Leu
545 550 555 560
Pro Ile Glu Asp Phe Gln Thr Gln Phe Asn Leu Thr Val Ala Glu Glu
565 570 575
Lys Ile Ile Lys His Glu Thr Leu Pro Tyr Gly Arg Pro Arg Val Leu
580 585 590
Gln Lys Glu Asn Thr Ile Cys Leu Leu Ser Gln His Gln Phe Met Ser
595 600 605
Gly Tyr Ser Gln Asp Ile Leu Met Pro Leu Trp Thr Ser Tyr Thr Val
610 615 620
Asp Arg Asn Asp Ser Phe Ser Thr Glu Asp Phe Ser Asn Cys Leu Tyr
625 630 635 640
Gln Asp Phe Arg Ile Pro Leu Ser Pro Val His Lys Cys Ser Phe Tyr
645 650 655
Lys Asn Asn Thr Lys Val Ser Tyr Gly Phe Leu Ser Pro Pro Gln Leu
660 665 670
Asn Lys Asn Ser Ser Gly Ile Tyr Ser Glu Ala Leu Leu Thr Thr Asn
675 680 685
Ile Val Pro Met Tyr Gln Ser Phe Gln Val Ile Trp Arg Tyr Phe His
690 695 700
Asp Thr Leu Leu Arg Lys Tyr Ala Glu Glu Arg Asn Gly Val Asn Val
705 710 715 720
Val Ser Gly Pro Val Phe Asp Phe Asp Tyr Asp Gly Arg Cys Asp Ser
725 730 735
Leu Glu Asn Leu Arg Gln Lys Arg Arg Val Ile Arg Asn Gln Glu Ile
740 745 750
Leu Ile Pro Thr His Phe Phe Ile Val Leu Thr Ser Cys Lys Asp Thr
755 760 765
Ser Gln Thr Pro Leu His Cys Glu Asn Leu Asp Thr Leu Ala Phe Ile
770 775 780
Leu Pro His Arg Thr Asp Asn Ser Glu Ser Cys Val His Gly Lys His
785 790 795 800
Asp Ser Ser Trp Val Glu Glu Leu Leu Met Leu His Arg Ala Arg Ile
805 810 815
Thr Asp Val Glu His Ile Thr Gly Leu Ser Phe Tyr Gln Gln Arg Lys
820 825 830
Glu Pro Val Ser Asp Ile Leu Lys Leu Lys Thr His Leu Pro Thr Phe
835 840 845
Ser Gln Glu Asp
850
<210> 11
<211> 2580
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence encoding a TAGsNPP1 fusion protein
<400> 11
atgggtgtac tgctcacaca gaggacgctg ctcagtctgg tccttgcact cctgtttcca 60
agcatggcga gcatggatga cgatgatgac gacgatgacc caagttgtgc caaagaagtt 120
aaaagttgca aaggtcgctg tttcgagaga acatttggga actgtcgctg tgatgctgcc 180
tgtgttgagc ttggaaactg ctgtttggat taccaggaga cgtgcataga accagaacat 240
atatggactt gcaacaaatt caggtgtggt gagaaaagat tgaccagaag cctctgtgcc 300
tgttcagatg attgcaagga caagggcgac tgctgcatca actacagttc agtgtgtcaa 360
ggtgagaaaa gttgggtgga agaaccatgt gagagcatta atgagccaca gtgcccagca 420
gggtttgaaa cgcctcctac actcttgttt tctttggatg gattcagggc agaatatttg 480
cacacttggg gtggacttct tcctgttatt agcaaactca aaaaatgtgg aacatatact 540
aaaaacatga gaccggtgta tccaacaaaa actttcccca atcactacag cattgtcacc 600
ggattgtatc cagaatctca tggcataatc gacaataaga tgtatgatcc caaaatgaat 660
gcttcctttt cacttaaaag taaagagaaa tttaatccgg agtggtacaa aggagaacca 720
atttgggtca cagctaagta tcaaggcctc aagtctggca catttttctg gccaggatca 780
gatgtggaaa ttaacggaat tttcccagac atctataaaa tgtataatgg ttcagtgcca 840
tttgaagaaa ggattttggc tgttcttcag tggctgcagc ttccaaaaga tgaaagacca 900
cacttttaca ctttgtattt ggaagaacca gattcttcag gtcattcata tggaccagtc 960
agcagtgaag tcatcaaagc cttgcagagg gttgatggta tggttggtat gctgatggat 1020
ggtctgaaag agctgaactt gcacagatgc ctgaacctca tccttatttc agatcatggc 1080
atggaacaag gcagttgtaa gaaatacata tatctgaata agtatttggg ggatgttaaa 1140
aatattaaag ttatctatgg acctgcagct cgattgagac cctctgatgt cccagataaa 1200
tactattcat ttaactatga aggcattgcc cgaaatcttt cttgccggga accaaaccag 1260
cacttcaaac cttatctgaa acatttcttg cctaagcgtt tgcactttgc taagagtgat 1320
agaattgagc ccttgacatt ctatttggac cctcagtggc aacttgcatt gaatccctca 1380
gaaaggaaat attgtggaag tggatttcat ggctctgaca atgtgttttc aaatatgcaa 1440
gccctctttg ttggctatgg acctggattc aagcatggca ttgaggctga cacctttgaa 1500
aacattgaag tctataactt gatgtgtgat ttgctgaatt tgacaccggc tcctaataac 1560
ggaactcatg gaagtcttaa ccaccttctg aagaatcctg tttatacgcc aaagcatccc 1620
aaagaagtgc accccctggt gcagtgcccc ttcacaagaa accccagaga taaccttggc 1680
tgctcatgta acccttccat tttgccgatt gaggattttc aaacacagtt caatctgacc 1740
gtggcagaag agaagattat taagcatgaa actttgccct atggaagacc tagagttctc 1800
cagaaggaaa acaccatctg tcttctttcc cagcaccagt ttatgagtgg atacagccaa 1860
gacatcttga tgcccctttg gacatcctat accgtggaca gaaatgacag tttctctacg 1920
gaagacttct ccaactgtct gtaccaggac tttagaattc ctcttagtcc tgtccataaa 1980
tgttcatttt ataaaaataa caccaaagtg agttacgggt tcctctcccc accacaactg 2040
aataagaatt caagtggaat atattctgaa gccttgctta ctacaaatat agtgccaatg 2100
taccagagtt ttcaagttat atggcgctac tttcatgaca ccctcttgcg aaagtatgca 2160
gaagaaagaa atggtgtcaa tgtcgtcagt ggtcctgtgt ttgactttga ttatgatgga 2220
cgttgtgatt ccttggagaa tttgaggcaa aaaagaagag tcatccgtaa ccaagaaatt 2280
ttgattccaa ctcatttctt cattgtgctg acaagctgta aagatacatc tcagacgcct 2340
ttgcactgtg aaaacctgga caccttggct ttcattttgc ctcacaggac tgataacagc 2400
gagagctgtg tgcatgggaa gcatgactcc tcatgggttg aagaattgtt gatgttgcac 2460
agagcacgga tcacagacgt cgagcacatc actggactca gcttttatca acaaagaaaa 2520
gagccagttt cagacatttt gaagttgaaa acacatttgc caacctttag ccaagaagat 2580
<210> 12
<211> 860
<212> PRT
<213> Artificial sequence
<220>
<223> D8 TAGsNPP1 fusion protein
<400> 12
Ile Gly Val Leu Leu Thr Gln Arg Thr Leu Leu Ser Leu Val Leu Ala
1 5 10 15
Leu Leu Phe Pro Ser Met Ala Ser Met Asp Asp Asp Asp Asp Asp Asp
20 25 30
Asp Pro Ser Cys Ala Lys Glu Val Lys Ser Cys Lys Gly Arg Cys Phe
35 40 45
Glu Arg Thr Phe Gly Asn Cys Arg Cys Asp Ala Ala Cys Val Glu Leu
50 55 60
Gly Asn Cys Cys Leu Asp Tyr Gln Glu Thr Cys Ile Glu Pro Glu His
65 70 75 80
Ile Trp Thr Cys Asn Lys Phe Arg Cys Gly Glu Lys Arg Leu Thr Arg
85 90 95
Ser Leu Cys Ala Cys Ser Asp Asp Cys Lys Asp Lys Gly Asp Cys Cys
100 105 110
Ile Asn Tyr Ser Ser Val Cys Gln Gly Glu Lys Ser Trp Val Glu Glu
115 120 125
Pro Cys Glu Ser Ile Asn Glu Pro Gln Cys Pro Ala Gly Phe Glu Thr
130 135 140
Pro Pro Thr Leu Leu Phe Ser Leu Asp Gly Phe Arg Ala Glu Tyr Leu
145 150 155 160
His Thr Trp Gly Gly Leu Leu Pro Val Ile Ser Lys Leu Lys Lys Cys
165 170 175
Gly Thr Tyr Thr Lys Asn Met Arg Pro Val Tyr Pro Thr Lys Thr Phe
180 185 190
Pro Asn His Tyr Ser Ile Val Thr Gly Leu Tyr Pro Glu Ser His Gly
195 200 205
Ile Ile Asp Asn Lys Met Tyr Asp Pro Lys Met Asn Ala Ser Phe Ser
210 215 220
Leu Lys Ser Lys Glu Lys Phe Asn Pro Glu Trp Tyr Lys Gly Glu Pro
225 230 235 240
Ile Trp Val Thr Ala Lys Tyr Gln Gly Leu Lys Ser Gly Thr Phe Phe
245 250 255
Trp Pro Gly Ser Asp Val Glu Ile Asn Gly Ile Phe Pro Asp Ile Tyr
260 265 270
Lys Met Tyr Asn Gly Ser Val Pro Phe Glu Glu Arg Ile Leu Ala Val
275 280 285
Leu Gln Trp Leu Gln Leu Pro Lys Asp Glu Arg Pro His Phe Tyr Thr
290 295 300
Leu Tyr Leu Glu Glu Pro Asp Ser Ser Gly His Ser Tyr Gly Pro Val
305 310 315 320
Ser Ser Glu Val Ile Lys Ala Leu Gln Arg Val Asp Gly Met Val Gly
325 330 335
Met Leu Met Asp Gly Leu Lys Glu Leu Asn Leu His Arg Cys Leu Asn
340 345 350
Leu Ile Leu Ile Ser Asp His Gly Met Glu Gln Gly Ser Cys Lys Lys
355 360 365
Tyr Ile Tyr Leu Asn Lys Tyr Leu Gly Asp Val Lys Asn Ile Lys Val
370 375 380
Ile Tyr Gly Pro Ala Ala Arg Leu Arg Pro Ser Asp Val Pro Asp Lys
385 390 395 400
Tyr Tyr Ser Phe Asn Tyr Glu Gly Ile Ala Arg Asn Leu Ser Cys Arg
405 410 415
Glu Pro Asn Gln His Phe Lys Pro Tyr Leu Lys His Phe Leu Pro Lys
420 425 430
Arg Leu His Phe Ala Lys Ser Asp Arg Ile Glu Pro Leu Thr Phe Tyr
435 440 445
Leu Asp Pro Gln Trp Gln Leu Ala Leu Asn Pro Ser Glu Arg Lys Tyr
450 455 460
Cys Gly Ser Gly Phe His Gly Ser Asp Asn Val Phe Ser Asn Met Gln
465 470 475 480
Ala Leu Phe Val Gly Tyr Gly Pro Gly Phe Lys His Gly Ile Glu Ala
485 490 495
Asp Thr Phe Glu Asn Ile Glu Val Tyr Asn Leu Met Cys Asp Leu Leu
500 505 510
Asn Leu Thr Pro Ala Pro Asn Asn Gly Thr His Gly Ser Leu Asn His
515 520 525
Leu Leu Lys Asn Pro Val Tyr Thr Pro Lys His Pro Lys Glu Val His
530 535 540
Pro Leu Val Gln Cys Pro Phe Thr Arg Asn Pro Arg Asp Asn Leu Gly
545 550 555 560
Cys Ser Cys Asn Pro Ser Ile Leu Pro Ile Glu Asp Phe Gln Thr Gln
565 570 575
Phe Asn Leu Thr Val Ala Glu Glu Lys Ile Ile Lys His Glu Thr Leu
580 585 590
Pro Tyr Gly Arg Pro Arg Val Leu Gln Lys Glu Asn Thr Ile Cys Leu
595 600 605
Leu Ser Gln His Gln Phe Met Ser Gly Tyr Ser Gln Asp Ile Leu Met
610 615 620
Pro Leu Trp Thr Ser Tyr Thr Val Asp Arg Asn Asp Ser Phe Ser Thr
625 630 635 640
Glu Asp Phe Ser Asn Cys Leu Tyr Gln Asp Phe Arg Ile Pro Leu Ser
645 650 655
Pro Val His Lys Cys Ser Phe Tyr Lys Asn Asn Thr Lys Val Ser Tyr
660 665 670
Gly Phe Leu Ser Pro Pro Gln Leu Asn Lys Asn Ser Ser Gly Ile Tyr
675 680 685
Ser Glu Ala Leu Leu Thr Thr Asn Ile Val Pro Met Tyr Gln Ser Phe
690 695 700
Gln Val Ile Trp Arg Tyr Phe His Asp Thr Leu Leu Arg Lys Tyr Ala
705 710 715 720
Glu Glu Arg Asn Gly Val Asn Val Val Ser Gly Pro Val Phe Asp Phe
725 730 735
Asp Tyr Asp Gly Arg Cys Asp Ser Leu Glu Asn Leu Arg Gln Lys Arg
740 745 750
Arg Val Ile Arg Asn Gln Glu Ile Leu Ile Pro Thr His Phe Phe Ile
755 760 765
Val Leu Thr Ser Cys Lys Asp Thr Ser Gln Thr Pro Leu His Cys Glu
770 775 780
Asn Leu Asp Thr Leu Ala Phe Ile Leu Pro His Arg Thr Asp Asn Ser
785 790 795 800
Glu Ser Cys Val His Gly Lys His Asp Ser Ser Trp Val Glu Glu Leu
805 810 815
Leu Met Leu His Arg Ala Arg Ile Thr Asp Val Glu His Ile Thr Gly
820 825 830
Leu Ser Phe Tyr Gln Gln Arg Lys Glu Pro Val Ser Asp Ile Leu Lys
835 840 845
Leu Lys Thr His Leu Pro Thr Phe Ser Gln Glu Asp
850 855 860
<210> 13
<211> 2580
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence encoding C-terminal D8 TAGsNPP1 protein
<400> 13
gtgggtgtac tgctcacaca gaggacgctg ctcagtctgg tccttgcact cctgtttcca 60
agcatggcga gcatgccaag ttgtgccaaa gaagttaaaa gttgcaaagg tcgctgtttc 120
gagagaacat ttgggaactg tcgctgtgat gctgcctgtg ttgagcttgg aaactgctgt 180
ttggattacc aggagacgtg catagaacca gaacatatat ggacttgcaa caaattcagg 240
tgtggtgaga aaagattgac cagaagcctc tgtgcctgtt cagatgattg caaggacaag 300
ggcgactgct gcatcaacta cagttcagtg tgtcaaggtg agaaaagttg ggtggaagaa 360
ccatgtgaga gcattaatga gccacagtgc ccagcagggt ttgaaacgcc tcctacactc 420
ttgttttctt tggatggatt cagggcagaa tatttgcaca cttggggtgg acttcttcct 480
gttattagca aactcaaaaa atgtggaaca tatactaaaa acatgagacc ggtgtatcca 540
acaaaaactt tccccaatca ctacagcatt gtcaccggat tgtatccaga atctcatggc 600
ataatcgaca ataagatgta tgatcccaaa atgaatgctt ccttttcact taaaagtaaa 660
gagaaattta atccggagtg gtacaaagga gaaccaattt gggtcacagc taagtatcaa 720
ggcctcaagt ctggcacatt tttctggcca ggatcagatg tggaaattaa cggaattttc 780
ccagacatct ataaaatgta taatggttca gtgccatttg aagaaaggat tttggctgtt 840
cttcagtggc tgcagcttcc aaaagatgaa agaccacact tttacacttt gtatttggaa 900
gaaccagatt cttcaggtca ttcatatgga ccagtcagca gtgaagtcat caaagccttg 960
cagagggttg atggtatggt tggtatgctg atggatggtc tgaaagagct gaacttgcac 1020
agatgcctga acctcatcct tatttcagat catggcatgg aacaaggcag ttgtaagaaa 1080
tacatatatc tgaataagta tttgggggat gttaaaaata ttaaagttat ctatggacct 1140
gcagctcgat tgagaccctc tgatgtccca gataaatact attcatttaa ctatgaaggc 1200
attgcccgaa atctttcttg ccgggaacca aaccagcact tcaaacctta tctgaaacat 1260
ttcttgccta agcgtttgca ctttgctaag agtgatagaa ttgagccctt gacattctat 1320
ttggaccctc agtggcaact tgcattgaat ccctcagaaa ggaaatattg tggaagtgga 1380
tttcatggct ctgacaatgt gttttcaaat atgcaagccc tctttgttgg ctatggacct 1440
ggattcaagc atggcattga ggctgacacc tttgaaaaca ttgaagtcta taacttgatg 1500
tgtgatttgc tgaatttgac accggctcct aataacggaa ctcatggaag tcttaaccac 1560
cttctgaaga atcctgttta tacgccaaag catcccaaag aagtgcaccc cctggtgcag 1620
tgccccttca caagaaaccc cagagataac cttggctgct catgtaaccc ttccattttg 1680
ccgattgagg attttcaaac acagttcaat ctgaccgtgg cagaagagaa gattattaag 1740
catgaaactt tgccctatgg aagacctaga gttctccaga aggaaaacac catctgtctt 1800
ctttcccagc accagtttat gagtggatac agccaagaca tcttgatgcc cctttggaca 1860
tcctataccg tggacagaaa tgacagtttc tctacggaag acttctccaa ctgtctgtac 1920
caggacttta gaattcctct tagtcctgtc cataaatgtt cattttataa aaataacacc 1980
aaagtgagtt acgggttcct ctccccacca caactgaata agaattcaag tggaatatat 2040
tctgaagcct tgcttactac aaatatagtg ccaatgtacc agagttttca agttatatgg 2100
cgctactttc atgacaccct cttgcgaaag tatgcagaag aaagaaatgg tgtcaatgtc 2160
gtcagtggtc ctgtgtttga ctttgattat gatggacgtt gtgattcctt ggagaatttg 2220
aggcaaaaaa gaagagtcat ccgtaaccaa gaaattttga ttccaactca tttcttcatt 2280
gtgctgacaa gctgtaaaga tacatctcag acgcctttgc actgtgaaaa cctggacacc 2340
ttggctttca ttttgcctca caggactgat aacagcgaga gctgtgtgca tgggaagcat 2400
gactcctcat gggttgaaga attgttgatg ttgcacagag cacggatcac agacgtcgag 2460
cacatcactg gactcagctt ttatcaacaa agaaaagagc cagtttcaga cattttgaag 2520
ttgaaaacac atttgccaac ctttagccaa gaagatgatg acgatgatga cgacgattga 2580
<210> 14
<211> 859
<212> PRT
<213> Artificial sequence
<220>
<223> C-terminal D8 TAGsNPP1 fusion protein
<400> 14
Gln Gly Val Leu Leu Thr Gln Arg Thr Leu Leu Ser Leu Val Leu Ala
1 5 10 15
Leu Leu Phe Pro Ser Met Ala Ser Met Pro Ser Cys Ala Lys Glu Val
20 25 30
Lys Ser Cys Lys Gly Arg Cys Phe Glu Arg Thr Phe Gly Asn Cys Arg
35 40 45
Cys Asp Ala Ala Cys Val Glu Leu Gly Asn Cys Cys Leu Asp Tyr Gln
50 55 60
Glu Thr Cys Ile Glu Pro Glu His Ile Trp Thr Cys Asn Lys Phe Arg
65 70 75 80
Cys Gly Glu Lys Arg Leu Thr Arg Ser Leu Cys Ala Cys Ser Asp Asp
85 90 95
Cys Lys Asp Lys Gly Asp Cys Cys Ile Asn Tyr Ser Ser Val Cys Gln
100 105 110
Gly Glu Lys Ser Trp Val Glu Glu Pro Cys Glu Ser Ile Asn Glu Pro
115 120 125
Gln Cys Pro Ala Gly Phe Glu Thr Pro Pro Thr Leu Leu Phe Ser Leu
130 135 140
Asp Gly Phe Arg Ala Glu Tyr Leu His Thr Trp Gly Gly Leu Leu Pro
145 150 155 160
Val Ile Ser Lys Leu Lys Lys Cys Gly Thr Tyr Thr Lys Asn Met Arg
165 170 175
Pro Val Tyr Pro Thr Lys Thr Phe Pro Asn His Tyr Ser Ile Val Thr
180 185 190
Gly Leu Tyr Pro Glu Ser His Gly Ile Ile Asp Asn Lys Met Tyr Asp
195 200 205
Pro Lys Met Asn Ala Ser Phe Ser Leu Lys Ser Lys Glu Lys Phe Asn
210 215 220
Pro Glu Trp Tyr Lys Gly Glu Pro Ile Trp Val Thr Ala Lys Tyr Gln
225 230 235 240
Gly Leu Lys Ser Gly Thr Phe Phe Trp Pro Gly Ser Asp Val Glu Ile
245 250 255
Asn Gly Ile Phe Pro Asp Ile Tyr Lys Met Tyr Asn Gly Ser Val Pro
260 265 270
Phe Glu Glu Arg Ile Leu Ala Val Leu Gln Trp Leu Gln Leu Pro Lys
275 280 285
Asp Glu Arg Pro His Phe Tyr Thr Leu Tyr Leu Glu Glu Pro Asp Ser
290 295 300
Ser Gly His Ser Tyr Gly Pro Val Ser Ser Glu Val Ile Lys Ala Leu
305 310 315 320
Gln Arg Val Asp Gly Met Val Gly Met Leu Met Asp Gly Leu Lys Glu
325 330 335
Leu Asn Leu His Arg Cys Leu Asn Leu Ile Leu Ile Ser Asp His Gly
340 345 350
Met Glu Gln Gly Ser Cys Lys Lys Tyr Ile Tyr Leu Asn Lys Tyr Leu
355 360 365
Gly Asp Val Lys Asn Ile Lys Val Ile Tyr Gly Pro Ala Ala Arg Leu
370 375 380
Arg Pro Ser Asp Val Pro Asp Lys Tyr Tyr Ser Phe Asn Tyr Glu Gly
385 390 395 400
Ile Ala Arg Asn Leu Ser Cys Arg Glu Pro Asn Gln His Phe Lys Pro
405 410 415
Tyr Leu Lys His Phe Leu Pro Lys Arg Leu His Phe Ala Lys Ser Asp
420 425 430
Arg Ile Glu Pro Leu Thr Phe Tyr Leu Asp Pro Gln Trp Gln Leu Ala
435 440 445
Leu Asn Pro Ser Glu Arg Lys Tyr Cys Gly Ser Gly Phe His Gly Ser
450 455 460
Asp Asn Val Phe Ser Asn Met Gln Ala Leu Phe Val Gly Tyr Gly Pro
465 470 475 480
Gly Phe Lys His Gly Ile Glu Ala Asp Thr Phe Glu Asn Ile Glu Val
485 490 495
Tyr Asn Leu Met Cys Asp Leu Leu Asn Leu Thr Pro Ala Pro Asn Asn
500 505 510
Gly Thr His Gly Ser Leu Asn His Leu Leu Lys Asn Pro Val Tyr Thr
515 520 525
Pro Lys His Pro Lys Glu Val His Pro Leu Val Gln Cys Pro Phe Thr
530 535 540
Arg Asn Pro Arg Asp Asn Leu Gly Cys Ser Cys Asn Pro Ser Ile Leu
545 550 555 560
Pro Ile Glu Asp Phe Gln Thr Gln Phe Asn Leu Thr Val Ala Glu Glu
565 570 575
Lys Ile Ile Lys His Glu Thr Leu Pro Tyr Gly Arg Pro Arg Val Leu
580 585 590
Gln Lys Glu Asn Thr Ile Cys Leu Leu Ser Gln His Gln Phe Met Ser
595 600 605
Gly Tyr Ser Gln Asp Ile Leu Met Pro Leu Trp Thr Ser Tyr Thr Val
610 615 620
Asp Arg Asn Asp Ser Phe Ser Thr Glu Asp Phe Ser Asn Cys Leu Tyr
625 630 635 640
Gln Asp Phe Arg Ile Pro Leu Ser Pro Val His Lys Cys Ser Phe Tyr
645 650 655
Lys Asn Asn Thr Lys Val Ser Tyr Gly Phe Leu Ser Pro Pro Gln Leu
660 665 670
Asn Lys Asn Ser Ser Gly Ile Tyr Ser Glu Ala Leu Leu Thr Thr Asn
675 680 685
Ile Val Pro Met Tyr Gln Ser Phe Gln Val Ile Trp Arg Tyr Phe His
690 695 700
Asp Thr Leu Leu Arg Lys Tyr Ala Glu Glu Arg Asn Gly Val Asn Val
705 710 715 720
Val Ser Gly Pro Val Phe Asp Phe Asp Tyr Asp Gly Arg Cys Asp Ser
725 730 735
Leu Glu Asn Leu Arg Gln Lys Arg Arg Val Ile Arg Asn Gln Glu Ile
740 745 750
Leu Ile Pro Thr His Phe Phe Ile Val Leu Thr Ser Cys Lys Asp Thr
755 760 765
Ser Gln Thr Pro Leu His Cys Glu Asn Leu Asp Thr Leu Ala Phe Ile
770 775 780
Leu Pro His Arg Thr Asp Asn Ser Glu Ser Cys Val His Gly Lys His
785 790 795 800
Asp Ser Ser Trp Val Glu Glu Leu Leu Met Leu His Arg Ala Arg Ile
805 810 815
Thr Asp Val Glu His Ile Thr Gly Leu Ser Phe Tyr Gln Gln Arg Lys
820 825 830
Glu Pro Val Ser Asp Ile Leu Lys Leu Lys Thr His Leu Pro Thr Phe
835 840 845
Ser Gln Glu Asp Asp Asp Asp Asp Asp Asp Asp
850 855
<210> 15
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> Linker peptide
<400> 15
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10
<210> 16
<211> 232
<212> PRT
<213> Artificial sequence
<220>
<223> Fc amino acid sequence
<400> 16
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
1 5 10 15
Pro Glu Ala Ala Gly Ala Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
20 25 30
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
35 40 45
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
50 55 60
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
65 70 75 80
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
85 90 95
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
100 105 110
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
115 120 125
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr
130 135 140
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
145 150 155 160
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
165 170 175
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
180 185 190
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
195 200 205
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
210 215 220
Ser Leu Ser Leu Ser Pro Gly Lys
225 230
<210> 17
<211> 662
<212> PRT
<213> Artificial sequence
<220>
<223> N-terminus Fc-D8 TAGsssNPP1 fusion protein
<400> 17
Ile Gly Val Leu Leu Thr Gln Arg Thr Leu Leu Ser Leu Val Leu Ala
1 5 10 15
Leu Leu Phe Pro Ser Met Ala Ser Met Glu Pro Lys Ser Cys Asp Lys
20 25 30
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Ala Pro
35 40 45
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
50 55 60
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
65 70 75 80
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
85 90 95
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
100 105 110
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
115 120 125
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
130 135 140
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
145 150 155 160
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
165 170 175
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
180 185 190
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
195 200 205
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
210 215 220
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
225 230 235 240
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
245 250 255
Lys Asp Asp Asp Asp Asp Asp Asp Asp Gly Gly Gly Gly Ser Gly Gly
260 265 270
Gly Gly Ser Ala Gly Phe Glu Thr Pro Pro Thr Leu Leu Phe Ser Leu
275 280 285
Asp Gly Phe Arg Ala Glu Tyr Leu His Thr Trp Gly Gly Leu Leu Pro
290 295 300
Val Ile Ser Lys Leu Lys Lys Cys Gly Thr Tyr Thr Lys Asn Met Arg
305 310 315 320
Pro Val Tyr Pro Thr Lys Thr Phe Pro Asn His Tyr Ser Ile Val Thr
325 330 335
Gly Leu Tyr Pro Glu Ser His Gly Ile Ile Asp Asn Lys Met Tyr Asp
340 345 350
Pro Lys Met Asn Ala Ser Phe Ser Leu Lys Ser Lys Glu Lys Phe Asn
355 360 365
Pro Glu Trp Tyr Lys Gly Glu Pro Ile Trp Val Thr Ala Lys Tyr Gln
370 375 380
Gly Leu Lys Ser Gly Thr Phe Phe Trp Pro Gly Ser Asp Val Glu Ile
385 390 395 400
Asn Gly Ile Phe Pro Asp Ile Tyr Lys Met Tyr Asn Gly Ser Val Pro
405 410 415
Phe Glu Glu Arg Ile Leu Ala Val Leu Gln Trp Leu Gln Leu Pro Lys
420 425 430
Asp Glu Arg Pro His Phe Tyr Thr Leu Tyr Leu Glu Glu Pro Asp Ser
435 440 445
Ser Gly His Ser Tyr Gly Pro Val Ser Ser Glu Val Ile Lys Ala Leu
450 455 460
Gln Arg Val Asp Gly Met Val Gly Met Leu Met Asp Gly Leu Lys Glu
465 470 475 480
Leu Asn Leu His Arg Cys Leu Asn Leu Ile Leu Ile Ser Asp His Gly
485 490 495
Met Glu Gln Gly Ser Cys Lys Lys Tyr Ile Tyr Leu Asn Lys Tyr Leu
500 505 510
Gly Asp Val Lys Asn Ile Lys Val Ile Tyr Gly Pro Ala Ala Arg Leu
515 520 525
Arg Pro Ser Asp Val Pro Asp Lys Tyr Tyr Ser Phe Asn Tyr Glu Gly
530 535 540
Ile Ala Arg Asn Leu Ser Cys Arg Glu Pro Asn Gln His Phe Lys Pro
545 550 555 560
Tyr Leu Lys His Phe Leu Pro Lys Arg Leu His Phe Ala Lys Ser Asp
565 570 575
Arg Ile Glu Pro Leu Thr Phe Tyr Leu Asp Pro Gln Trp Gln Leu Ala
580 585 590
Leu Asn Pro Ser Glu Arg Lys Tyr Cys Gly Ser Gly Phe His Gly Ser
595 600 605
Asp Asn Val Phe Ser Asn Met Gln Ala Leu Phe Val Gly Tyr Gly Pro
610 615 620
Gly Phe Lys His Gly Ile Glu Ala Asp Thr Phe Glu Asn Ile Glu Val
625 630 635 640
Tyr Asn Leu Met Cys Asp Leu Leu Asn Leu Thr Pro Ala Pro Asn Asn
645 650 655
Gly Thr His Gly Ser Leu
660
<210> 18
<211> 662
<212> PRT
<213> Artificial sequence
<220>
<223> C-termininal Fc-D8 TAGsssNPP1 fusion protein
<400> 18
Ile Gly Val Leu Leu Thr Gln Arg Thr Leu Leu Ser Leu Val Leu Ala
1 5 10 15
Leu Leu Phe Pro Ser Met Ala Ser Met Glu Pro Lys Ser Cys Asp Lys
20 25 30
Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Ala Pro
35 40 45
Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser
50 55 60
Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp
65 70 75 80
Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn
85 90 95
Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val
100 105 110
Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu
115 120 125
Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys
130 135 140
Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr
145 150 155 160
Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr
165 170 175
Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu
180 185 190
Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu
195 200 205
Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys
210 215 220
Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu
225 230 235 240
Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
245 250 255
Lys Ala Gly Phe Glu Thr Pro Pro Thr Leu Leu Phe Ser Leu Asp Gly
260 265 270
Phe Arg Ala Glu Tyr Leu His Thr Trp Gly Gly Leu Leu Pro Val Ile
275 280 285
Ser Lys Leu Lys Lys Cys Gly Thr Tyr Thr Lys Asn Met Arg Pro Val
290 295 300
Tyr Pro Thr Lys Thr Phe Pro Asn His Tyr Ser Ile Val Thr Gly Leu
305 310 315 320
Tyr Pro Glu Ser His Gly Ile Ile Asp Asn Lys Met Tyr Asp Pro Lys
325 330 335
Met Asn Ala Ser Phe Ser Leu Lys Ser Lys Glu Lys Phe Asn Pro Glu
340 345 350
Trp Tyr Lys Gly Glu Pro Ile Trp Val Thr Ala Lys Tyr Gln Gly Leu
355 360 365
Lys Ser Gly Thr Phe Phe Trp Pro Gly Ser Asp Val Glu Ile Asn Gly
370 375 380
Ile Phe Pro Asp Ile Tyr Lys Met Tyr Asn Gly Ser Val Pro Phe Glu
385 390 395 400
Glu Arg Ile Leu Ala Val Leu Gln Trp Leu Gln Leu Pro Lys Asp Glu
405 410 415
Arg Pro His Phe Tyr Thr Leu Tyr Leu Glu Glu Pro Asp Ser Ser Gly
420 425 430
His Ser Tyr Gly Pro Val Ser Ser Glu Val Ile Lys Ala Leu Gln Arg
435 440 445
Val Asp Gly Met Val Gly Met Leu Met Asp Gly Leu Lys Glu Leu Asn
450 455 460
Leu His Arg Cys Leu Asn Leu Ile Leu Ile Ser Asp His Gly Met Glu
465 470 475 480
Gln Gly Ser Cys Lys Lys Tyr Ile Tyr Leu Asn Lys Tyr Leu Gly Asp
485 490 495
Val Lys Asn Ile Lys Val Ile Tyr Gly Pro Ala Ala Arg Leu Arg Pro
500 505 510
Ser Asp Val Pro Asp Lys Tyr Tyr Ser Phe Asn Tyr Glu Gly Ile Ala
515 520 525
Arg Asn Leu Ser Cys Arg Glu Pro Asn Gln His Phe Lys Pro Tyr Leu
530 535 540
Lys His Phe Leu Pro Lys Arg Leu His Phe Ala Lys Ser Asp Arg Ile
545 550 555 560
Glu Pro Leu Thr Phe Tyr Leu Asp Pro Gln Trp Gln Leu Ala Leu Asn
565 570 575
Pro Ser Glu Arg Lys Tyr Cys Gly Ser Gly Phe His Gly Ser Asp Asn
580 585 590
Val Phe Ser Asn Met Gln Ala Leu Phe Val Gly Tyr Gly Pro Gly Phe
595 600 605
Lys His Gly Ile Glu Ala Asp Thr Phe Glu Asn Ile Glu Val Tyr Asn
610 615 620
Leu Met Cys Asp Leu Leu Asn Leu Thr Pro Ala Pro Asn Asn Gly Thr
625 630 635 640
His Gly Ser Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Asp
645 650 655
Asp Asp Asp Asp Asp Asp
660
<210> 19
<211> 2580
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence encoding D8 TAGsNPP1 fusion protein
<400> 19
atgggtgtac tgctcacaca gaggacgctg ctcagtctgg tccttgcact cctgtttcca 60
agcatggcga gcatgccaag ttgtgccaaa gaagttaaaa gttgcaaagg tcgctgtttc 120
gagagaacat ttgggaactg tcgctgtgat gctgcctgtg ttgagcttgg aaactgctgt 180
ttggattacc aggagacgtg catagaacca gaacatatat ggacttgcaa caaattcagg 240
tgtggtgaga aaagattgac cagaagcctc tgtgcctgtt cagatgattg caaggacaag 300
ggcgactgct gcatcaacta cagttcagtg tgtcaaggtg agaaaagttg ggtggaagaa 360
ccatgtgaga gcattaatga gccacagtgc ccagcagggt ttgaaacgcc tcctacactc 420
ttgttttctt tggatggatt cagggcagaa tatttgcaca cttggggtgg acttcttcct 480
gttattagca aactcaaaaa atgtggaaca tatactaaaa acatgagacc ggtgtatcca 540
acaaaaactt tccccaatca ctacagcatt gtcaccggat tgtatccaga atctcatggc 600
ataatcgaca ataagatgta tgatcccaaa atgaatgctt ccttttcact taaaagtaaa 660
gagaaattta atccggagtg gtacaaagga gaaccaattt gggtcacagc taagtatcaa 720
ggcctcaagt ctggcacatt tttctggcca ggatcagatg tggaaattaa cggaattttc 780
ccagacatct ataaaatgta taatggttca gtgccatttg aagaaaggat tttggctgtt 840
cttcagtggc tgcagcttcc aaaagatgaa agaccacact tttacacttt gtatttggaa 900
gaaccagatt cttcaggtca ttcatatgga ccagtcagca gtgaagtcat caaagccttg 960
cagagggttg atggtatggt tggtatgctg atggatggtc tgaaagagct gaacttgcac 1020
agatgcctga acctcatcct tatttcagat catggcatgg aacaaggcag ttgtaagaaa 1080
tacatatatc tgaataagta tttgggggat gttaaaaata ttaaagttat ctatggacct 1140
gcagctcgat tgagaccctc tgatgtccca gataaatact attcatttaa ctatgaaggc 1200
attgcccgaa atctttcttg ccgggaacca aaccagcact tcaaacctta tctgaaacat 1260
ttcttgccta agcgtttgca ctttgctaag agtgatagaa ttgagccctt gacattctat 1320
ttggaccctc agtggcaact tgcattgaat ccctcagaaa ggaaatattg tggaagtgga 1380
tttcatggct ctgacaatgt gttttcaaat atgcaagccc tctttgttgg ctatggacct 1440
ggattcaagc atggcattga ggctgacacc tttgaaaaca ttgaagtcta taacttgatg 1500
tgtgatttgc tgaatttgac accggctcct aataacggaa ctcatggaag tcttaaccac 1560
cttctgaaga atcctgttta tacgccaaag catcccaaag aagtgcaccc cctggtgcag 1620
tgccccttca caagaaaccc cagagataac cttggctgct catgtaaccc ttccattttg 1680
ccgattgagg attttcaaac acagttcaat ctgaccgtgg cagaagagaa gattattaag 1740
catgaaactt tgccctatgg aagacctaga gttctccaga aggaaaacac catctgtctt 1800
ctttcccagc accagtttat gagtggatac agccaagaca tcttgatgcc cctttggaca 1860
tcctataccg tggacagaaa tgacagtttc tctacggaag acttctccaa ctgtctgtac 1920
caggacttta gaattcctct tagtcctgtc cataaatgtt cattttataa aaataacacc 1980
aaagtgagtt acgggttcct ctccccacca caactgaata agaattcaag tggaatatat 2040
tctgaagcct tgcttactac aaatatagtg ccaatgtacc agagttttca agttatatgg 2100
cgctactttc atgacaccct cttgcgaaag tatgcagaag aaagaaatgg tgtcaatgtc 2160
gtcagtggtc ctgtgtttga ctttgattat gatggacgtt gtgattcctt ggagaatttg 2220
aggcaaaaaa gaagagtcat ccgtaaccaa gaaattttga ttccaactca tttcttcatt 2280
gtgctgacaa gctgtaaaga tacatctcag acgcctttgc actgtgaaaa cctggacacc 2340
ttggctttca ttttgcctca caggactgat aacagcgaga gctgtgtgca tgggaagcat 2400
gactcctcat gggttgaaga attgttgatg ttgcacagag cacggatcac agacgtcgag 2460
cacatcactg gactcagctt ttatcaacaa agaaaagagc cagtttcaga cattttgaag 2520
ttgaaaacac atttgccaac ctttagccaa gaagatgatg acgatgatga cgacgattga 2580
<210> 20
<211> 859
<212> PRT
<213> Artificial sequence
<220>
<223> C-terminal D8 TAGsNPP1 fusion protein
<400> 20
Met Gly Val Leu Leu Thr Gln Arg Thr Leu Leu Ser Leu Val Leu Ala
1 5 10 15
Leu Leu Phe Pro Ser Met Ala Ser Met Pro Ser Cys Ala Lys Glu Val
20 25 30
Lys Ser Cys Lys Gly Arg Cys Phe Glu Arg Thr Phe Gly Asn Cys Arg
35 40 45
Cys Asp Ala Ala Cys Val Glu Leu Gly Asn Cys Cys Leu Asp Tyr Gln
50 55 60
Glu Thr Cys Ile Glu Pro Glu His Ile Trp Thr Cys Asn Lys Phe Arg
65 70 75 80
Cys Gly Glu Lys Arg Leu Thr Arg Ser Leu Cys Ala Cys Ser Asp Asp
85 90 95
Cys Lys Asp Lys Gly Asp Cys Cys Ile Asn Tyr Ser Ser Val Cys Gln
100 105 110
Gly Glu Lys Ser Trp Val Glu Glu Pro Cys Glu Ser Ile Asn Glu Pro
115 120 125
Gln Cys Pro Ala Gly Phe Glu Thr Pro Pro Thr Leu Leu Phe Ser Leu
130 135 140
Asp Gly Phe Arg Ala Glu Tyr Leu His Thr Trp Gly Gly Leu Leu Pro
145 150 155 160
Val Ile Ser Lys Leu Lys Lys Cys Gly Thr Tyr Thr Lys Asn Met Arg
165 170 175
Pro Val Tyr Pro Thr Lys Thr Phe Pro Asn His Tyr Ser Ile Val Thr
180 185 190
Gly Leu Tyr Pro Glu Ser His Gly Ile Ile Asp Asn Lys Met Tyr Asp
195 200 205
Pro Lys Met Asn Ala Ser Phe Ser Leu Lys Ser Lys Glu Lys Phe Asn
210 215 220
Pro Glu Trp Tyr Lys Gly Glu Pro Ile Trp Val Thr Ala Lys Tyr Gln
225 230 235 240
Gly Leu Lys Ser Gly Thr Phe Phe Trp Pro Gly Ser Asp Val Glu Ile
245 250 255
Asn Gly Ile Phe Pro Asp Ile Tyr Lys Met Tyr Asn Gly Ser Val Pro
260 265 270
Phe Glu Glu Arg Ile Leu Ala Val Leu Gln Trp Leu Gln Leu Pro Lys
275 280 285
Asp Glu Arg Pro His Phe Tyr Thr Leu Tyr Leu Glu Glu Pro Asp Ser
290 295 300
Ser Gly His Ser Tyr Gly Pro Val Ser Ser Glu Val Ile Lys Ala Leu
305 310 315 320
Gln Arg Val Asp Gly Met Val Gly Met Leu Met Asp Gly Leu Lys Glu
325 330 335
Leu Asn Leu His Arg Cys Leu Asn Leu Ile Leu Ile Ser Asp His Gly
340 345 350
Met Glu Gln Gly Ser Cys Lys Lys Tyr Ile Tyr Leu Asn Lys Tyr Leu
355 360 365
Gly Asp Val Lys Asn Ile Lys Val Ile Tyr Gly Pro Ala Ala Arg Leu
370 375 380
Arg Pro Ser Asp Val Pro Asp Lys Tyr Tyr Ser Phe Asn Tyr Glu Gly
385 390 395 400
Ile Ala Arg Asn Leu Ser Cys Arg Glu Pro Asn Gln His Phe Lys Pro
405 410 415
Tyr Leu Lys His Phe Leu Pro Lys Arg Leu His Phe Ala Lys Ser Asp
420 425 430
Arg Ile Glu Pro Leu Thr Phe Tyr Leu Asp Pro Gln Trp Gln Leu Ala
435 440 445
Leu Asn Pro Ser Glu Arg Lys Tyr Cys Gly Ser Gly Phe His Gly Ser
450 455 460
Asp Asn Val Phe Ser Asn Met Gln Ala Leu Phe Val Gly Tyr Gly Pro
465 470 475 480
Gly Phe Lys His Gly Ile Glu Ala Asp Thr Phe Glu Asn Ile Glu Val
485 490 495
Tyr Asn Leu Met Cys Asp Leu Leu Asn Leu Thr Pro Ala Pro Asn Asn
500 505 510
Gly Thr His Gly Ser Leu Asn His Leu Leu Lys Asn Pro Val Tyr Thr
515 520 525
Pro Lys His Pro Lys Glu Val His Pro Leu Val Gln Cys Pro Phe Thr
530 535 540
Arg Asn Pro Arg Asp Asn Leu Gly Cys Ser Cys Asn Pro Ser Ile Leu
545 550 555 560
Pro Ile Glu Asp Phe Gln Thr Gln Phe Asn Leu Thr Val Ala Glu Glu
565 570 575
Lys Ile Ile Lys His Glu Thr Leu Pro Tyr Gly Arg Pro Arg Val Leu
580 585 590
Gln Lys Glu Asn Thr Ile Cys Leu Leu Ser Gln His Gln Phe Met Ser
595 600 605
Gly Tyr Ser Gln Asp Ile Leu Met Pro Leu Trp Thr Ser Tyr Thr Val
610 615 620
Asp Arg Asn Asp Ser Phe Ser Thr Glu Asp Phe Ser Asn Cys Leu Tyr
625 630 635 640
Gln Asp Phe Arg Ile Pro Leu Ser Pro Val His Lys Cys Ser Phe Tyr
645 650 655
Lys Asn Asn Thr Lys Val Ser Tyr Gly Phe Leu Ser Pro Pro Gln Leu
660 665 670
Asn Lys Asn Ser Ser Gly Ile Tyr Ser Glu Ala Leu Leu Thr Thr Asn
675 680 685
Ile Val Pro Met Tyr Gln Ser Phe Gln Val Ile Trp Arg Tyr Phe His
690 695 700
Asp Thr Leu Leu Arg Lys Tyr Ala Glu Glu Arg Asn Gly Val Asn Val
705 710 715 720
Val Ser Gly Pro Val Phe Asp Phe Asp Tyr Asp Gly Arg Cys Asp Ser
725 730 735
Leu Glu Asn Leu Arg Gln Lys Arg Arg Val Ile Arg Asn Gln Glu Ile
740 745 750
Leu Ile Pro Thr His Phe Phe Ile Val Leu Thr Ser Cys Lys Asp Thr
755 760 765
Ser Gln Thr Pro Leu His Cys Glu Asn Leu Asp Thr Leu Ala Phe Ile
770 775 780
Leu Pro His Arg Thr Asp Asn Ser Glu Ser Cys Val His Gly Lys His
785 790 795 800
Asp Ser Ser Trp Val Glu Glu Leu Leu Met Leu His Arg Ala Arg Ile
805 810 815
Thr Asp Val Glu His Ile Thr Gly Leu Ser Phe Tyr Gln Gln Arg Lys
820 825 830
Glu Pro Val Ser Asp Ile Leu Lys Leu Lys Thr His Leu Pro Thr Phe
835 840 845
Ser Gln Glu Asp Asp Asp Asp Asp Asp Asp Asp
850 855
<210> 21
<211> 3255
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleotide sequence encoding sNPP1-Fc fusion protein
<400> 21
atgggtgtac tgctcacaca gaggacgctg ctcagtctgg tccttgcact cctgtttcca 60
agcatggcga gcatgccaag ttgtgccaaa gaagttaaaa gttgcaaagg tcgctgtttc 120
gagagaacat ttgggaactg tcgctgtgat gctgcctgtg ttgagcttgg aaactgctgt 180
ttggattacc aggagacgtg catagaacca gaacatatat ggacttgcaa caaattcagg 240
tgtggtgaga aaagattgac cagaagcctc tgtgcctgtt cagatgattg caaggacaag 300
ggcgactgct gcatcaacta cagttcagtg tgtcaaggtg agaaaagttg ggtggaagaa 360
ccatgtgaga gcattaatga gccacagtgc ccagcagggt ttgaaacgcc tcctacactc 420
ttgttttctt tggatggatt cagggcagaa tatttgcaca cttggggtgg acttcttcct 480
gttattagca aactcaaaaa atgtggaaca tatactaaaa acatgagacc ggtgtatcca 540
acaaaaactt tccccaatca ctacagcatt gtcaccggat tgtatccaga atctcatggc 600
ataatcgaca ataagatgta tgatcccaaa atgaatgctt ccttttcact taaaagtaaa 660
gagaaattta atccggagtg gtacaaagga gaaccaattt gggtcacagc taagtatcaa 720
ggcctcaagt ctggcacatt tttctggcca ggatcagatg tggaaattaa cggaattttc 780
ccagacatct ataaaatgta taatggttca gtgccatttg aagaaaggat tttggctgtt 840
cttcagtggc tgcagcttcc aaaagatgaa agaccacact tttacacttt gtatttggaa 900
gaaccagatt cttcaggtca ttcatatgga ccagtcagca gtgaagtcat caaagccttg 960
cagagggttg atggtatggt tggtatgctg atggatggtc tgaaagagct gaacttgcac 1020
agatgcctga acctcatcct tatttcagat catggcatgg aacaaggcag ttgtaagaaa 1080
tacatatatc tgaataagta tttgggggat gttaaaaata ttaaagttat ctatggacct 1140
gcagctcgat tgagaccctc tgatgtccca gataaatact attcatttaa ctatgaaggc 1200
attgcccgaa atctttcttg ccgggaacca aaccagcact tcaaacctta tctgaaacat 1260
ttcttgccta agcgtttgca ctttgctaag agtgatagaa ttgagccctt gacattctat 1320
ttggaccctc agtggcaact tgcattgaat ccctcagaaa ggaaatattg tggaagtgga 1380
tttcatggct ctgacaatgt gttttcaaat atgcaagccc tctttgttgg ctatggacct 1440
ggattcaagc atggcattga ggctgacacc tttgaaaaca ttgaagtcta taacttgatg 1500
tgtgatttgc tgaatttgac accggctcct aataacggaa ctcatggaag tcttaaccac 1560
cttctgaaga atcctgttta tacgccaaag catcccaaag aagtgcaccc cctggtgcag 1620
tgccccttca caagaaaccc cagagataac cttggctgct catgtaaccc ttccattttg 1680
ccgattgagg attttcaaac acagttcaat ctgaccgtgg cagaagagaa gattattaag 1740
catgaaactt tgccctatgg aagacctaga gttctccaga aggaaaacac catctgtctt 1800
ctttcccagc accagtttat gagtggatac agccaagaca tcttgatgcc cctttggaca 1860
tcctataccg tggacagaaa tgacagtttc tctacggaag acttctccaa ctgtctgtac 1920
caggacttta gaattcctct tagtcctgtc cataaatgtt cattttataa aaataacacc 1980
aaagtgagtt acgggttcct ctccccacca caactgaata agaattcaag tggaatatat 2040
tctgaagcct tgcttactac aaatatagtg ccaatgtacc agagttttca agttatatgg 2100
cgctactttc atgacaccct cttgcgaaag tatgcagaag aaagaaatgg tgtcaatgtc 2160
gtcagtggtc ctgtgtttga ctttgattat gatggacgtt gtgattcctt ggagaatttg 2220
aggcaaaaaa gaagagtcat ccgtaaccaa gaaattttga ttccaactca tttcttcatt 2280
gtgctgacaa gctgtaaaga tacatctcag acgcctttgc actgtgaaaa cctggacacc 2340
ttggctttca ttttgcctca caggactgat aacagcgaga gctgtgtgca tgggaagcat 2400
gactcctcat gggttgaaga attgttgatg ttgcacagag cacggatcac agacgtcgag 2460
cacatcactg gactcagctt ttatcaacaa agaaaagagc cagtttcaga cattttgaag 2520
ttgaaaacac atttgccaac ctttagccaa gaagatgagc ccaaatcttg tgacaaaact 2580
cacacatgcc caccgtgccc agcacctgaa ctcctggggg gaccgtcagt cttcctcttc 2640
cccccaaaac ccaaggacac cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg 2700
gtggacgtga gccacgaaga ccctgaggtc aagttcaact ggtacgtgga cggcgtggag 2760
gtgcataatg ccaagacaaa gccgcgggag gagcagtaca acagcacgta ccgtgtggtc 2820
agcgtcctca ccgtcctgca ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc 2880
tccaacaaag ccctcccagc ccccatcgag aaaaccatct ccaaagccaa agggcagccc 2940
cgagaaccac aggtgtacac cctgccccca tcccgggagg agatgaccaa gaaccaggtc 3000
agcctgacct gcctggtcaa aggcttctat cccagcgaca tcgccgtgga gtgggagagc 3060
aatgggcagc cggagaacaa ctacaagacc acgcctcccg tgctggactc cgacggctcc 3120
ttcttcctct atagcaagct caccgtggac aagagcaggt ggcagcaggg gaacgtcttc 3180
tcatgctccg tgatgcatga ggctctgcac aaccactaca cgcagaagag cctctccctg 3240
tccccgggta aatga 3255
<210> 22
<211> 1084
<212> PRT
<213> Artificial sequence
<220>
<223> sNPP1-Fc fusion protein
<400> 22
Met Gly Val Leu Leu Thr Gln Arg Thr Leu Leu Ser Leu Val Leu Ala
1 5 10 15
Leu Leu Phe Pro Ser Met Ala Ser Met Pro Ser Cys Ala Lys Glu Val
20 25 30
Lys Ser Cys Lys Gly Arg Cys Phe Glu Arg Thr Phe Gly Asn Cys Arg
35 40 45
Cys Asp Ala Ala Cys Val Glu Leu Gly Asn Cys Cys Leu Asp Tyr Gln
50 55 60
Glu Thr Cys Ile Glu Pro Glu His Ile Trp Thr Cys Asn Lys Phe Arg
65 70 75 80
Cys Gly Glu Lys Arg Leu Thr Arg Ser Leu Cys Ala Cys Ser Asp Asp
85 90 95
Cys Lys Asp Lys Gly Asp Cys Cys Ile Asn Tyr Ser Ser Val Cys Gln
100 105 110
Gly Glu Lys Ser Trp Val Glu Glu Pro Cys Glu Ser Ile Asn Glu Pro
115 120 125
Gln Cys Pro Ala Gly Phe Glu Thr Pro Pro Thr Leu Leu Phe Ser Leu
130 135 140
Asp Gly Phe Arg Ala Glu Tyr Leu His Thr Trp Gly Gly Leu Leu Pro
145 150 155 160
Val Ile Ser Lys Leu Lys Lys Cys Gly Thr Tyr Thr Lys Asn Met Arg
165 170 175
Pro Val Tyr Pro Thr Lys Thr Phe Pro Asn His Tyr Ser Ile Val Thr
180 185 190
Gly Leu Tyr Pro Glu Ser His Gly Ile Ile Asp Asn Lys Met Tyr Asp
195 200 205
Pro Lys Met Asn Ala Ser Phe Ser Leu Lys Ser Lys Glu Lys Phe Asn
210 215 220
Pro Glu Trp Tyr Lys Gly Glu Pro Ile Trp Val Thr Ala Lys Tyr Gln
225 230 235 240
Gly Leu Lys Ser Gly Thr Phe Phe Trp Pro Gly Ser Asp Val Glu Ile
245 250 255
Asn Gly Ile Phe Pro Asp Ile Tyr Lys Met Tyr Asn Gly Ser Val Pro
260 265 270
Phe Glu Glu Arg Ile Leu Ala Val Leu Gln Trp Leu Gln Leu Pro Lys
275 280 285
Asp Glu Arg Pro His Phe Tyr Thr Leu Tyr Leu Glu Glu Pro Asp Ser
290 295 300
Ser Gly His Ser Tyr Gly Pro Val Ser Ser Glu Val Ile Lys Ala Leu
305 310 315 320
Gln Arg Val Asp Gly Met Val Gly Met Leu Met Asp Gly Leu Lys Glu
325 330 335
Leu Asn Leu His Arg Cys Leu Asn Leu Ile Leu Ile Ser Asp His Gly
340 345 350
Met Glu Gln Gly Ser Cys Lys Lys Tyr Ile Tyr Leu Asn Lys Tyr Leu
355 360 365
Gly Asp Val Lys Asn Ile Lys Val Ile Tyr Gly Pro Ala Ala Arg Leu
370 375 380
Arg Pro Ser Asp Val Pro Asp Lys Tyr Tyr Ser Phe Asn Tyr Glu Gly
385 390 395 400
Ile Ala Arg Asn Leu Ser Cys Arg Glu Pro Asn Gln His Phe Lys Pro
405 410 415
Tyr Leu Lys His Phe Leu Pro Lys Arg Leu His Phe Ala Lys Ser Asp
420 425 430
Arg Ile Glu Pro Leu Thr Phe Tyr Leu Asp Pro Gln Trp Gln Leu Ala
435 440 445
Leu Asn Pro Ser Glu Arg Lys Tyr Cys Gly Ser Gly Phe His Gly Ser
450 455 460
Asp Asn Val Phe Ser Asn Met Gln Ala Leu Phe Val Gly Tyr Gly Pro
465 470 475 480
Gly Phe Lys His Gly Ile Glu Ala Asp Thr Phe Glu Asn Ile Glu Val
485 490 495
Tyr Asn Leu Met Cys Asp Leu Leu Asn Leu Thr Pro Ala Pro Asn Asn
500 505 510
Gly Thr His Gly Ser Leu Asn His Leu Leu Lys Asn Pro Val Tyr Thr
515 520 525
Pro Lys His Pro Lys Glu Val His Pro Leu Val Gln Cys Pro Phe Thr
530 535 540
Arg Asn Pro Arg Asp Asn Leu Gly Cys Ser Cys Asn Pro Ser Ile Leu
545 550 555 560
Pro Ile Glu Asp Phe Gln Thr Gln Phe Asn Leu Thr Val Ala Glu Glu
565 570 575
Lys Ile Ile Lys His Glu Thr Leu Pro Tyr Gly Arg Pro Arg Val Leu
580 585 590
Gln Lys Glu Asn Thr Ile Cys Leu Leu Ser Gln His Gln Phe Met Ser
595 600 605
Gly Tyr Ser Gln Asp Ile Leu Met Pro Leu Trp Thr Ser Tyr Thr Val
610 615 620
Asp Arg Asn Asp Ser Phe Ser Thr Glu Asp Phe Ser Asn Cys Leu Tyr
625 630 635 640
Gln Asp Phe Arg Ile Pro Leu Ser Pro Val His Lys Cys Ser Phe Tyr
645 650 655
Lys Asn Asn Thr Lys Val Ser Tyr Gly Phe Leu Ser Pro Pro Gln Leu
660 665 670
Asn Lys Asn Ser Ser Gly Ile Tyr Ser Glu Ala Leu Leu Thr Thr Asn
675 680 685
Ile Val Pro Met Tyr Gln Ser Phe Gln Val Ile Trp Arg Tyr Phe His
690 695 700
Asp Thr Leu Leu Arg Lys Tyr Ala Glu Glu Arg Asn Gly Val Asn Val
705 710 715 720
Val Ser Gly Pro Val Phe Asp Phe Asp Tyr Asp Gly Arg Cys Asp Ser
725 730 735
Leu Glu Asn Leu Arg Gln Lys Arg Arg Val Ile Arg Asn Gln Glu Ile
740 745 750
Leu Ile Pro Thr His Phe Phe Ile Val Leu Thr Ser Cys Lys Asp Thr
755 760 765
Ser Gln Thr Pro Leu His Cys Glu Asn Leu Asp Thr Leu Ala Phe Ile
770 775 780
Leu Pro His Arg Thr Asp Asn Ser Glu Ser Cys Val His Gly Lys His
785 790 795 800
Asp Ser Ser Trp Val Glu Glu Leu Leu Met Leu His Arg Ala Arg Ile
805 810 815
Thr Asp Val Glu His Ile Thr Gly Leu Ser Phe Tyr Gln Gln Arg Lys
820 825 830
Glu Pro Val Ser Asp Ile Leu Lys Leu Lys Thr His Leu Pro Thr Phe
835 840 845
Ser Gln Glu Asp Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro
850 855 860
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
865 870 875 880
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
885 890 895
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
900 905 910
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
915 920 925
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
930 935 940
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
945 950 955 960
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
965 970 975
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
980 985 990
Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
995 1000 1005
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
1010 1015 1020
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
1025 1030 1035
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
1040 1045 1050
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
1055 1060 1065
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly
1070 1075 1080
Lys
Claims (38)
- NPP1 성분, 표적화 모이어티(targeting moiety), 및 면역글로불린의 Fc 영역을 포함하는 분리된 NPP1 융합 단백질로서,
a) NPP1 성분은 시스테인-풍부 영역 및 NPP1의 C-말단 촉매 도메인을 포함하고,
b) 표적화 모이어티 및 Fc 영역은 각각 NPP1 성분의 C-말단에 위치해 있으며,
c) 분리된 NPP1 융합 단백질은 NPP1 효소 활성을 갖는 것을 특징으로 하는, 분리된 NPP1 융합 단백질. - 제 1항에 있어서, 상기 NPP1 효소 활성은 피로포스파타제 활성, 포스포디에스테라제 활성, 또는 피로포스파타제 및 포스포디에스테라제 활성인 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 1항에 있어서, 상기 융합 단백질은 재조합 단백질인 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 1항에 있어서, 상기 표적화 모이어티는 상기 NPP1의 촉매 도메인에 화학적으로 연결된 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 1항에 있어서, 상기 NPP1 성분은 SEQ ID NO:1의 P99 내지 D925로 이루어진 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 5항에 있어서, 상기 표적화 모이어티는 적어도 4개의 음성으로 하전된 아미노산 잔기를 포함하는 펩티드인 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 5항에 있어서, 상기 표적화 모이어티는 5개 내지 15개의 음성으로 하전된 아미노산 잔기를 포함하는 펩티드인 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 7항에 있어서, 상기 음성으로 하전된 아미노산 잔기는 8개의 연속적인 아스파르트산 또는 글루탐산 잔기를 포함하는 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 7항에 있어서, 상기 음성으로 하전된 아미노산 잔기는 적어도 4개의 아스파르트산 잔기를 포함하는 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 7항에 있어서, 상기 음성으로 하전된 아미노산 잔기는 적어도 4개의 글루탐산 잔기를 포함하는 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 7항에 있어서, 상기 음성으로 하전된 아미노산 잔기는 8개의 연속적인 아스파르트산 잔기를 포함하는 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 5항에 있어서, 상기 표적화 모이어티는 상기 NPP1의 촉매 도메인의 C-말단에 융합된 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 5항에 있어서, 상기 Fc 영역은 상기 NPP1의 촉매 도메인의 C-말단에 융합된 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 1항에 있어서, 상기 융합 단백질은 상기 표적화 모이어티와 상기 NPP1의 촉매 도메인 사이에 폴리펩티드 링커를 추가로 포함하는 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 1항에 있어서, 상기 융합 단백질은 신호 펩티드를 추가로 포함하는 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 1항에 있어서, 상기 융합 단백질은 동종이합체를 형성하는 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 1항에 있어서, 상기 융합 단백질은 단량체인 것을 특징으로 하는, 분리된 NPP1 융합 단백질.
- 제 1항의 분리된 NPP1 융합 단백질을 인코딩하는 분리된 핵산.
- 제 18항의 분리된 핵산을 갖는 복제 또는 발현 벡터.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
USPCT/US2011/028233 | 2011-03-11 | ||
PCT/US2011/028233 WO2011113027A2 (en) | 2010-03-12 | 2011-03-11 | Npp1 fusion proteins |
PCT/US2011/051858 WO2012125182A1 (en) | 2011-03-11 | 2011-09-15 | Npp1 fusion proteins |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177003612A Division KR101772366B1 (ko) | 2011-03-11 | 2011-09-15 | Npp1 융합 단백질 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140043726A KR20140043726A (ko) | 2014-04-10 |
KR101707712B1 true KR101707712B1 (ko) | 2017-02-17 |
Family
ID=50687200
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137026773A KR101707712B1 (ko) | 2011-03-11 | 2011-09-15 | Npp1 융합 단백질 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101707712B1 (ko) |
-
2011
- 2011-09-15 KR KR1020137026773A patent/KR101707712B1/ko active IP Right Grant
Non-Patent Citations (4)
Title |
---|
Flanagan et al., "Soluble Fc Fusion Proteins for Biomedical Research," in |
Goding et al., Biochimica et Biophysica Acta (2003) 1638, 1-19 |
Guan et al., Bioconjugate Chem. (2008) 19, 1813-1821. |
Wang et al., Molecular Pharmaceutics (2006) 3(6), 717-725. |
Also Published As
Publication number | Publication date |
---|---|
KR20140043726A (ko) | 2014-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101772366B1 (ko) | Npp1 융합 단백질 | |
US20230129977A1 (en) | Npp1 fusion proteins | |
JP2004024276A (ja) | 殺菌/浸透性が向上した安定なタンパク質生成物およびそれを含む薬剤組成物 | |
CN101014626A (zh) | 糖基化免疫球蛋白以及含有糖基化免疫球蛋白的免疫粘附素 | |
JP4174183B2 (ja) | 分泌及び膜貫通ポリペプチドとそれをコードする核酸 | |
US20030106084A1 (en) | Methods of blocking tissue destruction by autoreactive T cells | |
US6090621A (en) | Signaling inositol polyphosphate 5-phosphatases (SIPs) | |
KR101707712B1 (ko) | Npp1 융합 단백질 | |
RU2760943C2 (ru) | Гибридные белки NPP1 | |
KR101651330B1 (ko) | 세포투과성이 우수한 tat-a20 융합단백질의 제조방법 및 이의 용도 | |
WO1997046583A1 (fr) | Nouvelle proteine de cytokine feline | |
KR20230061710A (ko) | Cadm1을 인식하는 재조합 단백질 및 이를 유효성분으로 포함하는 암의 치료용 약학적 조성물 | |
CN116917336A (zh) | 用于治疗病毒感染的方法和组合物 | |
BR122021013881B1 (pt) | Proteína de fusão npp1 isolada, ácido nucleico isolado que codifica a proteína de fusão, vetor de expressão, processo para a produção de uma proteína de fusão e composição farmacêutica compreendendo a proteína de fusão | |
WO1998055511A1 (fr) | Nouvelle proteine appelee cytokine canine | |
TW200412993A (en) | Peptides and related molecules that modulate nerve growth factor activity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E701 | Decision to grant or registration of patent right | ||
A107 | Divisional application of patent | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20200130 Year of fee payment: 4 |