RU2782212C2 - Гликозилированные слитые белки vwf с улучшенной фармакокинетикой - Google Patents
Гликозилированные слитые белки vwf с улучшенной фармакокинетикой Download PDFInfo
- Publication number
- RU2782212C2 RU2782212C2 RU2018144112A RU2018144112A RU2782212C2 RU 2782212 C2 RU2782212 C2 RU 2782212C2 RU 2018144112 A RU2018144112 A RU 2018144112A RU 2018144112 A RU2018144112 A RU 2018144112A RU 2782212 C2 RU2782212 C2 RU 2782212C2
- Authority
- RU
- Russia
- Prior art keywords
- leu
- val
- ser
- pro
- gly
- Prior art date
Links
- 230000036231 pharmacokinetics Effects 0.000 title description 2
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 307
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 307
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 131
- 150000001413 amino acids Chemical class 0.000 claims abstract description 116
- 230000036499 Half live Effects 0.000 claims abstract description 89
- 241000282414 Homo sapiens Species 0.000 claims abstract description 63
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 57
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 57
- 229920000023 polynucleotide Polymers 0.000 claims abstract description 43
- 239000002157 polynucleotide Substances 0.000 claims abstract description 43
- 230000027455 binding Effects 0.000 claims abstract description 42
- 239000000203 mixture Substances 0.000 claims abstract description 38
- 230000001965 increased Effects 0.000 claims abstract description 26
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 15
- 102000004506 Blood Proteins Human genes 0.000 claims abstract description 14
- 108010017384 Blood Proteins Proteins 0.000 claims abstract description 14
- 230000002265 prevention Effects 0.000 claims abstract description 7
- 239000000126 substance Substances 0.000 claims abstract description 6
- 102000037240 fusion proteins Human genes 0.000 claims description 168
- 108020001507 fusion proteins Proteins 0.000 claims description 168
- 102100019017 VWF Human genes 0.000 claims description 136
- 108010047303 von Willebrand Factor Proteins 0.000 claims description 135
- 229960001134 von Willebrand factor Drugs 0.000 claims description 121
- 210000004027 cells Anatomy 0.000 claims description 61
- 210000002381 Plasma Anatomy 0.000 claims description 23
- 230000001225 therapeutic Effects 0.000 claims description 18
- 101700070229 F8 Proteins 0.000 claims description 16
- 102100000368 F8 Human genes 0.000 claims description 16
- 201000010099 disease Diseases 0.000 claims description 15
- 206010018987 Haemorrhage Diseases 0.000 claims description 11
- 239000004019 antithrombin Substances 0.000 claims description 11
- 230000000740 bleeding Effects 0.000 claims description 11
- 231100000319 bleeding Toxicity 0.000 claims description 11
- 239000003114 blood coagulation factor Substances 0.000 claims description 11
- -1 2-macroglobulin Proteins 0.000 claims description 10
- 108010049003 Fibrinogen Proteins 0.000 claims description 10
- 102000008946 Fibrinogen Human genes 0.000 claims description 10
- 229940012952 Fibrinogen Drugs 0.000 claims description 9
- 229940019698 Fibrinogen containing hemostatics Drugs 0.000 claims description 9
- 108010001953 Protein C Inhibitor Proteins 0.000 claims description 6
- 102100002742 SERPINA5 Human genes 0.000 claims description 6
- 102100008880 TFPI Human genes 0.000 claims description 6
- 101710034269 TFPI Proteins 0.000 claims description 6
- 101700048951 VSPDV Proteins 0.000 claims description 6
- 239000000539 dimer Substances 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 6
- 102100006780 ADAMTS13 Human genes 0.000 claims description 5
- 108091005662 ADAMTS13 Proteins 0.000 claims description 5
- 102000005911 Complement C1 Inhibitor Protein Human genes 0.000 claims description 5
- 108010005563 Complement C1 Inhibitor Protein Proteins 0.000 claims description 5
- 102100015239 F2 Human genes 0.000 claims description 5
- 102000017975 Protein C Human genes 0.000 claims description 5
- 229960000856 Protein C Drugs 0.000 claims description 5
- 102000029610 Protein S Human genes 0.000 claims description 5
- 108010066124 Protein S Proteins 0.000 claims description 5
- 229940096437 Protein S Drugs 0.000 claims description 5
- 108010094028 Prothrombin Proteins 0.000 claims description 5
- 229940039716 Prothrombin Drugs 0.000 claims description 5
- 239000003541 chymotrypsin inhibitor Substances 0.000 claims description 5
- 238000010253 intravenous injection Methods 0.000 claims description 5
- 210000003292 kidney cell Anatomy 0.000 claims description 5
- 108060005018 mobB Proteins 0.000 claims description 5
- 239000000137 peptide hydrolase inhibitor Substances 0.000 claims description 5
- 108010025221 plasma protein Z Proteins 0.000 claims description 5
- 238000010254 subcutaneous injection Methods 0.000 claims description 5
- 102000004032 Heparin cofactor II Human genes 0.000 claims description 4
- 108090000481 Heparin cofactor II Proteins 0.000 claims description 4
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 claims description 4
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 claims description 4
- 229940024142 alpha 1-Antitrypsin Drugs 0.000 claims description 4
- 238000006471 dimerization reaction Methods 0.000 claims description 4
- 210000004962 mammalian cells Anatomy 0.000 claims description 4
- 239000007929 subcutaneous injection Substances 0.000 claims description 4
- 230000001900 immune effect Effects 0.000 claims description 3
- 230000001939 inductive effect Effects 0.000 claims description 3
- 238000001990 intravenous administration Methods 0.000 claims description 3
- 125000001433 C-terminal amino-acid group Chemical group 0.000 claims description 2
- 101700012683 PEF1 Proteins 0.000 claims description 2
- 230000024664 tolerance induction Effects 0.000 claims description 2
- 108010022233 Plasminogen Activator Inhibitor 1 Proteins 0.000 claims 3
- 102100007015 SERPINE1 Human genes 0.000 claims 3
- 210000001161 Embryo, Mammalian Anatomy 0.000 claims 2
- 210000003734 Kidney Anatomy 0.000 claims 1
- 210000002308 embryonic cell Anatomy 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 26
- 206010009802 Coagulopathy Diseases 0.000 abstract description 6
- 201000007368 coagulation protein disease Diseases 0.000 abstract 2
- 235000018102 proteins Nutrition 0.000 description 246
- 102000001690 Factor VIII Human genes 0.000 description 156
- 108010054218 Factor VIII Proteins 0.000 description 155
- 229960000301 Factor VIII Drugs 0.000 description 138
- 235000001014 amino acid Nutrition 0.000 description 107
- 229940021015 I.V. solution additive Amino Acids Drugs 0.000 description 88
- 108010060199 cysteinylproline Proteins 0.000 description 86
- FCKYPQBAHLOOJQ-UHFFFAOYSA-N 2-[[2-[bis(carboxymethyl)amino]cyclohexyl]-(carboxymethyl)amino]acetic acid Chemical compound OC(=O)CN(CC(O)=O)C1CCCCC1N(CC(O)=O)CC(O)=O FCKYPQBAHLOOJQ-UHFFFAOYSA-N 0.000 description 83
- 108010026333 seryl-proline Proteins 0.000 description 63
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 58
- WPSXZFTVLIAPCN-UHFFFAOYSA-N Valyl-Cysteine Chemical compound CC(C)C(N)C(=O)NC(CS)C(O)=O WPSXZFTVLIAPCN-UHFFFAOYSA-N 0.000 description 54
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 53
- STTYIMSDIYISRG-WDSKDSINSA-N Val-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(O)=O STTYIMSDIYISRG-WDSKDSINSA-N 0.000 description 52
- 108010047857 aspartylglycine Proteins 0.000 description 50
- FFOKMZOAVHEWET-UHFFFAOYSA-N Serinyl-Cysteine Chemical compound OCC(N)C(=O)NC(CS)C(O)=O FFOKMZOAVHEWET-UHFFFAOYSA-N 0.000 description 48
- 108010029020 prolylglycine Proteins 0.000 description 48
- 108010016616 cysteinylglycine Proteins 0.000 description 46
- CUTPSEKWUPZFLV-UHFFFAOYSA-N Threoninyl-Cysteine Chemical compound CC(O)C(N)C(=O)NC(CS)C(O)=O CUTPSEKWUPZFLV-UHFFFAOYSA-N 0.000 description 45
- 108010087924 alanylproline Proteins 0.000 description 44
- 108010073969 valyllysine Proteins 0.000 description 43
- JQDFGZKKXBEANU-UHFFFAOYSA-N Alanyl-Cysteine Chemical compound CC(N)C(=O)NC(CS)C(O)=O JQDFGZKKXBEANU-UHFFFAOYSA-N 0.000 description 41
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 41
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 40
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 40
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 40
- ZSRSLWKGWFFVCM-WDSKDSINSA-N Cys-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O ZSRSLWKGWFFVCM-WDSKDSINSA-N 0.000 description 38
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 38
- 241000880493 Leptailurus serval Species 0.000 description 37
- GVRKWABULJAONN-UHFFFAOYSA-N Valyl-Threonine Chemical compound CC(C)C(N)C(=O)NC(C(C)O)C(O)=O GVRKWABULJAONN-UHFFFAOYSA-N 0.000 description 36
- 108010093581 aspartyl-proline Proteins 0.000 description 35
- 108010012058 leucyltyrosine Proteins 0.000 description 34
- YHDXIZKDOIWPBW-UHFFFAOYSA-N Cysteinyl-Glutamine Chemical compound SCC(N)C(=O)NC(C(O)=O)CCC(N)=O YHDXIZKDOIWPBW-UHFFFAOYSA-N 0.000 description 33
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 33
- GVUVRRPYYDHHGK-UHFFFAOYSA-N Prolyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C1CCCN1 GVUVRRPYYDHHGK-UHFFFAOYSA-N 0.000 description 33
- 108010077112 prolyl-proline Proteins 0.000 description 33
- BUXAPSQPMALTOY-UHFFFAOYSA-N 2-[(2-amino-3-sulfanylpropanoyl)amino]pentanedioic acid Chemical compound SCC(N)C(=O)NC(C(O)=O)CCC(O)=O BUXAPSQPMALTOY-UHFFFAOYSA-N 0.000 description 32
- 108010038633 aspartylglutamate Proteins 0.000 description 32
- YXQDRIRSAHTJKM-IMJSIDKUSA-N Cys-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YXQDRIRSAHTJKM-IMJSIDKUSA-N 0.000 description 30
- HIZYETOZLYFUFF-BQBZGAKWSA-N Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O HIZYETOZLYFUFF-BQBZGAKWSA-N 0.000 description 30
- JYOAXOMPIXKMKK-UHFFFAOYSA-N Leucyl-Glutamine Chemical compound CC(C)CC(N)C(=O)NC(C(O)=O)CCC(N)=O JYOAXOMPIXKMKK-UHFFFAOYSA-N 0.000 description 30
- 108010017391 lysylvaline Proteins 0.000 description 30
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 29
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 29
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 29
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 29
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 27
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 27
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 27
- OSASDIVHOSJVII-UHFFFAOYSA-N Arginyl-Cysteine Chemical compound SCC(C(O)=O)NC(=O)C(N)CCCNC(N)=N OSASDIVHOSJVII-UHFFFAOYSA-N 0.000 description 25
- UKGGPJNBONZZCM-WDSKDSINSA-N Aspartyl-L-proline Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 25
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 25
- UCGDDTHMMVWVMV-FSPLSTOPSA-N Ile-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(O)=O UCGDDTHMMVWVMV-FSPLSTOPSA-N 0.000 description 25
- TWVKGYNQQAUNRN-ACZMJKKPSA-N Ile-Ser Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O TWVKGYNQQAUNRN-ACZMJKKPSA-N 0.000 description 25
- ZUKPVRWZDMRIEO-VKHMYHEASA-N L-cysteinylglycine zwitterion Chemical compound SC[C@H]([NH3+])C(=O)NCC([O-])=O ZUKPVRWZDMRIEO-VKHMYHEASA-N 0.000 description 25
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 25
- 229920003013 deoxyribonucleic acid Polymers 0.000 description 25
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 25
- SITLTJHOQZFJGG-XPUUQOCRSA-N α-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 25
- OELDIVRKHTYFNG-UHFFFAOYSA-N Cysteinyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CS OELDIVRKHTYFNG-UHFFFAOYSA-N 0.000 description 24
- OWOFCNWTMWOOJJ-WDSKDSINSA-N Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OWOFCNWTMWOOJJ-WDSKDSINSA-N 0.000 description 24
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 24
- 108010057821 leucylproline Proteins 0.000 description 24
- FKBFDTRILNZGAI-UHFFFAOYSA-N Aspartyl-Cysteine Chemical compound OC(=O)CC(N)C(=O)NC(CS)C(O)=O FKBFDTRILNZGAI-UHFFFAOYSA-N 0.000 description 23
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 23
- MAJYPBAJPNUFPV-UHFFFAOYSA-N Histidinyl-Cysteine Chemical compound SCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 MAJYPBAJPNUFPV-UHFFFAOYSA-N 0.000 description 23
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 23
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 23
- PABVKUJVLNMOJP-UHFFFAOYSA-N 4-amino-5-[(1-carboxy-2-sulfanylethyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CS)C(O)=O PABVKUJVLNMOJP-UHFFFAOYSA-N 0.000 description 22
- 108010049041 glutamylalanine Proteins 0.000 description 22
- 108010089804 glycyl-threonine Proteins 0.000 description 22
- XIPZDANNDPMZGQ-UHFFFAOYSA-N Glutaminyl-Cysteine Chemical compound NC(=O)CCC(N)C(=O)NC(CS)C(O)=O XIPZDANNDPMZGQ-UHFFFAOYSA-N 0.000 description 21
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 21
- 108010050848 glycylleucine Proteins 0.000 description 21
- 108010015792 glycyllysine Proteins 0.000 description 21
- 108010034529 leucyl-lysine Proteins 0.000 description 21
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 20
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 20
- NTQDELBZOMWXRS-UHFFFAOYSA-N Aspartyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(O)=O NTQDELBZOMWXRS-UHFFFAOYSA-N 0.000 description 20
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 20
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 20
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 20
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 20
- 108010077245 asparaginyl-proline Proteins 0.000 description 20
- 108010027338 isoleucylcysteine Proteins 0.000 description 20
- DOFAQXCYFQKSHT-SRVKXCTJSA-N (2S)-1-[(2S)-1-[(2S)-2-amino-3-methylbutanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 19
- MRVYVEQPNDSWLH-UHFFFAOYSA-N Glutaminyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CCC(N)=O MRVYVEQPNDSWLH-UHFFFAOYSA-N 0.000 description 19
- 108010062796 arginyllysine Proteins 0.000 description 19
- 229920001184 polypeptide Polymers 0.000 description 19
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 19
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 18
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 18
- JWBXCSQZLLIOCI-GUBZILKMSA-N Ile-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C JWBXCSQZLLIOCI-GUBZILKMSA-N 0.000 description 18
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 18
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 18
- 108010047495 alanylglycine Proteins 0.000 description 18
- 108010013835 arginine glutamate Proteins 0.000 description 18
- 108010078144 glutaminyl-glycine Proteins 0.000 description 18
- 108010092114 histidylphenylalanine Proteins 0.000 description 18
- QLROSWPKSBORFJ-BQBZGAKWSA-N pro glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 18
- MPZWMIIOPAPAKE-UHFFFAOYSA-N 4-amino-5-[[1-carboxy-4-(diaminomethylideneamino)butyl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CCCN=C(N)N MPZWMIIOPAPAKE-UHFFFAOYSA-N 0.000 description 17
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 17
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 17
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 17
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 17
- WBAXJMCUFIXCNI-WDSKDSINSA-N Ser-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WBAXJMCUFIXCNI-WDSKDSINSA-N 0.000 description 17
- XXDVDTMEVBYRPK-XPUUQOCRSA-N Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O XXDVDTMEVBYRPK-XPUUQOCRSA-N 0.000 description 17
- 108010044940 alanylglutamine Proteins 0.000 description 17
- 108010054155 lysyllysine Proteins 0.000 description 17
- RZVAJINKPMORJF-UHFFFAOYSA-N p-acetaminophenol Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 17
- 108010051242 phenylalanylserine Proteins 0.000 description 17
- 239000000047 product Substances 0.000 description 17
- 108010048818 seryl-histidine Proteins 0.000 description 17
- JSZMKEYEVLDPDO-ACZMJKKPSA-N (2R)-2-[[(2S,3S)-2-amino-3-methylpentanoyl]amino]-3-sulfanylpropanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CS)C(O)=O JSZMKEYEVLDPDO-ACZMJKKPSA-N 0.000 description 16
- JTEDVYBZBROSJT-UHFFFAOYSA-N Indole-3-butyric acid Natural products C1=CC=C2C(CCCC(=O)O)=CNC2=C1 JTEDVYBZBROSJT-UHFFFAOYSA-N 0.000 description 16
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 16
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 16
- CKHWEVXPLJBEOZ-UHFFFAOYSA-N Threoninyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)C(C)O CKHWEVXPLJBEOZ-UHFFFAOYSA-N 0.000 description 16
- LCPVBXOHXMBLFW-JSGCOSHPSA-N Trp-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)=CNC2=C1 LCPVBXOHXMBLFW-JSGCOSHPSA-N 0.000 description 16
- 108010036413 histidylglycine Proteins 0.000 description 16
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 15
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 15
- QJMCHPGWFZZRID-UHFFFAOYSA-N Asparaginyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC(N)=O QJMCHPGWFZZRID-UHFFFAOYSA-N 0.000 description 15
- 210000004369 Blood Anatomy 0.000 description 15
- AYKQJQVWUYEZNU-UHFFFAOYSA-N Cysteinyl-Asparagine Chemical compound SCC(N)C(=O)NC(C(O)=O)CC(N)=O AYKQJQVWUYEZNU-UHFFFAOYSA-N 0.000 description 15
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 15
- 208000009292 Hemophilia A Diseases 0.000 description 15
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 15
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 15
- HXNYBZQLBWIADP-UHFFFAOYSA-N Prolyl-Cysteine Chemical compound OC(=O)C(CS)NC(=O)C1CCCN1 HXNYBZQLBWIADP-UHFFFAOYSA-N 0.000 description 15
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 15
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 15
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 15
- 239000008280 blood Substances 0.000 description 15
- 108010064235 lysylglycine Proteins 0.000 description 15
- 108010071207 serylmethionine Proteins 0.000 description 15
- CPMKYMGGYUFOHS-FSPLSTOPSA-N Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O CPMKYMGGYUFOHS-FSPLSTOPSA-N 0.000 description 14
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 14
- SSHIXEILTLPAQT-UHFFFAOYSA-N Glutaminyl-Aspartate Chemical compound NC(=O)CCC(N)C(=O)NC(CC(O)=O)C(O)=O SSHIXEILTLPAQT-UHFFFAOYSA-N 0.000 description 14
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 14
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 14
- 238000006206 glycosylation reaction Methods 0.000 description 14
- 108010031719 prolyl-serine Proteins 0.000 description 14
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 13
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 13
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 13
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 13
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 13
- 239000000427 antigen Substances 0.000 description 13
- 102000038129 antigens Human genes 0.000 description 13
- 108091007172 antigens Proteins 0.000 description 13
- 108010060035 arginylproline Proteins 0.000 description 13
- 230000003899 glycosylation Effects 0.000 description 13
- DXJZITDUDUPINW-UHFFFAOYSA-N γ-glutamyl-Asparagine Chemical compound NC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O DXJZITDUDUPINW-UHFFFAOYSA-N 0.000 description 13
- ILDSIMPXNFWKLH-KATARQTJSA-N (2S)-2-[[(2S,3R)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 12
- QYLJIYOGHRGUIH-CIUDSAMLSA-N Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N QYLJIYOGHRGUIH-CIUDSAMLSA-N 0.000 description 12
- BNODVYXZAAXSHW-UHFFFAOYSA-N Arginyl-Histidine Chemical compound NC(=N)NCCCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 BNODVYXZAAXSHW-UHFFFAOYSA-N 0.000 description 12
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 12
- HSPSXROIMXIJQW-BQBZGAKWSA-N Asp-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 HSPSXROIMXIJQW-BQBZGAKWSA-N 0.000 description 12
- LVNMAAGSAUGNIC-UHFFFAOYSA-N Cysteinyl-Histidine Chemical compound SCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 LVNMAAGSAUGNIC-UHFFFAOYSA-N 0.000 description 12
- NXTYATMDWQYLGJ-UHFFFAOYSA-N Cysteinyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CS NXTYATMDWQYLGJ-UHFFFAOYSA-N 0.000 description 12
- OOULJWDSSVOMHX-UHFFFAOYSA-N Cysteinyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CS OOULJWDSSVOMHX-UHFFFAOYSA-N 0.000 description 12
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 12
- PFMUCCYYAAFKTH-YFKPBYRVSA-N Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CN PFMUCCYYAAFKTH-YFKPBYRVSA-N 0.000 description 12
- VYZAGTDAHUIRQA-WHFBIAKZSA-N L-alanyl-L-glutamic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O VYZAGTDAHUIRQA-WHFBIAKZSA-N 0.000 description 12
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 12
- YZMPDHTZJJCGEI-BQBZGAKWSA-N Ser-His Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 YZMPDHTZJJCGEI-BQBZGAKWSA-N 0.000 description 12
- PBUXMVYWOSKHMF-WDSKDSINSA-N Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO PBUXMVYWOSKHMF-WDSKDSINSA-N 0.000 description 12
- LZLREEUGSYITMX-UHFFFAOYSA-N Serinyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CO)N)C(O)=O)=CNC2=C1 LZLREEUGSYITMX-UHFFFAOYSA-N 0.000 description 12
- APIDTRXFGYOLLH-VQVTYTSYSA-N Thr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O APIDTRXFGYOLLH-VQVTYTSYSA-N 0.000 description 12
- ONWMQORSVZYVNH-UHFFFAOYSA-N Tyrosyl-Asparagine Chemical compound NC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ONWMQORSVZYVNH-UHFFFAOYSA-N 0.000 description 12
- QZOSVNLXLSNHQK-UHFFFAOYSA-N Tyrosyl-Aspartate Chemical compound OC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UHFFFAOYSA-N 0.000 description 12
- 108010025306 histidylleucine Proteins 0.000 description 12
- 108010085325 histidylproline Proteins 0.000 description 12
- 108010070643 prolylglutamic acid Proteins 0.000 description 12
- 108010090894 prolylleucine Proteins 0.000 description 12
- GJSURZIOUXUGAL-UHFFFAOYSA-N 2-((2,6-Dichlorophenyl)imino)imidazolidine Chemical compound ClC1=CC=CC(Cl)=C1NC1=NCCN1 GJSURZIOUXUGAL-UHFFFAOYSA-N 0.000 description 11
- JSLGXODUIAFWCF-UHFFFAOYSA-N Arginyl-Asparagine Chemical compound NC(N)=NCCCC(N)C(=O)NC(CC(N)=O)C(O)=O JSLGXODUIAFWCF-UHFFFAOYSA-N 0.000 description 11
- HXWUJJADFMXNKA-UHFFFAOYSA-N Asparaginyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(N)=O HXWUJJADFMXNKA-UHFFFAOYSA-N 0.000 description 11
- 101800001415 Bri23 peptide Proteins 0.000 description 11
- 102400000107 C-terminal peptide Human genes 0.000 description 11
- 101800000655 C-terminal peptide Proteins 0.000 description 11
- HAYVTMHUNMMXCV-UHFFFAOYSA-N Cysteinyl-Alanine Chemical compound OC(=O)C(C)NC(=O)C(N)CS HAYVTMHUNMMXCV-UHFFFAOYSA-N 0.000 description 11
- WXOFKRKAHJQKLT-UHFFFAOYSA-N Cysteinyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CS WXOFKRKAHJQKLT-UHFFFAOYSA-N 0.000 description 11
- WYVKPHCYMTWUCW-UHFFFAOYSA-N Cysteinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CS WYVKPHCYMTWUCW-UHFFFAOYSA-N 0.000 description 11
- 108010090461 DFG peptide Proteins 0.000 description 11
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 11
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 11
- OAPNERBWQWUPTI-YUMQZZPRSA-N Lys-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O OAPNERBWQWUPTI-YUMQZZPRSA-N 0.000 description 11
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 11
- XPJBQTCXPJNIFE-ZETCQYMHSA-N (2S)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]-4-methylpentanoate Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 10
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 10
- OMSMPWHEGLNQOD-UHFFFAOYSA-N Asparaginyl-Phenylalanine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UHFFFAOYSA-N 0.000 description 10
- BSWHERGFUNMWGS-UHFFFAOYSA-N Aspartyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 10
- HHSJMSCOLJVTCX-UHFFFAOYSA-N Glutaminyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCC(N)=O HHSJMSCOLJVTCX-UHFFFAOYSA-N 0.000 description 10
- CTCFZNBRZBNKAX-UHFFFAOYSA-N Histidinyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 CTCFZNBRZBNKAX-UHFFFAOYSA-N 0.000 description 10
- CNPNWGHRMBQHBZ-ZKWXMUAHSA-N Ile-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O CNPNWGHRMBQHBZ-ZKWXMUAHSA-N 0.000 description 10
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 10
- LHSGPCFBGJHPCY-STQMWFEESA-N Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-STQMWFEESA-N 0.000 description 10
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 10
- 229920001850 Nucleic acid sequence Polymers 0.000 description 10
- KLAONOISLHWJEE-UHFFFAOYSA-N Phenylalanyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 KLAONOISLHWJEE-UHFFFAOYSA-N 0.000 description 10
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 10
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 10
- VEYJKJORLPYVLO-RYUDHWBXSA-N Val-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VEYJKJORLPYVLO-RYUDHWBXSA-N 0.000 description 10
- 108010070944 alanylhistidine Proteins 0.000 description 10
- 201000003542 factor VIII deficiency Diseases 0.000 description 10
- 108010056582 methionylglutamic acid Proteins 0.000 description 10
- IOUPEELXVYPCPG-UHFFFAOYSA-N val-gly Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 10
- 108010009962 valyltyrosine Proteins 0.000 description 10
- LQJAALCCPOTJGB-YUMQZZPRSA-N (2S)-1-[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carboxylic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 9
- LZDNBBYBDGBADK-KBPBESRZSA-N (2S)-2-[[(2S)-2-amino-3-methylbutanoyl]amino]-3-(1H-indol-3-yl)propanoic acid Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-KBPBESRZSA-N 0.000 description 9
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 9
- XNSKSTRGQIPTSE-UHFFFAOYSA-N Arginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCCNC(N)=N XNSKSTRGQIPTSE-UHFFFAOYSA-N 0.000 description 9
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 9
- FRJIAZKQGSCKPQ-FSPLSTOPSA-N His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 FRJIAZKQGSCKPQ-FSPLSTOPSA-N 0.000 description 9
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 9
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 9
- 108010066427 N-valyltryptophan Proteins 0.000 description 9
- OHUXOEXBXPZKPT-STQMWFEESA-N Phe-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 OHUXOEXBXPZKPT-STQMWFEESA-N 0.000 description 9
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 9
- UBAQSAUDKMIEQZ-QWRGUYRKSA-N Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UBAQSAUDKMIEQZ-QWRGUYRKSA-N 0.000 description 9
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 9
- 108010087823 glycyltyrosine Proteins 0.000 description 9
- 108010040030 histidinoalanine Proteins 0.000 description 9
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 9
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 9
- SNFUTDLOCQQRQD-UHFFFAOYSA-N 2-[(2-amino-4-carboxybutanoyl)amino]-3-methylpentanoic acid Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SNFUTDLOCQQRQD-UHFFFAOYSA-N 0.000 description 8
- AAKRWBIIGKPOKQ-ONGXEEELSA-N 2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 8
- MGHKSHCBDXNTHX-UHFFFAOYSA-N 4-amino-5-[(4-amino-1-carboxy-4-oxobutyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CCC(N)=O)C(O)=O MGHKSHCBDXNTHX-UHFFFAOYSA-N 0.000 description 8
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 8
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 8
- RGTVXXNMOGHRAY-UHFFFAOYSA-N Cysteinyl-Arginine Chemical compound SCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RGTVXXNMOGHRAY-UHFFFAOYSA-N 0.000 description 8
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 8
- ARPVSMCNIDAQBO-UHFFFAOYSA-N Glutaminyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CCC(N)=O ARPVSMCNIDAQBO-UHFFFAOYSA-N 0.000 description 8
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 8
- PNMUAGGSDZXTHX-BYPYZUCNSA-N Gly-Gln Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(N)=O PNMUAGGSDZXTHX-BYPYZUCNSA-N 0.000 description 8
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 8
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 8
- PPQRSMGDOHLTBE-UWVGGRQHSA-N Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PPQRSMGDOHLTBE-UWVGGRQHSA-N 0.000 description 8
- BXLYSRPHVMCOPS-UHFFFAOYSA-N Serinyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CO BXLYSRPHVMCOPS-UHFFFAOYSA-N 0.000 description 8
- LUMXICQAOKVQOB-UHFFFAOYSA-N Threoninyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)C(C)O LUMXICQAOKVQOB-UHFFFAOYSA-N 0.000 description 8
- GRQCSEWEPIHLBI-UHFFFAOYSA-N Tryptophyl-Asparagine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CC(N)=O)C(O)=O)=CNC2=C1 GRQCSEWEPIHLBI-UHFFFAOYSA-N 0.000 description 8
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 8
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 8
- 108010068380 arginylarginine Proteins 0.000 description 8
- 102000035362 glycosylated proteins Human genes 0.000 description 8
- 108091005600 glycosylated proteins Proteins 0.000 description 8
- 108010018006 histidylserine Proteins 0.000 description 8
- 230000002829 reduced Effects 0.000 description 8
- 108010061238 threonyl-glycine Proteins 0.000 description 8
- KTGFOCFYOZQVRJ-UHFFFAOYSA-N 2-[(2-amino-3-methylpentanoyl)amino]pentanedioic acid Chemical compound CCC(C)C(N)C(=O)NC(C(O)=O)CCC(O)=O KTGFOCFYOZQVRJ-UHFFFAOYSA-N 0.000 description 7
- YOKVEHGYYQEQOP-QWRGUYRKSA-N 2-[[(2S)-2-[[(2S)-2-azaniumyl-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]acetate Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 7
- SITWEMZOJNKJCH-UHFFFAOYSA-N Alanyl-Arginine Chemical compound CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 7
- XTWSWDJMIKUJDQ-RYUDHWBXSA-N Arg-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XTWSWDJMIKUJDQ-RYUDHWBXSA-N 0.000 description 7
- KWBQPGIYEZKDEG-FSPLSTOPSA-N Asn-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O KWBQPGIYEZKDEG-FSPLSTOPSA-N 0.000 description 7
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 7
- NPDLYUOYAGBHFB-UHFFFAOYSA-N Asparaginyl-Arginine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N NPDLYUOYAGBHFB-UHFFFAOYSA-N 0.000 description 7
- MQLZLIYPFDIDMZ-UHFFFAOYSA-N Asparaginyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(N)=O MQLZLIYPFDIDMZ-UHFFFAOYSA-N 0.000 description 7
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 7
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 7
- KRBMQYPTDYSENE-BQBZGAKWSA-N His-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 KRBMQYPTDYSENE-BQBZGAKWSA-N 0.000 description 7
- WRPDZHJNLYNFFT-UHFFFAOYSA-N Histidinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CN=CN1 WRPDZHJNLYNFFT-UHFFFAOYSA-N 0.000 description 7
- TUYOFUHICRWDGA-CIUDSAMLSA-N Ile-Met Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCSC TUYOFUHICRWDGA-CIUDSAMLSA-N 0.000 description 7
- WKXVAXOSIPTXEC-UHFFFAOYSA-N Isoleucyl-Aspartate Chemical compound CCC(C)C(N)C(=O)NC(C(O)=O)CC(O)=O WKXVAXOSIPTXEC-UHFFFAOYSA-N 0.000 description 7
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 7
- KNPVDQMEHSCAGX-UHFFFAOYSA-N Phenylalanyl-Cysteine Chemical compound SCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 KNPVDQMEHSCAGX-UHFFFAOYSA-N 0.000 description 7
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 7
- LDEBVRIURYMKQS-UHFFFAOYSA-N Serinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CO LDEBVRIURYMKQS-UHFFFAOYSA-N 0.000 description 7
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 7
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 108010081551 glycylphenylalanine Proteins 0.000 description 7
- 108010037850 glycylvaline Proteins 0.000 description 7
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 7
- 108010009298 lysylglutamic acid Proteins 0.000 description 7
- 150000007523 nucleic acids Chemical class 0.000 description 7
- 230000000275 pharmacokinetic Effects 0.000 description 7
- 108010020532 tyrosyl-proline Proteins 0.000 description 7
- XMAUFHMAAVTODF-STQMWFEESA-N (2S)-2-[[(2S)-2-amino-3-(1H-imidazol-5-yl)propanoyl]amino]-3-phenylpropanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XMAUFHMAAVTODF-STQMWFEESA-N 0.000 description 6
- XUUXCWCKKCZEAW-YFKPBYRVSA-N 2-[[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 6
- XMBSYZWANAQXEV-UHFFFAOYSA-N 4-amino-5-[(1-carboxy-2-phenylethyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 6
- TUTIHHSZKFBMHM-UHFFFAOYSA-N 4-amino-5-[(3-amino-1-carboxy-3-oxopropyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O TUTIHHSZKFBMHM-UHFFFAOYSA-N 0.000 description 6
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 6
- WUGMRIBZSVSJNP-UFBFGSQYSA-N Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UFBFGSQYSA-N 0.000 description 6
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 6
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 6
- VBIIZCXWOZDIHS-UHFFFAOYSA-N Cysteinyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CS VBIIZCXWOZDIHS-UHFFFAOYSA-N 0.000 description 6
- XZFYRXDAULDNFX-UHFFFAOYSA-N Cysteinyl-Phenylalanine Chemical compound SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 6
- JZOYFBPIEHCDFV-UHFFFAOYSA-N Glutaminyl-Histidine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 JZOYFBPIEHCDFV-UHFFFAOYSA-N 0.000 description 6
- 206010061992 Haemophilia Diseases 0.000 description 6
- WMDZARSFSMZOQO-DRZSPHRISA-N Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WMDZARSFSMZOQO-DRZSPHRISA-N 0.000 description 6
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 6
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 6
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 6
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 6
- FMIIKPHLJKUXGE-GUBZILKMSA-N Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN FMIIKPHLJKUXGE-GUBZILKMSA-N 0.000 description 6
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 6
- QTZXSYBVOSXBEJ-WDSKDSINSA-N Met-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O QTZXSYBVOSXBEJ-WDSKDSINSA-N 0.000 description 6
- 230000004989 O-glycosylation Effects 0.000 description 6
- PYOHODCEOHCZBM-RYUDHWBXSA-N Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 PYOHODCEOHCZBM-RYUDHWBXSA-N 0.000 description 6
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 6
- IEHDJWSAXBGJIP-RYUDHWBXSA-N Phe-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 IEHDJWSAXBGJIP-RYUDHWBXSA-N 0.000 description 6
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 6
- SBMNPABNWKXNBJ-UHFFFAOYSA-N Serinyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CO SBMNPABNWKXNBJ-UHFFFAOYSA-N 0.000 description 6
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfizole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 6
- YKRQRPFODDJQTC-UHFFFAOYSA-N Threoninyl-Lysine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CCCCN YKRQRPFODDJQTC-UHFFFAOYSA-N 0.000 description 6
- QJKMCQRFHJRIPU-XDTLVQLUSA-N Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QJKMCQRFHJRIPU-XDTLVQLUSA-N 0.000 description 6
- AUEJLPRZGVVDNU-STQMWFEESA-N Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-STQMWFEESA-N 0.000 description 6
- ZSXJENBJGRHKIG-UHFFFAOYSA-N Tyrosyl-Serine Chemical compound OCC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UHFFFAOYSA-N 0.000 description 6
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 6
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 6
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 6
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 6
- 108010004073 cysteinylcysteine Proteins 0.000 description 6
- 108010069495 cysteinyltyrosine Proteins 0.000 description 6
- 108010010147 glycylglutamine Proteins 0.000 description 6
- 230000028993 immune response Effects 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 108010078580 tyrosylleucine Proteins 0.000 description 6
- UKKNTTCNGZLJEX-UHFFFAOYSA-N γ-glutamyl-Serine Chemical compound NC(=O)CCC(N)C(=O)NC(CO)C(O)=O UKKNTTCNGZLJEX-UHFFFAOYSA-N 0.000 description 6
- PVMPDMIKUVNOBD-CIUDSAMLSA-N (3S)-3-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-[[(1S)-1-carboxy-2-hydroxyethyl]amino]-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 5
- ZRUBWRCKIVDCFS-XPCJQDJLSA-N (3S)-3-amino-4-[[(2S)-1-[[(2S,3R)-1-[[(1S)-1-carboxy-2-hydroxyethyl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-4-oxobutanoic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZRUBWRCKIVDCFS-XPCJQDJLSA-N 0.000 description 5
- HKTRDWYCAUTRRL-UHFFFAOYSA-N 4-amino-5-[[1-carboxy-2-(1H-imidazol-5-yl)ethyl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 HKTRDWYCAUTRRL-UHFFFAOYSA-N 0.000 description 5
- FSHURBQASBLAPO-WDSKDSINSA-N Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)N FSHURBQASBLAPO-WDSKDSINSA-N 0.000 description 5
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 5
- TWXZVVXRRRRSLT-UHFFFAOYSA-N Asparaginyl-Cysteine Chemical compound NC(=O)CC(N)C(=O)NC(CS)C(O)=O TWXZVVXRRRRSLT-UHFFFAOYSA-N 0.000 description 5
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 5
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 5
- 229940028334 Follicle Stimulating Hormone Drugs 0.000 description 5
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 description 5
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N L-serine Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 5
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 5
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 5
- MUMXFARPYQTTSL-BQBZGAKWSA-N Met-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O MUMXFARPYQTTSL-BQBZGAKWSA-N 0.000 description 5
- IMTUWVJPCQPJEE-IUCAKERBSA-N Met-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN IMTUWVJPCQPJEE-IUCAKERBSA-N 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 229940110078 Nuwiq Drugs 0.000 description 5
- UJTZHGHXJKIAOS-WHFBIAKZSA-N Ser-Gln Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O UJTZHGHXJKIAOS-WHFBIAKZSA-N 0.000 description 5
- 108010068265 aspartyltyrosine Proteins 0.000 description 5
- UIIMBOGNXHQVGW-UHFFFAOYSA-M buffer Substances [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 5
- 230000000875 corresponding Effects 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 239000003937 drug carrier Substances 0.000 description 5
- KGNSGRRALVIRGR-UHFFFAOYSA-N gln-tyr Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 KGNSGRRALVIRGR-UHFFFAOYSA-N 0.000 description 5
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 108010079317 prolyl-tyrosine Proteins 0.000 description 5
- 238000003259 recombinant expression Methods 0.000 description 5
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 5
- XITLYYAIPBBHPX-UHFFFAOYSA-N γ-glutamyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CCC(N)=O XITLYYAIPBBHPX-UHFFFAOYSA-N 0.000 description 5
- OABOXRPGTFRBFZ-IMJSIDKUSA-N (2R)-2-[[(2R)-2-amino-3-sulfanylpropanoyl]amino]-3-sulfanylpropanoic acid Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(O)=O OABOXRPGTFRBFZ-IMJSIDKUSA-N 0.000 description 4
- VNYDHJARLHNEGA-RYUDHWBXSA-N (2S)-1-[(2S)-2-azaniumyl-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carboxylate Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 4
- RXGLHDWAZQECBI-SRVKXCTJSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 4
- IESFZVCAVACGPH-PEFMBERDSA-N (2S,3S)-2-[[(2S)-2-[[(2S)-2-amino-4-carboxybutanoyl]amino]-3-carboxypropanoyl]amino]-3-methylpentanoic acid Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 4
- WNGVUZWBXZKQES-YUMQZZPRSA-N 2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]propanoyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 4
- 101710027066 ALB Proteins 0.000 description 4
- XAEWTDMGFGHWFK-IMJSIDKUSA-N Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O XAEWTDMGFGHWFK-IMJSIDKUSA-N 0.000 description 4
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 4
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 4
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 4
- DVUFTQLHHHJEMK-IMJSIDKUSA-N Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O DVUFTQLHHHJEMK-IMJSIDKUSA-N 0.000 description 4
- 229920002676 Complementary DNA Polymers 0.000 description 4
- 102100006624 F9 Human genes 0.000 description 4
- YSWHPLCDIMUKFE-QWRGUYRKSA-N Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YSWHPLCDIMUKFE-QWRGUYRKSA-N 0.000 description 4
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 4
- 102000003886 Glycoproteins Human genes 0.000 description 4
- 108090000288 Glycoproteins Proteins 0.000 description 4
- VHOLZZKNEBBHTH-YUMQZZPRSA-N His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 VHOLZZKNEBBHTH-YUMQZZPRSA-N 0.000 description 4
- NIKBMHGRNAPJFW-UHFFFAOYSA-N Histidinyl-Arginine Chemical compound NC(=N)NCCCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 NIKBMHGRNAPJFW-UHFFFAOYSA-N 0.000 description 4
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 4
- 102000015728 Mucins Human genes 0.000 description 4
- 108010063954 Mucins Proteins 0.000 description 4
- 108091005503 Nucleic proteins Proteins 0.000 description 4
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 4
- 102000007073 Sialic Acid Binding Immunoglobulin-like Lectins Human genes 0.000 description 4
- 108010047827 Sialic Acid Binding Immunoglobulin-like Lectins Proteins 0.000 description 4
- BWUHENPAEMNGQJ-ZDLURKLDSA-N Thr-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O BWUHENPAEMNGQJ-ZDLURKLDSA-N 0.000 description 4
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 4
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 4
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 4
- OYOQKMOWUDVWCR-RYUDHWBXSA-N Tyr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OYOQKMOWUDVWCR-RYUDHWBXSA-N 0.000 description 4
- PNVLWFYAPWAQMU-CIUDSAMLSA-N Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)C(C)C PNVLWFYAPWAQMU-CIUDSAMLSA-N 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 108010041407 alanylaspartic acid Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 229940079593 drugs Drugs 0.000 description 4
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 4
- 108010079547 glutamylmethionine Proteins 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 108010084389 glycyltryptophan Proteins 0.000 description 4
- 108010078274 isoleucylvaline Proteins 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- DSTWKJOBKSMVCV-UWVGGRQHSA-N (2S)-2-[[(2R)-2-amino-3-sulfanylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DSTWKJOBKSMVCV-UWVGGRQHSA-N 0.000 description 3
- RSMIHCFQDCVVBR-CIUDSAMLSA-N (2S)-2-[[(2S)-5-amino-2-[[(2S)-2-amino-3-carboxypropanoyl]amino]-5-oxopentanoyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RSMIHCFQDCVVBR-CIUDSAMLSA-N 0.000 description 3
- NIZKGBJVCMRDKO-KWQFWETISA-N (2S)-2-[[2-[[(2S)-2-aminopropanoyl]amino]acetyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 3
- SOYWRINXUSUWEQ-DLOVCJGASA-N (4S)-4-amino-5-[[(2S)-1-[[(1S)-1-carboxy-2-methylpropyl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-oxopentanoic acid Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 3
- FPTXMUIBLMGTQH-ONGXEEELSA-N 2-[[(2S)-2-[[(2S)-2-amino-3-phenylpropanoyl]amino]propanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- 102100001249 ALB Human genes 0.000 description 3
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 3
- PMGDADKJMCOXHX-BQBZGAKWSA-N Arg-Gln Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PMGDADKJMCOXHX-BQBZGAKWSA-N 0.000 description 3
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 3
- GSMPSRPMQQDRIB-WHFBIAKZSA-N Asp-Gln Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O GSMPSRPMQQDRIB-WHFBIAKZSA-N 0.000 description 3
- VBKIFHUVGLOJKT-UHFFFAOYSA-N Asparaginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(N)=O VBKIFHUVGLOJKT-UHFFFAOYSA-N 0.000 description 3
- VGRHZPNRCLAHQA-UHFFFAOYSA-N Aspartyl-Asparagine Chemical compound OC(=O)CC(N)C(=O)NC(CC(N)=O)C(O)=O VGRHZPNRCLAHQA-UHFFFAOYSA-N 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 108010078791 Carrier Proteins Proteins 0.000 description 3
- 229940015047 Chorionic Gonadotropin Drugs 0.000 description 3
- 102000011022 Chorionic Gonadotropin Human genes 0.000 description 3
- 108010062540 Chorionic Gonadotropin Proteins 0.000 description 3
- 210000000349 Chromosomes Anatomy 0.000 description 3
- 229920001405 Coding region Polymers 0.000 description 3
- 101700074227 F9 Proteins 0.000 description 3
- LOJYQMFIIJVETK-WDSKDSINSA-N Gln-Gln Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LOJYQMFIIJVETK-WDSKDSINSA-N 0.000 description 3
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 3
- 208000009429 Hemophilia B Diseases 0.000 description 3
- WSDOHRLQDGAOGU-UHFFFAOYSA-N Histidinyl-Asparagine Chemical compound NC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 WSDOHRLQDGAOGU-UHFFFAOYSA-N 0.000 description 3
- IDXZDKMBEXLFMB-UHFFFAOYSA-N Histidinyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC1=CN=CN1 IDXZDKMBEXLFMB-UHFFFAOYSA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 229940084986 Human Chorionic Gonadotropin Drugs 0.000 description 3
- HZYHBDVRCBDJJV-HAFWLYHUSA-N Ile-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O HZYHBDVRCBDJJV-HAFWLYHUSA-N 0.000 description 3
- BCVIOZZGJNOEQS-XKNYDFJKSA-N Ile-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)[C@@H](C)CC BCVIOZZGJNOEQS-XKNYDFJKSA-N 0.000 description 3
- BCXBIONYYJCSDF-CIUDSAMLSA-N Ile-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O BCXBIONYYJCSDF-CIUDSAMLSA-N 0.000 description 3
- XUJNEKJLAYXESH-REOHCLBHSA-N L-cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 3
- BQVUABVGYYSDCJ-ZFWWWQNUSA-N Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-ZFWWWQNUSA-N 0.000 description 3
- 229940040129 Luteinizing Hormone Drugs 0.000 description 3
- 102000009151 Luteinizing Hormone Human genes 0.000 description 3
- 108010073521 Luteinizing Hormone Proteins 0.000 description 3
- DZMGFGQBRYWJOR-YUMQZZPRSA-N Met-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O DZMGFGQBRYWJOR-YUMQZZPRSA-N 0.000 description 3
- NDYNTQWSJLPEMK-UHFFFAOYSA-N Methionyl-Cysteine Chemical compound CSCCC(N)C(=O)NC(CS)C(O)=O NDYNTQWSJLPEMK-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 108091005771 Peptidases Proteins 0.000 description 3
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 3
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N Phenylalanyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 3
- OIDKVWTWGDWMHY-RYUDHWBXSA-N Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 OIDKVWTWGDWMHY-RYUDHWBXSA-N 0.000 description 3
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 3
- 241000282898 Sus scrofa Species 0.000 description 3
- 101700038204 TGFA Proteins 0.000 description 3
- WXVIGTAUZBUDPZ-DTLFHODZSA-N Thr-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 WXVIGTAUZBUDPZ-DTLFHODZSA-N 0.000 description 3
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- UQTNIFUCMBFWEJ-UHFFFAOYSA-N Threoninyl-Asparagine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-UHFFFAOYSA-N 0.000 description 3
- 102000011923 Thyrotropin Human genes 0.000 description 3
- 108010061174 Thyrotropin Proteins 0.000 description 3
- 102000004338 Transferrin Human genes 0.000 description 3
- 108090000901 Transferrin Proteins 0.000 description 3
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K Trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 3
- PEEAINPHPNDNGE-JQWIXIFHSA-N Trp-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 PEEAINPHPNDNGE-JQWIXIFHSA-N 0.000 description 3
- SMDQRGAERNMJJF-UHFFFAOYSA-N Tryptophyl-Cysteine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CS)C(O)=O)=CNC2=C1 SMDQRGAERNMJJF-UHFFFAOYSA-N 0.000 description 3
- YBRHKUNWEYBZGT-UHFFFAOYSA-N Tryptophyl-Threonine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(C(O)C)C(O)=O)=CNC2=C1 YBRHKUNWEYBZGT-UHFFFAOYSA-N 0.000 description 3
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 3
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 3
- OBTCMSPFOITUIJ-FSPLSTOPSA-N Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O OBTCMSPFOITUIJ-FSPLSTOPSA-N 0.000 description 3
- 206010047715 Von Willebrand's disease Diseases 0.000 description 3
- 239000004480 active ingredient Substances 0.000 description 3
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 229940050528 albumin Drugs 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010006195 arginyl-glycyl-aspartyl-cysteine Proteins 0.000 description 3
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 238000004166 bioassay Methods 0.000 description 3
- 230000023555 blood coagulation Effects 0.000 description 3
- 239000012141 concentrate Substances 0.000 description 3
- 235000008504 concentrate Nutrition 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N edta Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 238000005755 formation reaction Methods 0.000 description 3
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 3
- 150000004676 glycans Chemical class 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- 108010028295 histidylhistidine Proteins 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 230000015788 innate immune response Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006011 modification reaction Methods 0.000 description 3
- 108010084572 phenylalanyl-valine Proteins 0.000 description 3
- 108010018625 phenylalanylarginine Proteins 0.000 description 3
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 3
- OZAIFHULBGXAKX-UHFFFAOYSA-N precursor Substances N#CC(C)(C)N=NC(C)(C)C#N OZAIFHULBGXAKX-UHFFFAOYSA-N 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 230000003252 repetitive Effects 0.000 description 3
- 239000001509 sodium citrate Substances 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 239000012581 transferrin Substances 0.000 description 3
- 239000011778 trisodium citrate Substances 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- NJMYZEJORPYOTO-UHFFFAOYSA-N γ-glutamyl-Proline Chemical compound NC(=O)CCC(N)C(=O)N1CCCC1C(O)=O NJMYZEJORPYOTO-UHFFFAOYSA-N 0.000 description 3
- FAQVCWVVIYYWRR-WHFBIAKZSA-N (2S)-2-[[(2S)-2,5-diamino-5-oxopentanoyl]amino]propanoic acid Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O FAQVCWVVIYYWRR-WHFBIAKZSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-phenylpropanoyl]amino]butanedioic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- QXRNAOYBCYVZCD-BQBZGAKWSA-N (2S)-6-amino-2-[[(2S)-2-aminopropanoyl]amino]hexanoic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN QXRNAOYBCYVZCD-BQBZGAKWSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N (3S)-3-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-(carboxymethylamino)-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- MXPBQDFWIMBACQ-ACZMJKKPSA-N (4S)-4-amino-5-[[(2R)-1-[[(1R)-1-carboxy-2-sulfanylethyl]amino]-1-oxo-3-sulfanylpropan-2-yl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O MXPBQDFWIMBACQ-ACZMJKKPSA-N 0.000 description 2
- OMNVYXHOSHNURL-WPRPVWTQSA-N Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMNVYXHOSHNURL-WPRPVWTQSA-N 0.000 description 2
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 2
- 102000007592 Apolipoproteins Human genes 0.000 description 2
- 108010071619 Apolipoproteins Proteins 0.000 description 2
- 210000001772 Blood Platelets Anatomy 0.000 description 2
- 230000035839 C max Effects 0.000 description 2
- 108010074051 C-Reactive Protein Proteins 0.000 description 2
- 102000025380 C-Reactive Protein Human genes 0.000 description 2
- 101710013652 CGB Proteins 0.000 description 2
- 102100012993 CGB3 Human genes 0.000 description 2
- 101710013878 CGB8 Proteins 0.000 description 2
- 230000037242 Cmax Effects 0.000 description 2
- 102000008186 Collagen Human genes 0.000 description 2
- 108010035532 Collagen Proteins 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- 230000036947 Dissociation constant Effects 0.000 description 2
- 101700033006 EGF Proteins 0.000 description 2
- 102100010813 EGF Human genes 0.000 description 2
- 230000037287 ELIMINATION RATE CONSTANT Effects 0.000 description 2
- 229940116977 Epidermal Growth Factor Drugs 0.000 description 2
- 108010079356 FIIa Proteins 0.000 description 2
- 102100008658 FN1 Human genes 0.000 description 2
- 108050007372 Fibroblast growth factor family Proteins 0.000 description 2
- 102000018233 Fibroblast growth factor family Human genes 0.000 description 2
- 108010067306 Fibronectins Proteins 0.000 description 2
- SXGAGTVDWKQYCX-BQBZGAKWSA-N Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SXGAGTVDWKQYCX-BQBZGAKWSA-N 0.000 description 2
- CLSDNFWKGFJIBZ-UHFFFAOYSA-N Glutaminyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CCC(N)=O CLSDNFWKGFJIBZ-UHFFFAOYSA-N 0.000 description 2
- VHLZDSUANXBJHW-UHFFFAOYSA-N Glutaminyl-Phenylalanine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 VHLZDSUANXBJHW-UHFFFAOYSA-N 0.000 description 2
- 229960002897 Heparin Drugs 0.000 description 2
- ZFGMDIBRIDKWMY-PASTXAENSA-N Heparin Chemical compound CC(O)=N[C@@H]1[C@@H](O)[C@H](O)[C@@H](COS(O)(=O)=O)O[C@@H]1O[C@@H]1[C@@H](C(O)=O)O[C@@H](O[C@H]2[C@@H]([C@@H](OS(O)(=O)=O)[C@@H](O[C@@H]3[C@@H](OC(O)[C@H](OS(O)(=O)=O)[C@H]3O)C(O)=O)O[C@@H]2O)CS(O)(=O)=O)[C@H](O)[C@H]1O ZFGMDIBRIDKWMY-PASTXAENSA-N 0.000 description 2
- 102000003745 Hepatocyte Growth Factor Human genes 0.000 description 2
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 2
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 2
- BBIXOODYWPFNDT-CIUDSAMLSA-N Ile-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O BBIXOODYWPFNDT-CIUDSAMLSA-N 0.000 description 2
- MUFXDFWAJSPHIQ-XDTLVQLUSA-N Ile-Tyr Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 MUFXDFWAJSPHIQ-XDTLVQLUSA-N 0.000 description 2
- 210000000987 Immune System Anatomy 0.000 description 2
- 108060003951 Immunoglobulins Proteins 0.000 description 2
- 102000018358 Immunoglobulins Human genes 0.000 description 2
- DRCKHKZYDLJYFQ-UHFFFAOYSA-N Isoleucyl-Threonine Chemical compound CCC(C)C(N)C(=O)NC(C(C)O)C(O)=O DRCKHKZYDLJYFQ-UHFFFAOYSA-N 0.000 description 2
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 2
- WEDDFMCSUNNZJR-WDSKDSINSA-N Met-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O WEDDFMCSUNNZJR-WDSKDSINSA-N 0.000 description 2
- 206010028549 Myeloid leukaemia Diseases 0.000 description 2
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-ACETYL-D-GALACTOSAMINE Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 2
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-Acetylglucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 2
- 229950006780 N-Acetylglucosamine Drugs 0.000 description 2
- 102000035443 Peptidases Human genes 0.000 description 2
- FSXRLASFHBWESK-HOTGVXAUSA-N Phe-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 FSXRLASFHBWESK-HOTGVXAUSA-N 0.000 description 2
- 108010051456 Plasminogen Proteins 0.000 description 2
- 102000013566 Plasminogen Human genes 0.000 description 2
- SHAQGFGGJSLLHE-BQBZGAKWSA-N Pro-Gln Chemical compound NC(=O)CC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 SHAQGFGGJSLLHE-BQBZGAKWSA-N 0.000 description 2
- OCYROESYHWUPBP-CIUDSAMLSA-N Pro-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 OCYROESYHWUPBP-CIUDSAMLSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 210000003491 Skin Anatomy 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 230000037034 TERMINAL HALF LIFE Effects 0.000 description 2
- 102000006747 Transforming growth factor alpha Human genes 0.000 description 2
- PWIQCLSQVQBOQV-AAEUAGOBSA-N Trp-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 PWIQCLSQVQBOQV-AAEUAGOBSA-N 0.000 description 2
- IBIDRSSEHFLGSD-YUMQZZPRSA-N Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-YUMQZZPRSA-N 0.000 description 2
- 210000003462 Veins Anatomy 0.000 description 2
- SRBFZHDQGSBBOR-SQOUGZDYSA-N Xylose Natural products O[C@@H]1CO[C@@H](O)[C@@H](O)[C@@H]1O SRBFZHDQGSBBOR-SQOUGZDYSA-N 0.000 description 2
- 230000033289 adaptive immune response Effects 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000001772 anti-angiogenic Effects 0.000 description 2
- 102000024070 binding proteins Human genes 0.000 description 2
- 108091007650 binding proteins Proteins 0.000 description 2
- 230000000903 blocking Effects 0.000 description 2
- 229960000182 blood factors Drugs 0.000 description 2
- 230000037396 body weight Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000002759 chromosomal Effects 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000035602 clotting Effects 0.000 description 2
- 230000015271 coagulation Effects 0.000 description 2
- 229920001436 collagen Polymers 0.000 description 2
- 229960005188 collagen Drugs 0.000 description 2
- 230000000295 complement Effects 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 230000037320 fibronectin Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 230000023597 hemostasis Effects 0.000 description 2
- 229920000669 heparin Polymers 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 239000003906 humectant Substances 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000002609 media Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000007911 parenteral administration Methods 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 230000036470 plasma concentration Effects 0.000 description 2
- 230000000770 pro-inflamatory Effects 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 125000003616 serine group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 2
- 101700047425 sig-7 Proteins 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 239000003826 tablet Substances 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- SBVPYBFMIGDIDX-SRVKXCTJSA-N (2S)-1-[(2S)-1-[(2S)-pyrrolidin-1-ium-2-carbonyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylate Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N (2S)-1-[(2S)-5-amino-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-5-oxopentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- NKCXQMYPWXSLIZ-PSRDDEIFSA-N (2S)-2-[[(2S)-1-[(2S)-5-amino-2-[[2-[[(2S)-6-amino-2-[[2-[[(2S)-2-[[(2S)-4-amino-2-[[(2S)-2-[[(2S,3R)-2-[[(2S)-2-[[(2S,3R)-2-amino-3-hydroxybutanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-3-hydroxybutanoyl]amino]propanoyl]amino]-4-oxobutanoyl]amino]-3-m Chemical compound O=C([C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@@H](N)[C@@H](C)O)[C@@H](C)O)C(C)C)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NKCXQMYPWXSLIZ-PSRDDEIFSA-N 0.000 description 1
- ADNPLDHMAVUMIW-CUZNLEPHSA-N (2S)-2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-1-[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-N-[(2S)-5-amino-1-[[(2S)-1-[[(2S)-1-[[2-[[(2S)-1-[[(2S)-1-amino-4-methylsulfanyl-1-oxobutan-2-y Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CCCN=C(N)N)C1=CC=CC=C1 ADNPLDHMAVUMIW-CUZNLEPHSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]propanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- KYPMKDGKAYQCHO-RYUDHWBXSA-N (2S)-2-[[(2S)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]-4-methylsulfanylbutanoic acid Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KYPMKDGKAYQCHO-RYUDHWBXSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N (2S)-2-[[(2S,3R)-2-[[(2S,3R)-2-amino-3-hydroxybutanoyl]amino]-3-hydroxybutanoyl]amino]butanedioic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- RSUVOPBMWMTVDI-XEGUGMAKSA-N (4S)-4-amino-5-[[(2S)-1-[[(1S)-1-carboxy-2-(1H-indol-3-yl)ethyl]amino]-1-oxopropan-2-yl]amino]-5-oxopentanoic acid Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(O)=O)C)C(O)=O)=CNC2=C1 RSUVOPBMWMTVDI-XEGUGMAKSA-N 0.000 description 1
- 229920000160 (ribonucleotides)n+m Polymers 0.000 description 1
- ASJSAQIRZKANQN-UHFFFAOYSA-N 3,4,5-trihydroxypentanal Chemical class OCC(O)C(O)CC=O ASJSAQIRZKANQN-UHFFFAOYSA-N 0.000 description 1
- YSMODUONRAFBET-UHFFFAOYSA-N 5-hydroxylysine Chemical compound NCC(O)CCC(N)C(O)=O YSMODUONRAFBET-UHFFFAOYSA-N 0.000 description 1
- 102100007877 APOE Human genes 0.000 description 1
- RDIKFPRVLJLMER-BQBZGAKWSA-N Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)N RDIKFPRVLJLMER-BQBZGAKWSA-N 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N Ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 210000000612 Antigen-Presenting Cells Anatomy 0.000 description 1
- 102000005666 Apolipoprotein A-I Human genes 0.000 description 1
- 108010059886 Apolipoprotein A-I Proteins 0.000 description 1
- 102000009081 Apolipoprotein A-II Human genes 0.000 description 1
- 108010087614 Apolipoprotein A-II Proteins 0.000 description 1
- 108010025628 Apolipoproteins E Proteins 0.000 description 1
- WYBVBIHNJWOLCJ-IUCAKERBSA-N Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N WYBVBIHNJWOLCJ-IUCAKERBSA-N 0.000 description 1
- ROWCTNFEMKOIFQ-YUMQZZPRSA-N Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N ROWCTNFEMKOIFQ-YUMQZZPRSA-N 0.000 description 1
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 1
- 229960003589 Arginine hydrochloride Drugs 0.000 description 1
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 1
- ZARXTZFGQZBYFO-JQWIXIFHSA-N Asp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)N)C(O)=O)=CNC2=C1 ZARXTZFGQZBYFO-JQWIXIFHSA-N 0.000 description 1
- SJUXYGVRSGTPMC-UHFFFAOYSA-N Asparaginyl-Alanine Chemical compound OC(=O)C(C)NC(=O)C(N)CC(N)=O SJUXYGVRSGTPMC-UHFFFAOYSA-N 0.000 description 1
- ZVDPYSVOZFINEE-UHFFFAOYSA-N Aspartyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(O)=O ZVDPYSVOZFINEE-UHFFFAOYSA-N 0.000 description 1
- DYDKXJWQCIVTMR-UHFFFAOYSA-N Aspartyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CC(O)=O DYDKXJWQCIVTMR-UHFFFAOYSA-N 0.000 description 1
- 108090000206 Autoantibodies Proteins 0.000 description 1
- 102000003852 Autoantibodies Human genes 0.000 description 1
- 108010019949 BAX 855 Proteins 0.000 description 1
- 108010026955 BAY 94-9027 Proteins 0.000 description 1
- 108010005130 Bence Jones Protein Proteins 0.000 description 1
- 208000001593 Bernard-Soulier Syndrome Diseases 0.000 description 1
- 230000036868 Blood Concentration Effects 0.000 description 1
- 101800001453 C-terminal extension peptide Proteins 0.000 description 1
- 102100016295 CFI Human genes 0.000 description 1
- 102100020197 CFP Human genes 0.000 description 1
- 102100006077 CP Human genes 0.000 description 1
- 206010008111 Cerebral haemorrhage Diseases 0.000 description 1
- 108010075016 Ceruloplasmin Proteins 0.000 description 1
- 210000002987 Choroid Plexus Anatomy 0.000 description 1
- 210000004507 Chromosomes, Artificial Anatomy 0.000 description 1
- 108090000056 Complement Factor B Proteins 0.000 description 1
- 102000003712 Complement Factor B Human genes 0.000 description 1
- 108010053085 Complement Factor H Proteins 0.000 description 1
- 102000016550 Complement Factor H Human genes 0.000 description 1
- 108090000044 Complement Factor I Proteins 0.000 description 1
- 206010058896 Congenital thrombocyte disease Diseases 0.000 description 1
- 206010070976 Craniocerebral injury Diseases 0.000 description 1
- GZCGUPFRVQAUEE-KCDKBNATSA-N D-(+)-Galactose Natural products OC[C@@H](O)[C@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-KCDKBNATSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N D-Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N D-sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 210000004443 Dendritic Cells Anatomy 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 102000033147 ERVK-25 Human genes 0.000 description 1
- 229940079157 Eloctate Drugs 0.000 description 1
- 210000002889 Endothelial Cells Anatomy 0.000 description 1
- 229940088598 Enzyme Drugs 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 210000002615 Epidermis Anatomy 0.000 description 1
- 210000000981 Epithelium Anatomy 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 229920000665 Exon Polymers 0.000 description 1
- 210000002744 Extracellular Matrix Anatomy 0.000 description 1
- 229940012356 Eye Drops Drugs 0.000 description 1
- 101000401077 F8 Proteins 0.000 description 1
- 229950003499 FIBRIN Drugs 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 102000009123 Fibrin Human genes 0.000 description 1
- 108010073385 Fibrin Proteins 0.000 description 1
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 1
- 108010088842 Fibrinolysin Proteins 0.000 description 1
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 1
- SHZGCJCMOBCMKK-DHVFOXMCSA-N Fucose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 1
- 201000007395 Glanzmann's thrombasthenia Diseases 0.000 description 1
- LLEUXCDZPQOJMY-AAEUAGOBSA-N Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 LLEUXCDZPQOJMY-AAEUAGOBSA-N 0.000 description 1
- 102000005720 Glutathione Transferase family Human genes 0.000 description 1
- 108010070675 Glutathione Transferase family Proteins 0.000 description 1
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 1
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 1
- 210000004013 Groin Anatomy 0.000 description 1
- 102100010716 HRG Human genes 0.000 description 1
- 108060003792 HRG Proteins 0.000 description 1
- 108050005077 Haptoglobin Proteins 0.000 description 1
- 102000014702 Haptoglobin Human genes 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 108010026027 Hemopexin Proteins 0.000 description 1
- 102000013271 Hemopexin Human genes 0.000 description 1
- MDCTVRUPVLZSPG-BQBZGAKWSA-N His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 MDCTVRUPVLZSPG-BQBZGAKWSA-N 0.000 description 1
- CZVQSYNVUHAILZ-UWVGGRQHSA-N His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 CZVQSYNVUHAILZ-UWVGGRQHSA-N 0.000 description 1
- HTOOKGDPMXSJSY-STQMWFEESA-N His-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 HTOOKGDPMXSJSY-STQMWFEESA-N 0.000 description 1
- 229940088597 Hormone Drugs 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 229960002591 Hydroxyproline Drugs 0.000 description 1
- 102100015720 IFNB1 Human genes 0.000 description 1
- 101700011451 IFNB1 Proteins 0.000 description 1
- 229940072221 IMMUNOGLOBULINS Drugs 0.000 description 1
- 206010021245 Idiopathic thrombocytopenic purpura Diseases 0.000 description 1
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 1
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 1
- 206010022114 Injury Diseases 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 210000004731 Jugular Veins Anatomy 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- DVCSNHXRZUVYAM-BQBZGAKWSA-N Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 1
- NTISAKGPIGTIJJ-IUCAKERBSA-N Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C NTISAKGPIGTIJJ-IUCAKERBSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N Leu-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- 210000004072 Lung Anatomy 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- RVKIPWVMZANZLI-ZFWWWQNUSA-N Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-ZFWWWQNUSA-N 0.000 description 1
- 102100019384 MBL2 Human genes 0.000 description 1
- 108010087870 Mannose-Binding Lectin Proteins 0.000 description 1
- 210000003593 Megakaryocytes Anatomy 0.000 description 1
- 108020004999 Messenger RNA Proteins 0.000 description 1
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 1
- PBOUVYGPDSARIS-IUCAKERBSA-N Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C PBOUVYGPDSARIS-IUCAKERBSA-N 0.000 description 1
- KAKJTZWHIUWTTD-VQVTYTSYSA-N Met-Thr Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)O)C([O-])=O KAKJTZWHIUWTTD-VQVTYTSYSA-N 0.000 description 1
- PXZWGQLGAKCNKD-DPNMSELWSA-N MolPort-023-276-326 Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O)[C@@H](C)O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 PXZWGQLGAKCNKD-DPNMSELWSA-N 0.000 description 1
- 229940051875 Mucins Drugs 0.000 description 1
- SQVRNKJHWKZAKO-LUWBGTNYSA-N N-acetylneuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)CC(O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-LUWBGTNYSA-N 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- AEMBWNDIEFEPTH-UHFFFAOYSA-N N-tert-butyl-N-ethylnitrous amide Chemical compound CCN(N=O)C(C)(C)C AEMBWNDIEFEPTH-UHFFFAOYSA-N 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 229940100662 Nasal Drops Drugs 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101700028182 OGT Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010061952 Orosomucoid Proteins 0.000 description 1
- 102000012404 Orosomucoid Human genes 0.000 description 1
- 241000209094 Oryza Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 102400000319 Oxyntomodulin Human genes 0.000 description 1
- 101800001388 Oxyntomodulin Proteins 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- MIDZLCFIAINOQN-WPRPVWTQSA-N Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 MIDZLCFIAINOQN-WPRPVWTQSA-N 0.000 description 1
- JWBLQDDHSDGEGR-DRZSPHRISA-N Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWBLQDDHSDGEGR-DRZSPHRISA-N 0.000 description 1
- 210000004011 Plasma Cells Anatomy 0.000 description 1
- 230000037289 Plasma half life Effects 0.000 description 1
- 230000037240 Plasma half-life Effects 0.000 description 1
- 229940012957 Plasmin Drugs 0.000 description 1
- 108090000778 Platelet factor 4 Proteins 0.000 description 1
- 102000004211 Platelet factor 4 Human genes 0.000 description 1
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 1
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 1
- UEKYKRQIAQHOOZ-KBPBESRZSA-N Pro-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)[O-])C(=O)[C@@H]1CCC[NH2+]1 UEKYKRQIAQHOOZ-KBPBESRZSA-N 0.000 description 1
- BEPSGCXDIVACBU-UHFFFAOYSA-N Prolyl-Histidine Chemical compound C1CCNC1C(=O)NC(C(=O)O)CC1=CN=CN1 BEPSGCXDIVACBU-UHFFFAOYSA-N 0.000 description 1
- 108010005642 Properdin Proteins 0.000 description 1
- 208000002098 Purpura, Thrombocytopenic, Idiopathic Diseases 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000007312 Recombinant Proteins Human genes 0.000 description 1
- 108010033725 Recombinant Proteins Proteins 0.000 description 1
- 229920000970 Repeated sequence (DNA) Polymers 0.000 description 1
- RZEQTVHJZCIUBT-UHFFFAOYSA-N Serinyl-Arginine Chemical compound OCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-UHFFFAOYSA-N 0.000 description 1
- 210000002966 Serum Anatomy 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- CZMRCDWAGMRECN-GDQSFJPYSA-N Sucrose Natural products O([C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](CO)O1)[C@@]1(CO)[C@H](O)[C@@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-GDQSFJPYSA-N 0.000 description 1
- 101700065588 TAC1 Proteins 0.000 description 1
- 102100002996 TAC1 Human genes 0.000 description 1
- 102100014223 TGFA Human genes 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- 102000002262 Thromboplastin Human genes 0.000 description 1
- 230000035852 Tmax Effects 0.000 description 1
- 210000003437 Trachea Anatomy 0.000 description 1
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 1
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 1
- 208000005765 Traumatic Brain Injury Diseases 0.000 description 1
- OHGNSVACHBZKSS-KWQFWETISA-N Trp-Ala Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](C)C([O-])=O)=CNC2=C1 OHGNSVACHBZKSS-KWQFWETISA-N 0.000 description 1
- DZHDVYLBNKMLMB-ZFWWWQNUSA-N Trp-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 DZHDVYLBNKMLMB-ZFWWWQNUSA-N 0.000 description 1
- LWFWZRANSFAJDR-JSGCOSHPSA-N Trp-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 LWFWZRANSFAJDR-JSGCOSHPSA-N 0.000 description 1
- DXYQIGZZWYBXSD-UHFFFAOYSA-N Tryptophyl-Proline Chemical compound C=1NC2=CC=CC=C2C=1CC(N)C(=O)N1CCCC1C(O)=O DXYQIGZZWYBXSD-UHFFFAOYSA-N 0.000 description 1
- 229950010521 Turoctocog alfa pegol Drugs 0.000 description 1
- MFEVVAXTBZELLL-UHFFFAOYSA-N Tyrosyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-UHFFFAOYSA-N 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- 101700025600 VWF Proteins 0.000 description 1
- YSGSDAIMSCVPHG-YUMQZZPRSA-N Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)C(C)C YSGSDAIMSCVPHG-YUMQZZPRSA-N 0.000 description 1
- GJNDXQBALKCYSZ-RYUDHWBXSA-N Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 GJNDXQBALKCYSZ-RYUDHWBXSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 229940018782 Wilate Drugs 0.000 description 1
- 229960003487 Xylose Drugs 0.000 description 1
- GBXZONVFWYCRPT-KVTDHHQDSA-N [(2S,3S,4R,5R)-3,4,5,6-tetrahydroxy-1-oxohexan-2-yl] dihydrogen phosphate Chemical class OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](C=O)OP(O)(O)=O GBXZONVFWYCRPT-KVTDHHQDSA-N 0.000 description 1
- 239000002250 absorbent Substances 0.000 description 1
- 230000002745 absorbent Effects 0.000 description 1
- 239000003655 absorption accelerator Substances 0.000 description 1
- 208000006032 acquired Factor 8 deficiency Diseases 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000003044 adaptive Effects 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000009632 agar plate Methods 0.000 description 1
- 108010031014 alanyl-histidyl-leucyl-leucine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 101800001761 alpha-1-microglobulin Proteins 0.000 description 1
- 102000003966 alpha-1-microglobulin Human genes 0.000 description 1
- 102000012005 alpha-2-HS-Glycoprotein Human genes 0.000 description 1
- 108010075843 alpha-2-HS-Glycoprotein Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000002429 anti-coagulation Effects 0.000 description 1
- 230000003110 anti-inflammatory Effects 0.000 description 1
- 108090001123 antibodies Proteins 0.000 description 1
- 102000004965 antibodies Human genes 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229960000070 antineoplastic Monoclonal antibodies Drugs 0.000 description 1
- 150000001479 arabinose derivatives Chemical class 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 201000003710 autoimmune thrombocytopenic purpura Diseases 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000003115 biocidal Effects 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L cacl2 Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 150000001720 carbohydrates Chemical group 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000006143 cell culture media Substances 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 230000001413 cellular Effects 0.000 description 1
- 229940105778 coagulation factor VIII Drugs 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000001351 cycling Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 229940042399 direct acting antivirals Protease inhibitors Drugs 0.000 description 1
- 239000007884 disintegrant Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 229960002451 efmoroctocog alfa Drugs 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 230000002255 enzymatic Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000003889 eye drop Substances 0.000 description 1
- 229960004222 factor IX Drugs 0.000 description 1
- 201000007219 factor XI deficiency Diseases 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000002068 genetic Effects 0.000 description 1
- 201000002406 genetic disease Diseases 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010037389 glutamyl-cysteinyl-lysine Proteins 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- VPZXBVLAVMBEQI-VKHMYHEASA-N gly ala Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 1
- STKYPAFSDFAEPH-LURJTMIESA-N gly-val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine zwitterion Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 229920000140 heteropolymer Polymers 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 102000026806 human F8 protein Human genes 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002209 hydrophobic Effects 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 230000001506 immunosuppresive Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 108010093564 inter-alpha-inhibitor Proteins 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 108010044655 lysylproline Proteins 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229920002106 messenger RNA Polymers 0.000 description 1
- 230000002503 metabolic Effects 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 229960000060 monoclonal antibodies Drugs 0.000 description 1
- 108010045030 monoclonal antibodies Proteins 0.000 description 1
- 102000005614 monoclonal antibodies Human genes 0.000 description 1
- 150000002772 monosaccharides Chemical group 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000007923 nasal drop Substances 0.000 description 1
- 230000025020 negative regulation of T cell proliferation Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Polymers 0.000 description 1
- 230000003204 osmotic Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 230000000896 plasminic Effects 0.000 description 1
- 229920001993 poloxamer 188 Polymers 0.000 description 1
- 108091008117 polyclonal antibodies Proteins 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 150000004804 polysaccharides Polymers 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002335 preservative Effects 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002947 procoagulant Effects 0.000 description 1
- 239000003805 procoagulant Substances 0.000 description 1
- 230000002035 prolonged Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000002797 proteolythic Effects 0.000 description 1
- 230000003362 replicative Effects 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing Effects 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing Effects 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N trans-L-hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 150000003668 tyrosines Chemical class 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 102000028599 vitamin D binding proteins Human genes 0.000 description 1
- 108091022026 vitamin D binding proteins Proteins 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N α-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N β-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- OPINTGHFESTVAX-UHFFFAOYSA-N γ-glutamyl-Arginine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N OPINTGHFESTVAX-UHFFFAOYSA-N 0.000 description 1
Images
Abstract
Изобретение относится к биотехнологии. Представлен слитый белок, содержащий основной белок и один или более пептиды удлинения, где аминокислотная последовательность основного белка идентична или схожа с аминокислотной последовательностью белка крови человека или его фрагмента. Причем указанный(е) пептид(ы) удлинения содержит(ат) кластер O-гликозилированных аминокислот с по меньшей мере двумя О-гликозилированными аминокислотами и имеет(ют) идентичность последовательности по меньшей мере 90% к SEQ ID NO: 1. Также представлены: композиция первого белка и второго белка для лечения или профилактики нарушения свертываемости крови, комплекс, образованный слитым белком, полинуклеотид, кодирующий слитый белок, вектор, клетка-хозяин, содержащей полинуклеотид, применение слитого белка для повышения времени полужизни второго белка и применение фармацевтической композиции или комплекса для лечения или профилактики нарушения свертываемости крови. Изобретение позволяет получить слитый белок, который имеет повышенное время полужизни по сравнению с основным белком и его можно использовать для повышения времени полужизни партнера по связыванию. 8 н. и 23 з.п. ф-лы, 3 табл., 4 ил., 3 пр.
Description
ОБЛАСТЬ ИЗОБРЕТЕНИЯ
Изобретение относится к пролонгированию времени полужизни белков, в частности, факторов свертывания человека, таких как фактор фон Виллебранда (VWF) и фактор VIII (FVIII).
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
Гемофилия является группой наследственных генетических нарушений, влияющих на способность организма контролировать свертывание крови или коагуляцию. При наиболее распространенной форме, гемофилии A, наблюдают недостаточность фактора свертывания VIII (FVIII). Гемофилия A встречается с частотой приблизительно 1 на 5000-10000 рожденных мальчиков. Белок FVIII является необходимым кофактором для свертывания крови с многофункциональными свойствами. Недостаточность FVIII можно лечить с использованием полученных из плазмы концентратов FVIII или рекомбинантно полученного FVIII. Лечение концентратами FVIII приводит к нормализации жизни пациентов с гемофилией.
Пациентов с гемофилией A лечат с использованием FVIII по мере необходимости или в качестве профилактического терапевтического средства, вводимого несколько раз в неделю. В случае профилактического лечения 15-25 МЕ/кг массы тела FVIII вводят три раза в неделю, что необходимо в связи с постоянной потребностью в FVIII и его небольшого времени полужизни в кровотоке, составляющем у людей всего приблизительно 11 часов (Ewenstein et al., 2004).
В крови в нормальных условиях молекула FVIII всегда связана со своим кофактором фактором фон Виллебранда (VWF), защищающим молекулу FVIII от различных форм дегенерации. Нековалентный комплекс FVIII и VWF имеет высокую аффинность связывания 0,2-0,3 нМ (Vlot et al., 1996).
Исторически сложилось так, что гемофилию A лечили с использованием FVIII, полученного из плазмы крови человека. Однако, с 1990-х гг. на рынке появились различные рекомбинантно полученные белки FVIII. Однако, ни полученные из плазмы, ни полученные рекомбинантно белки FVIII не имеют оптимальных фармакокинетических свойств. Подобно многим другим терапевтическим белкам, они подвергаются метаболическому кругообороту под действием пептидаз, что значительно ограничивает их время полужизни in vivo.
Как описано Tiede et al. (2015), попытки пролонгирования времени полужизни FVIII включают слияние с Fc (элоктат, элокта, эфмороктоког альфа), добавление полиэтиленгликоля (туроктоког альфа пегол [N8-GP], BAY 94-9027, BAX 855) и одноцепочечную конструкцию (CSL627). С помощью всех этих технологий изменяют молекулу FVIII, и это приводит к пролонгированному приблизительно в 1,5 раз времени полужизни FVIII.
Дальнейшее увеличение времени полужизни FVIII ограничено временем полужизни VWF. Как показано Yee et al., домена D'D3 VWF человека достаточно для стабилизации FVIII в плазме. Однако, слитый белок D'D3-Fc способен увеличивать время полужизни FVIII только у мышей VWF-/-. У мышей с гемофилией A конструкция D'D3-Fc не приводит к пролонгированию времени полужизни FVIII по причине неэффективной конкуренции фрагментов белка с эндогенным VWF за связывание FVIII.
В WO 2014/011819 A2 описывают успешное пролонгирование времени полужизни конструкции FVIII, содержащей домен D'D3 VWF, домен Fc IgG и XTEN. Т.к. эта конструкция не связывается с эндогенным VWF, тот же эффект пролонгирования времени полужизни наблюдают у мышей с двойным нокаутом VWF/FVIII (DKO) и мышей с гемофилией A. Однако, хотя конструкция полностью функциональна in vitro, она проявляет значительно сниженную активность in vivo.
Другие подходы для повышения времени полужизни терапевтических белков включают генетическое слияние терапевтического белка с белком с природно большим временем полужизни, таким как трансферрин и альбумин, или с белковыми доменами, такими как C-концевой пептид (CTP) хорионического гонадотропина (CG).
CG принадлежит к семейству гликопротеиновых гормонов, включающему лютеинизирующий гормон (LH), фолликулостимулирующий гормон (FSH) и тиреотропный гормон (TSH). Эти гликогормоны являются гетеродимерами и состоят из общей α-субъединицы и уникальных β-субъединиц, придающих им разные активности. Время полужизни CG человека (hCG) значительно больше времени полужизни LH, FSH и TSH. Показано, что O-гликозилированный CTP hCG-β отвечает за пролонгирование его времени полужизни. Описывают, что CTP состоит из последовательности FQSSSS*KAPPPS*LPSPS*RLPGPS*DTPILPQ, содержащей четыре участка O-гликозилирования (обозначенных как S*) (Birken et al., 1977).
Как описано Strohl et al (2015), разработаны различные слитые белки терапевтического белка и CTP, и сейчас они проходят клинические исследования. Терапевтические белки включают FSH (Elonva®), FVIIa, FIX, IFN-β и оксинтомодулин.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Настоящее изобретение, помимо прочего, основано на обнаружении того, что добавление кластера O-гликозилированных аминокислот (присутствующего в полноразмерном VWF человек) к фрагменту VWF приводит к значительному повышению его времени полужизни. Время полужизни слитого белка пролонгируют по сравнению с фрагментом VWF без дополнительного O-гликанового кластера.
Таким образом, в первом аспекте изобретение относится к слитому белку, содержащему основной белок и по меньшей мере один пептид удлинения, где аминокислотная последовательность основного белка идентична или схожа с аминокислотной последовательностью белка млекопитающего, такого как VWF, или его фрагмента, и указанный пептид удлинения содержит кластер O-гликозилированных аминокислот.
Примечательно, что пептид удлинения, включающий кластер O-гликозилированных аминокислот, добавляемых к фрагменту VWF, получают из этого конкретного белка, а именно VWF. Таким образом, авторы настоящего изобретения определяли общий принцип повышения времени полужизни белков. Этим общим принципом является добавление внутреннего кластера O-гликозилированных аминокислот белка к указанному белку или его фрагменту.
Таким образом, в предпочтительном варианте осуществления слитого белка по первому аспекту аминокислотная последовательность одного или нескольких пептидов удлинения идентична или схожа с неповторяющейся частью аминокислотной последовательности указанного белка млекопитающего или фрагмента, в частности, указанного основного белка.
Другим выводом из результатов, полученных авторами настоящего изобретения, является то, что кластер O-гликозилированных аминокислот VWF, определенный в SEQ ID NO: 1, применим в качестве пептида для увеличения времени полужизни.
Т.к. свойство увеличения времени полужизни не ограничено VWF, в дополнительном предпочтительном варианте осуществления первого аспекта один или более пептидов удлинения имеют идентичность последовательности по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - по меньшей мере 100% по отношению к O-гликозилированному пептиду VWF, в частности, SEQ ID NO: 1.
Во втором аспекте изобретение относится к полинуклеотиду, кодирующему слитый белок по первому аспекту.
В третьем аспекте изобретение относится к вектору, содержащему полинуклеотид по второму аспекту.
В четвертом аспекте изобретение относится к клетке-хозяину, содержащей полинуклеотид по второму аспекту или вектор по третьему аспекту, где клетка-хозяин представляет собой клетку млекопитающего.
Авторы настоящего изобретения обнаружили, что повышается не только время полужизни VWF, но также и время полужизни его партнера по связыванию FVIII. Таким образом, в пятом аспекте изобретение относится к применению слитого белка по первому аспекту для повышения времени полужизни второго белка, где слитый белок способен связываться с указанным вторым белком.
Таким образом, в полученном комплексе или композиции слитого белка и второго белка второй белок также имеет повышенное время полужизни.
Таким образом, в шестом аспекте изобретение относится к композиции первого белка и второго белка, где указанный первый белок является слитым белком по первому аспекту и способен связываться с указанным вторым белком, и указанный второй белок является терапевтическим белком, содержащим аминокислотную последовательность, идентичную или схожую с аминокислотной последовательностью второго белка млекопитающего или его фрагмента.
В седьмом аспекте изобретение относится к комплексу первого белка и второго белка, где указанный первый белок является слитым белком по первому аспекту, и указанный второй белок имеет аминокислотную последовательность, идентичную или схожую с аминокислотной последовательностью второго белка млекопитающего или его фрагмента.
И наконец, в восьмом аспекте, изобретение также относится к фармацевтической композиции, содержащей слитый белок по первому аспекту, композицию по шестому аспекту или комплекс по седьмому аспекту, для применения в лечении или профилактике нарушения свертываемости, предпочтительно выбранного из лечения PUP или лечения ITI и другого родственного нарушения свертываемости.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
На фиг. 1 схематически представлены A) фрагмент VWF OCTA 11, и B) слитый белок по изобретению с фрагментом VWF в качестве основного белка: OCTA 12; C) слитый белок по изобретению с фрагментом VWF в качестве основного белка: OCTA14; D) слитый белок по изобретению с фрагментом VWF в качестве основного белка: OCTA15.
На фиг. 2 представлена временная зависимость активности FVIII после внутривенного введения FVIII, составленного совместно с разными белками VWF или полученным из плазмы полноразмерного VWF, в плазме мышей с двойным нокаутом (DKO) FVIII/VWF. Точки данных и планки погрешностей соответствуют среднему значению и стандартному отклонению (SD) для 5 значений. Из-за небольшого размера несколько из планок погрешностей неразличимы.
На фиг. 3 представлена временная зависимость концентрации антигена OCTA 12 после подкожного введения 100 ед./кг FVIII, составленного совместно с OCTA 12, в плазме карликовой свиньи.
На фиг. 4 представлена временная зависимость концентрации антигена FVIII после подкожной и внутривенной инъекции 100 ед./кг FVIII или подкожной инъекции 100 ед./кг FVIII, составленного совместно с белком VWF OCTA 12, в плазме карликовой свиньи.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Для обеспечения четкого и последовательного понимания описания и формулы изобретения и объема, данного этим терминам, представлены следующие определения.
Определения
В рамках изобретения "пептид" может состоять из любого количества аминокислот любого типа, предпочтительно, природных аминокислот, предпочтительно, соединенных пептидными связями. В частности, пептид содержит по меньшей мере 3 аминокислоты, предпочтительно - по меньшей мере 5, по меньшей мере 7, по меньшей мере 9, по меньшей мере 12 или по меньшей мере 15 аминокислот. Кроме того, нет верхнего предела длины пептида. Однако, предпочтительно, длина пептида по изобретению не превышает 500 аминокислот, более предпочтительно - не превышает 300 аминокислот; даже более предпочтительно - не превышает 250 аминокислот.
Таким образом, термин "пептид" включает термин "олигопептиды", как правило, относящийся к пептидам с длиной от 2 до 10 аминокислот, и термин "полипептиды", как правило, относящийся к пептидам с длиной более 10 аминокислот.
В рамках изобретения "белок" может содержать одну или несколько полипептидных цепей. Белки с несколькими полипептидными цепями часто экспрессируются в виде одной полипептидной цепи с одного гена и расщепляются посттрансляционно. Таким образом, термины "полипептид" и "белок" используют взаимозаменяемо. В рамках изобретения полипептиды и белки включают химически синтезированные белки, а также природно синтезированные белки, кодируемые генами. Полипептиды или белки можно получать из природного источника, такого как кровь человека, или в культуре клеток в виде рекомбинантных белков.
В рамках изобретения термин "терапевтический белок" относится к белкам или полипептидам с терапевтическим эффектом, т.е. белкам, используемым в качестве активного фармацевтического ингредиента.
По изобретению термины "предшественник белка", "про-белок" или "про-пептид" относятся к неактивному белку (или пептиду), который можно превращать в активную форму посредством посттрансляционной модификации, ферментативного расщепления части аминокислотной последовательности.
Родство между двумя аминокислотными последовательностями или двумя нуклеотидными последовательностями описывают с помощью параметра "идентичность последовательности". В целях по настоящему изобретению, степень идентичности последовательности между двумя аминокислотными последовательностями определяют с использованием алгоритма Needleman-Wunsch (Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453), реализованного в программе Needle в пакете EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277), предпочтительно, версии 3.0.0 или более поздней версии. Необязательными используемыми параметрами являются штраф за открытие пропуска 10, штраф за увеличение пропуска 0,5 и подстановочная матрица EBLOSUM62 (EMBOSS-версия BLOSUM62). Выходные данные Needle, помеченные как "наибольшая идентичность" (полученные с использованием опции "no brief"), используют в качестве процента идентичности и вычисляют следующим образом:
(Идентичные остатки×100)/(длина выравнивания - общее количество пропусков при выравнивании).
В целях по настоящему изобретению, степень идентичности последовательности между двумя нуклеотидными последовательностями определяют с использованием алгоритма Needleman-Wunsch (Needleman and Wunsch, 1970, выше) реализованного в программе Needle в пакете EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277), предпочтительно, версии 3.0.0 или более поздней версии. Необязательными используемыми параметрами являются штраф за открытие пропуска 10, штраф за увеличение пропуска 0,5 и подстановочная матрица EDNAFULL (EMBOSS-версия NCBI NUC4.4). Выходные данные Needle, помеченные как "наибольшая идентичность" (полученные с использованием опции "no brief"), используют в качестве процента идентичности и вычисляют следующим образом:
(Идентичные дезоксирибонуклеотиды×100)/(длина выравнивания - общее количество пропусков при выравнивании)
В рамках изобретения термины "сходство" и "схожий" в отношении определения пептида или полинуклеотида относятся к определенной степени идентичности аминокислотной последовательности или нуклеотидной последовательности по отношению к референсу. Принято, чтобы схожая аминокислотная последовательность включала аминокислотную последовательность, по меньшей мере на 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или даже 99% идентичную рассматриваемой последовательности. Как правило, схожие последовательности будут включать одинаковые остатки в положениях, важные для функционирования пептида или полинуклеотида, такие как остатки в активном центре или гликозилированные аминокислоты, однако они могут включать любое количество консервативных аминокислотных замен. Принято, чтобы схожая нуклеотидная последовательность включала нуклеотидную последовательность, по меньшей мере на 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или даже 99% идентичную рассматриваемой последовательности.
В рамках изобретения термин "идентичный" относится к 100% идентичности аминокислотной или нуклеотидной последовательности по отношению к референсной последовательности.
Термин "рекомбинантный" при использовании по отношению к клетке, нуклеиновой кислоте, белку или вектору свидетельствует о том, что клетку, нуклеиновую кислоту, белок или вектор модифицировали посредством встраивания гетерологичной нуклеиновой кислоты или белка или изменения нативной нуклеиновой кислоты или белка, или что клетку получают из клетки, модифицированной таким образом. Таким образом, например, рекомбинантные клетки экспрессируют гены, не обнаруживаемые в нативной (нерекомбинантной) форме клетки, или экспрессируют нативные гены на иных уровнях или в иных условиях, чем в природе.
В рамках изобретения термин "время полужизни" представляет собой время, необходимое концентрации в плазме/крови, чтобы снизиться на 50% после достигнутого псевдоравновесия распределения (в соответствии с определением в Toutain et al., 2005). Термин "время полужизни" также обозначают как "время полужизни в кровотоке", "конечный период полувыведения" или "время полувыведения".
В рамках изобретения термины "трансформированный", "стабильно трансформированный" и "трансгенный", используемые в отношении клетки, означают, что клетка содержит ненативную (например, гетерологичную) последовательность нуклеиновой кислоты, интегрированную в ее геном или содержащуюся в виде эписомы, поддерживаемую во множестве поколений.
В рамках изобретения термин "фрагмент" относится к полипептиду, имеющему амино-концевую и/или карбокси-концевую делецию одной или нескольких аминокислот по сравнению с нативным белком или белком дикого типа, но в котором остальная аминокислотная последовательность идентична соответствующим положениям в аминокислотной последовательности, прослеживаемой из полноразмерной кДНК. Фрагменты, как правило, составляют по меньшей мере 50 аминокислот в длину.
В рамках изобретения термин "гликозилирование" относится к присоединению гликанов к молекулам, например, белкам. Гликозилирование может являться ферментативной реакцией. Присоединение может осуществляться с помощью ковалентных связей. Таким образом, в рамках изобретения гликозилированный полипептид является полипептидом, к которому присоединены один или множество гликанов. Фраза "высокогликозилированный" относится к молекуле, такой как фермент, гликозилированный по всем или почти всем из доступных участков гликозилирования, например O-сцепленным или N-сцепленным участкам гликозилирования.
В рамках изобретения термин "гликан" относится к полисахариду, или олигосахариду, или углеводной части гликопротеина или гликозилированного полипептида. Гликаны могут являться гомо- или гетерополимерами моносахаридных остатков. Они могут являться линейными или разветвленными молекулами. Гликаны, как правило, содержат по меньшей мере три сахара и могут являться линейными или разветвленными. Гликан может включать природные остатки сахаров (например, глюкозу, N-ацетилглюкозамин, N-ацетилнейраминовую кислоту, N-ацетилгалактозамин, галактозу, маннозу, фукозу, арабинозу, рибозу, ксилозу и т.д.) и/или модифицированные сахара (например, 2′-фторрибозу, 2′-дезоксирибозу, фосфоманнозу, 6′-сульфо-N-ацетилглюкозамин и т.д.).
В рамках изобретения термин "O-гликаны" относится к гликанам, как правило, обнаруживаемым ковалентно связанными с остатками серина и треонина гликопротеинов млекопитающих. O-гликаны могут являться α-сцепленными через остаток N-ацетилгалактозамина (GalNAc) с -OH серина или треонина O-гликозидной связью. Другие связи включают гликаны с α-сцепленной O-фукозой, β-сцепленной O-ксилозой, α-сцепленной O-маннозой, β-сцепленным O-GlcNAc (N-ацетилглюкозамином), α- или β-сцепленной O-галактозой и α- или β-сцепленной O-глюкозой.
В рамках изобретения термины "кластер O-гликозилирования", "O-гликановый кластер" и "кластер O-гликозилированных аминокислот" используют взаимозаменяемо, и они относятся к двум или более O-гликозилированным аминокислотам.
В рамках изобретения термин "сиалированный" относится к молекулам, в частности, гликанам, прореагировавшим с сиаловой кислотой или ее производными.
Переходный термин "содержащий", являющийся синонимом для терминов "включающий" или "отличающийся", является включительным или открытым и не исключает дополнительные, неперечисленные элементы или стадии способа. Переходная фраза "состоящий из" исключает любой элемент, стадию или ингредиент, не указанный в формуле изобретения, за исключением примесей, как правило, связанных с ними. Если фраза "состоит из" фигурирует в пункте формулы изобретения, а не сразу после преамбулы, она ограничивает только элемент, указанный в пункте; другие элементы не исключены из формулы изобретения в целом. Переходная фраза "состоящий, по существу, из" ограничивает объем формулы изобретения конкретными материалами или стадиями "и тем, что материально не влияет на основные и новые характеристики" описываемого в заявке изобретения. "Пункт "состоящий, по существу, из" охватывает среднюю позицию между замкнутыми пунктами, написанными в формате "состоящий из" и полностью открытыми пунктами, составленными в формате "содержащий"".
В контексте изобретения по практическим соображениям термин "гликозилированный белок", такой как слитый белок, используют в единственном числе. Как правило, на практике, белки встречаются в композиции белковых молекул одного типа. Однако в случае гликозилированных белков гликозилирование не будет идентичным в каждой молекуле композиции. Например, не все отдельные молекулы композиции могут являться гликозилированными на 100%. Кроме того, могут иметь место различия в гликанах, связанных со специфическим O-участком гликозилирования. Таким образом, в настоящей заявке ссылка на "слитый белок" также относится к композиции молекул слитых белков с идентичными аминокислотными последовательностями, но различиями в структуре O-гликана.
В рамках изобретения термины "аффинность связывания" или "аффинность" свидетельствуют о силе связывания между двумя молекулами, в частности, лигандом и белком-мишенью. На аффинности связывания влияют нековалентные межмолекулярные взаимодействия между двумя молекулами, такие как водородные связи, электростатические взаимодействия, гидрофобные взаимодействия и вандерваальсовы силы.
В рамках изобретения термин "иммунный ответ" относится к адаптивному или врожденному иммунному ответу. Термин "врожденный иммунный ответ" относится к неспецифическим защитным механизмам, активирующимся сразу или в течение нескольких часов после появления антигена в организме. Эти механизмы включают физические барьеры, такие как кожа, химические вещества в крови и клетки иммунной системы, атакующие чужеродные клетки в организме. Врожденный иммунный ответ активируется химическими свойствами антигена. Адаптивный иммунный ответ относится к антиген-специфическому иммунному ответу. В связи с этим, антиген сначала должен быть подвергнут обработке и распознаванию. После распознавания антигена адаптивная иммунная система создает большое количество иммунных клеток, конкретно предназначенных для воздействия на этот антиген.
Слитый белок
В первом аспекте изобретение относится к слитому белку, содержащему основной белок и по меньшей мере один пептид удлинения, где аминокислотная последовательность основного белка является идентичной или схожей с аминокислотной последовательностью белка млекопитающего или его фрагмента, и указанный пептид удлинения содержит кластер O-гликозилированных аминокислот.
Авторы настоящего изобретения идентифицировали модификацию белков, приводящую к повышению времени полужизни, а именно, добавление пептида удлинения, содержащего кластер O-гликозилированных аминокислот. Как показано в примерах, слияние кластера O-гликозилирования 1 VWF человека в качестве пептида удлинения с фрагментом VWF приводит к получению слитого белка (OCTA 12) с повышенным временем полужизни по сравнению с фрагментом VWF (OCTA 11) в отдельности.
Время полужизни (t1/2) можно вычислять посредством линейного регрессионного анализа линейно-логарифмической части отдельных кривых концентрация в плазме-время или посредством нелинейной регрессии с использованием однофазной модели экспоненциального уменьшения. Примерами программного обеспечения для вычисления являются GraphPad Prism версии 6.07 (La Jolla, CA 92037 USA) и WinNonlin версии 6,4 (Pharsight Corporation, Mountain View, CA, USA).
Вычисления основаны на следующих уравнениях:
Kel=константа скорости элиминации
t½=время полувыведения
c=концентрация
t=время
Таким образом, в одном из вариантов осуществления слитый белок имеет повышенное время полужизни по сравнению с основным белком без пептида удлинения.
Т.к. можно было повысить время полужизни фрагмента VWF с использованием кластера гликозилированных аминокислот, полученного из VWF, авторы настоящего изобретения идентифицировали новый принцип пролонгирования времени полужизни. Т.е. повышение времени полужизни белка или фрагмента белка посредством добавления кластера O-гликозилированных аминокислот, также присутствующего в природном белке.
Таким образом, в одном из вариантов осуществления слитого белка аминокислотная последовательность одного или нескольких пептидов удлинения является идентичной или схожей с частью указанного белка млекопитающего. Эта часть белка млекопитающего, в частности, является неповторяющейся аминокислотной последовательностью.
В рамках изобретения неповторяющаяся аминокислотная последовательность является последовательностью, обнаруживаемой в природном белке млекопитающего по изобретению только в одной копии. Таким образом, неповторяющаяся аминокислотная последовательность явно исключает какие-либо повторяющиеся природные последовательности в белках. В частности, последовательность считают повторяющейся, если последовательность состоит из более чем 20 аминокислот, предпочтительно - более чем 15 аминокислот, более предпочтительно - более чем 10 аминокислот, и белок млекопитающего содержит несколько этих последовательностей.
Повторяющиеся последовательности можно получать из так называемых тандемных повторов с переменным количеством звеньев. Тандемный повтор с переменным количеством звеньев (VNTR) является участком в геноме, где короткая нуклеотидная последовательность организована в виде "тандемного повтора". "Тандемные повторы" встречаются в ДНК, когда паттерн из одного или нескольких нуклеотидов повторяется и повторы являются непосредственно смежными друг с другом. VNTR обнаруживают на многих хромосомах, и часто наблюдают вариации их длины от индивидуума к индивидууму. В случае, когда тандемные повторы локализуются в белок-кодирующих последовательностях ДНК, это приводит к повторам в аминокислотной последовательности. Примерами являются тандемные повторы, обнаруживаемые во всех членах семейства муциновых белков. Муцины являются семейством высокомолекулярных, сильно гликозилированных белков, продуцируемых эпителиальными тканями в большинстве организмов царства Животных. Неповторяющаяся аминокислотная последовательность по изобретению явно исключает такие тандемные повторы в аминокислотной последовательности, в частности, муциновые тандемные повторы.
Пептид удлинения не только можно получать из того же белка млекопитающего, что и основной белок, но, более конкретно, он может содержать часть, также присутствующую в основном белке. Таким образом, в одном из вариантов осуществления аминокислотная последовательность одного или нескольких пептидов удлинения является идентичной или схожей с частью неповторяющейся аминокислотной последовательности указанного основного белка.
Предпочтительно, один или более пептидов удлинения не получают из β-субъединицы хорионического гонадотропина (CG-β). Показано, что C-концевой пептид (CTP) β-субъединицы хорионического гонадотропина повышает время полужизни других белков, таких как FSH, FVIIa и FIX. Однако, в случае, когда был описан hCG с дополнительным CTP, т.е. несколькими копиями CTP, этот белок конкретно исключен из объекта настоящего изобретения. Таким образом, в частности, пептид удлинения не является идентичным или схожим с CTP CG-β.
По настоящему изобретению две или более O-гликозилированных аминокислот в непосредственной близости в аминокислотной последовательности считают кластером. Таким образом, в одном из вариантов осуществления слитого белка кластер O-гликозилированных аминокислот по меньшей мере одного пептида удлинения содержит по меньшей мере две O-гликозилированных аминокислоты. Кластер может содержать, например, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15 O-гликозилированных аминокислот.
Теоретически, эффект повышения времени полужизни основан на отрицательном заряде O-гликанов. Таким образом, эффект пролонгирования времени полужизни должен повышаться с количеством O-гликозилированных аминокислот в кластере. Таким образом, кластер, предпочтительно, содержит по меньшей мере три O-гликозилированных аминокислоты. Как показано в примерах, значительного эффекта повышения времени полужизни достигали с использованием пептида удлинения с кластером из четырех O-гликозилированных аминокислот. Таким образом, в предпочтительном варианте осуществления кластер содержит по меньшей мере четыре O-гликозилированных аминокислоты.
В дополнение к O-гликозилированным аминокислотам кластера также могут присутствовать N-гликозилированные аминокислоты. Предпочтительно, в кластере O-гликозилирования нет N-гликозилированных аминокислотов.
В случае наличия нескольких пептидов удлинения, кластеры пептидов удлинения могут содержать разное количество O-гликозилированных аминокислот. Например, слитый белок может содержать один кластер с двумя и второй кластер с четырьмя O-гликозилированными аминокислотами. Кроме того, один кластер может содержать три участка O-гликозилирования, а другой - четыре участка O-гликозилирования.
O-гликозилированные аминокислоты пептида удлинения могут являться O-гликозилированными аминокислотами серином (Ser) и треонином (Thr) муцинового типа. Однако, в этой области также известны O-гликозилированный тирозин (Tyr), гидроксилизин (гидрокси-Lys) или гидроксипролин (гидрокси-Pro). Таким образом, одну или несколько O-гликозилированных аминокислот в слитом белке, в частности, в пептиде удлинения, можно выбирать из Ser, Thr, Tyr, гидрокси-Lys и гидрокси-Pro.
Пептид удлинения, слитый с фрагментом VWF в OCTA 12, что приводит к пролонгированию времени полужизни указанного фрагмента, содержит O-гликозилированные остатки треонина и остатки серина. Таким образом, в одном из вариантов осуществления первого аспекта кластер O-гликозилированных аминокислот содержит по меньшей мере один O-гликозилированный треонин. Предпочтительно, указанный кластер содержит и треонин, и серин в качестве O-гликозилированных аминокислот. Примечательно, что пептид удлинения OCTA 12 содержит два соседних остатка треонина, являющихся O-гликозилированными. Таким образом, в одном из вариантов осуществления пептид удлинения содержит по меньшей мере два соседних O-гликозилированных остатка треонина.
Как описано выше, полагают, что отрицательный заряд поверхности белка, генерируемый O-гликанами, приводит к пролонгированию времени полужизни. Не желая быть связанными какой-либо теорией, полагают, что для проявления эффекта необходимы два или более O-гликана в непосредственной близости. Эффект может быть слабым или отсутствовать, если пропуски между O-гликанами являются слишком большими, т.е. при менее чем одной O-гликозилированной аминокислоте на 15 аминокислот. Таким образом, в одном из вариантов осуществления слитого белка по меньшей мере один пептид удлинения содержит по меньшей мере одну O-гликозилированную аминокислоту на 15 аминокислот.
Более предпочтительно, по меньшей мере один пептид удлинения содержит по меньшей мере один O-участок гликозилирования на 10 аминокислот. Как показано в примерах, тестируемый пептид удлинения содержит кластеры с одним O-участком гликозилирования на 8 аминокислот. Таким образом, в предпочтительном варианте осуществления один или более кластеров содержат по меньшей мере один участок гликозилирования на 8 аминокислот.
Длину пептида удлинения определяют в соответствии с двумя разными аспектами. Пептид удлинения должен быть достаточно длинным, чтобы содержать участки распознавания, способствующие гликозилированию O-гликозилированных аминокислот. Таким образом, пептид удлинения должен составлять по меньшей мере 10 аминокислот в длину. С другой стороны, чем короче пептид удлинения, тем менее вероятно, что он будет мешать структурной целостности или активности и, таким образом, терапевтическому эффекту основного белка. Таким образом, пептид удлинения не должен превышать 100 аминокислот. В одном из вариантов осуществления один или более пептидов удлинения имеют длину в диапазоне от 15 до 60 аминокислот. Чтобы позволить четырем аминокислотам быть O-гликозилированными в пептиде удлинения, длина, предпочтительно, должна составлять в диапазоне от 22 до 40 аминокислот. Более предпочтительно, длина пептида удлинения приблизительно равна длине пептидов удлинения в OCTA 12, т.е. в диапазоне от 26 до 36 аминокислот. В одном из вариантов осуществления один или более пептидов удлинения имеют длину приблизительно 31 аминокислота.
Результаты, полученные авторами настоящего изобретения, не только приводят к выводу о принципе добавления одной или нескольких копий O-гликозилированного пептида, естественным образом присутствующего в белке, для повышения времени полужизни того же белка или его фрагмента. Кроме того, эти результаты свидетельствуют о том, что конкретный O-гликозилированный пептид VWF, по аналогии с CTP, может повышать время полужизни других белков, т.е. белков в целом.
Таким образом, в одном из вариантов осуществления один или более пептидов удлинения имеют идентичность последовательности по меньшей мере 90% по отношению к O-гликозилированному пептиду VWF человека. Этот полученный из VWF человека пептид удлинения можно подвергать слиянию с другими белками млекопитающих или их фрагментами, такими как FVIII. Идентичность последовательности одного или нескольких пептидов удлинения, предпочтительно, составляет по меньшей мере 95% по отношению к O-гликозилированному пептиду VWF человека. Более предпочтительно, идентичность последовательности составляет по меньшей мере 98%. Наиболее предпочтительно, последовательность пептида удлинения является идентичной O-гликозилированному пептиду VWF человека.
O-гликозилированный пептид VWF человека включает предпочтительно, по меньшей мере, частично, кластер 2O-гликозилирования VWF (аминокислоты 1238-1268 SEQ ID NO: 2): QEPGGLVVPPTDAPVSPTTLYVEDISEPPLH (SEQ ID NO: 1) или его вариант. Таким образом, в одном из вариантов осуществления пептид удлинения имеет идентичность последовательности по отношению к SEQ ID NO: 1 по меньшей мере 90%. Идентичность последовательности по отношению к SEQ ID NO: 1, предпочтительно, составляет по меньшей мере 95%. Более предпочтительно, идентичность последовательности пептида удлинения по отношению к SEQ ID NO: 1 составляет по меньшей мере 98%. Наиболее предпочтительно, один или более пептидов удлинения имеют идентичность последовательности 100% по отношению к SEQ ID NO: 1.
Основной белок основан на белке млекопитающего, т.е. содержит аминокислотную последовательность, схожую или идентичную белку млекопитающего или его фрагменту. Белок млекопитающего, в частности, является белком человека.
Белок млекопитающего, по отношению к которому аминокислотная последовательность основного белка является схожей или идентичной, может являться гликозилированным белком. В одном из вариантов осуществления слитого белка основной белок содержит гликозилированную часть белка млекопитающего. В другом варианте осуществления основной белок содержит по меньшей мере один кластер O-гликозилированных аминокислот. Этот кластер O-гликозилированных аминокислот может являться идентичным кластеру O-гликозилированных аминокислот в пептиде удлинения.
Белок млекопитающего, на котором основан основной белок, более предпочтительно, является белком крови. В одном из вариантов осуществления белок млекопитающего является белком крови человека.
Белок крови млекопитающего может являться фактором свертывания, транспортным белком, ингибитором протеазы, иммуноглобулином, клеточным белком плазмы, аполипопротеином, фактором комплемента, фактором роста, антиангиогенным белком, сильно гликозилированным белком, фактором крови или другим белком крови.
Фактор свертывания, в частности, фактор свертывания человека, предпочтительно, выбран из группы, состоящей из фибриногена (FI), протромбина (FII), тканевого фактора (FIII), FV, FVII, FVIII, FIX, FX, FXI, FXII, и FXIII, VWF и ADAMTS13.
Следует понимать, что факторы свертывания FI, FII, FV, FVII, FVIII, FIX, FX, FXI, FXII, и FXIII могут находиться в неактивной или активированной форме. Таким образом, в контексте по изобретению, ссылка на FI, FII, FV, FVII, FVIII, FIX, FX, FXI, FXII, и FXIII включает активированные формы FIa (фибрина), FIIa (тромбина), FVa, FIXa, FVIIa, FVIIIa, FXa, FXIa, FXIIa и FXIIIa, соответственно, если четко не указано иное или это не следует из контекста, активированную форму исключают логически. Таким образом, например, в этом контексте FI, FII, FV, FIX, FVII, FVIII, FX, FXI, FXII и FXIII можно читать как FI/FIa, FII/FIIa, FV/FVa, FVII/FVIIa, FVIII/FVIIIa, FIX/FXIa, FX/FXa, FXI/FXIa, FXII/FXIIa и FXIII/FXIIIa.
Транспортный белок, в частности, транспортный белок человека, можно выбирать из альбумина, трансферрина, церулоплазмина, гаптоглобина, гемоглобина и гемопексина.
В одном из вариантов осуществления белок млекопитающего является ингибитором протеазы, в частности, ингибитором протеазы человека. Примерами таких ингибиторов протеаз являются β-антитромбин, α-антитромбин, прелатентный антитромбин, окисленный антитромбин, 2-макроглобулин, ингибитор C1, ингибитор пути тканевого фактора (TFPI), кофактор гепарина II, ингибитор протеина C (PAI-3), протеин C, протеин S и протеин Z.
Примерами иммуноглобулинов являются поликлональные антитела (IgG), моноклональные антитела, IgG1, IgG2, IgG3, IgG4, IgA, IgA1, IgA2, IgM, IgE, IgD и белок Бенс-Джонса.
Клеточно-родственный белок плазмы может являться, например, фибронектином, тромбоглобулином или тромбоцитарным фактором 4. Примерами аполипопротеинов являются апо-A-I, апо-A-II и апо-E.
Факторами комплемента по изобретению являются, например, фактор B, фактор D, фактор H, фактор I, инактиватор C3b, пропердин, C4-связывающий белок и т.д.
Примеры факторов роста включают фактор роста тромбоцитов (PDGF), эпидермальный фактор роста (EGF), трансформирующий фактор роста альфа (TGF-α), трансформирующий фактор роста бета (TGF-α), фактор роста фибробластов (FGF) и фактор роста гепатоцитов (HGF).
Антиангиогенные белки включают латентный антитромбин, прелатентный антитромбин, окисленный антитромбин и плазминоген.
Примерами сильно гликозилированных белков являются альфа-1-кислый гликопротеин, антихимотрипсин, интер-α-ингибитор трипсина, α-2-HS-гликопротеин, C-реактивный белок.
Факторами крови могут являться, например, эритропоэтин, интерферон, опухолевые факторы, tPA или gCSF.
Другие белки крови человека включают богатый гистидином гликопротеин, маннозосвязывающий лектин, C4-связывающий белок, фибронектин, GC-глобулин, плазминоген/плазмин, α-1-микроглобулин, C-реактивный белок.
Белок млекопитающего, в частности, выбран из VWF человека, фибриногена, протромбина, FIII, FV, FVII, FVIII, FIX, FX, FXI, FXII, FXIII, ADAMTS13, антитромбина, альфа-1-антитрипсина, ингибитора C1, антихимотрипсина, PAI-1, PAI-3, 2-макроглобулина, TFPI, кофактора гепарина II, протеина Z, протеина C и протеина S.
Фактор VIII у людей кодируется геном F8, содержащим 187000 пар оснований в шести экзонах. Транскрибируемая мРНК имеет длину 9029 пар оснований и транслируется в белок из 2351 аминокислоты, из которого удалены 19 аминокислот. Молекула FVIII у людей гликозилирована по 31 аминокислоте, 25 из которых N-гликозилированы и 6 - O-гликозилированы (см. Kannicht et al., 2013).
После трансляции цепь аминокислот расщепляется специфическими протеазами в определенных положениях, что приводит к образованию тяжелой цепи из приблизительно 200 кДа и легкой цепи из приблизительно 80 кДа. Организация доменов, как правило, представляет собой A1-A2-B-A3-C1-C2. Легкая цепь состоит из доменов A3-C1-C2. Тяжелая цепь, в принципе, состоит из доменов A1-A2-B. Тяжелые цепи, обнаруживаемые в плазме, имеют гетерогенную композицию с молекулярными массами, варьирующимися от 90 до 200 кДа. Причиной этого является гетерогенность его гликозилирования, существование вариантов сплайсинга и существование протеолитических продуктов, таких как лишенная домена B тяжелая цепь A1-A2. Аминокислотную последовательность полноразмерного FVIII определяют по аминокислотам 20-2351 P00451 в UniProtKB, версии последовательности 1 от 21 июля 1986 года (в дальнейшем UniProtKB P00451.1).
В одном из вариантов осуществления белок млекопитающего, по отношению к которому основной белок является схожим или идентичным, является полноразмерным FVIII человека, определенным по аминокислотам 20-2351 UniProtKB P00451.1. В другом варианте осуществления основной белок является FVIII, в котором отсутствует, по меньшей мере, часть B-домена. В связи с этим, может отсутствовать весь B-домен. Отсутствующую часть B-домена, необязательно, заменяют линкером. Линкерная последовательность, в частности, содержит последовательность следующих аминокислот SFSQNSRHQAYRYRRG (SEQ ID NO: 12). Примером FVIII, в котором B-домен заменяют линкером, является симоктоког альфа, активный ингредиент Nuwiq® или Vihuma®. Симоктоког альфа имеет следующую последовательность:
ATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHQAYRYRRGEITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY (SEQ ID NO: 13)
VWF является мультимерным адгезивным гликопротеином, присутствующим в плазме млекопитающих, обладающим множеством физиологических функций. При первичном гемостазе, VWF действует в качестве медиатора между специфическими рецепторами на поверхности тромбоцитов и компонентами внеклеточного матрикса, такими как коллаген. Кроме того, VWF служит в качестве носителя и стабилизирующего белка для прокоагулянта фактора VIII. VWF синтезируется в эндотелиальных клетках и мегакариоцитах в качестве молекулы-предшественника из 2813 аминокислот.
Организация доменов VWF, как правило, представляет собой Til3-D3-TIL4-A1-A2-A3-D4-C1-C2-C3-CK.
Полипептид-предшественник, пре-про-VWF, состоит из сигнального пептида из 22 остатков, про-пептида из 741 остатка (домены D1-D2) и полипептида из 2050 остатков, обнаруживаемого в зрелом факторе фон Виллебранда в плазме (Fischer et al., 1994). Полноразмерный VWF определен в записи P04275 UniprotKB (версия записи 224 от 12 апреля 2017 года).
VWF человека по настоящему изобретению имеет аминокислотную последовательность любой из последовательностей указанной UniprotKB P04275, в частности, SEQ ID NO: 2 (изоформа 1). VWF содержит два кластера O-гликозилированных аминокислот. Первый кластер O-гликозилированных аминокислот обнаруживают между аминокислотами 1238-1268 SEQ ID NO: 2. Второй кластер включает аминокислоты 1468-1487 SEQ ID NO: 2.
После секреции в плазму VWF циркулирует в форме различных молекул разного размера. Эти молекулы VWF состоят из олиго- и мультимеров зрелой субъединицы из 2050 аминокислотных остатков. VWF, как правило, можно обнаружить в плазме в качестве мультимеров с диапазоном размеров приблизительно от 500 до 20000 кДа (Furlan et al., 1996).
В одном из вариантов осуществления основной белок имеет аминокислотную последовательность, идентичную или схожую с последовательностью зрелого VWF человека.
В другом варианте осуществления основной белок имеет аминокислотную последовательность, схожую или идентичную последовательности фрагмента VWF человека.
Например, в фрагменте VWF человека могут отсутствовать один или более доменов A1, A2, A3, D4, C1, C2, C3, CK относительно зрелого VWF человека (Til3-D3-TIL4-A1-A2-A3-D4-C1-C2-C3-CK). Фрагмент VWF, например, может иметь организацию доменов, выбранную из следующей группы, состоящей из Til3-D3-TIL4-A1, Til3-D3-TIL4-A1-A2, Til3-D3-TIL4-A1-A2-A3, Til3-D3-TIL4-A1-A2-A3-D4, Til3-D3-TIL4-A1-A2-A3-D4-C1, Til3-D3-TIL4-A1-A2-A3-D4-C1-C2 и Til3-D3-TIL4-A1-A2-A3-D4-C1-C2-C3-CK.
В связи с этим, фрагмент VWF человека, в частности, является фрагментом, начинающимся с аминокислоты 764 SEQ ID NO: 2. Аминокислоты 764-1035 SEQ ID NO: 2 содержат FVIII-связывающий домен VWF.
Основной белок, например, может содержать фрагмент VWF, как определено в WO 2015/185758 A2. Как представлено в WO 2015/185758 A2, комплекс FVIII и фрагментов VWF, как определено, проявляет сниженное связывание с фосфолипидными мембранами по сравнению с FVIII в отдельности, а также сниженное связывание с коллагеном III и гепарином по сравнению с комплексом FVIII и полноразмерного VWF.
Фрагмент VWF, предпочтительно, начинающийся с аминокислоты 764 SEQ ID NO: 2, предпочтительно, заканчивается аминокислотой в диапазоне 1905-2153 SEQ ID NO: 2. В одном из вариантов осуществления фрагмент VWF заканчивается аминокислотой VWF в диапазоне 2030-2153 SEQ ID NO: 2. В дополнительном варианте осуществления изобретения фрагмент VWF заканчивается аминокислотой в диапазоне 2100-2153 SEQ ID NO: 2.
В одном из вариантов осуществления основной белок имеет аминокислотную последовательность, схожую или идентичную аминокислотам 764-1268 SEQ ID NO: 2. В одном из вариантов осуществления аминокислотная последовательность основного белка имеет идентичность по меньшей мере 90% по отношению к аминокислотам 764-1268 SEQ ID NO: 2. Аминокислотная последовательность основного белка также может иметь идентичность по меньшей мере 95% по отношению к аминокислотам 764-1268 SEQ ID NO: 2. Кроме того, идентичность аминокислотной последовательности основного белка по отношению к аминокислотам 764-1268 SEQ ID NO: 2 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность основного белка может иметь идентичность 100% по отношению к аминокислотам 764-1268 SEQ ID NO: 2.
В одном из вариантов осуществления основной белок имеет аминокислотную последовательность, схожую или идентичную аминокислотам 764-1905 SEQ ID NO: 2. В одном из вариантов осуществления аминокислотная последовательность основного белка имеет идентичность по меньшей мере 90% по отношению к аминокислотам 764-1905 SEQ ID NO: 2. Аминокислотная последовательность основного белка также может иметь идентичность по меньшей мере 95% по отношению к аминокислотам 764-1905 SEQ ID NO: 2. Кроме того, идентичность аминокислотной последовательности основного белка по отношению к аминокислотам 764-1905 SEQ ID NO: 2 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность основного белка может иметь идентичность 100% по отношению к аминокислотам 764-1905 SEQ ID NO: 2.
Слитый белок может содержать любое количество пептидов удлинения, например, один, два, три, четыре, пять, шесть, семь, восемь, девять или десять пептидов удлинения. Слитый белок OCTA 12 содержит две копии пептида удлинения и проявляет значительное повышение времени полужизни по сравнению с фрагментом VWF OCTA 11. Таким образом, в одном из вариантов осуществления слитый белок содержит по меньшей мере два пептида удлинения.
Следует понимать, что эффект пролонгирования времени полужизни, по меньшей мере, частично основан на отрицательном заряде O-гликанов пептида удлинения. Таким образом, повышение количества копий пептида удлинения приводит к дополнительному усилению эффекта пролонгирования времени полужизни. Это подтверждено с помощью OCTA 14, содержащего четыре копии пептида удлинения. Таким образом, в одном из вариантов осуществления слитый белок содержит по меньшей мере четыре пептида удлинения.
С другой стороны, с повышением количества копий пептида удлинения повышается вероятность того, что пептиды удлинения будут мешать структурной целостности или активности и, таким образом, терапевтическому эффекту основного белка. Таким образом, в одном из вариантов осуществления количество пептидов удлинения составляет менее 11.
Слитый белок может содержать дополнительные пептидные компоненты помимо основного белка и пептидов удлинения. В частности, помимо пептида удлинения по изобретению слитый белок может содержать дополнительные пептиды для пролонгирования времени полужизни, такие как CTP, XTEN, трансферрин или его фрагменты, альбумин или его фрагменты.
Также возможно, что основной белок является фрагментом белка млекопитающего, и слитый белок содержит дополнительный фрагмент того же белка млекопитающего. В частности, два фрагмента разделяют одним или несколькими пептидами удлинения. Примером такого белка является OCTA 15, содержащий аминокислоты 764-1268 VWF, два пептида удлинения с последовательностью SEQ ID NO: 1 и "домен цистеиновый узел" VWF, состоящий из аминокислот 2721-2813 SEQ ID NO: 2.
В слитом белке один или более пептидов удлинения можно соединять с N-концом или C-концом основного белка. В частности, слитый белок может содержать один или более пептидов удлинения, соединенных с N-концом, и один или более пептидов удлинения, соединенных с C-концом основного белка.
Т.к. слитый белок может содержать дополнительные пептиды помимо основного белка и одного или нескольких пептидов удлинения. Таким образом, пептиды удлинения можно напрямую или косвенно соединять с основным белком. В связи с этим, термин "соединенный напрямую" означает, что аминокислотные последовательности основного белка и пептида удлинения являются смежными. Термин "косвенно соединенные" означает, что между основным белком и пептидом удлинения находится дополнительный пептид. В частности, линкерный пептид может находиться между основным белком и пептидом удлинения. Линкер может содержать участок расщепления, что делает пептид удлинения отщепляемым от основного белка.
Основной белок, один или более пептидов удлинения и, необязательно, дополнительные пептиды можно получать, соединяя гены, кДНК или последовательности, кодирующие их. Таким образом, основной белок, один или более пептидов удлинения и, необязательно, дополнительные пептиды соединены пептидными связями. По изобретению, пептиды слитого белка фактически можно соединять с помощью других линкеров, таких как химические линкеры или гликозидные связи. Предпочтительно, пептиды слитого белка соединены пептидными связями.
В одном из вариантов осуществления пептид удлинения напрямую соединяют с C-концом основного белка. В частности, слитый белок содержит по меньшей мере два последовательных пептида удлинения, соединенных с C-концом основного белка.
Слитый белок можно соединять с двумя или несколькими аффинными метками. Примерами аффинных меток являются полигистидин, протеин A, глутатион-S-трансфераза, вещество P, FLAG, стрептавидин и константная область тяжелой цепи иммуноглобулина. Хотя аффинная метка, как правило, является частью аминокислотной последовательности полной конструкции, ее не считают частью слитого белка. Одну или несколько аффинных меток, предпочтительно, соединяют с C-концом или N-концом слитого белка. В случае, когда слитый белок соединяют с одной или несколькими аффинными метками, он, предпочтительно, содержит участок расщепления между аффинной меткой и остальной частью белка, что делает аффинную метку отщепляемой, например, посредством расщепления протеазами.
В одном из вариантов осуществления один пептид удлинения образует N-конец слитого белка. Как описано выше, N-концевую аминокислоту указанного пептида удлинения, необязательно, соединяют с аффинной меткой. В одном из вариантов осуществления один пептид удлинения образует C-конец слитого белка. Как описано выше, C-концевую аминокислоту указанного пептида удлинения, необязательно, соединяют с аффинной меткой.
В одном из вариантов осуществления слитый белок содержит по меньшей мере 4, предпочтительно - по меньшей мере 8, более предпочтительно - по меньшей мере 12 дополнительных O-гликанов по сравнению с основным белком.
В одном из вариантов осуществления слитый белок содержит домен димеризации; в частности, основной белок содержит домен димеризации. В VWF димеры образуются посредством связывания CK-доменов. Таким образом, в случае, когда основной белок является фрагментом VWF, он, предпочтительно, содержит CK-домен.
Типичным слитым белком по изобретению является OCTA 12. OCTA 12 имеет следующую аминокислотную последовательность (SEQ ID NO: 3):
SLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH
OCTA 12 является слитым белком фрагмента VWF, соответствующего аминокислотам 764-1268 SEQ ID NO: 2, и двух копий пептида удлинения (помеченного полужирным шрифтом), связанных с C-концом, состоящим из аминокислот 1238-1268 SEQ ID NO: 2.
В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 3. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 3. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 3 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 3.
Следующая последовательность (SEQ ID NO: 4) представляет собой OCTA 12 с дополнительным сигнальным пептидом из 12 аминокислот (выделено полужирным шрифтом и подчеркнуто). При экспрессии этого пептида получают мономерную форму OCTA 12. Сигнальный пептид отщепляется.
MIPARFAGVLLALALILPGTLC SLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH (SEQ ID NO: 4)
В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 4. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 4. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 4 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 4.
Дополнительным типичным слитым белком по изобретению является про-OCTA 12, включающий OCTA 12 и пропептид (выделен полужирным шрифтом) с сигнальным пептидом (выделен полужирным шрифтом и подчеркнут). Про-OCTA 12 определен в SEQ ID NO: 5:
MIPARFAGVLLALALILPGTLC AEGTRGRSSTARCSLFGSDFVNTFDGSMYSFAGYCSYLLAGGCQKRSFSIIGDFQNGKRVSLSVYLGEFFDIHLFVNGTVTQGDQRVSMPYASKGLYLETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNFNIFAEDDFMTQEGTLTSDPYDFANSWALSSGEQWCERASPPSSSCNISSGEMQKGLWEQCQLLKSTSVFARCHPLVDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLYGWTDHSACSPVCPAGMEYRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQLLDEGLCVESTECPCVHSGKRYPPGTSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFSGICQYLLARDCQDHSFSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPLLKGDLRIQHTVTASVRLSYGEDLQMDWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGDDFLTPSGLAEPRVEDFGNAWKLHGDCQDLQKQHSDPCALNPRMTRFSEEACAVLTSPTFEACHRAVSPLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRVAWREPGRCELNCPKGQVYLQCGTPCNLTCRSLSYPDEECNEACLEGCFCPPGLYMDERGDCVPKAQCPCYYDGEIFQPEDIFSDHHTMCYCEDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH (SEQ ID NO: 5)
Экспрессия про-OCTA 12 приводит к образованию димеров. После расщепления пропептида остаются пропептидные димеры.
В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 5. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 5. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 5 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 5.
Дополнительным типичным слитым белком по изобретению является OCTA 14. OCTA 14 имеет следующую аминокислотную последовательность:
SLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH (SEQ ID NO: 6)
OCTA 14 является слитым белком фрагмента VWF, соответствующего аминокислотам 764-1268 SEQ ID NO: 2, и четырех копий пептида удлинения (выделены полужирным шрифтом), связанных с C-концом, состоящим из аминокислот 1238-1268 SEQ ID NO: 2.
В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 6. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 6. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 6.
Следующая последовательность (SEQ ID NO: 7) представляет собой OCTA 14 с дополнительным сигнальным пептидом из 12 аминокислот (выделен полужирным шрифтом и подчеркнут). При экспрессии этого пептида получают мономерную форму OCTA 14. Сигнальный пептид отщепляется.
MIPARFAGVLLALALILPGTLC SLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH(SEQ ID NO: 7)
В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 7. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 7. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 7 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 7.
Дополнительным типичным слитым белком по изобретению является про-OCTA 14, включающий OCTA 14 и пропептид (выделен полужирным шрифтом) с сигнальным пептидом (выделен полужирным шрифтом и подчеркнут). Про-OCTA 14 определен в SEQ ID NO: 8:
MIPARFAGVLLALALILPGTLC AEGTRGRSSTARCSLFGSDFVNTFDGSMYSFAGYCSYLLAGGCQKRSFSIIGDFQNGKRVSLSVYLGEFFDIHLFVNGTVTQGDQRVSMPYASKGLYLETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNFNIFAEDDFMTQEGTLTSDPYDFANSWALSSGEQWCERASPPSSSCNISSGEMQKGLWEQCQLLKSTSVFARCHPLVDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLYGWTDHSACSPVCPAGMEYRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQLLDEGLCVESTECPCVHSGKRYPPGTSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFSGICQYLLARDCQDHSFSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPLLKGDLRIQHTVTASVRLSYGEDLQMDWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGDDFLTPSGLAEPRVEDFGNAWKLHGDCQDLQKQHSDPCALNPRMTRFSEEACAVLTSPTFEACHRAVSPLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRVAWREPGRCELNCPKGQVYLQCGTPCNLTCRSLSYPDEECNEACLEGCFCPPGLYMDERGDCVPKAQCPCYYDGEIFQPEDIFSDHHTMCYCEDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH (SEQ ID NO: 8)
В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 8. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 8. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 8 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 8.
Дополнительным типичным слитым белком по изобретению является OCTA 15. OCTA 15 имеет следующую аминокислотную последовательность:
SLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVPTTLYVEDISEPPLH EEPECNDITARLQYVKVGSCKSEVEVDIHYCQGKCASKAMYSIDINDVQDQCSCCSPTRTEPMQVALHCTNGSVVYHEVLNAMECKCSPRKCSK (SEQ ID NO: 9)
OCTA 15 является слитым белком фрагмента VWF, соответствующего аминокислотам 764-1268 SEQ ID NO: 2, двух копий пептида удлинения (выделен полужирным шрифтом), связанных с C-концом, состоящим из аминокислот 1238-1268 SEQ ID NO: 2, и "домена цистеиновый узел" VWF, состоящего из аминокислот 2721-2813 SEQ ID NO: 2.
В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 9. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 9. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 9 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 9.
Следующая последовательность (SEQ ID NO: 10) представляет собой OCTA 15 с дополнительным сигнальным пептидом из 12 аминокислот (выделен полужирным шрифтом и подчеркнут). При экспрессии этого пептида получают димерную форму OCTA 15. Сигнальный пептид отщепляется.
MIPARFAGVLLALALILPGTLC SLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVPTTLYVEDISEPPLHEEPECNDITARLQYVKVGSCKSEVEVDIHYCQGKCASKAMYSIDINDVQDQCSCCSPTRTEPMQVALHCTNGSVVYHEVLNAMECKCSPRKCSK (SEQ ID NO: 10)
В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 10. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 10. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 10 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 10.
Дополнительным типичным слитым белком по изобретению является про-OCTA 15, включающий OCTA 15 и пропептид (выделен полужирным шрифтом) с сигнальным пептидом (выделен полужирным шрифтом и подчеркнут). Экспрессия этой последовательности будет приводить к образованию мультимеров. Про-OCTA 15 определен в SEQ ID NO: 11:
MIPARFAGVLLALALILPGTLC AEGTRGRSSTARCSLFGSDFVNTFDGSMYSFAGYCSYLLAGGCQKRSFSIIGDFQNGKRVSLSVYLGEFFDIHLFVNGTVTQGDQRVSMPYASKGLYLETEAGYYKLSGEAYGFVARIDGSGNFQVLLSDRYFNKTCGLCGNFNIFAEDDFMTQEGTLTSDPYDFANSWALSSGEQWCERASPPSSSCNISSGEMQKGLWEQCQLLKSTSVFARCHPLVDPEPFVALCEKTLCECAGGLECACPALLEYARTCAQEGMVLYGWTDHSACSPVCPAGMEYRQCVSPCARTCQSLHINEMCQERCVDGCSCPEGQLLDEGLCVESTECPCVHSGKRYPPGTSLSRDCNTCICRNSQWICSNEECPGECLVTGQSHFKSFDNRYFTFSGICQYLLARDCQDHSFSIVIETVQCADDRDAVCTRSVTVRLPGLHNSLVKLKHGAGVAMDGQDVQLPLLKGDLRIQHTVTASVRLSYGEDLQMDWDGRGRLLVKLSPVYAGKTCGLCGNYNGNQGDDFLTPSGLAEPRVEDFGNAWKLHGDCQDLQKQHSDPCALNPRMTRFSEEACAVLTSPTFEACHRAVSPLPYLRNCRYDVCSCSDGRECLCGALASYAAACAGRGVRVAWREPGRCELNCPKGQVYLQCGTPCNLTCRSLSYPDEECNEACLEGCFCPPGLYMDERGDCVPKAQCPCYYDGEIFQPEDIFSDHHTMCYCEDGFMHCTMSGVPGSLLPDAVLSSPLSHRSKRSLSCRPPMVKLVCPADNLRAEGLECTKTCQNYDLECMSMGCVSGCLCPPGMVRHENRCVALERCPCFHQGKEYAPGETVKIGCNTCVCQDRKWNCTDHVCDATCSTIGMAHYLTFDGLKYLFPGECQYVLVQDYCGSNPGTFRILVGNKGCSHPSVKCKKRVTILVEGGEIELFDGEVNVKRPMKDETHFEVVESGRYIILLLGKALSVVWDRHLSISVVLKQTYQEKVCGLCGNFDGIQNNDLTSSNLQVEEDPVDFGNSWKVSSQCADTRKVPLDSSPATCHNNIMKQTMVDSSCRILTSDVFQDCNKLVDPEPYLDVCIYDTCSCESIGDCACFCDTIAAYAHVCAQHGKVVTWRTATLCPQSCEERNLRENGYECEWRYNSCAPACQVTCQHPEPLACPVQCVEGCHAHCPPGKILDELLQTCVDPEDCPVCEVAGRRFASGKKVTLNPSDPEHCQICHCDVVNLTCEACQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVPTTLYVEDISEPPLHEEPECNDITARLQYVKVGSCKSEVEVDIHYCQGKCASKAMYSIDINDVQDQCSCCSPTRTEPMQVALHCTNGSVVYHEVLNAMECKCSPRKCSK (SEQ ID NO: 11)
В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 11. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 11. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 11 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 11.
В одном из вариантов осуществления изобретения слитый белок является модифицированным белком FVIII на основе симоктокога альфа с двумя или более копиями пептида удлинения.
В этом варианте осуществления основной белок, предпочтительно, является идентичным или схожим с тяжелой цепью FVIII, в частности, с аминокислотами 20-759 UniprotKB P00451.1. Слитый белок с основным белком, идентичным или схожим с тяжелой цепью FVIII, в частности, с аминокислотами 20-759 UniprotKB P00451.1, предпочтительно, дополнительно содержит линкер, схожий или идентичный SEQ ID NO: 12, и дополнительную аминокислотную последовательность, схожую или идентичную легкой цепи, соответствующей аминокислотам 1668-2351 в записи UniprotKB P0045.1.
Пептиды удлинения можно подвергать слиянию с C-концом легкой цепи. Альтернативно, пептиды удлинения находится между тяжелой цепью и легкой цепью. В связи с этим, пептиды удлинения можно соединять с C-концом или N-концом линкера. Пептидами удлинения также можно заменять линкер. Кроме того, линкерная последовательность может прерываться одним или несколькими пептидами удлинения. Также возможно, чтобы пептиды удлинения находились между тяжелой и легкой цепью и на C-конце легкой цепи.
Предпочтительно, слитый белок, основанный на симоктокоге альфа, содержит, с N-конца к C-концу, тяжелую цепь FVIII, первую часть линкера, два или более, предпочтительно, три пептида удлинения (выделены полужирным шрифтом), вторую часть линкера (подчеркнута и выделена полужирным шрифтом) и легкую цепь. Примером такого белка является белок, определенный в SEQ ID NO: 14:
ATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPR SFSQNSRH QEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLHQEPGGLVVPPTDAPVSPTTLYVEDISEPPLH RYRRG EITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY (SEQ ID NO: 14)
В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 14. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 14. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 14 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 14.
Альтернативно, слитый белок, основанный на симоктокоге альфа, содержит два или более, предпочтительно, три пептида удлинения (выделены полужирным шрифтом), соединенных с C-концом симоктокога альфа. Примером такого белка является белок, определенный в SEQ ID NO: 21. В одном из вариантов осуществления аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90% по отношению к SEQ ID NO: 21. Аминокислотная последовательность слитого белка также может иметь идентичность по меньшей мере 95% по отношению к SEQ ID NO: 21. Кроме того, идентичность аминокислотной последовательности слитого белка по отношению к SEQ ID NO: 21 может составлять по меньшей мере 98%. В частности, аминокислотная последовательность слитого белка может иметь идентичность 100% по отношению к SEQ ID NO: 21.
Полинуклеотид
Во втором аспекте изобретение относится к выделенному полинуклеотиду, содержащему последовательность нуклеиновой кислоты, кодирующую слитый белок по первому аспекту изобретения.
Выделенный полинуклеотид может являться молекулой ДНК или молекулой РНК. Предпочтительно, выделенный полинуклеотид является молекулой ДНК, в частности, молекулой кДНК. Способы, используемые для выделения или клонирования полинуклеотида, кодирующего пептид, известны в этой области и включают выделение из геномной ДНК, получение из кДНК или их комбинацию. Клонирование полинуклеотидов из такой геномной ДНК можно осуществлять, например, с использованием хорошо известной полимеразной цепной реакции (ПЦР) или скрининга антител в экспрессионных библиотеках для определения клонированных фрагментов ДНК с общими структурными признаками (см., например, Innis et al, 1990) PCR: A Guide to Methods and Application, Academic Press, New York. Можно использовать другие способы амплификации нуклеиновой кислоты, такие как лигазная цепная реакция (LCR), активированная лигированием транскрипция (LAT) и амплификация на основе последовательности полинуклеотида (NASBA).
В частности, последовательность выделенного полинуклеотида может содержать первую часть, кодирующую основной белок, и по меньшей мере одну вторую часть последовательности. Первая часть, предпочтительно, является схожей или идентичной SEQ ID NO: 15. Первая часть, предпочтительно, имеет степень идентичности последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 15.
По меньшей мере одна вторая часть, предпочтительно, является схожей или идентичной SEQ ID NO: 16. Вторая часть, предпочтительно, имеет степень идентичности последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 16.
Выделенный полинуклеотид может являться молекулой ДНК, кодирующей слитый белок с аминокислотной последовательностью, схожей или идентичной последовательности, выбранной из группы, состоящей из SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 14 и SEQ ID NO: 21.
В частности, выделенный полинуклеотид может являться молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 4. Альтернативно, выделенный полинуклеотид может являться молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%. Кроме того, выделенный полинуклеотид может являться молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 5. В одном из вариантов осуществления выделенный полинуклеотид является молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 7. В одном из вариантов осуществления выделенный полинуклеотид является молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 8. В одном из вариантов осуществления выделенный полинуклеотид является молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 10. В одном из вариантов осуществления выделенный полинуклеотид является молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 11. В одном из вариантов осуществления выделенный полинуклеотид является молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 14. В одном из вариантов осуществления выделенный полинуклеотид является молекулой ДНК, кодирующей слитый белок, имеющий аминокислотную последовательность с идентичностью по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к SEQ ID NO: 21.
Выделенный полинуклеотид может являться молекулой ДНК с последовательностью, схожей или идентичной последовательности, выбранной из группы, состоящей из SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20 и SEQ ID NO: 22.
В одном из вариантов осуществления одна цепь выделенного полинуклеотида имеет идентичность последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 17.
В дополнительном варианте осуществления изобретения выделенный полинуклеотид имеет идентичность последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 18. В другом варианте осуществления выделенный полинуклеотид имеет идентичность последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 19. В одном из вариантов осуществления выделенный полинуклеотид имеет идентичность последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 20. В одном из вариантов осуществления выделенный полинуклеотид имеет идентичность последовательности по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% по отношению к SEQ ID NO: 20.
Список полинуклеотидных последовательностей:
SEQ ID NO: 15: ДНК, кодирующая OCTA 11 (AA 1-1268 SEQ ID NO: 2)
SEQ ID NO: 16: ДНК, кодирующая пептид удлинения (SEQ ID NO: 1)
SEQ ID NO: 17: ДНК, кодирующая про-OCTA 12 (SEQ ID NO: 5)
SEQ ID NO: 18: ДНК, кодирующая про-OCTA 14 (SEQ ID NO: 8)
SEQ ID NO: 19: ДНК, кодирующая про-OCTA 15 (SEQ ID NO: 11)
SEQ ID NO: 20: ДНК, кодирующая симоктоког альфа с тремя пептидами удлинения в линкерной области (SEQ ID NO 14)
SEQ ID NO: 22: последовательность ДНК, кодирующая симоктоког альфа с тремя C-концевыми пептидами удлинения (SEQ ID NO: 21)
Экспрессирующий вектор
В третьем аспекте изобретение также относится к экспрессирующим векторам, содержащим полинуклеотид по второму аспекту изобретения.
Экспрессирующий вектор, предпочтительно, дополнительно содержит контрольные элементы, такие как промотор и транскрипционные и трансляционные стоп-сигналы. Полинуклеотид по второму аспекту и контрольные элементы можно соединять для получения рекомбинантного экспрессирующего вектора, который может включать один или более участков рестрикции, чтобы сделать возможной инсерцию или замену полинуклеотида, кодирующего полипептид, в таких участках. Полинуклеотид можно встраивать в подходящий экспрессирующий вектор для экспрессии. При получении экспрессирующего вектора кодирующую последовательность располагают в экспрессирующем векторе таким образом, что кодирующая последовательность функционально связана с подходящими контрольными последовательностями для экспрессии.
Рекомбинантный экспрессирующий вектор может являться любым вектором (например, плазмидой или вирусом), который можно подвергать способам рекомбинантной ДНК и который может вызывать экспрессию полинуклеотида по четвертому аспекту изобретения. Выбор экспрессирующего вектора, как правило, будет зависеть от совместимости экспрессирующего вектора с клеткой-хозяином, в которую будут встраивать экспрессирующий вектор. Экспрессирующие векторы могут быть линейными или представлять собой замкнутую кольцевую плазмиду.
Экспрессирующий вектор, предпочтительно, адаптируют для экспрессии в клетках млекопитающих. Экспрессирующий вектор может являться автономно реплицирующимся вектором, т.е. вектором, существующим в экстрахромосомном виде, репликация которого не зависит от хромосомной репликации, например, плазмидой, экстрахромосомным элементом, минихромосомой или искусственной хромосомой. В случае автономной репликации вектор может дополнительно содержать участок начала репликации, позволяющий вектору автономно реплицироваться в интересующей клетке-хозяине. Участок начала репликации может являться любым плазмидным репликатором, опосредующим автономную репликацию, функционирующим в клетке. Термин "участок начала репликации" или "плазмидный репликатор" означает полинуклеотид, позволяющий плазмиде или вектору реплицироваться in vivo.
Вектор, предпочтительно, является вектором, который при встраивании в клетку-хозяина интегрируется в геном и реплицируется с хромосомами, в которые он интегрируется. В случае интеграции в геном клетки-хозяина экспрессирующий вектор может быть основан на любом другом элементе экспрессирующего вектора для интеграции в геном посредством гомологичной или негомологичной рекомбинации. Альтернативно, вектор может содержать дополнительные полинуклеотиды для регуляции интеграции посредством гомологичной рекомбинации в геном клетки-хозяина в конкретный участок хромосомы.
Векторы по настоящему изобретению, предпочтительно, содержат один или более (например, несколько) селективных маркеров, делающих возможной простую селекцию трансформированных, трансфицированных, трансдуцированных или т.п. клеток. Селективный маркер является геном, продукт которого обеспечивает биоцидное действие или вирусную резистентность, резистентность к тяжелым металлам, прототрофность у ауксотрофов и т.п.
Способы, используемые для лигирования описываемых выше элементов для конструирования рекомбинантных экспрессирующих векторов по настоящему изобретению хорошо известны специалисту в этой области (см., например, Sambrook et al., 1989, выше).
В одном из вариантов осуществления остов вектора по третьему аспекту выбран из pCDNA3, pCDNA3,1, pCDNA4, pCDNA5, pCDNA6, pCEP4, pCEP-puro, pCET1019, pCMV, pEF1, pEF4, pEF5, pEF6, pExchange, pEXPR, pIRES и pSCAS.
Клетка-хозяин
В четвертом аспекте изобретение относится к клетке-хозяину, содержащему экспрессирующий вектор по третьему аспекту изобретения. Экспрессирующий вектор по третьему аспекту встраивают в клетку-хозяина таким образом, что экспрессирующий вектор поддерживают в виде хромосомного интегранта или самореплицирующегося экстрахромосомного вектора, как описано выше. Термин "клетка-хозяин" включает любое потомство родительской клетки, не идентичное родительской клетке по причине мутаций, возникающих при репликации. Выбор клетки-хозяина, в значительной степени, будет зависеть от гена, кодирующего полипептид, и его источника.
В одном из вариантов осуществления слитый белок получают посредством экспрессии в линии клеток-хозяев млекопитающего. Слитый белок, предпочтительно, получают в линии клеток-хозяев человека. В целом, любая линия клеток-хозяев человека подходит для экспрессии слитого белка. Предпочтительного гликозилирования слитого белка, в частности, достигают с использованием линий клеток почки человека. Предпочтительными линиями клеток почки человека являются линии клеток HEK, в частности, линии клеток HEK 293.
Примерами линий клеток HEK для получения гликозилированного полипептида являются HEK 293 F, Flp-In™-293 (Invitrogen, R75007), 293 (ATCC® CRL-1573), 293 EBNA, 293 H (ThermoScientific 11631017), 293S, 293T (ATCC® CRL-3216™), 293T/17 (ATCC® CRL11268™), 293T/17 SF (ATCC® ACS4500™), HEK 293 STF (ATCC® CRL 3249™), HEK-293.2sus (ATCC® CRL-1573™). Предпочтительной линией клеток для получения полипептида является линия клеток HEK 293 F.
Другие линии клеток, подходящие в качестве клеток-хозяев для экспрессии, включают линии клеток, полученные из клеток миелолейкоза человека. Конкретными примерами клеток-хозяев являются K562, NM-F9, NM-D4, NM-H9D8, NM-H9D8-E6, NM H9D8- E6Q12, GT-2X, GT-5s и клетки, полученные из любых из указанных клеток-хозяев. K562 является линией клеток миелолейкоза человека, находящейся в American Type Culture Collection (ATCC CCL-243). Остальные линии клеток получают из клеток K562 и выбирают по конкретным признакам гликозилирования.
Применение слитого белка
Как показано в примерах, пептиды удлинения SEQ ID NO: 1 в слитых белках OCTA 12 и OCTA 14 не только приводят к повышению времени полужизни слитого белка по сравнению с основным белком, т.е. фрагментом VWF. Слитые белки OCTA 12 и OCTA 14 при введении пациенту вместе с FVIII, партнером по связыванию VWF, также приводят к повышению времени полужизни FVIII.
Таким образом, в пятом аспекте изобретение относится к применению слитого белка по первому аспекту для повышения времени полужизни второго белка, где слитый белок способен связываться с указанным вторым белком.
Применение также можно описать как способ лечения пациента с использованием терапевтического белка, где способ включает введение терапевтического белка, например, белка FVIII вместе со слитым белком по первому аспекту.
Композиция и белковый комплекс
Таким образом, концепция изобретения, а именно пролонгирование времени полужизни, обеспечиваемое пептидами удлинения, не ограничено слитым белком, но, кроме того, можно повышать время полужизни второго белка, связывающегося со слитым белком.
Таким образом, в шестом аспекте изобретение относится к композиции первого белка и второго белка, где указанный первый белок является слитым белком по первому аспекту и способен связываться с указанным вторым белком, и указанный второй белок является терапевтическим белком, содержащим аминокислотную последовательность, идентичную или схожую с аминокислотной последовательностью второго белка млекопитающего или его фрагмента.
Первый белок может связываться со вторым белком ковалентно или нековалентно с образованием комплекса. Таким образом, настоящее изобретение также относится к комплексу первого белка и второго белка, где указанный первый белок является слитым белком по первому аспекту, и указанный второй белок имеет аминокислотную последовательность, идентичную или схожую с аминокислотной последовательностью второго белка млекопитающего или его фрагмента. Таким образом, комплексы образуются посредством нековалентного связывания первого белка со вторым белком.
В одном из вариантов осуществления первый белок связывается со вторым белком ковалентно. Линкер, облегчающий связывание первого и второго белка, можно выбирать из дисульфидного мостика, пептидной связи, химического линкера или гликозидной связи.
Альтернативно, первый белок связывается со вторым белком нековалентно. В случае нековалентного связывания первый белок, в частности, может содержать специфический связывающий домен, делающий возможным связывание указанного второго белка, т.е. связывающий домен второго белка. В зависимости от локализации одного или нескольких пептидов удлинения в последовательности первого белка они могут находиться в разных положениях первого белка. Предпочтительно, один или более пептидов удлинения локализуются в положении, экспонируемом на поверхности белка в свернутом состоянии. Один или более пептидов удлинения могут находиться в любом положении относительно участка связывания второго белка, например, связывающего домена.
В одном из вариантов осуществления композиции один или более пептидов удлинения находятся в положении первого белка в свернутом состоянии, не мешающем связыванию первого белка со вторым белком.
В одном из вариантов осуществления время полужизни второго белка, например, FVIII, связанного с первым белком, например, фрагментом VWF, повышается по сравнению со свободной формой указанного второго белка, например, белка FVIII.
Предпочтительно, время полужизни второго белка, например, белка FVIII, связанного с первым белком, например, OCTA 12, повышается по сравнению с указанным вторым белком, связанным с нативным белком млекопитающего, например, зрелым VWF.
Более предпочтительно, второй белок, например, белок FVIII, связанный с первым белком, например, OCTA 12, повышается по сравнению с указанным вторым белком, связанным с основным белком, без слитого пептида, например, OCTA 11.
Второй белок млекопитающего можно выбирать из списка, представленного выше для белка млекопитающего. Однако в композиции или комплексе второй белок млекопитающего не является тем же, что и первый белок млекопитающего.
В одном из вариантов осуществления второй белок млекопитающего является белком крови, в частности, белком крови человека. Предпочтительно, второй белок млекопитающего является фактором свертывания, в частности, фактором свертывания человека.
В одном из вариантов осуществления второй белок млекопитающего, по отношению к которому основной белок является схожим или идентичным, является полноразмерным FVIII человека, определяемым по аминокислотам 20-2351 UniProtKB P00451.1. В другом варианте осуществления основной белок является FVIII, в котором отсутствует, по меньшей мере, часть B-домена. В связи с этим может отсутствовать весь B-домен. Отсутствующую часть B-домена, необязательно, заменяют линкером. Линкерная последовательность, в частности, имеет следующую аминокислотную последовательность SFSQNSRHQAYRYRRG (SEQ ID NO: 12). Примером FVIII, в котором B-домен заменяют линкером, является симоктоког альфа (SEQ ID NO: 13), активный ингредиент Nuwiq® или Vihuma®.
В одном из вариантов осуществления белок FVIII является белком FVIII человека со сниженным иммунным ответом у пациентов.
Сниженный иммунный ответ на белок FVIII, предпочтительно, основан на связывании с SIGLEC SIG-5, SIG-7, SIG-8 и SIG-9. Не будучи связанными какой-либо теорией, полагают, что связывание с SIGLEC на антигенпрезентирующих клетках (подобных, например, дендритным клеткам) приводит к отрицательной регуляции экспрессии провоспалительных рецепторов и положительной регуляции экспрессии иммуносупрессорных рецепторов на поверхности клетки. Кроме того, связывание приводит к повышенной продукции противовоспалительных цитокинов, сниженной продукции провоспалительных цитокинов и, в результате, к ингибированию пролиферации T-клеток и продукции антител. Таким образом, связывание SIGLEC SIG-5, SIG-7, SIG-8 и SIG-9 приводит к сниженному иммунному ответу или повышенной иммунологической толерантности, когда гликозилированный полипептид вводят пациенту.
Связывание SIGLEC и, таким образом, сниженный иммунный ответ основаны на повышении количества или процентной доли O-гликанов с сиалированным кором 2 и/или удлиненным кором 1 в гликозилированном белке по сравнению с количеством O-гликанов с сиалированным кором 2 и/или удлиненным кором 1 природного FVIII человека.
Таким образом, в одном из вариантов осуществления белок FVIII имеет повышенное количество или процентную долю O-гликанов с сиалированным кором 2 и/или удлиненным кором 1 в гликозилированном белке по сравнению с количеством O-гликанов с сиалированным кором 2 и/или удлиненным кором 1 природного FVIII человека.
В случае, когда второй белок является белком FVIII, основной белок первого белка, предпочтительно, является фрагментом VWF, содержащим связывающий домен FVIII, что делает возможным связывание с белком FVIII.
В одном из вариантов осуществления композиции первый белок имеет аминокислотную последовательность с идентичностью по меньшей мере 95%, предпочтительно - по меньшей мере 98% более предпочтительно - 100% по отношению к SEQ ID NO: 3, и второй белок имеет аминокислотную последовательность с идентичностью по меньшей мере 95%, предпочтительно - по меньшей мере 98%, более предпочтительно - 100% по отношению к SEQ ID NO: 13.
В одном из вариантов осуществления композиции первый белок имеет аминокислотную последовательность с идентичностью по меньшей мере 95%, предпочтительно - по меньшей мере 98%. более предпочтительно - 100% по отношению к SEQ ID NO: 6, и второй белок имеет аминокислотную последовательность с идентичностью по меньшей мере 95%, предпочтительно - по меньшей мере 98% более предпочтительно - 100% по отношению к SEQ ID NO: 13.
В одном из вариантов осуществления композиции первый белок имеет аминокислотную последовательность с идентичностью по меньшей мере 95%, предпочтительно - по меньшей мере 98% более предпочтительно - 100% по отношению к SEQ ID NO: 9, и второй белок имеет аминокислотную последовательность с идентичностью по меньшей мере 95%, предпочтительно - по меньшей мере 98%, более предпочтительно - 100% по отношению к SEQ ID NO: 13.
Т.к. в крови пациента слитый белок, содержащий фрагмент VWF, в частности, OCTA 12, конкурирует с эндогенным VWF за связывание с белком FVIII, предпочтительно, чтобы композиция содержала слитый белок, содержащий фрагмент VWF, в частности, OCTA 12, в молярном избытке по сравнению с белком FVIII.
Предпочтительно, молярное соотношение первого белка и второго белка находится в диапазоне от 0,1 до 250, предпочтительно - в диапазоне от 0,5 до 50, более предпочтительно - в диапазоне от 1 до 25, наиболее предпочтительно - в диапазоне от 2 до 10.
Для образования стабильного нековалентно связанного комплекса и, таким образом, пролонгирования времени полужизни второго белка аффинность связывания первого белка со вторым белком, определяемая равновесной константой диссоциации (KD), должна составлять менее 10 мкМ. Предпочтительно, равновесная константа диссоциации фрагмента VWF в первом белке и белка FVIII находится в диапазоне от 0,05 до 3 нМ.
Первый и второй белок можно получать посредством раздельной рекомбинантной экспрессии, а затем соединять. Альтернативно, первый и второй белок рекомбинантно экспрессируют в одной клетке. В этом случае первый и второй белок могут кодироваться одним вектором или двумя разными векторами.
Конструкции VWF, используемые в примерах, т.е. OCTA 12, OCTA 14 и OCTA 15, экспрессировали в форме их про-белков, что приводит к образованию димеров или, в случае OCTA 15, к образованию мультимеров. Эти димеры остаются интактными даже после расщепления про-пептида, и, таким образом, каждая из копий конструкции VWF в димере может связываться с белком FVIII. Таким образом, в одном из вариантов осуществления комплекс содержит две копии первого и второго белка, где две копии первого белка образуют димер. Этот димер первого белка, предпочтительно, является нековалентно связанным димером.
Фармацевтическая композиция и медицинское применение
Как описано выше, слитый белок по первому аспекту, композиция по шестому аспекту и комплекс по седьмому аспекту изобретения обладают преимуществом повышенного времени полужизни в крови пациентов и, таким образом, повышенного терапевтического эффекта у пациентов. Таким образом, слитый белок по первому аспекту, композиция по шестому аспекту и комплекс по седьмому аспекту, в частности, применимы в качестве активных ингредиентов для лечения. Предпочтительно, они применимы для лечения или профилактики нарушения свертываемости. Слитый белок по первому аспекту, композицию по шестому аспекту, в частности, белковый комплекс, представленный в настоящем описании, можно вводить в отдельности или в форме фармацевтических композиций.
Таким образом, в восьмом аспекте изобретение относится к фармацевтической композиции слитого белка по первому аспекту, композиции по шестому аспекту и комплекса по седьмому аспекту.
По изобретению фармацевтическая композиция может содержать эффективное количество слитого белка по первому аспекту, композиции по шестому аспекту и комплекса по седьмому аспекту, составленных по меньшей мере с одним фармацевтически приемлемым носителем. Фармацевтические композиции по вариантам осуществления можно получать и вводить индивидууму любыми способами, хорошо известными в области фармацевтики. См., например, Goodman & Gilman's The Pharmacological Basis of Therapeutics, Hardman et al., eds., McGraw-Hill Professional (10th ed., 2001); Remington: The Science and Practice of Pharmacy, Gennaro, ed., Lippincott Williams & Wilkins (20th ed., 2003); and Pharmaceutical Dosage Forms and Drug Delivery Systems, Ansel et al. (eds), Lippincott Williams & Wilkins (7th ed., 1999). Кроме того, фармацевтические композиции по вариантам осуществления также можно составлять так, чтобы они включали другие медицински применимые лекарственные средства или биологические средства. Фармацевтическая композиция, как правило, содержит терапевтически эффективное количество слитого белка или белкового комплекса в комбинации с фармацевтически приемлемым носителем. Фармацевтически приемлемый носитель является любым носителем, известным в этой области. Примеры фармацевтически приемлемых носителей включают стерильную воду без пирогенов и стерильный физиологический раствор без пирогенов. Другие формы фармацевтически приемлемых носителей, которые можно использовать для вариантов осуществления изобретения, включают связывающие средства, разрыхлители, поверхностно-активные вещества, ускорители абсорбции, влагоудерживающие средства, абсорбирующие средства, смазочные средства, наполнители, увлажнители, консерванты, стабилизаторы, эмульгаторы, солюбилизаторы, соли, контролирующие осмотическое давление, разбавители, такие как буферы, и эксципиенты, как правило, используемые в зависимости от используемой формы состава. Необязательно, их выбирают и используют в соответствии с единицей дозирования полученного состава.
Таким образом, девятый аспект изобретения также относится к способу лечения или профилактики нарушения свертываемости у пациента, включающему введение указанному пациенту фармацевтической композиции по восьмому аспекту.
В рамках изобретения термин "нарушение свертываемости" относится к заболеванию или состоянию, нарушающему нормальный гемостаз. Нарушение свертываемости может являться, например, гемофилией A, гемофилией B, недостаточностью фактора VIII, недостаточностью фактора XI, болезнью фон Виллебранда, тромбастенией Гланцманна, синдромом Бернара-Сулье, идиопатической тромбоцитопенической пурпурой, внутримозговым кровоизлиянием, травмой, черепно-мозговой травмой и т.п.
В рамках изобретения термин "гемофилия" относится к группе нарушений свертываемости, ассоциированных с повышенным временем свертывания по сравнению с временем свертывания у здоровых индивидуумов без гемофилии. Гемофилия включает гемофилию A, являющуюся нарушением, приводящим к продукции дефектного фактора VIII, гемофилию B, являющуюся нарушением, приводящим к продукции дефектного фактора IX, и приобретенную гемофилию A, редкое нарушение свертываемости, вызываемое аутоантителами против фактора свертывания (F) VIII.
Нарушение свертываемости, предпочтительно, является гемофилией A или B. Лечение может представлять собой, например, лечение гемофилии PUPS (пациентов, ранее не подвергнутых лечению), или лечение с индукцией иммунологической толерантности (ITI), и/или другое лечение родственных гемофилических нарушений.
Для применения in vivo фармацевтические композиции можно вводить пациенту любым общепринятым способом введения, например, перорально, парентерально или посредством ингаляции. Парентеральное введение включает внутривенную инъекцию, подкожную инъекцию, интраперитонеальную инъекцию, внутримышечную инъекцию, введение жидких средств, суспензий, эмульсий и капельное введение. В случае парентерального введения фармацевтическая композиция должна являться инъецируемым средством, таким как жидкое средство или суспензия.
В других вариантах осуществления фармацевтическую композицию вводят пациенту перорально. В этих вариантах осуществления форма лекарственного средства включает твердые составы, такие как таблетки, таблетки с покрытием, порошки, гранулы, капсулы и пилюли, жидкие составы, такие как жидкие средства (например, глазные капли, назальные капли), суспензия, эмульсия и сироп, ингаляционные средства, такие как аэрозольные средства, атомайзеры и небулайзеры, и липосомные средства. В некоторых других вариантах осуществления гликозилированный полипептид, белковый комплекс или фармацевтическую композицию вводят посредством ингаляции в дыхательные пути пациента для воздействия на трахею и/или легкие индивидуума.
В одном из вариантов осуществления восьмого аспекта применение включает внутривенную или невнутривенную инъекцию. Невнутривенная инъекция, предпочтительно, является подкожной инъекцией.
Все публикации и патенты, процитированные в описании, включены в него в полном объеме в качестве ссылок. Если материал, включенный в качестве ссылки, противоречит или не соответствует описанию, описание обладает приоритетом относительно любого такого материала.
ПРИМЕРЫ
Пример 1 - Рекомбинантная экспрессия белков VWF
Следующие рекомбинантные белки VWF транзиторно экспрессировали в линии клеток HEK 293 F с C-концевой меткой Strep-Tag и очищали посредством аффинной хроматографии StrepTactin (IBA GmbH):
- OCTA 11
- OCTA 12
OCTA 12 является слитым белком по изобретению. OCTA 11 является сравнительным фрагментом VWF. Белки VWF схематически изображены на фиг. 1. Экспрессия про-белков приводит к образованию димеров. Пептидные димеры также остаются после расщепления пропептида.
Синтез и клонирование генов
В качестве первой стадии, гены, кодирующие про-белки белков VWF, синтезировали в GeneArt (Thermo Fisher Scientific):
- про-OCTA 11
- про-OCTA 12
Гены, кодирующие про-белки, клонировали в экспрессирующий вектор pDSG (IBA GmbH), содержащий метку Twin-Strep-tag. Отдельные культуры E.coli TOP10 (IBA GmbH) трансформировали с использованием векторных конструкций и отдельные клоны подвергали селекции после инкубации в течение ночи при 37°C на чашках с содержащим ампициллин LB-агаром.
Получение плазмидной ДНК осуществляли с использованием наборов QIAamp DNA Mini или Maxi kit (Qiagen) по инструкциям производителя. С помощью секвенирования подтверждали целостность векторов, в частности, правильную ориентацию и целостность генов, кодирующих про-OCTA 11, про-OCTA 12.
Экспрессия белка
Для эукариотической экспрессии белков VWF клетки MEXi-293 (IBA GmbH), выращенные в среде для трансфекции MEXi (IBA GmbH), трансфицировали с использованием 1,5 мг/л конструкций с использованием 4,5 мг/мл линейного полиэтиленимина 25 кДа. После инкубации в течение 2-4 при 37°C, 5% CO2 и 100-150 об./мин., культуру разводили 1:2 средой для трансфекции MEXi и продолжали культивирование до достижения жизнеспособности клеток 75%.
Затем супернатант отделяли от клеток посредством центрифугирования при 4°C и 300×g. Для минимизации ингибиторного эффекта биотина в среде для культивирования клеток и для коррекции pH к супернатанту добавляли 0,1 объема буфера (1 M Трис-HCl, 1,5 мМ NaCl, 10 мМ ЭДТА, pH 8,0) и 0,09% (об./об.) раствора BioLock (IBA GmbH) и инкубировали в течение 20 мин при 4°C.
Очистка белка
После центрифугирования супернатант наносили на колонку Strep-Tactin XT (IBA GmbH), промывали пять раз промывочным буфером (100 мМ Трис-HCl, 150 мМ NaCl, 1 мМ ЭДТА, pH 8,0) и связанные белки, содержащие метку Strep-tag, элюировали с помощью элюирующего буфера (100 мМ Трис-HCl, 150 мМ NaCl, 1 мМ ЭДТА, 10 мМ дестиобиотин, pH 8,0).
Пример 2 - Влияние полноразмерного VWF или белков VWF на время полужизни FVIII при совместном введении с FVIII мышам с двойным нокаутом (DKO) FVIII/VWF
2.1 Предпосылки
В этом эксперименте исследовали влияние белков VWF, полученных по примеру 1, и полноразмерного, полученного из плазмы VWF (pdVWF) на время полужизни FVIII.
Известно, что полноразмерный VWF и FVIII являются партнерами по связыванию, образующими нековалентный комплекс. Время полужизни FVIII в кровотоке определяется, в основном, временем полужизни VWF в кровотоке.
Т.к. в сыворотке эндогенный VWF конкурирует с вводимыми белками VWF (фрагментами) за связывание с FVIII, это конкурирование будет влиять на любой эффект вводимых белков VWF в отношении времени полужизни FVIII.
Таким образом, в этом эксперименте мышей C57Bl/6 с двойным нокаутом FVIII и VWF (FVIII/VWF-DKO) использовали в качестве модельных организмов для оценки влияния VWF на время полужизни FVIII.
2.2 Эксперимент
2.2.1 FVIII-содержащие продукты
Получали следующие FVIII-содержащие продукты:
1) FVIII в отдельности
2) FVIII и OCTA 11
3) FVIII и OCTA 12
4) FVIII и pdVWF
Белки VWF OCTA 11 и OCTA 12 получали, как описано в примере 1. pdVWF представлял собой концентрат VWF Wilate (Octapharma). FVIII являлся FVIII с делецией B-домена из линии клеток человека (Nuwiq, Octapharma). Продукт Nuwiq содержит следующую буферную композицию:
Аргинин HCl | 25,6 мМ |
Сахароза | 15,8 мМ |
NaCl | 308 мМ |
Плюроник F68 | 0,14 мМ |
Цитрат натрия | 3,6 мМ |
Хлорид кальция | 2,0 мМ |
Молярное соотношение белка VWF и FVIII в FVIII-содержащих продуктах 2)-4) составляло 5:1. Белки VWF добавляли в продукт Nuwiq (FVIII).
2.2.2 Линия мышей FVIII/VWF-DKO
Использовали мышей C57Bl/6 с двойным нокаутом FVIII и VWF (FVIII/VWF-DKO).
2.2.3 Введение продуктов
Четыре FVIII-содержащих продукта вводили 20 мышам FVIII/VWF-DKO посредством инфузии в хвостовую вену в дозе 240 МЕ FVIII/кг (~6 МЕ/мышь).
2.2.4 Забор образцов и анализ
Образцы крови мышей получали через 5 минут и 1, 4, 8, 12, 24, 36 и 48 часов после введения FVIII-содержащих продуктов. Образцы крови получали из ретроорбитального сосудистого сплетения мышей. Для каждой временной точки получали образцы крови 5 мышей на FVIII-содержащий продукт и анализировали по отдельности. Образец от каждой мыши получали во временной точке 5 мин и максимально в двух дополнительных временных точках.
Активность FVIII в каждом из образцов крови анализировали с использованием хромогенного анализа (CHROMOGENIX).
2.3 Результаты
Вместе со значениями активности FVIII в образцах крови определяли динамику активности FVIII для каждого из FVIII-содержащих продуктов, как показано на фиг. 2.
Как и для каждой временной точки и FVIII-содержащего продукта, проводили измерения в образцах крови пяти животных, каждая точка данных на фиг. 2 представляет собой среднее для 5 значений.
Кроме того, активность FVIII в отдельных временных точках представляли в виде процента активности FVIII через 5 минут после введения, которую определяли как 100% активности для каждого из FVIII-содержащих продуктов.
Время полужизни FVIII в пяти продуктах вычисляли после аппроксимации кривой с использованием линейного регрессионного анализа линейно-логарифмической части отдельных кривых концентрация в плазме-время или посредством нелинейной регрессии с использованием однофазной модели экспоненциального уменьшения. Программным обеспечением, используемым для вычисления, являлось GraphPad Prism версии 6.07 (La Jolla, CA 92037 USA) и WinNonlin версии 6.4 (Pharsight Corporation, Mountain View, CA, USA).
Вычисления были основаны на следующих уравнениях:
Kel=константа скорости элиминации
t½=время полувыведения
c=концентрация
t=время
Результаты представлены в таблице 1.
Таблица 1. Конечное время полужизни FVIII у мышей DKO | |
FVIII-содержащий продукт | t1/2 [ч.] |
1) FVIII в отдельности | 0,07 |
2) FVIII и OCTA 11 | 0,45 |
3) FVIII и OCTA 12 | 1,03 |
4) FVIII и flVWF | 0,32 |
Из этих чисел очевидно, что совместное введение FVIII с любым из белков VWF приводит к повышению времени полужизни. Совместное введение FVIII с pdVWF приводит к ~4,6-кратному повышению времени полужизни FVIII (0,31).
FVIII, вводимый совместно с белком VWF OCTA 11, демонстрирует сравнимое время полужизни 0,45 ч. (приблизительно 1,4-кратное повышение).
Примечательно, что совместное введение с белком VWF OCTA 12 приводит к времени полужизни FVIII 1,03 ч., что представляет собой повышение приблизительно в 3,2 раза по сравнению с flVWF. Повышение является 14,7-кратным по сравнению с FVIII.
Эти результаты свидетельствуют о том, что дополнительные O-гликановые повторы, присутствующие в OCTA 12, приводят к значительному эффекту пролонгирования времени полужизни в отношении фрагмента VWF и, в свою очередь, комплекса VWF/FVIII. Кроме того, эти результаты свидетельствуют о том, что добавление копий характерного O-гликанового кластера может повышать время полужизни белка.
Пример 3 - Фармакокинетический профиль FVIII и VWF OCTA 12 после IV и подкожного (SQ) введения у карликовых свиней
3.1 Предпосылки
Доставка SQ лекарственных средств привлекает все больше внимания в области факторов свертывания. Однако по причине очень низкого высвобождения этот путь пока не применим для введения FVIII. Карликовая свинья является наиболее известной моделью на животных для тестирования SQ введения лекарственных средств по причине близкого сходства со структурой эпидермиса человека. Целью этого эксперимента являлась оценка времени полужизни VWF OCTA 12 и FVIII при введении в отдельности или с пятикратным молярным избытком OCTA 12 у карликовой свиньи с помощью SQ пути. Кроме того, время полужизни FVIII при введении в отдельности общепринятым IV путем сравнивали с FVIII, вводимым SQ с VWF OCTA 12 или без него.
3.2 Эксперимент
Для этого исследования использовали девять самок карликовых свиней Aachener возрастом от 10 до 14 месяцев. Масса тела составляла от 13,7 до 19,5 кг. IV инъекцию делали в латеральную ушную вену, SQ инъекцию делали под кожу в паховой области. Доза составляла 100 ед. FVIII/кг BW, использовали 3 животных на группу с каждым продуктом:
- Группа 1: FVIII в отдельности, SQ
- Группа 2: FVIII с OCTA 12, SQ
- Группа 3: FVIII в отдельности, IV
Для получения 2×200 мкл плазмы с цитратом натрия на животное и время забора собирали достаточное количество крови из яремной вены всех животных в следующие моменты времени: 0 (до введения дозы), 0,5, 1, 2, 4, 8, 24, 32, 48, 72, 96 и 120 ч. после каждого введения.
Цельную кровь собирали в пробирки, содержащие цитрат натрия (0,15 M) в качестве антикоагулянта, и сразу охлаждали с использованием системы IsoTherm-Rack (Eppendorf). Плазму отделяли посредством центрифугирования в пределах 30 минут после забора крови. Сразу после центрифугирования образцы плазмы замораживали и хранили при ≤-20°C до транспортировки.
Каждый образец тестировали на антиген FVIII с использованием набора Asserachrom (Diagnostica Stago). OCTA 12 количественно анализировали с использованием анализа ELISA следующим образом: покрытый Strep-Tactin® XT микропланшет (IBA GmbH) блокировали блокирующим буфером (1% BSA in PBS) в течение 2 ч. при RT. Образцы плазмы разводили блокирующим буфером 1:15 и наносили на планшет. Через 2 ч. инкубации при 37°C фрагмент VWF определяли с использованием pAb против VWF (Dako P0226). После каждой инкубации планшет промывали 3 раза 0,1% Tween в PBS.
Фармакокинетическую оценку данных анализа осуществляли с использованием WinNonlin версии 6.4 (Pharsight Corporation, Mountain View, CA, USA).
3.3 Результаты
На фигуре 3 показана динамика концентрации VWF OCTA 12 в плазме карликовой свиньи после SQ введения смеси FVIII/VWF OCTA 12. Как представлено в таблице 2, OCTA 12 циркулирует с временем полужизни 219,31 ч. Время полужизни определяли, как описано в примере 2.
Таблица 2. Фармакокинетические параметры антигена VWF OCTA 12 у карликовых свиней. Значения представляют собой среднее±SD для трех животных. | |||||
Фармакокинетические параметры антигена OCTA 12 | |||||
Группа/доза/путь | C max [нМ] | t max [ч.] | t 1/2 [ч.] | ||
Группа 2: 100 ед./кг BW FVIII с OCTA 12 SQ. |
0,93±0,38 | 8,00 | 219,31 | ||
Cmax | наибольшая измеренная концентрация в плазме | ||||
tmax | время Cmax | ||||
t1/2 | конечное время полужизни |
У свиней с болезнью фон Виллебранда (VWD) время полужизни полноразмерного рекомбинантного VWF человека (rhVWF) составляет приблизительно от 10 до 16 часов, и время полужизни полученного VWF свиньи в плазме составляет от 10 до 18 часов (Nichols et al.). Время полужизни фрагмента VWF, содержащего только связывающие домены FVIII, меньше времени полужизни flVWF, как показано Yee et al. на мышах с недостаточностью VWF. Таким образом, время полужизни OCTA 12 составляет приблизительно в 14-22 раза больше времени полужизни rhVWF у свиньи.
Кроме того, также наблюдали значительный эффект пролонгирования в отношении времени полужизни FVIII. Как показано на фигуре 4 и в таблице 3, FVIII при совместном введении с OCTA 12 имеет время полужизни 25,3 ч, что представляет собой 6,7-кратное повышение времени полужизни по сравнению с FVIII в отдельности, вводимого тем же путем (SQ), и 3,9-кратное улучшение по сравнению с FVIII, вводимым в отдельности общепринятым IV путем.
Таблица 3. Фармакокинетические параметры антигена FVIII у карликовых свиней. Значения представляют собой среднее±SD для трех животных. | |||
Фармакокинетические параметры антигена FVIII | |||
Группа/доза/путь |
C
max
[ед./мл] |
t
max
[ч.] |
t
1/2
[ч.] |
Группа 1: 100 ед./кг BW FVIII в отдельности SQ |
0,03±0,015 | 8,00 | 3,78±1,31 |
Группа 2: 100 ед./кг BW FVIII с OCTA 12 SQ |
0,178±0,09 | 8,00 | 25,30±11,24 |
Группа 3: FVIII в отдельности IV |
2,56±0,26 | 1,00 | 6,45±2,32 |
Множество модификаций и других вариантов осуществления изобретения, представленного в настоящем описании, будут очевидны специалисту в области, к которой относится изобретение, который может извлечь пользу из идеи, представленной в изложенном выше описании и прилагаемых чертежах. Таким образом, следует понимать, что изобретение не должно быть ограничено конкретными описанными вариантами осуществления, и что в объем формулы изобретения должны быть включены модификации и другие варианты осуществления. Хотя в настоящем описании используют конкретные термины, их используют исключительно в общем и описательном смысле, а не для ограничения.
ССЫЛКИ
Birken S, Canfield RE. Isolation and amino acid sequence of COOH-terminal fragments from the beta subunit of human choriogonadotropin. J Biol Chem. 1977; vol. 252 pg. 5386-5392
Ewenstein BM, Collins P, Tarantino MD, Negrier C, Blanchette V, Shapiro AD, Baker D, Spotts G, Sensel M, Yi SE, Gomperts ED. Hemophilia therapy innovation development of an advanced category recombinant factor VIII by a plasma/albumin-free method Proceedings of a Special Symposium at the XIXth Congress of the International Society on Thrombosis and Haemostasis; 2004, vol. 41, pg. 1-16.
Fischer B, Mitterer A, Schlokat U, DenBouwmeester R, Dorner ʺStructural analysis of recombinant von Willebrand factor: identification of hetero- and homo-dimersʺ FFEBS Lett. 1994 Sep 12; 351(3):345-8. Erratum in: FEBS Lett 1994 Oct 24; 353(3):337.
Furlan M. ʺVon Willebrand factor: molecular size and functional activityʺ Ann Hematol. 1996 Jun; 72(6):341-8.
Kannicht C, Ramstrom M, Kohla G, et al. Characterisation of the post-translational modifications of a novel, human cell line-derived recombinant human factor VIII. Thromb Res. 2013; 131(1):78-88.
Needleman SB, Wunsch CD. A general method applicable to the search for similarities in the amino acid sequence of two proteins. J Mol Biol. 1970; vol. 48(3); pg. 443-453.
Nichols TC, Bellinger DA, Merricks EP, et al. Porcine and Canine von Willebrand Factor and von Willebrand Disease: Hemostasis, Thrombosis, and Atherosclerosis Studies. Thrombosis. 2010;2010:461238.
Strohl WR. Fusion Proteins for Half-Life Extension of Biologics as a Strategy to Make Biobetters. BioDrugs. 2015 Aug; vol. 29(4), pg. 215-239.
Tiede A. Half-life extended factor VIII for the treatment of hemophilia A. J Thromb Haemost. 2015 Jun; vol. 13 Suppl 1; pg. S176-179
Vlot AJ, Koppelman SJ, Meijers JC, Dama C, van den Berg HM, Bouma BN, Sixma JJ, Willems GM. Kinetics of factor VIII-von Willebrand factor association. Blood. 1996 1; vol. 87(5); pg. 1809-1816
Yee A, Gildersleeve RD, Gu S, Kretz CA, McGee BM, Carr KM, Pipe SW, Ginsburg D. A von Willebrand factor fragment containing the D'D3 domains is sufficient to stabilize coagulation factor VIII in mice. Blood. 2014 Jul 17; vol. 124(3); pg. 445-452.
Innis et al, 1990 PCR: A Guide to Methods and Application, Academic Press, New York.
--->
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> Octapharma AG
<120> ГЛИКОЗИЛИРОВАННЫЕ СЛИТЫЕ БЕЛКИ VWF С УЛУЧШЕННОЙ ФАРМАКОКИНЕТИКОЙ
<130> 4830P1098WORU
<140> 2018144112
<141> 2017-04-26
<150> EP 16170690.8
<151> 2016-05-20
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 31
<212> БЕЛОК
<213> Homo sapiens
<400> 1
Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser
1 5 10 15
Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His
20 25 30
<210> 2
<211> 2813
<212> БЕЛОК
<213> Homo sapiens
<400> 2
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Val Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Arg Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr
1235 1240 1245
Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser
1250 1255 1260
Glu Pro Pro Leu His Asp Phe Tyr Cys Ser Arg Leu Leu Asp Leu
1265 1270 1275
Val Phe Leu Leu Asp Gly Ser Ser Arg Leu Ser Glu Ala Glu Phe
1280 1285 1290
Glu Val Leu Lys Ala Phe Val Val Asp Met Met Glu Arg Leu Arg
1295 1300 1305
Ile Ser Gln Lys Trp Val Arg Val Ala Val Val Glu Tyr His Asp
1310 1315 1320
Gly Ser His Ala Tyr Ile Gly Leu Lys Asp Arg Lys Arg Pro Ser
1325 1330 1335
Glu Leu Arg Arg Ile Ala Ser Gln Val Lys Tyr Ala Gly Ser Gln
1340 1345 1350
Val Ala Ser Thr Ser Glu Val Leu Lys Tyr Thr Leu Phe Gln Ile
1355 1360 1365
Phe Ser Lys Ile Asp Arg Pro Glu Ala Ser Arg Ile Thr Leu Leu
1370 1375 1380
Leu Met Ala Ser Gln Glu Pro Gln Arg Met Ser Arg Asn Phe Val
1385 1390 1395
Arg Tyr Val Gln Gly Leu Lys Lys Lys Lys Val Ile Val Ile Pro
1400 1405 1410
Val Gly Ile Gly Pro His Ala Asn Leu Lys Gln Ile Arg Leu Ile
1415 1420 1425
Glu Lys Gln Ala Pro Glu Asn Lys Ala Phe Val Leu Ser Ser Val
1430 1435 1440
Asp Glu Leu Glu Gln Gln Arg Asp Glu Ile Val Ser Tyr Leu Cys
1445 1450 1455
Asp Leu Ala Pro Glu Ala Pro Pro Pro Thr Leu Pro Pro Asp Met
1460 1465 1470
Ala Gln Val Thr Val Gly Pro Gly Leu Leu Gly Val Ser Thr Leu
1475 1480 1485
Gly Pro Lys Arg Asn Ser Met Val Leu Asp Val Ala Phe Val Leu
1490 1495 1500
Glu Gly Ser Asp Lys Ile Gly Glu Ala Asp Phe Asn Arg Ser Lys
1505 1510 1515
Glu Phe Met Glu Glu Val Ile Gln Arg Met Asp Val Gly Gln Asp
1520 1525 1530
Ser Ile His Val Thr Val Leu Gln Tyr Ser Tyr Met Val Thr Val
1535 1540 1545
Glu Tyr Pro Phe Ser Glu Ala Gln Ser Lys Gly Asp Ile Leu Gln
1550 1555 1560
Arg Val Arg Glu Ile Arg Tyr Gln Gly Gly Asn Arg Thr Asn Thr
1565 1570 1575
Gly Leu Ala Leu Arg Tyr Leu Ser Asp His Ser Phe Leu Val Ser
1580 1585 1590
Gln Gly Asp Arg Glu Gln Ala Pro Asn Leu Val Tyr Met Val Thr
1595 1600 1605
Gly Asn Pro Ala Ser Asp Glu Ile Lys Arg Leu Pro Gly Asp Ile
1610 1615 1620
Gln Val Val Pro Ile Gly Val Gly Pro Asn Ala Asn Val Gln Glu
1625 1630 1635
Leu Glu Arg Ile Gly Trp Pro Asn Ala Pro Ile Leu Ile Gln Asp
1640 1645 1650
Phe Glu Thr Leu Pro Arg Glu Ala Pro Asp Leu Val Leu Gln Arg
1655 1660 1665
Cys Cys Ser Gly Glu Gly Leu Gln Ile Pro Thr Leu Ser Pro Ala
1670 1675 1680
Pro Asp Cys Ser Gln Pro Leu Asp Val Ile Leu Leu Leu Asp Gly
1685 1690 1695
Ser Ser Ser Phe Pro Ala Ser Tyr Phe Asp Glu Met Lys Ser Phe
1700 1705 1710
Ala Lys Ala Phe Ile Ser Lys Ala Asn Ile Gly Pro Arg Leu Thr
1715 1720 1725
Gln Val Ser Val Leu Gln Tyr Gly Ser Ile Thr Thr Ile Asp Val
1730 1735 1740
Pro Trp Asn Val Val Pro Glu Lys Ala His Leu Leu Ser Leu Val
1745 1750 1755
Asp Val Met Gln Arg Glu Gly Gly Pro Ser Gln Ile Gly Asp Ala
1760 1765 1770
Leu Gly Phe Ala Val Arg Tyr Leu Thr Ser Glu Met His Gly Ala
1775 1780 1785
Arg Pro Gly Ala Ser Lys Ala Val Val Ile Leu Val Thr Asp Val
1790 1795 1800
Ser Val Asp Ser Val Asp Ala Ala Ala Asp Ala Ala Arg Ser Asn
1805 1810 1815
Arg Val Thr Val Phe Pro Ile Gly Ile Gly Asp Arg Tyr Asp Ala
1820 1825 1830
Ala Gln Leu Arg Ile Leu Ala Gly Pro Ala Gly Asp Ser Asn Val
1835 1840 1845
Val Lys Leu Gln Arg Ile Glu Asp Leu Pro Thr Met Val Thr Leu
1850 1855 1860
Gly Asn Ser Phe Leu His Lys Leu Cys Ser Gly Phe Val Arg Ile
1865 1870 1875
Cys Met Asp Glu Asp Gly Asn Glu Lys Arg Pro Gly Asp Val Trp
1880 1885 1890
Thr Leu Pro Asp Gln Cys His Thr Val Thr Cys Gln Pro Asp Gly
1895 1900 1905
Gln Thr Leu Leu Lys Ser His Arg Val Asn Cys Asp Arg Gly Leu
1910 1915 1920
Arg Pro Ser Cys Pro Asn Ser Gln Ser Pro Val Lys Val Glu Glu
1925 1930 1935
Thr Cys Gly Cys Arg Trp Thr Cys Pro Cys Val Cys Thr Gly Ser
1940 1945 1950
Ser Thr Arg His Ile Val Thr Phe Asp Gly Gln Asn Phe Lys Leu
1955 1960 1965
Thr Gly Ser Cys Ser Tyr Val Leu Phe Gln Asn Lys Glu Gln Asp
1970 1975 1980
Leu Glu Val Ile Leu His Asn Gly Ala Cys Ser Pro Gly Ala Arg
1985 1990 1995
Gln Gly Cys Met Lys Ser Ile Glu Val Lys His Ser Ala Leu Ser
2000 2005 2010
Val Glu Leu His Ser Asp Met Glu Val Thr Val Asn Gly Arg Leu
2015 2020 2025
Val Ser Val Pro Tyr Val Gly Gly Asn Met Glu Val Asn Val Tyr
2030 2035 2040
Gly Ala Ile Met His Glu Val Arg Phe Asn His Leu Gly His Ile
2045 2050 2055
Phe Thr Phe Thr Pro Gln Asn Asn Glu Phe Gln Leu Gln Leu Ser
2060 2065 2070
Pro Lys Thr Phe Ala Ser Lys Thr Tyr Gly Leu Cys Gly Ile Cys
2075 2080 2085
Asp Glu Asn Gly Ala Asn Asp Phe Met Leu Arg Asp Gly Thr Val
2090 2095 2100
Thr Thr Asp Trp Lys Thr Leu Val Gln Glu Trp Thr Val Gln Arg
2105 2110 2115
Pro Gly Gln Thr Cys Gln Pro Ile Leu Glu Glu Gln Cys Leu Val
2120 2125 2130
Pro Asp Ser Ser His Cys Gln Val Leu Leu Leu Pro Leu Phe Ala
2135 2140 2145
Glu Cys His Lys Val Leu Ala Pro Ala Thr Phe Tyr Ala Ile Cys
2150 2155 2160
Gln Gln Asp Ser Cys His Gln Glu Gln Val Cys Glu Val Ile Ala
2165 2170 2175
Ser Tyr Ala His Leu Cys Arg Thr Asn Gly Val Cys Val Asp Trp
2180 2185 2190
Arg Thr Pro Asp Phe Cys Ala Met Ser Cys Pro Pro Ser Leu Val
2195 2200 2205
Tyr Asn His Cys Glu His Gly Cys Pro Arg His Cys Asp Gly Asn
2210 2215 2220
Val Ser Ser Cys Gly Asp His Pro Ser Glu Gly Cys Phe Cys Pro
2225 2230 2235
Pro Asp Lys Val Met Leu Glu Gly Ser Cys Val Pro Glu Glu Ala
2240 2245 2250
Cys Thr Gln Cys Ile Gly Glu Asp Gly Val Gln His Gln Phe Leu
2255 2260 2265
Glu Ala Trp Val Pro Asp His Gln Pro Cys Gln Ile Cys Thr Cys
2270 2275 2280
Leu Ser Gly Arg Lys Val Asn Cys Thr Thr Gln Pro Cys Pro Thr
2285 2290 2295
Ala Lys Ala Pro Thr Cys Gly Leu Cys Glu Val Ala Arg Leu Arg
2300 2305 2310
Gln Asn Ala Asp Gln Cys Cys Pro Glu Tyr Glu Cys Val Cys Asp
2315 2320 2325
Pro Val Ser Cys Asp Leu Pro Pro Val Pro His Cys Glu Arg Gly
2330 2335 2340
Leu Gln Pro Thr Leu Thr Asn Pro Gly Glu Cys Arg Pro Asn Phe
2345 2350 2355
Thr Cys Ala Cys Arg Lys Glu Glu Cys Lys Arg Val Ser Pro Pro
2360 2365 2370
Ser Cys Pro Pro His Arg Leu Pro Thr Leu Arg Lys Thr Gln Cys
2375 2380 2385
Cys Asp Glu Tyr Glu Cys Ala Cys Asn Cys Val Asn Ser Thr Val
2390 2395 2400
Ser Cys Pro Leu Gly Tyr Leu Ala Ser Thr Ala Thr Asn Asp Cys
2405 2410 2415
Gly Cys Thr Thr Thr Thr Cys Leu Pro Asp Lys Val Cys Val His
2420 2425 2430
Arg Ser Thr Ile Tyr Pro Val Gly Gln Phe Trp Glu Glu Gly Cys
2435 2440 2445
Asp Val Cys Thr Cys Thr Asp Met Glu Asp Ala Val Met Gly Leu
2450 2455 2460
Arg Val Ala Gln Cys Ser Gln Lys Pro Cys Glu Asp Ser Cys Arg
2465 2470 2475
Ser Gly Phe Thr Tyr Val Leu His Glu Gly Glu Cys Cys Gly Arg
2480 2485 2490
Cys Leu Pro Ser Ala Cys Glu Val Val Thr Gly Ser Pro Arg Gly
2495 2500 2505
Asp Ser Gln Ser Ser Trp Lys Ser Val Gly Ser Gln Trp Ala Ser
2510 2515 2520
Pro Glu Asn Pro Cys Leu Ile Asn Glu Cys Val Arg Val Lys Glu
2525 2530 2535
Glu Val Phe Ile Gln Gln Arg Asn Val Ser Cys Pro Gln Leu Glu
2540 2545 2550
Val Pro Val Cys Pro Ser Gly Phe Gln Leu Ser Cys Lys Thr Ser
2555 2560 2565
Ala Cys Cys Pro Ser Cys Arg Cys Glu Arg Met Glu Ala Cys Met
2570 2575 2580
Leu Asn Gly Thr Val Ile Gly Pro Gly Lys Thr Val Met Ile Asp
2585 2590 2595
Val Cys Thr Thr Cys Arg Cys Met Val Gln Val Gly Val Ile Ser
2600 2605 2610
Gly Phe Lys Leu Glu Cys Arg Lys Thr Thr Cys Asn Pro Cys Pro
2615 2620 2625
Leu Gly Tyr Lys Glu Glu Asn Asn Thr Gly Glu Cys Cys Gly Arg
2630 2635 2640
Cys Leu Pro Thr Ala Cys Thr Ile Gln Leu Arg Gly Gly Gln Ile
2645 2650 2655
Met Thr Leu Lys Arg Asp Glu Thr Leu Gln Asp Gly Cys Asp Thr
2660 2665 2670
His Phe Cys Lys Val Asn Glu Arg Gly Glu Tyr Phe Trp Glu Lys
2675 2680 2685
Arg Val Thr Gly Cys Pro Pro Phe Asp Glu His Lys Cys Leu Ala
2690 2695 2700
Glu Gly Gly Lys Ile Met Lys Ile Pro Gly Thr Cys Cys Asp Thr
2705 2710 2715
Cys Glu Glu Pro Glu Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr
2720 2725 2730
Val Lys Val Gly Ser Cys Lys Ser Glu Val Glu Val Asp Ile His
2735 2740 2745
Tyr Cys Gln Gly Lys Cys Ala Ser Lys Ala Met Tyr Ser Ile Asp
2750 2755 2760
Ile Asn Asp Val Gln Asp Gln Cys Ser Cys Cys Ser Pro Thr Arg
2765 2770 2775
Thr Glu Pro Met Gln Val Ala Leu His Cys Thr Asn Gly Ser Val
2780 2785 2790
Val Tyr His Glu Val Leu Asn Ala Met Glu Cys Lys Cys Ser Pro
2795 2800 2805
Arg Lys Cys Ser Lys
2810
<210> 3
<211> 567
<212> БЕЛОК
<213> Homo sapiens
<400> 3
Ser Leu Ser Cys Arg Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp
1 5 10 15
Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr
20 25 30
Asp Leu Glu Cys Met Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro
35 40 45
Pro Gly Met Val Arg His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys
50 55 60
Pro Cys Phe His Gln Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys
65 70 75 80
Ile Gly Cys Asn Thr Cys Val Cys Gln Asp Arg Lys Trp Asn Cys Thr
85 90 95
Asp His Val Cys Asp Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr
100 105 110
Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr
115 120 125
Val Leu Val Gln Asp Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile
130 135 140
Leu Val Gly Asn Lys Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys
145 150 155 160
Arg Val Thr Ile Leu Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly
165 170 175
Glu Val Asn Val Lys Arg Pro Met Lys Asp Glu Thr His Phe Glu Val
180 185 190
Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser
195 200 205
Val Val Trp Asp Arg His Leu Ser Ile Ser Val Val Leu Lys Gln Thr
210 215 220
Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln
225 230 235 240
Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val
245 250 255
Asp Phe Gly Asn Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg
260 265 270
Lys Val Pro Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met
275 280 285
Lys Gln Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val
290 295 300
Phe Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
305 310 315 320
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys
325 330 335
Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly
340 345 350
Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu
355 360 365
Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn
370 375 380
Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu
385 390 395 400
Ala Cys Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys Pro Pro
405 410 415
Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp
420 425 430
Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys
435 440 445
Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys Gln Ile Cys His Cys
450 455 460
Asp Val Val Asn Leu Thr Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu
465 470 475 480
Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val
485 490 495
Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val
500 505 510
Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu
515 520 525
Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val
530 535 540
Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp
545 550 555 560
Ile Ser Glu Pro Pro Leu His
565
<210> 4
<211> 589
<212> БЕЛОК
<213> Homo sapiens
<400> 4
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ser Leu Ser Cys Arg Pro Pro Met Val Lys
20 25 30
Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr
35 40 45
Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met Ser Met Gly Cys Val
50 55 60
Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg His Glu Asn Arg Cys
65 70 75 80
Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln Gly Lys Glu Tyr Ala
85 90 95
Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr Cys Val Cys Gln Asp
100 105 110
Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp Ala Thr Cys Ser Thr
115 120 125
Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe
130 135 140
Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp Tyr Cys Gly Ser Asn
145 150 155 160
Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys Gly Cys Ser His Pro
165 170 175
Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu Val Glu Gly Gly Glu
180 185 190
Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys Arg Pro Met Lys Asp
195 200 205
Glu Thr His Phe Glu Val Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu
210 215 220
Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg His Leu Ser Ile Ser
225 230 235 240
Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly
245 250 255
Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln
260 265 270
Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser Trp Lys Val Ser Ser
275 280 285
Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp Ser Ser Pro Ala Thr
290 295 300
Cys His Asn Asn Ile Met Lys Gln Thr Met Val Asp Ser Ser Cys Arg
305 310 315 320
Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn Lys Leu Val Asp Pro
325 330 335
Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser
340 345 350
Ile Gly Asp Cys Ala Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His
355 360 365
Val Cys Ala Gln His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu
370 375 380
Cys Pro Gln Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu
385 390 395 400
Cys Glu Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys
405 410 415
Gln His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
420 425 430
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr
435 440 445
Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly Arg Arg
450 455 460
Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp Pro Glu His
465 470 475 480
Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr Cys Glu Ala Cys
485 490 495
Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser
500 505 510
Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln
515 520 525
Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro
530 535 540
Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu
545 550 555 560
Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr
565 570 575
Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His
580 585
<210> 5
<211> 1330
<212> БЕЛОК
<213> Homo sapiens
<400> 5
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Val Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Gln Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr
1235 1240 1245
Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser
1250 1255 1260
Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro Pro
1265 1270 1275
Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile
1280 1285 1290
Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro
1295 1300 1305
Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp
1310 1315 1320
Ile Ser Glu Pro Pro Leu His
1325 1330
<210> 6
<211> 629
<212> БЕЛОК
<213> Homo sapiens
<400> 6
Ser Leu Ser Cys Arg Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp
1 5 10 15
Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr
20 25 30
Asp Leu Glu Cys Met Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro
35 40 45
Pro Gly Met Val Arg His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys
50 55 60
Pro Cys Phe His Gln Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys
65 70 75 80
Ile Gly Cys Asn Thr Cys Val Cys Gln Asp Arg Lys Trp Asn Cys Thr
85 90 95
Asp His Val Cys Asp Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr
100 105 110
Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr
115 120 125
Val Leu Val Gln Asp Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile
130 135 140
Leu Val Gly Asn Lys Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys
145 150 155 160
Arg Val Thr Ile Leu Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly
165 170 175
Glu Val Asn Val Lys Arg Pro Met Lys Asp Glu Thr His Phe Glu Val
180 185 190
Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser
195 200 205
Val Val Trp Asp Arg His Leu Ser Ile Ser Val Val Leu Lys Gln Thr
210 215 220
Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln
225 230 235 240
Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val
245 250 255
Asp Phe Gly Asn Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg
260 265 270
Lys Val Pro Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met
275 280 285
Lys Gln Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val
290 295 300
Phe Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
305 310 315 320
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys
325 330 335
Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly
340 345 350
Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu
355 360 365
Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn
370 375 380
Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu
385 390 395 400
Ala Cys Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys Pro Pro
405 410 415
Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp
420 425 430
Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys
435 440 445
Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys Gln Ile Cys His Cys
450 455 460
Asp Val Val Asn Leu Thr Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu
465 470 475 480
Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val
485 490 495
Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val
500 505 510
Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu
515 520 525
Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val
530 535 540
Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp
545 550 555 560
Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro
565 570 575
Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile
580 585 590
Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro Pro
595 600 605
Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser
610 615 620
Glu Pro Pro Leu His
625
<210> 7
<211> 651
<212> БЕЛОК
<213> Homo sapiens
<400> 7
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ser Leu Ser Cys Arg Pro Pro Met Val Lys
20 25 30
Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr
35 40 45
Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met Ser Met Gly Cys Val
50 55 60
Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg His Glu Asn Arg Cys
65 70 75 80
Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln Gly Lys Glu Tyr Ala
85 90 95
Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr Cys Val Cys Gln Asp
100 105 110
Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp Ala Thr Cys Ser Thr
115 120 125
Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe
130 135 140
Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp Tyr Cys Gly Ser Asn
145 150 155 160
Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys Gly Cys Ser His Pro
165 170 175
Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu Val Glu Gly Gly Glu
180 185 190
Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys Arg Pro Met Lys Asp
195 200 205
Glu Thr His Phe Glu Val Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu
210 215 220
Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg His Leu Ser Ile Ser
225 230 235 240
Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly
245 250 255
Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln
260 265 270
Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser Trp Lys Val Ser Ser
275 280 285
Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp Ser Ser Pro Ala Thr
290 295 300
Cys His Asn Asn Ile Met Lys Gln Thr Met Val Asp Ser Ser Cys Arg
305 310 315 320
Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn Lys Leu Val Asp Pro
325 330 335
Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser
340 345 350
Ile Gly Asp Cys Ala Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His
355 360 365
Val Cys Ala Gln His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu
370 375 380
Cys Pro Gln Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu
385 390 395 400
Cys Glu Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys
405 410 415
Gln His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
420 425 430
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr
435 440 445
Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly Arg Arg
450 455 460
Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp Pro Glu His
465 470 475 480
Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr Cys Glu Ala Cys
485 490 495
Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser
500 505 510
Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln
515 520 525
Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro
530 535 540
Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu
545 550 555 560
Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr
565 570 575
Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro
580 585 590
Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr
595 600 605
Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly
610 615 620
Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu
625 630 635 640
Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His
645 650
<210> 8
<211> 1392
<212> БЕЛОК
<213> Homo sapiens
<400> 8
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Val Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Gln Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr
1235 1240 1245
Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser
1250 1255 1260
Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro Pro
1265 1270 1275
Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile
1280 1285 1290
Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro
1295 1300 1305
Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp
1310 1315 1320
Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val
1325 1330 1335
Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu
1340 1345 1350
Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val
1355 1360 1365
Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val
1370 1375 1380
Glu Asp Ile Ser Glu Pro Pro Leu His
1385 1390
<210> 9
<211> 660
<212> БЕЛОК
<213> Homo sapiens
<400> 9
Ser Leu Ser Cys Arg Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp
1 5 10 15
Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr
20 25 30
Asp Leu Glu Cys Met Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro
35 40 45
Pro Gly Met Val Arg His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys
50 55 60
Pro Cys Phe His Gln Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys
65 70 75 80
Ile Gly Cys Asn Thr Cys Val Cys Gln Asp Arg Lys Trp Asn Cys Thr
85 90 95
Asp His Val Cys Asp Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr
100 105 110
Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr
115 120 125
Val Leu Val Gln Asp Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile
130 135 140
Leu Val Gly Asn Lys Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys
145 150 155 160
Arg Val Thr Ile Leu Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly
165 170 175
Glu Val Asn Val Lys Arg Pro Met Lys Asp Glu Thr His Phe Glu Val
180 185 190
Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser
195 200 205
Val Val Trp Asp Arg His Leu Ser Ile Ser Val Val Leu Lys Gln Thr
210 215 220
Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln
225 230 235 240
Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val
245 250 255
Asp Phe Gly Asn Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg
260 265 270
Lys Val Pro Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met
275 280 285
Lys Gln Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val
290 295 300
Phe Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
305 310 315 320
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys
325 330 335
Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly
340 345 350
Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu
355 360 365
Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn
370 375 380
Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro Leu
385 390 395 400
Ala Cys Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys Pro Pro
405 410 415
Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp Pro Glu Asp
420 425 430
Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala Ser Gly Lys Lys
435 440 445
Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys Gln Ile Cys His Cys
450 455 460
Asp Val Val Asn Leu Thr Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu
465 470 475 480
Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val
485 490 495
Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val
500 505 510
Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu
515 520 525
Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val
530 535 540
Pro Pro Thr Asp Ala Pro Val Pro Thr Thr Leu Tyr Val Glu Asp Ile
545 550 555 560
Ser Glu Pro Pro Leu His Glu Glu Pro Glu Cys Asn Asp Ile Thr Ala
565 570 575
Arg Leu Gln Tyr Val Lys Val Gly Ser Cys Lys Ser Glu Val Glu Val
580 585 590
Asp Ile His Tyr Cys Gln Gly Lys Cys Ala Ser Lys Ala Met Tyr Ser
595 600 605
Ile Asp Ile Asn Asp Val Gln Asp Gln Cys Ser Cys Cys Ser Pro Thr
610 615 620
Arg Thr Glu Pro Met Gln Val Ala Leu His Cys Thr Asn Gly Ser Val
625 630 635 640
Val Tyr His Glu Val Leu Asn Ala Met Glu Cys Lys Cys Ser Pro Arg
645 650 655
Lys Cys Ser Lys
660
<210> 10
<211> 682
<212> БЕЛОК
<213> Homo sapiens
<400> 10
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ser Leu Ser Cys Arg Pro Pro Met Val Lys
20 25 30
Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu Gly Leu Glu Cys Thr
35 40 45
Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met Ser Met Gly Cys Val
50 55 60
Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg His Glu Asn Arg Cys
65 70 75 80
Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln Gly Lys Glu Tyr Ala
85 90 95
Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr Cys Val Cys Gln Asp
100 105 110
Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp Ala Thr Cys Ser Thr
115 120 125
Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly Leu Lys Tyr Leu Phe
130 135 140
Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp Tyr Cys Gly Ser Asn
145 150 155 160
Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys Gly Cys Ser His Pro
165 170 175
Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu Val Glu Gly Gly Glu
180 185 190
Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys Arg Pro Met Lys Asp
195 200 205
Glu Thr His Phe Glu Val Val Glu Ser Gly Arg Tyr Ile Ile Leu Leu
210 215 220
Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg His Leu Ser Ile Ser
225 230 235 240
Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val Cys Gly Leu Cys Gly
245 250 255
Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr Ser Ser Asn Leu Gln
260 265 270
Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser Trp Lys Val Ser Ser
275 280 285
Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp Ser Ser Pro Ala Thr
290 295 300
Cys His Asn Asn Ile Met Lys Gln Thr Met Val Asp Ser Ser Cys Arg
305 310 315 320
Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn Lys Leu Val Asp Pro
325 330 335
Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser
340 345 350
Ile Gly Asp Cys Ala Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His
355 360 365
Val Cys Ala Gln His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu
370 375 380
Cys Pro Gln Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu
385 390 395 400
Cys Glu Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys
405 410 415
Gln His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
420 425 430
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr
435 440 445
Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly Arg Arg
450 455 460
Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp Pro Glu His
465 470 475 480
Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr Cys Glu Ala Cys
485 490 495
Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser
500 505 510
Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln
515 520 525
Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro
530 535 540
Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu
545 550 555 560
Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Pro Thr Thr
565 570 575
Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Glu Glu Pro Glu
580 585 590
Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr Val Lys Val Gly Ser Cys
595 600 605
Lys Ser Glu Val Glu Val Asp Ile His Tyr Cys Gln Gly Lys Cys Ala
610 615 620
Ser Lys Ala Met Tyr Ser Ile Asp Ile Asn Asp Val Gln Asp Gln Cys
625 630 635 640
Ser Cys Cys Ser Pro Thr Arg Thr Glu Pro Met Gln Val Ala Leu His
645 650 655
Cys Thr Asn Gly Ser Val Val Tyr His Glu Val Leu Asn Ala Met Glu
660 665 670
Cys Lys Cys Ser Pro Arg Lys Cys Ser Lys
675 680
<210> 11
<211> 1423
<212> БЕЛОК
<213> Homo sapiens
<400> 11
Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile
1 5 10 15
Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr
20 25 30
Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly
35 40 45
Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly
50 55 60
Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys
65 70 75 80
Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu
85 90 95
Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro
100 105 110
Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys
115 120 125
Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly
130 135 140
Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly
145 150 155 160
Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln
165 170 175
Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala
180 185 190
Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser
195 200 205
Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln
210 215 220
Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu
225 230 235 240
Val Asp Pro Glu Pro Phe Val Ala Leu Cys Glu Lys Thr Leu Cys Glu
245 250 255
Cys Ala Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala
260 265 270
Arg Thr Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His
275 280 285
Ser Ala Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys
290 295 300
Val Ser Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met
305 310 315 320
Cys Gln Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu
325 330 335
Leu Asp Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His
340 345 350
Ser Gly Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn
355 360 365
Thr Cys Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys
370 375 380
Pro Gly Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp
385 390 395 400
Asn Arg Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg
405 410 415
Asp Cys Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys
420 425 430
Ala Asp Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu
435 440 445
Pro Gly Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val
450 455 460
Ala Met Asp Gly Gln Asp Val Gln Leu Pro Leu Leu Lys Gly Asp Leu
465 470 475 480
Arg Ile Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu
485 490 495
Asp Leu Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu
500 505 510
Ser Pro Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn
515 520 525
Gly Asn Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Ala Glu Pro
530 535 540
Arg Val Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln
545 550 555 560
Asp Leu Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met
565 570 575
Thr Arg Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe
580 585 590
Glu Ala Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys
595 600 605
Arg Tyr Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly
610 615 620
Ala Leu Ala Ser Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val
625 630 635 640
Ala Trp Arg Glu Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln
645 650 655
Val Tyr Leu Gln Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu
660 665 670
Ser Tyr Pro Asp Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe
675 680 685
Cys Pro Pro Gly Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys
690 695 700
Ala Gln Cys Pro Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp
705 710 715 720
Ile Phe Ser Asp His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met
725 730 735
His Cys Thr Met Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val
740 745 750
Leu Ser Ser Pro Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg
755 760 765
Pro Pro Met Val Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu
770 775 780
Gly Leu Glu Cys Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met
785 790 795 800
Ser Met Gly Cys Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg
805 810 815
His Glu Asn Arg Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln
820 825 830
Gly Lys Glu Tyr Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr
835 840 845
Cys Val Cys Gln Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp
850 855 860
Ala Thr Cys Ser Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly
865 870 875 880
Leu Lys Tyr Leu Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp
885 890 895
Tyr Cys Gly Ser Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys
900 905 910
Gly Cys Ser His Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu
915 920 925
Val Glu Gly Gly Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys
930 935 940
Arg Pro Met Lys Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg
945 950 955 960
Tyr Ile Ile Leu Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg
965 970 975
His Leu Ser Ile Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val
980 985 990
Cys Gly Leu Cys Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr
995 1000 1005
Ser Ser Asn Leu Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn
1010 1015 1020
Ser Trp Lys Val Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro
1025 1030 1035
Leu Asp Ser Ser Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln
1040 1045 1050
Thr Met Val Asp Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe
1055 1060 1065
Gln Asp Cys Asn Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val
1070 1075 1080
Cys Ile Tyr Asp Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala
1085 1090 1095
Cys Phe Cys Asp Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln
1100 1105 1110
His Gly Lys Val Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln
1115 1120 1125
Ser Cys Glu Glu Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu
1130 1135 1140
Trp Arg Tyr Asn Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln
1145 1150 1155
His Pro Glu Pro Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys
1160 1165 1170
His Ala His Cys Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln
1175 1180 1185
Thr Cys Val Asp Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly
1190 1195 1200
Arg Arg Phe Ala Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp
1205 1210 1215
Pro Glu His Cys Gln Ile Cys His Cys Asp Val Val Asn Leu Thr
1220 1225 1230
Cys Glu Ala Cys Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr
1235 1240 1245
Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser
1250 1255 1260
Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro Pro
1265 1270 1275
Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile
1280 1285 1290
Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu Val Val Pro
1295 1300 1305
Pro Thr Asp Ala Pro Val Pro Thr Thr Leu Tyr Val Glu Asp Ile
1310 1315 1320
Ser Glu Pro Pro Leu His Glu Glu Pro Glu Cys Asn Asp Ile Thr
1325 1330 1335
Ala Arg Leu Gln Tyr Val Lys Val Gly Ser Cys Lys Ser Glu Val
1340 1345 1350
Glu Val Asp Ile His Tyr Cys Gln Gly Lys Cys Ala Ser Lys Ala
1355 1360 1365
Met Tyr Ser Ile Asp Ile Asn Asp Val Gln Asp Gln Cys Ser Cys
1370 1375 1380
Cys Ser Pro Thr Arg Thr Glu Pro Met Gln Val Ala Leu His Cys
1385 1390 1395
Thr Asn Gly Ser Val Val Tyr His Glu Val Leu Asn Ala Met Glu
1400 1405 1410
Cys Lys Cys Ser Pro Arg Lys Cys Ser Lys
1415 1420
<210> 12
<211> 16
<212> БЕЛОК
<213> Homo sapiens
<400> 12
Ser Phe Ser Gln Asn Ser Arg His Gln Ala Tyr Arg Tyr Arg Arg Gly
1 5 10 15
<210> 13
<211> 1440
<212> БЕЛОК
<213> Homo sapiens
<400> 13
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Gln Ala Tyr Arg
740 745 750
Tyr Arg Arg Gly Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu
755 760 765
Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp
770 775 780
Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln
785 790 795 800
Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp
805 810 815
Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser
820 825 830
Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp
835 840 845
Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu
850 855 860
Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met
865 870 875 880
Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
885 890 895
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys
900 905 910
Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln
915 920 925
His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala
930 935 940
Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile
945 950 955 960
Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly
965 970 975
Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp
980 985 990
Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg
995 1000 1005
Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn
1010 1015 1020
Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro
1025 1030 1035
Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu
1040 1045 1050
Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly
1055 1060 1065
His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu
1070 1075 1080
Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro
1085 1090 1095
Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His
1100 1105 1110
Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys
1115 1120 1125
Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe
1130 1135 1140
Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu
1145 1150 1155
Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys
1160 1165 1170
Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile
1175 1180 1185
Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser
1190 1195 1200
Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys
1205 1210 1215
Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val
1220 1225 1230
Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe
1235 1240 1245
Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His
1250 1255 1260
Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp
1265 1270 1275
Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile
1280 1285 1290
Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe
1295 1300 1305
Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg
1310 1315 1320
Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu
1325 1330 1335
Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr
1340 1345 1350
Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe
1355 1360 1365
Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe
1370 1375 1380
Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe
1385 1390 1395
Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr
1400 1405 1410
Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg
1415 1420 1425
Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435 1440
<210> 14
<211> 1530
<212> БЕЛОК
<213> Homo sapiens
<400> 14
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Gln Glu Pro Gly
740 745 750
Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu
755 760 765
Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly
770 775 780
Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr
785 790 795 800
Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu Pro Gly Gly Leu
805 810 815
Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr Thr Leu Tyr Val
820 825 830
Glu Asp Ile Ser Glu Pro Pro Leu His Arg Tyr Arg Arg Gly Glu Ile
835 840 845
Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp
850 855 860
Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu
865 870 875 880
Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
885 890 895
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser
900 905 910
Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe
915 920 925
Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro
930 935 940
Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr
945 950 955 960
Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln
965 970 975
Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu
980 985 990
Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn
995 1000 1005
Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met Ala Pro
1010 1015 1020
Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp
1025 1030 1035
Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu
1040 1045 1050
Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
1055 1060 1065
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu
1070 1075 1080
Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg
1085 1090 1095
Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn
1100 1105 1110
Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro
1115 1120 1125
Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu
1130 1135 1140
Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly
1145 1150 1155
His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu
1160 1165 1170
Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro
1175 1180 1185
Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His
1190 1195 1200
Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys
1205 1210 1215
Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe
1220 1225 1230
Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu
1235 1240 1245
Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys
1250 1255 1260
Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile
1265 1270 1275
Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser
1280 1285 1290
Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys
1295 1300 1305
Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val
1310 1315 1320
Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe
1325 1330 1335
Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His
1340 1345 1350
Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp
1355 1360 1365
Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile
1370 1375 1380
Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe
1385 1390 1395
Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg
1400 1405 1410
Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu
1415 1420 1425
Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr
1430 1435 1440
Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe
1445 1450 1455
Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe
1460 1465 1470
Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe
1475 1480 1485
Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr
1490 1495 1500
Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg
1505 1510 1515
Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1520 1525 1530
<210> 15
<211> 3807
<212> ДНК
<213> Homo sapiens
<400> 15
atgatccccg ccagatttgc cggcgtgctg ctggccctgg ctctgatcct gcctggaaca 60
ctgtgtgccg agggcaccag aggcagatcc agcaccgcca gatgcagcct gttcggcagc 120
gacttcgtga acaccttcga cggcagcatg tacagcttcg ccggctactg ctcctacctg 180
ctggctggcg gctgccagaa gcggagcttt agcatcatcg gcgacttcca gaacggcaag 240
cgggtgtccc tgagcgtgta cctgggcgag ttcttcgaca tccacctgtt cgtgaacggc 300
accgtgaccc agggcgatca gagggtgtcc atgccctacg ccagcaaggg cctgtacctg 360
gaaacagagg ccggctatta caagctgagc ggcgaggcct acggcttcgt ggccagaatc 420
gatggcagcg gcaacttcca ggtgctgctg agcgaccggt acttcaacaa gacctgcggc 480
ctgtgcggca atttcaacat cttcgccgag gacgacttca tgacccagga aggcaccctg 540
accagcgacc cctacgactt cgccaatagc tgggccctgt ctagcggcga gcagtggtgc 600
gaaagagcca gccctcctag cagcagctgc aacatcagca gcggcgagat gcagaaaggc 660
ctgtgggagc agtgccagct gctgaagtcc accagcgtgt tcgccaggtg ccaccctctg 720
gtggaccctg agccttttgt ggccctgtgc gagaaaacac tgtgcgagtg tgccggcgga 780
ctggaatgtg cctgtcctgc cctgctggaa tacgccagaa cctgcgctca ggaagggatg 840
gtgctgtacg gctggaccga ccactctgcc tgtagccctg tgtgtcctgc cggcatggaa 900
tatcggcagt gcgtgtcccc ctgcgccagg acctgtcaga gcctgcacat caacgagatg 960
tgccaggaac gctgcgtgga cggctgtagc tgtcctgagg gacagctgct ggatgagggc 1020
ctgtgtgtgg aaagcaccga gtgcccttgt gtgcacagcg gcaagagata cccccctggc 1080
accagcctga gccgggactg caatacctgc atctgccgga acagccagtg gatctgctcc 1140
aacgaggaat gccctggcga gtgcctcgtg acaggccaga gccacttcaa gagcttcgac 1200
aacagatact tcaccttcag cggcatctgc cagtatctgc tggccagaga ctgccaggac 1260
cacagcttca gcatcgtgat cgagacagtg cagtgcgccg acgacagaga tgccgtgtgc 1320
accagatccg tgaccgtgcg gctgcctggc ctgcacaaca gcctcgtgaa gctgaaacac 1380
ggcgctgggg tggccatgga cggacaggac gtgcagctgc ctctgctgaa gggcgacctg 1440
agaatccagc acaccgtgac agcctctgtg cggctgagct acggcgagga cctccagatg 1500
gactgggatg gcaggggcag actgctcgtg aaactgagcc cagtgtatgc cggcaagact 1560
tgtggactgt gtggcaacta caacggcaac cagggcgacg atttcctgac cccttctggc 1620
ctggccgagc cccgggtgga agattttggc aacgcctgga agctgcacgg cgactgtcag 1680
gatctccaga agcagcacag cgacccttgc gccctgaacc cccggatgac cagattcagc 1740
gaagaggcct gtgccgtgct gaccagccct acctttgagg cctgccacag agccgtgtct 1800
ccactgcctt acctgcggaa ttgcagatac gacgtgtgct cctgctccga cggccgcgaa 1860
tgtctgtgtg gcgccctggc ctcttatgcc gccgcttgtg ctggaagagg cgtgcgggtg 1920
gcatggcggg aaccaggcag atgcgagctg aactgcccta agggccaggt gtacctccag 1980
tgcggcaccc cctgcaacct gacctgtaga agcctgagct accccgacga agagtgcaac 2040
gaggcctgtc tggaaggctg cttttgccct cccggcctgt atatggacga gcggggcgat 2100
tgtgtgccca aggcccagtg cccctgctac tacgacggcg agattttcca gcccgaggac 2160
atcttcagcg accaccacac catgtgctac tgcgaggatg gcttcatgca ctgcaccatg 2220
agcggcgtgc caggctccct gctgcctgat gctgtgctgt ctagccccct gagccacaga 2280
agcaagagaa gcctgtcttg cagacccccc atggtcaagc tcgtgtgccc tgccgacaac 2340
ctgagagccg agggcctgga atgcaccaag acatgccaga actacgacct ggaatgcatg 2400
agcatgggct gcgtgtccgg ctgtctgtgc cctcctggca tggtgcgcca cgagaataga 2460
tgcgtggccc tggaacggtg cccgtgcttt catcagggca aagagtacgc cccaggcgaa 2520
accgtgaaga tcggctgcaa cacatgcgtg tgtcaggacc ggaagtggaa ctgcaccgac 2580
cacgtgtgcg acgccacctg tagcacaatc ggcatggccc actacctgac cttcgatggc 2640
ctgaagtacc tgttccccgg cgagtgtcag tacgtgctgg tgcaggatta ctgcggcagc 2700
aaccccggca ccttcagaat cctcgtgggc aacaagggct gtagccaccc ctccgtgaag 2760
tgcaagaaac gcgtgaccat cctggtggaa ggcggagaga tcgagctgtt cgacggcgaa 2820
gtgaacgtga agcggcccat gaaggacgag acacacttcg aggtggtgga aagcggccgg 2880
tacatcatcc tgctgctggg caaagccctg tccgtcgtgt gggacagaca cctgagcatc 2940
agcgtggtgc tgaagcagac ctaccaggaa aaagtgtgcg ggctgtgtgg gaactttgac 3000
ggcatccaga acaacgatct gaccagcagc aatctccagg tggaagagga ccccgtggac 3060
ttcggcaatt cctggaaggt gtccagccag tgtgccgaca ccagaaaggt gcccctggat 3120
agcagccccg ccacatgcca caacaacatc atgaagcaga caatggtgga cagcagctgc 3180
cgcatcctga cctccgatgt gtttcaggac tgcaacaaac tggtggaccc cgaaccctac 3240
ctggacgtgt gcatctacga cacatgcagc tgcgagagca tcggcgattg cgcctgcttc 3300
tgcgacacca ttgccgccta cgcccatgtg tgcgcccagc acggaaaggt cgtgacttgg 3360
agaaccgcca ccctgtgccc acagagctgc gaggaacgga acctgcggga aaacggctac 3420
gagtgcgagt ggcggtacaa cagctgtgcc ccagcctgcc aagtgacctg ccagcaccct 3480
gaacctctgg cttgccccgt gcagtgcgtg gaaggatgtc acgcccattg cccacccggc 3540
aagatcctgg atgagctgct ccagacctgt gtggacccag aggactgccc agtgtgcgaa 3600
gtggccggaa gaagattcgc ctccggcaag aaagtgaccc tgaatccctc cgaccccgag 3660
cactgtcaga tttgtcactg cgacgtcgtg aatctgacat gcgaagcctg ccaggaacct 3720
ggcggactgg tggtgcctcc tacagatgcc cctgtgtccc ccaccaccct gtacgtggaa 3780
gatatcagcg agccccccct gcactaa 3807
<210> 16
<211> 93
<212> ДНК
<213> Homo sapiens
<400> 16
caggaacctg gcggactggt ggtgcctcct acagatgccc ctgtgtcccc caccaccctg 60
tacgtggaag atatcagcga gccccccctg cac 93
<210> 17
<211> 3993
<212> ДНК
<213> Homo sapiens
<400> 17
atgatccccg ccagatttgc cggcgtgctg ctggccctgg ctctgatcct gcctggaaca 60
ctgtgtgccg agggcaccag aggcagatcc agcaccgcca gatgcagcct gttcggcagc 120
gacttcgtga acaccttcga cggcagcatg tacagcttcg ccggctactg ctcctacctg 180
ctggctggcg gctgccagaa gcggagcttt agcatcatcg gcgacttcca gaacggcaag 240
cgggtgtccc tgagcgtgta cctgggcgag ttcttcgaca tccacctgtt cgtgaacggc 300
accgtgaccc agggcgatca gagggtgtcc atgccctacg ccagcaaggg cctgtacctg 360
gaaacagagg ccggctatta caagctgagc ggcgaggcct acggcttcgt ggccagaatc 420
gatggcagcg gcaacttcca ggtgctgctg agcgaccggt acttcaacaa gacctgcggc 480
ctgtgcggca atttcaacat cttcgccgag gacgacttca tgacccagga aggcaccctg 540
accagcgacc cctacgactt cgccaatagc tgggccctgt ctagcggcga gcagtggtgc 600
gaaagagcca gccctcctag cagcagctgc aacatcagca gcggcgagat gcagaaaggc 660
ctgtgggagc agtgccagct gctgaagtcc accagcgtgt tcgccaggtg ccaccctctg 720
gtggaccctg agccttttgt ggccctgtgc gagaaaacac tgtgcgagtg tgccggcgga 780
ctggaatgtg cctgtcctgc cctgctggaa tacgccagaa cctgcgctca ggaagggatg 840
gtgctgtacg gctggaccga ccactctgcc tgtagccctg tgtgtcctgc cggcatggaa 900
tatcggcagt gcgtgtcccc ctgcgccagg acctgtcaga gcctgcacat caacgagatg 960
tgccaggaac gctgcgtgga cggctgtagc tgtcctgagg gacagctgct ggatgagggc 1020
ctgtgtgtgg aaagcaccga gtgcccttgt gtgcacagcg gcaagagata cccccctggc 1080
accagcctga gccgggactg caatacctgc atctgccgga acagccagtg gatctgctcc 1140
aacgaggaat gccctggcga gtgcctcgtg acaggccaga gccacttcaa gagcttcgac 1200
aacagatact tcaccttcag cggcatctgc cagtatctgc tggccagaga ctgccaggac 1260
cacagcttca gcatcgtgat cgagacagtg cagtgcgccg acgacagaga tgccgtgtgc 1320
accagatccg tgaccgtgcg gctgcctggc ctgcacaaca gcctcgtgaa gctgaaacac 1380
ggcgctgggg tggccatgga cggacaggac gtgcagctgc ctctgctgaa gggcgacctg 1440
agaatccagc acaccgtgac agcctctgtg cggctgagct acggcgagga cctccagatg 1500
gactgggatg gcaggggcag actgctcgtg aaactgagcc cagtgtatgc cggcaagact 1560
tgtggactgt gtggcaacta caacggcaac cagggcgacg atttcctgac cccttctggc 1620
ctggccgagc cccgggtgga agattttggc aacgcctgga agctgcacgg cgactgtcag 1680
gatctccaga agcagcacag cgacccttgc gccctgaacc cccggatgac cagattcagc 1740
gaagaggcct gtgccgtgct gaccagccct acctttgagg cctgccacag agccgtgtct 1800
ccactgcctt acctgcggaa ttgcagatac gacgtgtgct cctgctccga cggccgcgaa 1860
tgtctgtgtg gcgccctggc ctcttatgcc gccgcttgtg ctggaagagg cgtgcgggtg 1920
gcatggcggg aaccaggcag atgcgagctg aactgcccta agggccaggt gtacctccag 1980
tgcggcaccc cctgcaacct gacctgtaga agcctgagct accccgacga agagtgcaac 2040
gaggcctgtc tggaaggctg cttttgccct cccggcctgt atatggacga gcggggcgat 2100
tgtgtgccca aggcccagtg cccctgctac tacgacggcg agattttcca gcccgaggac 2160
atcttcagcg accaccacac catgtgctac tgcgaggatg gcttcatgca ctgcaccatg 2220
agcggcgtgc caggctccct gctgcctgat gctgtgctgt ctagccccct gagccacaga 2280
agcaagagaa gcctgtcttg cagacccccc atggtcaagc tcgtgtgccc tgccgacaac 2340
ctgagagccg agggcctgga atgcaccaag acatgccaga actacgacct ggaatgcatg 2400
agcatgggct gcgtgtccgg ctgtctgtgc cctcctggca tggtgcgcca cgagaataga 2460
tgcgtggccc tggaacggtg cccgtgcttt catcagggca aagagtacgc cccaggcgaa 2520
accgtgaaga tcggctgcaa cacatgcgtg tgtcaggacc ggaagtggaa ctgcaccgac 2580
cacgtgtgcg acgccacctg tagcacaatc ggcatggccc actacctgac cttcgatggc 2640
ctgaagtacc tgttccccgg cgagtgtcag tacgtgctgg tgcaggatta ctgcggcagc 2700
aaccccggca ccttcagaat cctcgtgggc aacaagggct gtagccaccc ctccgtgaag 2760
tgcaagaaac gcgtgaccat cctggtggaa ggcggagaga tcgagctgtt cgacggcgaa 2820
gtgaacgtga agcggcccat gaaggacgag acacacttcg aggtggtgga aagcggccgg 2880
tacatcatcc tgctgctggg caaagccctg tccgtcgtgt gggacagaca cctgagcatc 2940
agcgtggtgc tgaagcagac ctaccaggaa aaagtgtgcg ggctgtgtgg gaactttgac 3000
ggcatccaga acaacgatct gaccagcagc aatctccagg tggaagagga ccccgtggac 3060
ttcggcaatt cctggaaggt gtccagccag tgtgccgaca ccagaaaggt gcccctggat 3120
agcagccccg ccacatgcca caacaacatc atgaagcaga caatggtgga cagcagctgc 3180
cgcatcctga cctccgatgt gtttcaggac tgcaacaaac tggtggaccc cgaaccctac 3240
ctggacgtgt gcatctacga cacatgcagc tgcgagagca tcggcgattg cgcctgcttc 3300
tgcgacacca ttgccgccta cgcccatgtg tgcgcccagc acggaaaggt cgtgacttgg 3360
agaaccgcca ccctgtgccc acagagctgc gaggaacgga acctgcggga aaacggctac 3420
gagtgcgagt ggcggtacaa cagctgtgcc ccagcctgcc aagtgacctg ccagcaccct 3480
gaacctctgg cttgccccgt gcagtgcgtg gaaggatgtc acgcccattg cccacccggc 3540
aagatcctgg atgagctgct ccagacctgt gtggacccag aggactgccc agtgtgcgaa 3600
gtggccggaa gaagattcgc ctccggcaag aaagtgaccc tgaatccctc cgaccccgag 3660
cactgtcaga tttgtcactg cgacgtcgtg aatctgacat gcgaagcctg ccaggaacct 3720
ggcggactgg tggtgcctcc tacagatgcc cctgtgtccc ccaccaccct gtacgtggaa 3780
gatatcagcg agccccccct gcaccaggaa cctggcggac tggtggtgcc tcctacagac 3840
gctcctgtgt ctcctacaac actgtatgtg gaagatattt ccgagcctcc tctgcatcag 3900
gaaccagggg gcctggtggt gccaccaact gatgcaccag tgtctccaac tactctgtac 3960
gtggaagata tttctgaacc ccccctgcat taa 3993
<210> 18
<211> 4179
<212> ДНК
<213> Homo sapiens
<400> 18
atgatccccg ccagatttgc cggcgtgctg ctggccctgg ctctgatcct gcctggaaca 60
ctgtgtgccg agggcaccag aggcagatcc agcaccgcca gatgcagcct gttcggcagc 120
gacttcgtga acaccttcga cggcagcatg tacagcttcg ccggctactg ctcctacctg 180
ctggctggcg gctgccagaa gcggagcttt agcatcatcg gcgacttcca gaacggcaag 240
cgggtgtccc tgagcgtgta cctgggcgag ttcttcgaca tccacctgtt cgtgaacggc 300
accgtgaccc agggcgatca gagggtgtcc atgccctacg ccagcaaggg cctgtacctg 360
gaaacagagg ccggctatta caagctgagc ggcgaggcct acggcttcgt ggccagaatc 420
gatggcagcg gcaacttcca ggtgctgctg agcgaccggt acttcaacaa gacctgcggc 480
ctgtgcggca atttcaacat cttcgccgag gacgacttca tgacccagga aggcaccctg 540
accagcgacc cctacgactt cgccaatagc tgggccctgt ctagcggcga gcagtggtgc 600
gaaagagcca gccctcctag cagcagctgc aacatcagca gcggcgagat gcagaaaggc 660
ctgtgggagc agtgccagct gctgaagtcc accagcgtgt tcgccaggtg ccaccctctg 720
gtggaccctg agccttttgt ggccctgtgc gagaaaacac tgtgcgagtg tgccggcgga 780
ctggaatgtg cctgtcctgc cctgctggaa tacgccagaa cctgcgctca ggaagggatg 840
gtgctgtacg gctggaccga ccactctgcc tgtagccctg tgtgtcctgc cggcatggaa 900
tatcggcagt gcgtgtcccc ctgcgccagg acctgtcaga gcctgcacat caacgagatg 960
tgccaggaac gctgcgtgga cggctgtagc tgtcctgagg gacagctgct ggatgagggc 1020
ctgtgtgtgg aaagcaccga gtgcccttgt gtgcacagcg gcaagagata cccccctggc 1080
accagcctga gccgggactg caatacctgc atctgccgga acagccagtg gatctgctcc 1140
aacgaggaat gccctggcga gtgcctcgtg acaggccaga gccacttcaa gagcttcgac 1200
aacagatact tcaccttcag cggcatctgc cagtatctgc tggccagaga ctgccaggac 1260
cacagcttca gcatcgtgat cgagacagtg cagtgcgccg acgacagaga tgccgtgtgc 1320
accagatccg tgaccgtgcg gctgcctggc ctgcacaaca gcctcgtgaa gctgaaacac 1380
ggcgctgggg tggccatgga cggacaggac gtgcagctgc ctctgctgaa gggcgacctg 1440
agaatccagc acaccgtgac agcctctgtg cggctgagct acggcgagga cctccagatg 1500
gactgggatg gcaggggcag actgctcgtg aaactgagcc cagtgtatgc cggcaagact 1560
tgtggactgt gtggcaacta caacggcaac cagggcgacg atttcctgac cccttctggc 1620
ctggccgagc cccgggtgga agattttggc aacgcctgga agctgcacgg cgactgtcag 1680
gatctccaga agcagcacag cgacccttgc gccctgaacc cccggatgac cagattcagc 1740
gaagaggcct gtgccgtgct gaccagccct acctttgagg cctgccacag agccgtgtct 1800
ccactgcctt acctgcggaa ttgcagatac gacgtgtgct cctgctccga cggccgcgaa 1860
tgtctgtgtg gcgccctggc ctcttatgcc gccgcttgtg ctggaagagg cgtgcgggtg 1920
gcatggcggg aaccaggcag atgcgagctg aactgcccta agggccaggt gtacctccag 1980
tgcggcaccc cctgcaacct gacctgtaga agcctgagct accccgacga agagtgcaac 2040
gaggcctgtc tggaaggctg cttttgccct cccggcctgt atatggacga gcggggcgat 2100
tgtgtgccca aggcccagtg cccctgctac tacgacggcg agattttcca gcccgaggac 2160
atcttcagcg accaccacac catgtgctac tgcgaggatg gcttcatgca ctgcaccatg 2220
agcggcgtgc caggctccct gctgcctgat gctgtgctgt ctagccccct gagccacaga 2280
agcaagagaa gcctgtcttg cagacccccc atggtcaagc tcgtgtgccc tgccgacaac 2340
ctgagagccg agggcctgga atgcaccaag acatgccaga actacgacct ggaatgcatg 2400
agcatgggct gcgtgtccgg ctgtctgtgc cctcctggca tggtgcgcca cgagaataga 2460
tgcgtggccc tggaacggtg cccgtgcttt catcagggca aagagtacgc cccaggcgaa 2520
accgtgaaga tcggctgcaa cacatgcgtg tgtcaggacc ggaagtggaa ctgcaccgac 2580
cacgtgtgcg acgccacctg tagcacaatc ggcatggccc actacctgac cttcgatggc 2640
ctgaagtacc tgttccccgg cgagtgtcag tacgtgctgg tgcaggatta ctgcggcagc 2700
aaccccggca ccttcagaat cctcgtgggc aacaagggct gtagccaccc ctccgtgaag 2760
tgcaagaaac gcgtgaccat cctggtggaa ggcggagaga tcgagctgtt cgacggcgaa 2820
gtgaacgtga agcggcccat gaaggacgag acacacttcg aggtggtgga aagcggccgg 2880
tacatcatcc tgctgctggg caaagccctg tccgtcgtgt gggacagaca cctgagcatc 2940
agcgtggtgc tgaagcagac ctaccaggaa aaagtgtgcg ggctgtgtgg gaactttgac 3000
ggcatccaga acaacgatct gaccagcagc aatctccagg tggaagagga ccccgtggac 3060
ttcggcaatt cctggaaggt gtccagccag tgtgccgaca ccagaaaggt gcccctggat 3120
agcagccccg ccacatgcca caacaacatc atgaagcaga caatggtgga cagcagctgc 3180
cgcatcctga cctccgatgt gtttcaggac tgcaacaaac tggtggaccc cgaaccctac 3240
ctggacgtgt gcatctacga cacatgcagc tgcgagagca tcggcgattg cgcctgcttc 3300
tgcgacacca ttgccgccta cgcccatgtg tgcgcccagc acggaaaggt cgtgacttgg 3360
agaaccgcca ccctgtgccc acagagctgc gaggaacgga acctgcggga aaacggctac 3420
gagtgcgagt ggcggtacaa cagctgtgcc ccagcctgcc aagtgacctg ccagcaccct 3480
gaacctctgg cttgccccgt gcagtgcgtg gaaggatgtc acgcccattg cccacccggc 3540
aagatcctgg atgagctgct ccagacctgt gtggacccag aggactgccc agtgtgcgaa 3600
gtggccggaa gaagattcgc ctccggcaag aaagtgaccc tgaatccctc cgaccccgag 3660
cactgtcaga tttgtcactg cgacgtcgtg aatctgacat gcgaagcctg ccaggaacct 3720
ggcggactgg tggtgcctcc tacagatgcc cctgtgtccc ccaccaccct gtacgtggaa 3780
gatatcagcg agccccccct gcaccaagaa cctggtggac tggtggtgcc tcctacagat 3840
gctcctgtgt ctcccaccac actgtacgtg gaagatatca gcgagcctcc tctgcaccaa 3900
gagccaggcg gacttgtggt cccaccaact gatgcccctg tcagccctac aactctgtac 3960
gtcgaggaca tctccgagcc accactgcat caagaacctg gcggccttgt cgttcctcca 4020
acagacgcac ctgttagccc aactacactg tatgttgagg acataagcga accgcctctc 4080
catcaagaac ccggtggtct tgttgtccca cctacagacg ccccagtctc tcctaccact 4140
ctctatgtcg aagatatttc cgaacctcca ctgcactaa 4179
<210> 19
<211> 4275
<212> ДНК
<213> Homo sapiens
<400> 19
atgatccccg ccagatttgc cggcgtgctg ctggccctgg ctctgatcct gcctggaaca 60
ctgtgtgccg agggcaccag aggcagatcc agcaccgcca gatgcagcct gttcggcagc 120
gacttcgtga acaccttcga cggcagcatg tacagcttcg ccggctactg ctcctacctg 180
ctggctggcg gctgccagaa gcggagcttt agcatcatcg gcgacttcca gaacggcaag 240
cgggtgtccc tgagcgtgta cctgggcgag ttcttcgaca tccacctgtt cgtgaacggc 300
accgtgaccc agggcgatca gagggtgtcc atgccctacg ccagcaaggg cctgtacctg 360
gaaacagagg ccggctatta caagctgagc ggcgaggcct acggcttcgt ggccagaatc 420
gatggcagcg gcaacttcca ggtgctgctg agcgaccggt acttcaacaa gacctgcggc 480
ctgtgcggca atttcaacat cttcgccgag gacgacttca tgacccagga aggcaccctg 540
accagcgacc cctacgactt cgccaatagc tgggccctgt ctagcggcga gcagtggtgc 600
gaaagagcca gccctcctag cagcagctgc aacatcagca gcggcgagat gcagaaaggc 660
ctgtgggagc agtgccagct gctgaagtcc accagcgtgt tcgccaggtg ccaccctctg 720
gtggaccctg agccttttgt ggccctgtgc gagaaaacac tgtgcgagtg tgccggcgga 780
ctggaatgtg cctgtcctgc cctgctggaa tacgccagaa cctgcgctca ggaagggatg 840
gtgctgtacg gctggaccga ccactctgcc tgtagccctg tgtgtcctgc cggcatggaa 900
tatcggcagt gcgtgtcccc ctgcgccagg acctgtcaga gcctgcacat caacgagatg 960
tgccaggaac gctgcgtgga cggctgtagc tgtcctgagg gacagctgct ggatgagggc 1020
ctgtgtgtgg aaagcaccga gtgcccttgt gtgcacagcg gcaagagata cccccctggc 1080
accagcctga gccgggactg caatacctgc atctgccgga acagccagtg gatctgctcc 1140
aacgaggaat gccctggcga gtgcctcgtg acaggccaga gccacttcaa gagcttcgac 1200
aacagatact tcaccttcag cggcatctgc cagtatctgc tggccagaga ctgccaggac 1260
cacagcttca gcatcgtgat cgagacagtg cagtgcgccg acgacagaga tgccgtgtgc 1320
accagatccg tgaccgtgcg gctgcctggc ctgcacaaca gcctcgtgaa gctgaaacac 1380
ggcgctgggg tggccatgga cggacaggac gtgcagctgc ctctgctgaa gggcgacctg 1440
agaatccagc acaccgtgac agcctctgtg cggctgagct acggcgagga cctccagatg 1500
gactgggatg gcaggggcag actgctcgtg aaactgagcc cagtgtatgc cggcaagact 1560
tgtggactgt gtggcaacta caacggcaac cagggcgacg atttcctgac cccttctggc 1620
ctggccgagc cccgggtgga agattttggc aacgcctgga agctgcacgg cgactgtcag 1680
gatctccaga agcagcacag cgacccttgc gccctgaacc cccggatgac cagattcagc 1740
gaagaggcct gtgccgtgct gaccagccct acctttgagg cctgccacag agccgtgtct 1800
ccactgcctt acctgcggaa ttgcagatac gacgtgtgct cctgctccga cggccgcgaa 1860
tgtctgtgtg gcgccctggc ctcttatgcc gccgcttgtg ctggaagagg cgtgcgggtg 1920
gcatggcggg aaccaggcag atgcgagctg aactgcccta agggccaggt gtacctccag 1980
tgcggcaccc cctgcaacct gacctgtaga agcctgagct accccgacga agagtgcaac 2040
gaggcctgtc tggaaggctg cttttgccct cccggcctgt atatggacga gcggggcgat 2100
tgtgtgccca aggcccagtg cccctgctac tacgacggcg agattttcca gcccgaggac 2160
atcttcagcg accaccacac catgtgctac tgcgaggatg gcttcatgca ctgcaccatg 2220
agcggcgtgc caggctccct gctgcctgat gctgtgctgt ctagccccct gagccacaga 2280
agcaagagaa gcctgtcttg cagacccccc atggtcaagc tcgtgtgccc tgccgacaac 2340
ctgagagccg agggcctgga atgcaccaag acatgccaga actacgacct ggaatgcatg 2400
agcatgggct gcgtgtccgg ctgtctgtgc cctcctggca tggtgcgcca cgagaataga 2460
tgcgtggccc tggaacggtg cccgtgcttt catcagggca aagagtacgc cccaggcgaa 2520
accgtgaaga tcggctgcaa cacatgcgtg tgtcaggacc ggaagtggaa ctgcaccgac 2580
cacgtgtgcg acgccacctg tagcacaatc ggcatggccc actacctgac cttcgatggc 2640
ctgaagtacc tgttccccgg cgagtgtcag tacgtgctgg tgcaggatta ctgcggcagc 2700
aaccccggca ccttcagaat cctcgtgggc aacaagggct gtagccaccc ctccgtgaag 2760
tgcaagaaac gcgtgaccat cctggtggaa ggcggagaga tcgagctgtt cgacggcgaa 2820
gtgaacgtga agcggcccat gaaggacgag acacacttcg aggtggtgga aagcggccgg 2880
tacatcatcc tgctgctggg caaagccctg tccgtcgtgt gggacagaca cctgagcatc 2940
agcgtggtgc tgaagcagac ctaccaggaa aaagtgtgcg ggctgtgtgg gaactttgac 3000
ggcatccaga acaacgatct gaccagcagc aatctccagg tggaagagga ccccgtggac 3060
ttcggcaatt cctggaaggt gtccagccag tgtgccgaca ccagaaaggt gcccctggat 3120
agcagccccg ccacatgcca caacaacatc atgaagcaga caatggtgga cagcagctgc 3180
cgcatcctga cctccgatgt gtttcaggac tgcaacaaac tggtggaccc cgaaccctac 3240
ctggacgtgt gcatctacga cacatgcagc tgcgagagca tcggcgattg cgcctgcttc 3300
tgcgacacca ttgccgccta cgcccatgtg tgcgcccagc acggaaaggt cgtgacttgg 3360
agaaccgcca ccctgtgccc acagagctgc gaggaacgga acctgcggga aaacggctac 3420
gagtgcgagt ggcggtacaa cagctgtgcc ccagcctgcc aagtgacctg ccagcaccct 3480
gaacctctgg cttgccccgt gcagtgcgtg gaaggatgtc acgcccattg cccacccggc 3540
aagatcctgg atgagctgct ccagacctgt gtggacccag aggactgccc agtgtgcgaa 3600
gtggccggaa gaagattcgc ctccggcaag aaagtgaccc tgaatccctc cgaccccgag 3660
cactgtcaga tttgtcactg cgacgtcgtg aatctgacat gcgaagcctg ccaggaacct 3720
ggcggactgg tggtgcctcc tacagatgcc cctgtgtccc ccaccaccct gtacgtggaa 3780
gatatcagcg agccccccct gcaccaagaa cctggtggac tggtggtgcc tcctacagat 3840
gctcctgtgt ctcccaccac actgtacgtg gaagatatca gcgagcctcc tctgcaccaa 3900
gagccaggcg gacttgtggt cccaccaact gatgcccctg tcagccctac aactctgtac 3960
gtcgaggaca tctccgagcc accactgcac gaggaacccg agtgcaacga tatcaccgcc 4020
agactgcagt acgtgaaagt gggcagctgc aagagcgagg tggaagtgga catccactac 4080
tgccagggca agtgtgccag caaggccatg tacagcatcg acatcaacga cgtgcaggac 4140
cagtgcagct gctgcagccc aacaagaacc gagcctatgc aggtcgccct gcactgtaca 4200
aatggcagcg tggtgtacca cgaggtgctg aacgccatgg aatgcaagtg cagccccaga 4260
aagtgcagca agtaa 4275
<210> 20
<211> 4659
<212> ДНК
<213> Homo sapiens
<400> 20
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctcccaga attcaagaca tcaggaacct ggcggactgg tggtgcctcc tacagatgcc 2340
cctgtgtccc ccaccaccct gtacgtggaa gatatcagcg agccccccct gcaccaggaa 2400
cctggcggac tggtggtgcc tcctacagac gctcctgtgt ctcctacaac actgtatgtg 2460
gaagatattt ccgagcctcc tctgcatcag gaaccagggg gcctggtggt gccaccaact 2520
gatgcaccag tgtctccaac tactctgtac gtggaagata tttctgaacc ccccctgcat 2580
caagcttatc gataccgtcg aggggaaata actcgtacta ctcttcagtc agatcaagag 2640
gaaattgact atgatgatac catatcagtt gaaatgaaga aggaagattt tgacatttat 2700
gatgaggatg aaaatcagag cccccgcagc tttcaaaaga aaacacgaca ctattttatt 2760
gctgcagtgg agaggctctg ggattatggg atgagtagct ccccacatgt tctaagaaac 2820
agggctcaga gtggcagtgt ccctcagttc aagaaagttg ttttccagga atttactgat 2880
ggctccttta ctcagccctt ataccgtgga gaactaaatg aacatttggg actcctgggg 2940
ccatatataa gagcagaagt tgaagataat atcatggtaa ctttcagaaa tcaggcctct 3000
cgtccctatt ccttctattc tagccttatt tcttatgagg aagatcagag gcaaggagca 3060
gaacctagaa aaaactttgt caagcctaat gaaaccaaaa cttacttttg gaaagtgcaa 3120
catcatatgg cacccactaa agatgagttt gactgcaaag cctgggctta tttctctgat 3180
gttgacctgg aaaaagatgt gcactcaggc ctgattggac cccttctggt ctgccacact 3240
aacacactga accctgctca tgggagacaa gtgacagtac aggaatttgc tctgtttttc 3300
accatctttg atgagaccaa aagctggtac ttcactgaaa atatggaaag aaactgcagg 3360
gctccctgca atatccagat ggaagatccc acttttaaag agaattatcg cttccatgca 3420
atcaatggct acataatgga tacactacct ggcttagtaa tggctcagga tcaaaggatt 3480
cgatggtatc tgctcagcat gggcagcaat gaaaacatcc attctattca tttcagtgga 3540
catgtgttca ctgtacgaaa aaaagaggag tataaaatgg cactgtacaa tctctatcca 3600
ggtgtttttg agacagtgga aatgttacca tccaaagctg gaatttggcg ggtggaatgc 3660
cttattggcg agcatctaca tgctgggatg agcacacttt ttctggtgta cagcaataag 3720
tgtcagactc ccctgggaat ggcttctgga cacattagag attttcagat tacagcttca 3780
ggacaatatg gacagtgggc cccaaagctg gccagacttc attattccgg atcaatcaat 3840
gcctggagca ccaaggagcc cttttcttgg atcaaggtgg atctgttggc accaatgatt 3900
attcacggca tcaagaccca gggtgcccgt cagaagttct ccagcctcta catctctcag 3960
tttatcatca tgtatagtct tgatgggaag aagtggcaga cttatcgagg aaattccact 4020
ggaaccttaa tggtcttctt tggcaatgtg gattcatctg ggataaaaca caatattttt 4080
aaccctccaa ttattgctcg atacatccgt ttgcacccaa ctcattatag cattcgcagc 4140
actcttcgca tggagttgat gggctgtgat ttaaatagtt gcagcatgcc attgggaatg 4200
gagagtaaag caatatcaga tgcacagatt actgcttcat cctactttac caatatgttt 4260
gccacctggt ctccttcaaa agctcgactt cacctccaag ggaggagtaa tgcctggaga 4320
cctcaggtga ataatccaaa agagtggctg caagtggact tccagaagac aatgaaagtc 4380
acaggagtaa ctactcaggg agtaaaatct ctgcttacca gcatgtatgt gaaggagttc 4440
ctcatctcca gcagtcaaga tggccatcag tggaccctct tttttcagaa tggcaaagta 4500
aaggtttttc agggaaatca agactccttc acacctgtgg tgaactctct agacccaccg 4560
ttactgactc gctaccttcg aattcacccc cagagttggg tgcaccagat tgccctgagg 4620
atggaggttc tgggctgcga ggcacaggac ctctactga 4659
<210> 21
<211> 1533
<212> БЕЛОК
<213> Homo sapiens
<400> 21
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Gln Ala Tyr Arg
740 745 750
Tyr Arg Arg Gly Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu
755 760 765
Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp
770 775 780
Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln
785 790 795 800
Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp
805 810 815
Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser
820 825 830
Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp
835 840 845
Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu
850 855 860
Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met
865 870 875 880
Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
885 890 895
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys
900 905 910
Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln
915 920 925
His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala
930 935 940
Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile
945 950 955 960
Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly
965 970 975
Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp
980 985 990
Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg
995 1000 1005
Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn
1010 1015 1020
Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro
1025 1030 1035
Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu
1040 1045 1050
Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly
1055 1060 1065
His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu
1070 1075 1080
Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro
1085 1090 1095
Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His
1100 1105 1110
Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys
1115 1120 1125
Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe
1130 1135 1140
Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu
1145 1150 1155
Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys
1160 1165 1170
Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile
1175 1180 1185
Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser
1190 1195 1200
Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys
1205 1210 1215
Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val
1220 1225 1230
Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe
1235 1240 1245
Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His
1250 1255 1260
Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp
1265 1270 1275
Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile
1280 1285 1290
Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe
1295 1300 1305
Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg
1310 1315 1320
Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu
1325 1330 1335
Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr
1340 1345 1350
Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe
1355 1360 1365
Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe
1370 1375 1380
Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe
1385 1390 1395
Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr
1400 1405 1410
Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg
1415 1420 1425
Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr Gln Glu Pro
1430 1435 1440
Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro Thr
1445 1450 1455
Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln Glu
1460 1465 1470
Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser Pro
1475 1480 1485
Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His Gln
1490 1495 1500
Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val Ser
1505 1510 1515
Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu His
1520 1525 1530
<210> 22
<211> 4659
<212> ДНК
<213> Homo sapiens
<400> 22
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctcccaga attcaagaca tcaagcttat cgataccgtc gaggggaaat aactcgtact 2340
actcttcagt cagatcaaga ggaaattgac tatgatgata ccatatcagt tgaaatgaag 2400
aaggaagatt ttgacattta tgatgaggat gaaaatcaga gcccccgcag ctttcaaaag 2460
aaaacacgac actattttat tgctgcagtg gagaggctct gggattatgg gatgagtagc 2520
tccccacatg ttctaagaaa cagggctcag agtggcagtg tccctcagtt caagaaagtt 2580
gttttccagg aatttactga tggctccttt actcagccct tataccgtgg agaactaaat 2640
gaacatttgg gactcctggg gccatatata agagcagaag ttgaagataa tatcatggta 2700
actttcagaa atcaggcctc tcgtccctat tccttctatt ctagccttat ttcttatgag 2760
gaagatcaga ggcaaggagc agaacctaga aaaaactttg tcaagcctaa tgaaaccaaa 2820
acttactttt ggaaagtgca acatcatatg gcacccacta aagatgagtt tgactgcaaa 2880
gcctgggctt atttctctga tgttgacctg gaaaaagatg tgcactcagg cctgattgga 2940
ccccttctgg tctgccacac taacacactg aaccctgctc atgggagaca agtgacagta 3000
caggaatttg ctctgttttt caccatcttt gatgagacca aaagctggta cttcactgaa 3060
aatatggaaa gaaactgcag ggctccctgc aatatccaga tggaagatcc cacttttaaa 3120
gagaattatc gcttccatgc aatcaatggc tacataatgg atacactacc tggcttagta 3180
atggctcagg atcaaaggat tcgatggtat ctgctcagca tgggcagcaa tgaaaacatc 3240
cattctattc atttcagtgg acatgtgttc actgtacgaa aaaaagagga gtataaaatg 3300
gcactgtaca atctctatcc aggtgttttt gagacagtgg aaatgttacc atccaaagct 3360
ggaatttggc gggtggaatg ccttattggc gagcatctac atgctgggat gagcacactt 3420
tttctggtgt acagcaataa gtgtcagact cccctgggaa tggcttctgg acacattaga 3480
gattttcaga ttacagcttc aggacaatat ggacagtggg ccccaaagct ggccagactt 3540
cattattccg gatcaatcaa tgcctggagc accaaggagc ccttttcttg gatcaaggtg 3600
gatctgttgg caccaatgat tattcacggc atcaagaccc agggtgcccg tcagaagttc 3660
tccagcctct acatctctca gtttatcatc atgtatagtc ttgatgggaa gaagtggcag 3720
acttatcgag gaaattccac tggaacctta atggtcttct ttggcaatgt ggattcatct 3780
gggataaaac acaatatttt taaccctcca attattgctc gatacatccg tttgcaccca 3840
actcattata gcattcgcag cactcttcgc atggagttga tgggctgtga tttaaatagt 3900
tgcagcatgc cattgggaat ggagagtaaa gcaatatcag atgcacagat tactgcttca 3960
tcctacttta ccaatatgtt tgccacctgg tctccttcaa aagctcgact tcacctccaa 4020
gggaggagta atgcctggag acctcaggtg aataatccaa aagagtggct gcaagtggac 4080
ttccagaaga caatgaaagt cacaggagta actactcagg gagtaaaatc tctgcttacc 4140
agcatgtatg tgaaggagtt cctcatctcc agcagtcaag atggccatca gtggaccctc 4200
ttttttcaga atggcaaagt aaaggttttt cagggaaatc aagactcctt cacacctgtg 4260
gtgaactctc tagacccacc gttactgact cgctaccttc gaattcaccc ccagagttgg 4320
gtgcaccaga ttgccctgag gatggaggtt ctgggctgcg aggcacagga cctctaccag 4380
gaacctggcg gactggtggt gcctcctaca gatgcccctg tgtcccccac caccctgtac 4440
gtggaagata tcagcgagcc ccccctgcac caggaacctg gcggactggt ggtgcctcct 4500
acagacgctc ctgtgtctcc tacaacactg tatgtggaag atatttccga gcctcctctg 4560
catcaggaac cagggggcct ggtggtgcca ccaactgatg caccagtgtc tccaactact 4620
ctgtacgtgg aagatatttc tgaacccccc ctgcattga 4659
<---
Claims (31)
1. Слитый белок, содержащий основной белок и один или более пептидов удлинения, где аминокислотная последовательность основного белка идентична или схожа с аминокислотной последовательностью белка крови человека или его фрагмента и указанный(е) пептид(ы) удлинения содержит(ат) кластер O-гликозилированных аминокислот с по меньшей мере двумя О-гликозилированными аминокислотами и имеет(ют) идентичность последовательности по меньшей мере 90% к SEQ ID NO: 1 и где слитый белок имеет повышенное время полужизни по сравнению с основным белком без пептида(ов) удлинения.
2. Слитый белок по п.1, где кластеры O-гликозилированных аминокислот пептидов удлинения содержат по меньшей мере три, по меньшей мере четыре O-гликозилированных аминокислоты.
3. Слитый белок по любому из пп. 1 или 2, где один или более пептидов удлинения имеют идентичность последовательности по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - по меньшей мере 100% по отношению к O-гликозилированному пептиду фактора фон Виллебранда (VWF), в частности SEQ ID NO: 1.
4. Слитый белок по любому из предшествующих пунктов, содержащий по меньшей мере две копии, предпочтительно - по меньшей мере четыре копии пептида удлинения.
5. Слитый белок по любому из предшествующих пунктов, где пептид удлинения напрямую или косвенно слит с C-концом основного белка.
6. Слитый белок по любому из предшествующих пунктов, где пептид удлинения образует C-конец слитого белка, где C-концевая аминокислота указанного пептида удлинения, необязательно, соединена с аффинной меткой слитого пептида.
7. Слитый белок по любому из пп. 3-6, где основной белок содержит по меньшей мере один кластер O-гликозилированных аминокислот.
8. Слитый белок по любому из предшествующих пунктов, где слитый белок содержит домен димеризации, в частности основной белок содержит домен димеризации.
9. Слитый белок по любому из предшествующих пунктов, где белок млекопитающего является фактором свертывания или ингибитором протеазы, более предпочтительно выбран из группы, состоящей из VWF, протромбина, фибриногена, FIII, FV, FVII, FVIII, FIX, FX, FXI, FXII, FXIII, ADAMTS13, антитромбина, альфа-1-антитрипсина, ингибитора C1, антихимотрипсина, PAI-1, PAI-3, 2-макроглобулина, TFPI, кофактора гепарина II, протеина Z, протеина C и протеина S.
10. Слитый белок по любому из предшествующих пунктов, где основной белок имеет идентичность последовательности по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к аминокислотам 764-1268 SEQ ID NO: 2.
11. Слитый белок по любому из предшествующих пунктов, где слитый белок содержит по меньшей мере 4, предпочтительно - по меньшей мере 8, более предпочтительно - по меньшей мере 12 дополнительных O-гликанов по сравнению с основным белком.
12. Слитый белок по любому из предшествующих пунктов, где аминокислотная последовательность слитого белка имеет идентичность по меньшей мере 90%, предпочтительно - по меньшей мере 95%, более предпочтительно - по меньшей мере 98%, наиболее предпочтительно - 100% по отношению к последовательности, выбранной из SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 14 или SEQ ID NO: 21.
13. Слитый белок по любому из предшествующих пунктов, где слитый белок получают посредством экспрессии в линии клеток млекопитающего, предпочтительно - линии клеток человека, более предпочтительно - линии клеток почки человека, наиболее предпочтительно - линии эмбриональных клеток почки человек, в частности линии клеток HEK293, такой как HEK293F, где указанные клетки не являются клетками, полученными путем разрушения эмбриона человека.
14. Композиция первого белка и второго белка для лечения или профилактики нарушения свертываемости, где указанный первый белок является слитым белком по любому из пп. 1-13 и способен связываться с указанным вторым белком и указанный второй белок является терапевтическим белком, содержащим аминокислотную последовательность, идентичную или схожую с аминокислотной последовательностью второго белка крови человека или его фрагмента, где второй белок крови человека выбирают из VWF, протромбина, фибриногена, FIII, FV, FVII, FVIII, FIX, FX, FXI, FXII, FXIII, ADAMTS13, антитромбина, альфа-1-антитрипсина, ингибитора C1, антихимотрипсина, PAI-1, PAI-3, 2-макроглобулина, TFPI, кофактора гепарина II, протеина Z, протеина C и протеина S.
15. Композиция по п. 14, где время полужизни второго белка, связанного с первым белком, повышается по сравнению со свободной формой указанного второго белка, предпочтительно, где время полужизни второго белка, связанного с первым белком, повышается по сравнению с указанным вторым белком, связанным с нативным белком млекопитающего, или основным белком без слитого пептида.
16. Композиция по п. 14 или 15, где молярное соотношение первого белка и второго белка находится в диапазоне от 0,1 до 250, предпочтительно - в диапазоне от 0,5 до 50, более предпочтительно - в диапазоне от 1 до 25, наиболее предпочтительно - в диапазоне от 2 до 10.
17. Композиция по любому из пп. 14-16, где аффинность связывания первого белка со вторым белком находится в диапазоне от 0,05 до 3 нМ.
18. Композиция по любому из пп. 14-17, где второй белок млекопитающего является белком крови, более предпочтительно указанный второй белок млекопитающего является белком плазмы, наиболее предпочтительно указанный второй белок является фактором свертывания.
19. Композиция по любому из пп. 14-18, где второй белок является белком FVIII, выбранным из полноразмерного FVIII, белка FVIII, в котором по меньшей мере часть B-домена отсутствует, и белка FVIII, в котором по меньшей мере часть B-домена заменяют пептидом удлинения, где пептид удлинения определяют по любому из пп. 1-3.
20. Композиция по любому из пп. 14-19, где один или более пептидов удлинения находятся в положении в свернутом состоянии первого белка, не мешающем связыванию первого белка со вторым белком.
21. Комплекс первого белка и второго белка для лечения или профилактики нарушения свертываемости, где указанный первый белок является слитым белком по любому из пп. 1-13 и указанный второй белок представляет собой терапевтический белок, содержащий аминокислотную последовательность, идентичную или схожую с аминокислотной последовательностью второго белка крови человека или его фрагмента, где второй белок крови человека выбирают из VWF, протромбина, фибриногена, FIII, FV, FVII, FVIII, FIX, FX, FXI, FXII, FXIII, ADAMTS13, антитромбина, альфа-1-антитрипсина, ингибитора C1, антихимотрипсина, PAI-1, PAI-3, 2-макроглобулина, TFPI, кофактора гепарина II, протеина Z, протеина C и протеина S.
22. Комплекс по п. 21, где первый белок нековалентно связан со вторым белком.
23. Комплекс по п. 21 или 22, содержащий две копии первого и второго белка, где две копии первого белка образуют димер, предпочтительно нековалентно связанный димер.
24. Комплекс по п. 21, где первый белок ковалентно связан со вторым белком, где линкер выбран из пептидной связи, химического линкера или гликозидной связи.
25. Полинуклеотид, кодирующий слитый белок по любому из пп. 1-13.
26. Полинуклеотид по п. 25, кодирующий слитый белок по п. 12.
27. Экспрессирующий вектор, содержащий полинуклеотид по п. 25 или 26, где остов вектора, предпочтительно, выбран из pCDNA3, pCDNA3.1, pCDNA4, pCDNA5, pCDNA6, pCEP4, pCEP-puro, pCET1019, pCMV, pEF1, pEF4, pEF5, pEF6, pExchange, pEXPR, pIRES и pSCAS.
28. Клетка-хозяин для получения слитого белка по любому из пп. 1-13, содержащая полинуклеотид по п. 25 или 26 или вектор по п. 27, где клетка-хозяин является клеткой линии клеток млекопитающего, предпочтительно - линии клеток человека, более предпочтительно - линии клеток почки человека, наиболее предпочтительно - линии эмбриональных клеток почки человека, в частности линии клеток HEK293, такой как HEK293F, где указанная клетка не является клеткой, полученной путем разрушения эмбриона человека.
29. Применение слитого белка по любому из пп. 1-13 для повышения времени полужизни второго белка, где слитый белок способен связываться с указанным вторым белком.
30. Применение фармацевтической композиции, содержащей слитый белок по любому из пп. 1-13, композиции по любому из пп. 14-20 или комплекса по любому из пп. 21-24 для лечения или профилактики нарушения свертываемости, предпочтительно, выбранного из лечения пациентов, ранее не подвергнутых лечению (PUP), и лечения с индукцией иммунологической толерантности (ITI) и/или родственных нарушений свертываемости.
31. Применение по п. 30, где применение включает внутривенную или невнутривенную инъекцию, предпочтительно подкожную инъекцию.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16170690 | 2016-05-20 | ||
EP16170690.8 | 2016-05-20 | ||
PCT/EP2017/059976 WO2017198435A1 (en) | 2016-05-20 | 2017-04-26 | Glycosylated vwf fusion proteins with improved pharmacokinetics |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2018144112A RU2018144112A (ru) | 2020-06-22 |
RU2018144112A3 RU2018144112A3 (ru) | 2021-03-10 |
RU2782212C2 true RU2782212C2 (ru) | 2022-10-24 |
Family
ID=
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993015200A1 (fr) * | 1992-01-31 | 1993-08-05 | Rhone-Poulenc Rorer S.A. | Polypeptides antithrombotiques, antagonistes de la liaison du vwf aux plaquettes et/ou au sous-endothelium |
WO1993015199A1 (fr) * | 1992-01-31 | 1993-08-05 | Rhone-Poulenc Rorer S.A. | Nouveaux polypeptides biologiquement actifs, leur preparation et composition pharmaceutique les contenant |
RU2468080C2 (ru) * | 2004-09-10 | 2012-11-27 | Фанг ФАНГ | Новый класс терапевтических белковых молекул |
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993015200A1 (fr) * | 1992-01-31 | 1993-08-05 | Rhone-Poulenc Rorer S.A. | Polypeptides antithrombotiques, antagonistes de la liaison du vwf aux plaquettes et/ou au sous-endothelium |
WO1993015199A1 (fr) * | 1992-01-31 | 1993-08-05 | Rhone-Poulenc Rorer S.A. | Nouveaux polypeptides biologiquement actifs, leur preparation et composition pharmaceutique les contenant |
RU2468080C2 (ru) * | 2004-09-10 | 2012-11-27 | Фанг ФАНГ | Новый класс терапевтических белковых молекул |
Non-Patent Citations (1)
Title |
---|
DORON CALO et al.: "Enhancing the longevity and in vivo potency of therapeutic proteins: The power of OTP", Precision Medicine, 30.09.2015. * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7113860B2 (ja) | キメラ第viii因子ポリペプチドおよびその使用 | |
KR101507718B1 (ko) | 연장된 생체내 반감기를 갖는 인자 viii, 폰 빌레브란트 인자 또는 이들의 복합체 | |
KR101542752B1 (ko) | 연장된 생체내 반감기를 갖는 변형된 응고 인자 | |
AU2012318292B2 (en) | Method for improving the stability of purified Factor VIII after reconstitution | |
JP5162635B2 (ja) | 高レベルエキスプレッサー第viii因子ポリペプチドをコードする核酸配列およびアミノ酸配列および使用方法 | |
JP2000511407A (ja) | 不活性化耐性第▲viii▼因子 | |
AU2017267047B2 (en) | Glycosylated VWF fusion proteins with improved pharmacokinetics | |
RU2782212C2 (ru) | Гликозилированные слитые белки vwf с улучшенной фармакокинетикой | |
AU2013202564B2 (en) | Factor VIII, von Willebrand factor or complexes thereof with prolonged in vivo half-life | |
US20220118063A1 (en) | Methods and compositions related to improved factor viii long half-life coagulation complexes | |
EP3785726A1 (en) | Factor viii protein with increased half-life | |
AU2015258240A1 (en) | Method of improving the stability of purified factor viii after reconstitution |