CN115943154A - 用于治疗和预防病毒感染的方法和组合物 - Google Patents
用于治疗和预防病毒感染的方法和组合物 Download PDFInfo
- Publication number
- CN115943154A CN115943154A CN202180010808.6A CN202180010808A CN115943154A CN 115943154 A CN115943154 A CN 115943154A CN 202180010808 A CN202180010808 A CN 202180010808A CN 115943154 A CN115943154 A CN 115943154A
- Authority
- CN
- China
- Prior art keywords
- recombinant polypeptide
- virus
- leu
- ser
- viral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 117
- 239000000203 mixture Substances 0.000 title claims abstract description 72
- 230000009385 viral infection Effects 0.000 title claims abstract description 65
- 208000036142 Viral infection Diseases 0.000 title claims abstract description 62
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 416
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 396
- 229920001184 polypeptide Polymers 0.000 claims abstract description 390
- 108070000030 Viral receptors Proteins 0.000 claims abstract description 146
- 239000012634 fragment Substances 0.000 claims abstract description 106
- 230000014509 gene expression Effects 0.000 claims abstract description 78
- 230000001225 therapeutic effect Effects 0.000 claims abstract description 39
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 claims abstract description 31
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 claims abstract description 31
- 238000011282 treatment Methods 0.000 claims abstract description 25
- 241000700605 Viruses Species 0.000 claims description 197
- 229920002971 Heparan sulfate Polymers 0.000 claims description 126
- 108091033319 polynucleotide Proteins 0.000 claims description 93
- 102000040430 polynucleotide Human genes 0.000 claims description 93
- 239000002157 polynucleotide Substances 0.000 claims description 93
- 230000027455 binding Effects 0.000 claims description 77
- 102000005962 receptors Human genes 0.000 claims description 66
- 108020003175 receptors Proteins 0.000 claims description 66
- 239000013598 vector Substances 0.000 claims description 62
- 102100035765 Angiotensin-converting enzyme 2 Human genes 0.000 claims description 60
- 108090000975 Angiotensin-converting enzyme 2 Proteins 0.000 claims description 60
- 108010090804 Streptavidin Proteins 0.000 claims description 60
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 55
- 150000004676 glycans Chemical class 0.000 claims description 53
- 229920001282 polysaccharide Polymers 0.000 claims description 53
- 239000005017 polysaccharide Substances 0.000 claims description 53
- 241001678559 COVID-19 virus Species 0.000 claims description 51
- 239000008194 pharmaceutical composition Substances 0.000 claims description 49
- 241000315672 SARS coronavirus Species 0.000 claims description 44
- 208000015181 infectious disease Diseases 0.000 claims description 42
- 241000711573 Coronaviridae Species 0.000 claims description 41
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 claims description 41
- 239000013604 expression vector Substances 0.000 claims description 40
- 229920000669 heparin Polymers 0.000 claims description 40
- 229960002897 heparin Drugs 0.000 claims description 40
- 238000005670 sulfation reaction Methods 0.000 claims description 39
- 230000019635 sulfation Effects 0.000 claims description 38
- 244000309467 Human Coronavirus Species 0.000 claims description 36
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 claims description 35
- 108091028664 Ribonucleotide Proteins 0.000 claims description 31
- 239000002336 ribonucleotide Substances 0.000 claims description 31
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 31
- 108091005487 SCARB1 Proteins 0.000 claims description 27
- 150000001413 amino acids Chemical group 0.000 claims description 27
- 102100037118 Scavenger receptor class B member 1 Human genes 0.000 claims description 25
- JPSHPWJJSVEEAX-OWPBQMJCSA-N (2s)-2-amino-4-fluoranylpentanedioic acid Chemical compound OC(=O)[C@@H](N)CC([18F])C(O)=O JPSHPWJJSVEEAX-OWPBQMJCSA-N 0.000 claims description 24
- 108010007712 Hepatitis A Virus Cellular Receptor 1 Proteins 0.000 claims description 24
- 102100034459 Hepatitis A virus cellular receptor 1 Human genes 0.000 claims description 24
- 208000001528 Coronaviridae Infections Diseases 0.000 claims description 22
- 208000025370 Middle East respiratory syndrome Diseases 0.000 claims description 22
- 241000710781 Flaviviridae Species 0.000 claims description 21
- 101000914479 Homo sapiens CD81 antigen Proteins 0.000 claims description 21
- 102100027221 CD81 antigen Human genes 0.000 claims description 20
- 102100032412 Basigin Human genes 0.000 claims description 18
- 101000798441 Homo sapiens Basigin Proteins 0.000 claims description 18
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 claims description 18
- 101000908391 Homo sapiens Dipeptidyl peptidase 4 Proteins 0.000 claims description 17
- 208000025721 COVID-19 Diseases 0.000 claims description 15
- 102100025012 Dipeptidyl peptidase 4 Human genes 0.000 claims description 15
- -1 ptdSer R (CD 300 a) Proteins 0.000 claims description 15
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 claims description 15
- 101150098329 Tyro3 gene Proteins 0.000 claims description 14
- 108010037897 DC-specific ICAM-3 grabbing nonintegrin Proteins 0.000 claims description 13
- 101000807561 Homo sapiens Tyrosine-protein kinase receptor UFO Proteins 0.000 claims description 13
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 claims description 13
- 108010003533 Viral Envelope Proteins Proteins 0.000 claims description 13
- 208000037847 SARS-CoV-2-infection Diseases 0.000 claims description 12
- 241000710886 West Nile virus Species 0.000 claims description 12
- 241000700739 Hepadnaviridae Species 0.000 claims description 11
- 125000000539 amino acid group Chemical group 0.000 claims description 11
- 241000725619 Dengue virus Species 0.000 claims description 10
- 241000702421 Dependoparvovirus Species 0.000 claims description 10
- 230000002378 acidificating effect Effects 0.000 claims description 10
- 206010046865 Vaccinia virus infection Diseases 0.000 claims description 9
- 208000007089 vaccinia Diseases 0.000 claims description 9
- 241000907316 Zika virus Species 0.000 claims description 7
- 230000000241 respiratory effect Effects 0.000 claims description 7
- 241001115402 Ebolavirus Species 0.000 claims description 6
- 210000002345 respiratory system Anatomy 0.000 claims description 6
- 101100150273 Caenorhabditis elegans srb-1 gene Proteins 0.000 claims description 5
- 102100039367 T-cell immunoglobulin and mucin domain-containing protein 4 Human genes 0.000 claims description 4
- 101710174757 T-cell immunoglobulin and mucin domain-containing protein 4 Proteins 0.000 claims description 4
- 239000006199 nebulizer Substances 0.000 claims description 4
- 108010078070 scavenger receptors Proteins 0.000 claims description 4
- 102000014452 scavenger receptors Human genes 0.000 claims description 4
- 125000005629 sialic acid group Chemical group 0.000 claims description 3
- 108010003524 sodium-bile acid cotransporter Proteins 0.000 claims description 3
- 208000001490 Dengue Diseases 0.000 claims description 2
- 206010012310 Dengue fever Diseases 0.000 claims description 2
- 208000025729 dengue disease Diseases 0.000 claims description 2
- 230000002265 prevention Effects 0.000 abstract description 9
- 210000004027 cell Anatomy 0.000 description 164
- 108090000623 proteins and genes Proteins 0.000 description 117
- 102000004169 proteins and genes Human genes 0.000 description 100
- 235000018102 proteins Nutrition 0.000 description 96
- 102000008055 Heparan Sulfate Proteoglycans Human genes 0.000 description 65
- 108090000054 Syndecan-2 Proteins 0.000 description 65
- 241000282414 Homo sapiens Species 0.000 description 63
- 108091016585 CD44 antigen Proteins 0.000 description 48
- 108020004414 DNA Proteins 0.000 description 48
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 42
- 241000711549 Hepacivirus C Species 0.000 description 40
- 125000003275 alpha amino acid group Chemical group 0.000 description 39
- 230000003612 virological effect Effects 0.000 description 38
- 239000000539 dimer Substances 0.000 description 35
- 102000000844 Cell Surface Receptors Human genes 0.000 description 28
- 108010001857 Cell Surface Receptors Proteins 0.000 description 28
- 238000003556 assay Methods 0.000 description 28
- 235000001014 amino acid Nutrition 0.000 description 27
- 229940024606 amino acid Drugs 0.000 description 27
- 239000002773 nucleotide Substances 0.000 description 25
- 125000003729 nucleotide group Chemical group 0.000 description 25
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 23
- 239000002245 particle Substances 0.000 description 23
- 239000000047 product Substances 0.000 description 23
- 229960002685 biotin Drugs 0.000 description 21
- 235000020958 biotin Nutrition 0.000 description 21
- 239000011616 biotin Substances 0.000 description 21
- 108010050848 glycylleucine Proteins 0.000 description 20
- 239000013603 viral vector Substances 0.000 description 20
- 238000004113 cell culture Methods 0.000 description 19
- 238000000338 in vitro Methods 0.000 description 19
- 102100030988 Angiotensin-converting enzyme Human genes 0.000 description 18
- 150000007523 nucleic acids Chemical class 0.000 description 18
- 108091028043 Nucleic acid sequence Proteins 0.000 description 17
- 230000000694 effects Effects 0.000 description 17
- 241001112090 Pseudovirus Species 0.000 description 16
- 241000700721 Hepatitis B virus Species 0.000 description 15
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 15
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 15
- 201000010099 disease Diseases 0.000 description 15
- 230000006870 function Effects 0.000 description 15
- 239000002609 medium Substances 0.000 description 15
- 208000024891 symptom Diseases 0.000 description 15
- 108010061238 threonyl-glycine Proteins 0.000 description 15
- 101000638154 Homo sapiens Transmembrane protease serine 2 Proteins 0.000 description 14
- 238000012360 testing method Methods 0.000 description 14
- 108091026890 Coding region Proteins 0.000 description 13
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 13
- 102100031989 Transmembrane protease serine 2 Human genes 0.000 description 13
- 102000037865 fusion proteins Human genes 0.000 description 13
- 108020001507 fusion proteins Proteins 0.000 description 13
- 239000000499 gel Substances 0.000 description 13
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 13
- 241000880493 Leptailurus serval Species 0.000 description 12
- 239000003153 chemical reaction reagent Substances 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 108060003951 Immunoglobulin Proteins 0.000 description 11
- 108010002350 Interleukin-2 Proteins 0.000 description 11
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 11
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 11
- 108010067390 Viral Proteins Proteins 0.000 description 11
- 108010092854 aspartyllysine Proteins 0.000 description 11
- 102000018358 immunoglobulin Human genes 0.000 description 11
- 230000005764 inhibitory process Effects 0.000 description 11
- 102000039446 nucleic acids Human genes 0.000 description 11
- 108020004707 nucleic acids Proteins 0.000 description 11
- 235000000346 sugar Nutrition 0.000 description 11
- 238000001890 transfection Methods 0.000 description 11
- 108060001084 Luciferase Proteins 0.000 description 10
- 241000714177 Murine leukemia virus Species 0.000 description 10
- 230000014616 translation Effects 0.000 description 10
- 102000016611 Proteoglycans Human genes 0.000 description 9
- 108010067787 Proteoglycans Proteins 0.000 description 9
- 230000001413 cellular effect Effects 0.000 description 9
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 9
- 108010010147 glycylglutamine Proteins 0.000 description 9
- 238000001727 in vivo Methods 0.000 description 9
- 230000000069 prophylactic effect Effects 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 8
- 108010022901 Heparin Lyase Proteins 0.000 description 8
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 8
- 239000005089 Luciferase Substances 0.000 description 8
- 241000127282 Middle East respiratory syndrome-related coronavirus Species 0.000 description 8
- 108010076504 Protein Sorting Signals Proteins 0.000 description 8
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 8
- 208000035475 disorder Diseases 0.000 description 8
- 239000003814 drug Substances 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 239000002502 liposome Substances 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000001262 western blot Methods 0.000 description 8
- 102100031673 Corneodesmosin Human genes 0.000 description 7
- 101710139375 Corneodesmosin Proteins 0.000 description 7
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 7
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 7
- VOAKKHOIAFKOQZ-JYJNAYRXSA-N Met-Tyr-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=C(O)C=C1 VOAKKHOIAFKOQZ-JYJNAYRXSA-N 0.000 description 7
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 7
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 7
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 7
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 7
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 7
- 108010087924 alanylproline Proteins 0.000 description 7
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 7
- 108010093581 aspartyl-proline Proteins 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 7
- 239000003112 inhibitor Substances 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 108010070643 prolylglutamic acid Proteins 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- QAOWNCQODCNURD-UHFFFAOYSA-L sulfate group Chemical group S(=O)(=O)([O-])[O-] QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 7
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 6
- 208000002109 Argyria Diseases 0.000 description 6
- 102100036597 Basement membrane-specific heparan sulfate proteoglycan core protein Human genes 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 6
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 6
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 6
- 102000010956 Glypican Human genes 0.000 description 6
- 108050001154 Glypican Proteins 0.000 description 6
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 6
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 101000629318 Severe acute respiratory syndrome coronavirus 2 Spike glycoprotein Proteins 0.000 description 6
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 6
- 108020000999 Viral RNA Proteins 0.000 description 6
- 230000010530 Virus Neutralization Effects 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 239000002299 complementary DNA Substances 0.000 description 6
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 6
- 238000006206 glycosylation reaction Methods 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 6
- 239000003446 ligand Substances 0.000 description 6
- 230000007774 longterm Effects 0.000 description 6
- 108010003700 lysyl aspartic acid Proteins 0.000 description 6
- 108010064235 lysylglycine Proteins 0.000 description 6
- 210000004779 membrane envelope Anatomy 0.000 description 6
- 238000004806 packaging method and process Methods 0.000 description 6
- 108010049224 perlecan Proteins 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 108010051110 tyrosyl-lysine Proteins 0.000 description 6
- 229960005486 vaccine Drugs 0.000 description 6
- SQDAZGGFXASXDW-UHFFFAOYSA-N 5-bromo-2-(trifluoromethoxy)pyridine Chemical compound FC(F)(F)OC1=CC=C(Br)C=N1 SQDAZGGFXASXDW-UHFFFAOYSA-N 0.000 description 5
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 5
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 5
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 5
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 5
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 5
- 108090000565 Capsid Proteins Proteins 0.000 description 5
- 102100023321 Ceruloplasmin Human genes 0.000 description 5
- 229920001287 Chondroitin sulfate Polymers 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- 241000709661 Enterovirus Species 0.000 description 5
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 5
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 5
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 5
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 description 5
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 5
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 5
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 5
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 5
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 5
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 description 5
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 5
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 5
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 5
- 239000013592 cell lysate Substances 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 229940059329 chondroitin sulfate Drugs 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 108010078428 env Gene Products Proteins 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 5
- 108010083213 heparitinsulfate lyase Proteins 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 238000007918 intramuscular administration Methods 0.000 description 5
- 238000001990 intravenous administration Methods 0.000 description 5
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 5
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 5
- 108010017391 lysylvaline Proteins 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000003389 potentiating effect Effects 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- 230000028327 secretion Effects 0.000 description 5
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 5
- 229910052709 silver Inorganic materials 0.000 description 5
- 239000004332 silver Substances 0.000 description 5
- 125000006850 spacer group Chemical group 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 230000005030 transcription termination Effects 0.000 description 5
- IESDGNYHXIOKRW-YXMSTPNBSA-N (2s)-2-[[(2s)-1-[(2s)-6-amino-2-[[(2s,3r)-2-amino-3-hydroxybutanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IESDGNYHXIOKRW-YXMSTPNBSA-N 0.000 description 4
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 4
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 4
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 4
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 4
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 4
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 4
- ZXCAQANTQWBICD-DCAQKATOSA-N Cys-Lys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N ZXCAQANTQWBICD-DCAQKATOSA-N 0.000 description 4
- AEMOLEFTQBMNLQ-AQKNRBDQSA-N D-glucopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-AQKNRBDQSA-N 0.000 description 4
- 241000711950 Filoviridae Species 0.000 description 4
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 4
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 4
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 4
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 4
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 4
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 4
- 229920002683 Glycosaminoglycan Polymers 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- WMKXFMUJRCEGRP-SRVKXCTJSA-N His-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N WMKXFMUJRCEGRP-SRVKXCTJSA-N 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 4
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 4
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 4
- 108010065920 Insulin Lispro Proteins 0.000 description 4
- 102100034353 Integrase Human genes 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 4
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 4
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 4
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 4
- 241000283973 Oryctolagus cuniculus Species 0.000 description 4
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 4
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 4
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 4
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 4
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 4
- 102000019361 Syndecan Human genes 0.000 description 4
- 108050006774 Syndecan Proteins 0.000 description 4
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 4
- 108700019146 Transgenes Proteins 0.000 description 4
- DQDXHYIEITXNJY-BPUTZDHNSA-N Trp-Gln-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N DQDXHYIEITXNJY-BPUTZDHNSA-N 0.000 description 4
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 4
- OFHKXNKJXURPSY-ULQDDVLXSA-N Tyr-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O OFHKXNKJXURPSY-ULQDDVLXSA-N 0.000 description 4
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 4
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 4
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 4
- 101150054399 ace2 gene Proteins 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 239000003443 antiviral agent Substances 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 239000011324 bead Substances 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 210000000234 capsid Anatomy 0.000 description 4
- 239000006143 cell culture medium Substances 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 239000003636 conditioned culture medium Substances 0.000 description 4
- 108010060199 cysteinylproline Proteins 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000001476 gene delivery Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 4
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 210000004185 liver Anatomy 0.000 description 4
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 108010077112 prolyl-proline Proteins 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 230000003362 replicative effect Effects 0.000 description 4
- 230000002195 synergetic effect Effects 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 239000013638 trimer Substances 0.000 description 4
- 241001430294 unidentified retrovirus Species 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 108010052774 valyl-lysyl-glycyl-phenylalanyl-tyrosine Proteins 0.000 description 4
- 230000007502 viral entry Effects 0.000 description 4
- 230000029812 viral genome replication Effects 0.000 description 4
- PQFMROVJTOPVDF-JBDRJPRFSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PQFMROVJTOPVDF-JBDRJPRFSA-N 0.000 description 3
- WJRXVTCKASUIFF-FXQIFTODSA-N Ala-Cys-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WJRXVTCKASUIFF-FXQIFTODSA-N 0.000 description 3
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 3
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 3
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 3
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 3
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 3
- KNENKKKUYGEZIO-FXQIFTODSA-N Asn-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N KNENKKKUYGEZIO-FXQIFTODSA-N 0.000 description 3
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 3
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 3
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 3
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 3
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 3
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 3
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 3
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 3
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 3
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 3
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 3
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 3
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 3
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 3
- KWLMLNHADZIJIS-CIUDSAMLSA-N Gln-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N KWLMLNHADZIJIS-CIUDSAMLSA-N 0.000 description 3
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 3
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 3
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 3
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 3
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 3
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 3
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 3
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 3
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 3
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 3
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 3
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 3
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 3
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 3
- 102000003886 Glycoproteins Human genes 0.000 description 3
- 108090000288 Glycoproteins Proteins 0.000 description 3
- 101000929928 Homo sapiens Angiotensin-converting enzyme 2 Proteins 0.000 description 3
- 101000740659 Homo sapiens Scavenger receptor class B member 1 Proteins 0.000 description 3
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 3
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 3
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 3
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 3
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 3
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 3
- AUNMOHYWTAPQLA-XUXIUFHCSA-N Leu-Met-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AUNMOHYWTAPQLA-XUXIUFHCSA-N 0.000 description 3
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 3
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 3
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 3
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 3
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 3
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 3
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 3
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 3
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 3
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 3
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 3
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 3
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 3
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 3
- VYXIKLFLGRTANT-HRCADAONSA-N Met-Tyr-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N VYXIKLFLGRTANT-HRCADAONSA-N 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 3
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 3
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 3
- JDMKQHSHKJHAHR-UHFFFAOYSA-N Phe-Phe-Leu-Tyr Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)CC1=CC=CC=C1 JDMKQHSHKJHAHR-UHFFFAOYSA-N 0.000 description 3
- 241001505332 Polyomavirus sp. Species 0.000 description 3
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 3
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 3
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 3
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 3
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 3
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 3
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 3
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 3
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 3
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 3
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 3
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 3
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 3
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 3
- AXKJPUBALUNJEO-UBHSHLNASA-N Ser-Trp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O AXKJPUBALUNJEO-UBHSHLNASA-N 0.000 description 3
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 3
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 3
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 3
- 108700009124 Transcription Initiation Site Proteins 0.000 description 3
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 3
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 3
- GEGYPBOPIGNZIF-CWRNSKLLSA-N Trp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O GEGYPBOPIGNZIF-CWRNSKLLSA-N 0.000 description 3
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 3
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 3
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 3
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 3
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 3
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 3
- SBJCTAZFSZXWSR-AVGNSLFASA-N Val-Met-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SBJCTAZFSZXWSR-AVGNSLFASA-N 0.000 description 3
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 3
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 3
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 3
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 3
- 108010066342 Virus Receptors Proteins 0.000 description 3
- 102000018265 Virus Receptors Human genes 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 239000004480 active ingredient Substances 0.000 description 3
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 230000010056 antibody-dependent cellular cytotoxicity Effects 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 150000001720 carbohydrates Chemical class 0.000 description 3
- 230000004186 co-expression Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000034994 death Effects 0.000 description 3
- 231100000517 death Toxicity 0.000 description 3
- 239000005547 deoxyribonucleotide Substances 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000012636 effector Substances 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 102000048657 human ACE2 Human genes 0.000 description 3
- 102000051417 human SCARB1 Human genes 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 238000004020 luminiscence type Methods 0.000 description 3
- 239000012139 lysis buffer Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 238000006386 neutralization reaction Methods 0.000 description 3
- 230000003472 neutralizing effect Effects 0.000 description 3
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 3
- 230000001177 retroviral effect Effects 0.000 description 3
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 3
- 108010071207 serylmethionine Proteins 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000002269 spontaneous effect Effects 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 238000007920 subcutaneous administration Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 125000000020 sulfo group Chemical group O=S(=O)([*])O[H] 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000032258 transport Effects 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- DIBLBAURNYJYBF-XLXZRNDBSA-N (2s)-2-[[(2s)-2-[[2-[[(2s)-6-amino-2-[[(2s)-2-amino-3-methylbutanoyl]amino]hexanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 DIBLBAURNYJYBF-XLXZRNDBSA-N 0.000 description 2
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- 239000013607 AAV vector Substances 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 2
- 108010076441 Ala-His-His Proteins 0.000 description 2
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- OQWQTGBOFPJOIF-DLOVCJGASA-N Ala-Lys-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N OQWQTGBOFPJOIF-DLOVCJGASA-N 0.000 description 2
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 2
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 2
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 2
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 2
- FSXDWQGEWZQBPJ-HERUPUMHSA-N Ala-Trp-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FSXDWQGEWZQBPJ-HERUPUMHSA-N 0.000 description 2
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 2
- XKHLBBQNPSOGPI-GUBZILKMSA-N Ala-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N XKHLBBQNPSOGPI-GUBZILKMSA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 2
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 2
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 2
- MTANSHNQTWPZKP-KKUMJFAQSA-N Arg-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O MTANSHNQTWPZKP-KKUMJFAQSA-N 0.000 description 2
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 2
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 2
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 2
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 2
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 2
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 2
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 2
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 2
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 2
- BXLDDWZOTGGNOJ-SZMVWBNQSA-N Arg-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N BXLDDWZOTGGNOJ-SZMVWBNQSA-N 0.000 description 2
- CNBIWSCSSCAINS-UFYCRDLUSA-N Arg-Tyr-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNBIWSCSSCAINS-UFYCRDLUSA-N 0.000 description 2
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 2
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 2
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 2
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 2
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 2
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 2
- FUHFYEKSGWOWGZ-XHNCKOQMSA-N Asn-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O FUHFYEKSGWOWGZ-XHNCKOQMSA-N 0.000 description 2
- PPMTUXJSQDNUDE-CIUDSAMLSA-N Asn-Glu-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PPMTUXJSQDNUDE-CIUDSAMLSA-N 0.000 description 2
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 2
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 2
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 2
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 2
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 2
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 2
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 2
- UHGUKCOQUNPSKK-CIUDSAMLSA-N Asn-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N UHGUKCOQUNPSKK-CIUDSAMLSA-N 0.000 description 2
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 2
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 2
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 2
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 2
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 2
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 2
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 2
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 2
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 2
- LGCVSPFCFXWUEY-IHPCNDPISA-N Asn-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N LGCVSPFCFXWUEY-IHPCNDPISA-N 0.000 description 2
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 2
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 2
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 2
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 2
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 2
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 2
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 2
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 2
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 2
- AAIUGNSRQDGCDC-ZLUOBGJFSA-N Asp-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)O AAIUGNSRQDGCDC-ZLUOBGJFSA-N 0.000 description 2
- IAMNNSSEBXDJMN-CIUDSAMLSA-N Asp-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N IAMNNSSEBXDJMN-CIUDSAMLSA-N 0.000 description 2
- WLKVEEODTPQPLI-ACZMJKKPSA-N Asp-Gln-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O WLKVEEODTPQPLI-ACZMJKKPSA-N 0.000 description 2
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 2
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 2
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 2
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 2
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 2
- KOWYNSKRPUWSFG-IHPCNDPISA-N Asp-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)O)N KOWYNSKRPUWSFG-IHPCNDPISA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 2
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 2
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 2
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 2
- HTSSXFASOUSJQG-IHPCNDPISA-N Asp-Tyr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HTSSXFASOUSJQG-IHPCNDPISA-N 0.000 description 2
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 2
- GXIUDSXIUSTSLO-QXEWZRGKSA-N Asp-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N GXIUDSXIUSTSLO-QXEWZRGKSA-N 0.000 description 2
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 2
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 241001502567 Chikungunya virus Species 0.000 description 2
- 241000709687 Coxsackievirus Species 0.000 description 2
- SBMGKDLRJLYZCU-BIIVOSGPSA-N Cys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N)C(=O)O SBMGKDLRJLYZCU-BIIVOSGPSA-N 0.000 description 2
- BIVLWXQGXJLGKG-BIIVOSGPSA-N Cys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)C(=O)O BIVLWXQGXJLGKG-BIIVOSGPSA-N 0.000 description 2
- BVFQOPGFOQVZTE-ACZMJKKPSA-N Cys-Gln-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O BVFQOPGFOQVZTE-ACZMJKKPSA-N 0.000 description 2
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 2
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 2
- SMEYEQDCCBHTEF-FXQIFTODSA-N Cys-Pro-Ala Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O SMEYEQDCCBHTEF-FXQIFTODSA-N 0.000 description 2
- RAGIABZNLPZBGS-FXQIFTODSA-N Cys-Pro-Cys Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(O)=O RAGIABZNLPZBGS-FXQIFTODSA-N 0.000 description 2
- IRKLTAKLAFUTLA-KATARQTJSA-N Cys-Thr-Lys Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CCCCN)C(O)=O IRKLTAKLAFUTLA-KATARQTJSA-N 0.000 description 2
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 241001466953 Echovirus Species 0.000 description 2
- 241000701867 Enterobacteria phage T7 Species 0.000 description 2
- 241001529459 Enterovirus A71 Species 0.000 description 2
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 2
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 2
- OVQXQLWWJSNYFV-XEGUGMAKSA-N Gln-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(N)=O)C)C(O)=O)=CNC2=C1 OVQXQLWWJSNYFV-XEGUGMAKSA-N 0.000 description 2
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 2
- OIIIRRTWYLCQNW-ACZMJKKPSA-N Gln-Cys-Asn Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O OIIIRRTWYLCQNW-ACZMJKKPSA-N 0.000 description 2
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 2
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 2
- DOMHVQBSRJNNKD-ZPFDUUQYSA-N Gln-Met-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DOMHVQBSRJNNKD-ZPFDUUQYSA-N 0.000 description 2
- CULXMOZETKLBDI-XIRDDKMYSA-N Gln-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N CULXMOZETKLBDI-XIRDDKMYSA-N 0.000 description 2
- HHRAEXBUNGTOGZ-IHRRRGAJSA-N Gln-Phe-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O HHRAEXBUNGTOGZ-IHRRRGAJSA-N 0.000 description 2
- ZVQZXPADLZIQFF-FHWLQOOXSA-N Gln-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 ZVQZXPADLZIQFF-FHWLQOOXSA-N 0.000 description 2
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 2
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 2
- OACQOWPRWGNKTP-AVGNSLFASA-N Gln-Tyr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O OACQOWPRWGNKTP-AVGNSLFASA-N 0.000 description 2
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 2
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 2
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 2
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 2
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 2
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 2
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 2
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 2
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 2
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 2
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 2
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 2
- OFIHURVSQXAZIR-SZMVWBNQSA-N Glu-Lys-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OFIHURVSQXAZIR-SZMVWBNQSA-N 0.000 description 2
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 2
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 2
- ZTVGZOIBLRPQNR-KKUMJFAQSA-N Glu-Met-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZTVGZOIBLRPQNR-KKUMJFAQSA-N 0.000 description 2
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 2
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 2
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 2
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 2
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 2
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 2
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 2
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 2
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 2
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 2
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 2
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- HHSOPSCKAZKQHQ-PEXQALLHSA-N Gly-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN HHSOPSCKAZKQHQ-PEXQALLHSA-N 0.000 description 2
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 2
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 2
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 2
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 2
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 2
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 2
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 2
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 2
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- 241000893570 Hendra henipavirus Species 0.000 description 2
- MAABHGXCIBEYQR-XVYDVKMFSA-N His-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MAABHGXCIBEYQR-XVYDVKMFSA-N 0.000 description 2
- CTGZVVQVIBSOBB-AVGNSLFASA-N His-His-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O CTGZVVQVIBSOBB-AVGNSLFASA-N 0.000 description 2
- BPOHQCZZSFBSON-KKUMJFAQSA-N His-Leu-His Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BPOHQCZZSFBSON-KKUMJFAQSA-N 0.000 description 2
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 2
- LYDKQVYYCMYNMC-SRVKXCTJSA-N His-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LYDKQVYYCMYNMC-SRVKXCTJSA-N 0.000 description 2
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 2
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 2
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 2
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 2
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 2
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101100273730 Homo sapiens CD5 gene Proteins 0.000 description 2
- 241001135569 Human adenovirus 5 Species 0.000 description 2
- 241000482741 Human coronavirus NL63 Species 0.000 description 2
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 2
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 2
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 2
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 2
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 2
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 2
- 241000710842 Japanese encephalitis virus Species 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 2
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 2
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 2
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 2
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 2
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 2
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 2
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 2
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 2
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 2
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 2
- LQUIENKUVKPNIC-ULQDDVLXSA-N Leu-Met-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LQUIENKUVKPNIC-ULQDDVLXSA-N 0.000 description 2
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 2
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 2
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 2
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 2
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 2
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 2
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 2
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 2
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 2
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 2
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 2
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 2
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 2
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 2
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 2
- CRIODIGWCUPXKU-AVGNSLFASA-N Lys-Pro-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O CRIODIGWCUPXKU-AVGNSLFASA-N 0.000 description 2
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 2
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- LKDXINHHSWFFJC-SRVKXCTJSA-N Lys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N LKDXINHHSWFFJC-SRVKXCTJSA-N 0.000 description 2
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 2
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 2
- OPJRECCCQSDDCZ-TUSQITKMSA-N Lys-Trp-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OPJRECCCQSDDCZ-TUSQITKMSA-N 0.000 description 2
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 2
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 2
- DCHHUGLTVLJYKA-FXQIFTODSA-N Met-Asn-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DCHHUGLTVLJYKA-FXQIFTODSA-N 0.000 description 2
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 2
- DJBCKVNHEIJLQA-GMOBBJLQSA-N Met-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCSC)N DJBCKVNHEIJLQA-GMOBBJLQSA-N 0.000 description 2
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 2
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 2
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 2
- FNYBIOGBMWFQRJ-SRVKXCTJSA-N Met-Pro-Met Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N FNYBIOGBMWFQRJ-SRVKXCTJSA-N 0.000 description 2
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 2
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 2
- KLGIQJRMFHIGCQ-ZFWWWQNUSA-N Met-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)NCC(O)=O)=CNC2=C1 KLGIQJRMFHIGCQ-ZFWWWQNUSA-N 0.000 description 2
- YDKYJRZWRJTILC-WDSOQIARSA-N Met-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 YDKYJRZWRJTILC-WDSOQIARSA-N 0.000 description 2
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 2
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 2
- 241000526636 Nipah henipavirus Species 0.000 description 2
- 239000012124 Opti-MEM Substances 0.000 description 2
- 241000282579 Pan Species 0.000 description 2
- 208000002606 Paramyxoviridae Infections Diseases 0.000 description 2
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 2
- MQWISMJKHOUEMW-ULQDDVLXSA-N Phe-Arg-His Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 MQWISMJKHOUEMW-ULQDDVLXSA-N 0.000 description 2
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 2
- JOXIIFVCSATTDH-IHPCNDPISA-N Phe-Asn-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JOXIIFVCSATTDH-IHPCNDPISA-N 0.000 description 2
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 2
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 2
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 2
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 2
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 2
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 2
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 2
- YOFKMVUAZGPFCF-IHRRRGAJSA-N Phe-Met-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O YOFKMVUAZGPFCF-IHRRRGAJSA-N 0.000 description 2
- CKJACGQPCPMWIT-UFYCRDLUSA-N Phe-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CKJACGQPCPMWIT-UFYCRDLUSA-N 0.000 description 2
- LKRUQZQZMXMKEQ-SFJXLCSZSA-N Phe-Trp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LKRUQZQZMXMKEQ-SFJXLCSZSA-N 0.000 description 2
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 2
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 2
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- INXAPZFIOVGHSV-CIUDSAMLSA-N Pro-Asn-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 INXAPZFIOVGHSV-CIUDSAMLSA-N 0.000 description 2
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 2
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 2
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 2
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 2
- GBRUQFBAJOKCTF-DCAQKATOSA-N Pro-His-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O GBRUQFBAJOKCTF-DCAQKATOSA-N 0.000 description 2
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 2
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 2
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 2
- BLJMJZOMZRCESA-GUBZILKMSA-N Pro-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BLJMJZOMZRCESA-GUBZILKMSA-N 0.000 description 2
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 2
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 2
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 2
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 2
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 2
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 2
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 2
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 2
- VBZXFFYOBDLLFE-HSHDSVGOSA-N Pro-Trp-Thr Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H]([C@H](O)C)C(O)=O)C(=O)[C@@H]1CCCN1 VBZXFFYOBDLLFE-HSHDSVGOSA-N 0.000 description 2
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 2
- 229940096437 Protein S Drugs 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- UEJYSALTSUZXFV-SRVKXCTJSA-N Rigin Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UEJYSALTSUZXFV-SRVKXCTJSA-N 0.000 description 2
- 241000710961 Semliki Forest virus Species 0.000 description 2
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 2
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 2
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 2
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 2
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 2
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 2
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 2
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 2
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 2
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 2
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 2
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 2
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 2
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 2
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 2
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 2
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 241000710960 Sindbis virus Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 101710198474 Spike protein Proteins 0.000 description 2
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 2
- NRUPKQSXTJNQGD-XGEHTFHBSA-N Thr-Cys-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NRUPKQSXTJNQGD-XGEHTFHBSA-N 0.000 description 2
- DSLHSTIUAPKERR-XGEHTFHBSA-N Thr-Cys-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O DSLHSTIUAPKERR-XGEHTFHBSA-N 0.000 description 2
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 2
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 2
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 2
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 2
- XIULAFZYEKSGAJ-IXOXFDKPSA-N Thr-Leu-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XIULAFZYEKSGAJ-IXOXFDKPSA-N 0.000 description 2
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 2
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 2
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 2
- GYUUYCIXELGTJS-MEYUZBJRSA-N Thr-Phe-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O GYUUYCIXELGTJS-MEYUZBJRSA-N 0.000 description 2
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 2
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- VMSSYINFMOFLJM-KJEVXHAQSA-N Thr-Tyr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O VMSSYINFMOFLJM-KJEVXHAQSA-N 0.000 description 2
- 208000007536 Thrombosis Diseases 0.000 description 2
- MHNHRNHJMXAVHZ-AAEUAGOBSA-N Trp-Asn-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N MHNHRNHJMXAVHZ-AAEUAGOBSA-N 0.000 description 2
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 2
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 2
- FBGDDUKYOBNZJL-WDSOQIARSA-N Trp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N FBGDDUKYOBNZJL-WDSOQIARSA-N 0.000 description 2
- SSSDKJMQMZTMJP-BVSLBCMMSA-N Trp-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 SSSDKJMQMZTMJP-BVSLBCMMSA-N 0.000 description 2
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 2
- CDRYEAWHKJSGAF-BPNCWPANSA-N Tyr-Ala-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O CDRYEAWHKJSGAF-BPNCWPANSA-N 0.000 description 2
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 2
- FXYOYUMPUJONGW-FHWLQOOXSA-N Tyr-Gln-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 FXYOYUMPUJONGW-FHWLQOOXSA-N 0.000 description 2
- OSMTVLSRTQDWHJ-JBACZVJFSA-N Tyr-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 OSMTVLSRTQDWHJ-JBACZVJFSA-N 0.000 description 2
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 2
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 2
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 2
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 2
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 2
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 2
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 2
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 2
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 2
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 2
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 2
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 2
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 2
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 2
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 2
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 2
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 2
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 2
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 2
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 2
- WSUWDIVCPOJFCX-TUAOUCFPSA-N Val-Met-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N WSUWDIVCPOJFCX-TUAOUCFPSA-N 0.000 description 2
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 2
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 2
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 2
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 2
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 2
- USXYVSTVPHELAF-RCWTZXSCSA-N Val-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N)O USXYVSTVPHELAF-RCWTZXSCSA-N 0.000 description 2
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 2
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 2
- 108700005077 Viral Genes Proteins 0.000 description 2
- 241000710772 Yellow fever virus Species 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 230000003466 anti-cipated effect Effects 0.000 description 2
- 230000000890 antigenic effect Effects 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- AEMOLEFTQBMNLQ-UHFFFAOYSA-N beta-D-galactopyranuronic acid Natural products OC1OC(C(O)=O)C(O)C(O)C1O AEMOLEFTQBMNLQ-UHFFFAOYSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000001588 bifunctional effect Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 230000010307 cell transformation Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 108010054812 diprotin A Proteins 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000003511 endothelial effect Effects 0.000 description 2
- 210000002744 extracellular matrix Anatomy 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 102000045598 human DPP4 Human genes 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 229940072221 immunoglobulins Drugs 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 210000000936 intestine Anatomy 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 210000003292 kidney cell Anatomy 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 210000004379 membrane Anatomy 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 108010034507 methionyltryptophan Proteins 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 244000309711 non-enveloped viruses Species 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010073101 phenylalanylleucine Proteins 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 239000013608 rAAV vector Substances 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 108010091078 rigin Proteins 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000011830 transgenic mouse model Methods 0.000 description 2
- 238000004929 transmission Raman spectroscopy Methods 0.000 description 2
- 108700004896 tripeptide FEG Proteins 0.000 description 2
- 108010029384 tryptophyl-histidine Proteins 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- 108010029599 tyrosyl-glutamyl-tryptophan Proteins 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 108010027345 wheylin-1 peptide Proteins 0.000 description 2
- 229940051021 yellow-fever virus Drugs 0.000 description 2
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- LDGWQMRUWMSZIU-LQDDAWAPSA-M 2,3-bis[(z)-octadec-9-enoxy]propyl-trimethylazanium;chloride Chemical class [Cl-].CCCCCCCC\C=C/CCCCCCCCOCC(C[N+](C)(C)C)OCCCCCCCC\C=C/CCCCCCCC LDGWQMRUWMSZIU-LQDDAWAPSA-M 0.000 description 1
- WALUVDCNGPQPOD-UHFFFAOYSA-M 2,3-di(tetradecoxy)propyl-(2-hydroxyethyl)-dimethylazanium;bromide Chemical compound [Br-].CCCCCCCCCCCCCCOCC(C[N+](C)(C)CCO)OCCCCCCCCCCCCCC WALUVDCNGPQPOD-UHFFFAOYSA-M 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- CGTRVJQMKJCCRF-UHFFFAOYSA-N 3-(3-carbazol-9-ylphenyl)-9-[3-[3-(3-carbazol-9-ylphenyl)carbazol-9-yl]phenyl]carbazole Chemical compound C12=CC=CC=C2C2=CC(C=3C=CC=C(C=3)N3C4=CC=CC=C4C4=CC=CC=C43)=CC=C2N1C1=CC=CC(N2C3=CC=C(C=C3C3=CC=CC=C32)C=2C=C(C=CC=2)N2C3=CC=CC=C3C3=CC=CC=C32)=C1 CGTRVJQMKJCCRF-UHFFFAOYSA-N 0.000 description 1
- YRNWIFYIFSBPAU-UHFFFAOYSA-N 4-[4-(dimethylamino)phenyl]-n,n-dimethylaniline Chemical compound C1=CC(N(C)C)=CC=C1C1=CC=C(N(C)C)C=C1 YRNWIFYIFSBPAU-UHFFFAOYSA-N 0.000 description 1
- 101150079978 AGRN gene Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 1
- 102100040026 Agrin Human genes 0.000 description 1
- 108700019743 Agrin Proteins 0.000 description 1
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- DWINFPQUSSHSFS-UVBJJODRSA-N Ala-Arg-Trp Chemical compound N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O DWINFPQUSSHSFS-UVBJJODRSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- CRWFEKLFPVRPBV-CIUDSAMLSA-N Ala-Gln-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CRWFEKLFPVRPBV-CIUDSAMLSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- PHQXWZGXKAFWAZ-ZLIFDBKOSA-N Ala-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 PHQXWZGXKAFWAZ-ZLIFDBKOSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 241000004176 Alphacoronavirus Species 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 1
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 1
- BMNVSPMWMICFRV-DCAQKATOSA-N Arg-His-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CN=CN1 BMNVSPMWMICFRV-DCAQKATOSA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- ZUVMUOOHJYNJPP-XIRDDKMYSA-N Arg-Trp-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZUVMUOOHJYNJPP-XIRDDKMYSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- XMZZGVGKGXRIGJ-JYJNAYRXSA-N Arg-Tyr-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O XMZZGVGKGXRIGJ-JYJNAYRXSA-N 0.000 description 1
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- WQLJRNRLHWJIRW-KKUMJFAQSA-N Asn-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)O WQLJRNRLHWJIRW-KKUMJFAQSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 1
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 1
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- MJKBOVWWADWLHV-ZLUOBGJFSA-N Asp-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)O MJKBOVWWADWLHV-ZLUOBGJFSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 1
- ZXRQJQCXPSMNMR-XIRDDKMYSA-N Asp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N ZXRQJQCXPSMNMR-XIRDDKMYSA-N 0.000 description 1
- SARSTIZOZFBDOM-FXQIFTODSA-N Asp-Met-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SARSTIZOZFBDOM-FXQIFTODSA-N 0.000 description 1
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 1
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 1
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101710113758 Basement membrane proteoglycan Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 101150045282 CD81 gene Proteins 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 101150044789 Cap gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000282552 Chlorocebus aethiops Species 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 206010057573 Chronic hepatic failure Diseases 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 102000002029 Claudin Human genes 0.000 description 1
- 108050009302 Claudin Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 206010010099 Combined immunodeficiency Diseases 0.000 description 1
- 206010010144 Completed suicide Diseases 0.000 description 1
- VPAXJOUATWLOPR-UHFFFAOYSA-N Conferone Chemical compound C1=CC(=O)OC2=CC(OCC3C4(C)CCC(=O)C(C)(C)C4CC=C3C)=CC=C21 VPAXJOUATWLOPR-UHFFFAOYSA-N 0.000 description 1
- 238000011537 Coomassie blue staining Methods 0.000 description 1
- 241000709734 Coxsackievirus A24 Species 0.000 description 1
- 241000709675 Coxsackievirus B3 Species 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- GMXSSZUVDNPRMA-FXQIFTODSA-N Cys-Arg-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GMXSSZUVDNPRMA-FXQIFTODSA-N 0.000 description 1
- FWYBFUDWUUFLDN-FXQIFTODSA-N Cys-Asp-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N FWYBFUDWUUFLDN-FXQIFTODSA-N 0.000 description 1
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- WTNLLMQAFPOCTJ-GARJFASQSA-N Cys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N)C(=O)O WTNLLMQAFPOCTJ-GARJFASQSA-N 0.000 description 1
- WAJDEKCJRKGRPG-CIUDSAMLSA-N Cys-His-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N WAJDEKCJRKGRPG-CIUDSAMLSA-N 0.000 description 1
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 1
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 1
- JLZCAZJGWNRXCI-XKBZYTNZSA-N Cys-Thr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O JLZCAZJGWNRXCI-XKBZYTNZSA-N 0.000 description 1
- BUAUGQJXGNRTQE-AAEUAGOBSA-N Cys-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N BUAUGQJXGNRTQE-AAEUAGOBSA-N 0.000 description 1
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical group O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- XULFJDKZVHTRLG-JDVCJPALSA-N DOSPA trifluoroacetate Chemical compound [O-]C(=O)C(F)(F)F.CCCCCCCC\C=C/CCCCCCCCOCC(C[N+](C)(C)CCNC(=O)C(CCCNCCCN)NCCCN)OCCCCCCCC\C=C/CCCCCCCC XULFJDKZVHTRLG-JDVCJPALSA-N 0.000 description 1
- 241001533413 Deltavirus Species 0.000 description 1
- 108010044052 Desmin Proteins 0.000 description 1
- 102100036912 Desmin Human genes 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 241000709638 Echovirus E6 Species 0.000 description 1
- 208000010334 End Stage Liver Disease Diseases 0.000 description 1
- 102100021579 Enhancer of filamentation 1 Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 208000000832 Equine Encephalomyelitis Diseases 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 1
- 229920000855 Fucoidan Polymers 0.000 description 1
- 102000004961 Furin Human genes 0.000 description 1
- 108090001126 Furin Proteins 0.000 description 1
- 229940127513 Fusion Protein Inhibitors Drugs 0.000 description 1
- 101710177291 Gag polyprotein Proteins 0.000 description 1
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- XUMFMAVDHQDATI-DCAQKATOSA-N Gln-Pro-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XUMFMAVDHQDATI-DCAQKATOSA-N 0.000 description 1
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 1
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- IIMZHVKZBGSEKZ-SZMVWBNQSA-N Gln-Trp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O IIMZHVKZBGSEKZ-SZMVWBNQSA-N 0.000 description 1
- SJMJMEWQMBJYPR-DZKIICNBSA-N Gln-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N SJMJMEWQMBJYPR-DZKIICNBSA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- QEJKKJNDDDPSMU-KKUMJFAQSA-N Glu-Tyr-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O QEJKKJNDDDPSMU-KKUMJFAQSA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- IVSWQHKONQIOHA-YUMQZZPRSA-N Gly-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN IVSWQHKONQIOHA-YUMQZZPRSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- RVGMVLVBDRQVKB-UWVGGRQHSA-N Gly-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN RVGMVLVBDRQVKB-UWVGGRQHSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- WSWWTQYHFCBKBT-DVJZZOLTSA-N Gly-Thr-Trp Chemical compound C[C@@H](O)[C@H](NC(=O)CN)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O WSWWTQYHFCBKBT-DVJZZOLTSA-N 0.000 description 1
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 1
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 101710114810 Glycoprotein Proteins 0.000 description 1
- 108050009377 Glypican-5 Proteins 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Natural products C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- 101000729659 Haloarcula marismortui (strain ATCC 43049 / DSM 3752 / JCM 8966 / VKM B-1809) 30S ribosomal protein S8 Proteins 0.000 description 1
- FYVHHKMHFPMBBG-GUBZILKMSA-N His-Gln-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FYVHHKMHFPMBBG-GUBZILKMSA-N 0.000 description 1
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 1
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 1
- HZWWOGWOBQBETJ-CUJWVEQBSA-N His-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O HZWWOGWOBQBETJ-CUJWVEQBSA-N 0.000 description 1
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 1
- 101000928044 Homo sapiens Desmin Proteins 0.000 description 1
- 101000898310 Homo sapiens Enhancer of filamentation 1 Proteins 0.000 description 1
- 101100297256 Homo sapiens HSPG2 gene Proteins 0.000 description 1
- 101001051093 Homo sapiens Low-density lipoprotein receptor Proteins 0.000 description 1
- 101000716102 Homo sapiens T-cell surface glycoprotein CD4 Proteins 0.000 description 1
- 101000837639 Homo sapiens Thyroxine-binding globulin Proteins 0.000 description 1
- 241000598436 Human T-cell lymphotropic virus Species 0.000 description 1
- 241000714260 Human T-lymphotropic virus 1 Species 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- 241001428935 Human coronavirus OC43 Species 0.000 description 1
- 241000709716 Human enterovirus 70 Species 0.000 description 1
- 241001502974 Human gammaherpesvirus 8 Species 0.000 description 1
- 241000342334 Human metapneumovirus Species 0.000 description 1
- 241000701806 Human papillomavirus Species 0.000 description 1
- 241000798924 Human rhinovirus C15 Species 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical group C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 208000007766 Kaposi sarcoma Diseases 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DEFJQIDDEAULHB-IMJSIDKUSA-N L-alanyl-L-alanine Chemical group C[C@H](N)C(=O)N[C@@H](C)C(O)=O DEFJQIDDEAULHB-IMJSIDKUSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- NFHJQETXTSDZSI-DCAQKATOSA-N Leu-Cys-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NFHJQETXTSDZSI-DCAQKATOSA-N 0.000 description 1
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 1
- FEHQLKKBVJHSEC-SZMVWBNQSA-N Leu-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FEHQLKKBVJHSEC-SZMVWBNQSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- STLBOMUOQNIALW-BQBZGAKWSA-N Met-Gly-Cys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O STLBOMUOQNIALW-BQBZGAKWSA-N 0.000 description 1
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 1
- RKIIYGUHIQJCBW-SRVKXCTJSA-N Met-His-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RKIIYGUHIQJCBW-SRVKXCTJSA-N 0.000 description 1
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 1
- FWAHLGXNBLWIKB-NAKRPEOUSA-N Met-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCSC FWAHLGXNBLWIKB-NAKRPEOUSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 1
- 208000034486 Multi-organ failure Diseases 0.000 description 1
- 208000010718 Multiple Organ Failure Diseases 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-KEWYIRBNSA-N N-acetyl-D-galactosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-KEWYIRBNSA-N 0.000 description 1
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical group CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 241001263478 Norovirus Species 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 102000003940 Occludin Human genes 0.000 description 1
- 108090000304 Occludin Proteins 0.000 description 1
- 241000219925 Oenothera Species 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000682735 Pegivirus Species 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 208000037581 Persistent Infection Diseases 0.000 description 1
- OXUMFAOVGFODPN-KKUMJFAQSA-N Phe-Asn-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OXUMFAOVGFODPN-KKUMJFAQSA-N 0.000 description 1
- RORUIHAWOLADSH-HJWJTTGWSA-N Phe-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 RORUIHAWOLADSH-HJWJTTGWSA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 1
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 1
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 241001673669 Porcine circovirus 2 Species 0.000 description 1
- 241001135989 Porcine reproductive and respiratory syndrome virus Species 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 1
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 238000010240 RT-PCR analysis Methods 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 241000702263 Reovirus sp. Species 0.000 description 1
- 241000725643 Respiratory syncytial virus Species 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 241000713124 Rift Valley fever virus Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 1
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- MAWSJXHRLWVJEZ-ACZMJKKPSA-N Ser-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N MAWSJXHRLWVJEZ-ACZMJKKPSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- XNXRTQZTFVMJIJ-DCAQKATOSA-N Ser-Met-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNXRTQZTFVMJIJ-DCAQKATOSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- 101000629313 Severe acute respiratory syndrome coronavirus Spike glycoprotein Proteins 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 101710167605 Spike glycoprotein Proteins 0.000 description 1
- 241000701093 Suid alphaherpesvirus 1 Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 102100037220 Syndecan-4 Human genes 0.000 description 1
- 108010055215 Syndecan-4 Proteins 0.000 description 1
- 230000024932 T cell mediated immunity Effects 0.000 description 1
- 230000005867 T cell response Effects 0.000 description 1
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 101150045960 TPST2 gene Proteins 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- NFMPFBCXABPALN-OWLDWWDNSA-N Thr-Ala-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O NFMPFBCXABPALN-OWLDWWDNSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- ISLDRLHVPXABBC-IEGACIPQSA-N Thr-Leu-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISLDRLHVPXABBC-IEGACIPQSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 1
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000002248 Thyroxine-Binding Globulin Human genes 0.000 description 1
- 108010000259 Thyroxine-Binding Globulin Proteins 0.000 description 1
- 241000710771 Tick-borne encephalitis virus Species 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- KZTLJLFVOIMRAQ-IHPCNDPISA-N Trp-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZTLJLFVOIMRAQ-IHPCNDPISA-N 0.000 description 1
- OENGVSDBQHHGBU-QEJZJMRPSA-N Trp-Glu-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OENGVSDBQHHGBU-QEJZJMRPSA-N 0.000 description 1
- SVGAWGVHFIYAEE-JSGCOSHPSA-N Trp-Gly-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 SVGAWGVHFIYAEE-JSGCOSHPSA-N 0.000 description 1
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 1
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 1
- 108010028230 Trp-Ser- His-Pro-Gln-Phe-Glu-Lys Proteins 0.000 description 1
- UJGDFQRPYGJBEH-AAEUAGOBSA-N Trp-Ser-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N UJGDFQRPYGJBEH-AAEUAGOBSA-N 0.000 description 1
- MBLJBGZWLHTJBH-SZMVWBNQSA-N Trp-Val-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 MBLJBGZWLHTJBH-SZMVWBNQSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 1
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 1
- JJNXZIPLIXIGBX-HJPIBITLSA-N Tyr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JJNXZIPLIXIGBX-HJPIBITLSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- GZUIDWDVMWZSMI-KKUMJFAQSA-N Tyr-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GZUIDWDVMWZSMI-KKUMJFAQSA-N 0.000 description 1
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 1
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- VJOWWOGRNXRQMF-UVBJJODRSA-N Val-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 VJOWWOGRNXRQMF-UVBJJODRSA-N 0.000 description 1
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- GMOLURHJBLOBFW-ONGXEEELSA-N Val-Gly-His Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMOLURHJBLOBFW-ONGXEEELSA-N 0.000 description 1
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- SDHZOOIGIUEPDY-JYJNAYRXSA-N Val-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 SDHZOOIGIUEPDY-JYJNAYRXSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 1
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 description 1
- 206010058874 Viraemia Diseases 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 1
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010056243 alanylalanine Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 108010066270 beta-lactorphin Proteins 0.000 description 1
- 239000005312 bioglass Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000015861 cell surface binding Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 208000011444 chronic liver failure Diseases 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 108010044493 collagen type XVII Proteins 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- JECGPMYZUFFYJW-UHFFFAOYSA-N conferone Natural products CC1=CCC2C(C)(C)C(=O)CCC2(C)C1COc3cccc4C=CC(=O)Oc34 JECGPMYZUFFYJW-UHFFFAOYSA-N 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 210000004351 coronary vessel Anatomy 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 210000005220 cytoplasmic tail Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000005045 desmin Anatomy 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 150000002016 disaccharides Chemical group 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 201000002491 encephalomyelitis Diseases 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 210000003038 endothelium Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 238000003167 genetic complementation Methods 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 230000005182 global health Effects 0.000 description 1
- 229940097043 glucuronic acid Drugs 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 150000002402 hexoses Chemical group 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- 102000055772 human CD81 Human genes 0.000 description 1
- 102000048799 human SERPINA7 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- IAJILQKETJEXLJ-LECHCGJUSA-N iduronic acid Chemical compound O=C[C@@H](O)[C@H](O)[C@@H](O)[C@H](O)C(O)=O IAJILQKETJEXLJ-LECHCGJUSA-N 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000007813 immunodeficiency Effects 0.000 description 1
- 239000005414 inactive ingredient Substances 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000019423 liver disease Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000007758 minimum essential medium Substances 0.000 description 1
- 229940126619 mouse monoclonal antibody Drugs 0.000 description 1
- 208000029744 multiple organ dysfunction syndrome Diseases 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- DIOQZVSQGTUSAI-UHFFFAOYSA-N n-butylhexane Natural products CCCCCCCCCC DIOQZVSQGTUSAI-UHFFFAOYSA-N 0.000 description 1
- 201000009240 nasopharyngitis Diseases 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007826 nucleic acid assay Methods 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- MXHCPCSDRGLRER-UHFFFAOYSA-N pentaglycine Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O MXHCPCSDRGLRER-UHFFFAOYSA-N 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 229940127557 pharmaceutical product Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 108010084889 protein-tyrosine sulfotransferase Proteins 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000010837 receptor-mediated endocytosis Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000001180 sulfating effect Effects 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000008866 synergistic binding Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 150000004044 tetrasaccharides Chemical class 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- XUIIKFGFIJCVMT-UHFFFAOYSA-N thyroxine-binding globulin Natural products IC1=CC(CC([NH3+])C([O-])=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-UHFFFAOYSA-N 0.000 description 1
- 230000001296 transplacental effect Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 125000002264 triphosphate group Chemical group [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000006107 tyrosine sulfation Effects 0.000 description 1
- 210000000689 upper leg Anatomy 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000008478 viral entry into host cell Effects 0.000 description 1
- 230000006648 viral gene expression Effects 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 230000010464 virion assembly Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/08—RNA viruses
- C07K14/165—Coronaviridae, e.g. avian infectious bronchitis virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/713—Double-stranded nucleic acids or oligonucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/715—Polysaccharides, i.e. having more than five saccharide radicals attached to each other by glycosidic linkages; Derivatives thereof, e.g. ethers, esters
- A61K31/726—Glycosaminoglycans, i.e. mucopolysaccharides
- A61K31/727—Heparin; Heparan
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/36—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4725—Proteoglycans, e.g. aggreccan
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70596—Molecules with a "CD"-designation not provided for elsewhere
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/485—Exopeptidases (3.4.11-3.4.19)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/14—Dipeptidyl-peptidases and tripeptidyl-peptidases (3.4.14)
- C12Y304/14005—Dipeptidyl-peptidase IV (3.4.14.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/15—Peptidyl-dipeptidases (3.4.15)
- C12Y304/15001—Peptidyl-dipeptidase A (3.4.15.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/17—Metallocarboxypeptidases (3.4.17)
- C12Y304/17023—Angiotensin-converting enzyme 2 (3.4.17.23)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/30—Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16023—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Virology (AREA)
- Gastroenterology & Hepatology (AREA)
- Biotechnology (AREA)
- Toxicology (AREA)
- Microbiology (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Immunology (AREA)
- Cell Biology (AREA)
- Communicable Diseases (AREA)
- Epidemiology (AREA)
- Vascular Medicine (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oncology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Dermatology (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
本披露提供了用于治疗或预防病毒感染的重组多肽,这些重组多肽包含免疫球蛋白Fc片段和至少一种病毒受体或其片段。还提供了包含这样的重组多肽的RNA分子、治疗性组合物和表达系统,以及在有需要的受试者中预防或治疗病毒感染的方法,这些方法包括向受试者或患者施用这样的重组多肽。
Description
参考相关申请
本申请要求2020年1月23日提交的美国临时申请第62/965,033号和2020年7月10日提交的美国临时申请第63/050,473号的优先权,其内容以引用方式并入本文,就像完整地写在本文中一样。
序列表的并入
含有在名为“HAN0001-401-PC_ST25,”的文件(如在Microsoft Windows操作系统中测量的为107千字节)中的序列表于2021年1月21日创建,在此以电子方式提交,并通过引用结合于此。
背景技术
本披露涉及病毒学。更具体地,本披露涉及用于治疗和预防病毒感染的方法和组合物。
病毒进入宿主细胞是由与宿主细胞的细胞表面受体结合的病毒包膜(Env)蛋白介导的。病毒与其受体的结合需要特异性结构域识别,但也涉及病毒蛋白中存在的正(+)电荷和受体中存在的负(-)电荷之间的电荷相互作用。受体可以通过一段酸性氨基酸或蛋白质硫酸化带负电。后者确保了强(-)电荷,因为SO4基团在细胞的生理pH值中提供了大的电离电位。使用这种机制的病毒的一个实例是丙型肝炎病毒(HCV),它是全球可预防性死亡的主要原因之一,估计每年有400,000人死亡。没有针对HCV的有效疫苗,但目前可以获得昂贵的针对HCV的可治愈性药物。尽管HCV药物治疗对大多数(约90%)患者有效,但仍有相当一部分患者无法医治。此外,HCV治疗的长期(>约10年)疗效仍有待观察。使用相同机制的病毒的另一个实例是乙型肝炎病毒(HBV),它作为嗜肝DNA病毒科的一员,导致2.5亿人慢性感染,年死亡率为600,000人。尽管有有效的HBV疫苗可用,但没有可有效治疗病毒感染的可治愈性HBV药物。目前的HBV药物只能抑制病毒的复制,使大多数人终生使用它们。HBV和HCV仍然是一个全球性的健康问题。因此,本披露提供了一种对包括HCV和HBV的病毒的治疗,其对所有类型的病毒都有效,并且对于通过提供用于治疗或预防病毒感染的重组多肽来寻求治疗的患者而言更具成本效益,该重组多肽包括:a)Ig Fc片段和b)作为第一配体结合位点的硫酸化多糖;以及c)作为第二结合位点的至少一个病毒受体片段。因此,通过重组Fc的协同结合性质,靶病毒被有效地结合和中和。
发明内容
在一个方面,本披露提供了包含与至少一种病毒受体缀合的Ig Fc片段的重组多肽。在一些实施例中,重组多肽包括Fc片段和2个病毒受体。在一些实施例中,至少一种病毒受体选自硫酸乙酰肝素蛋白聚糖(HSPG)、CD81、SRB1、CD26、ACE2、CD147、唾液酸、DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、NPC1和NTCP。在一些实施例中,重组多肽包含Ig Fc片段和链霉亲和素(SA)或AviTagTM或Strep-Tag在一些实施例中,重组多肽是包含重组多肽的多个拷贝(从而形成例如二聚体、三聚体、四聚体、八聚体、十聚体或更多)的复合物的一部分。在一些实施例中,重组多肽的二聚体可以与二聚体复合物的多个拷贝复合。
在一个方面,本披露提供了一种重组多肽,其包含:a)免疫球蛋白Fc片段和硫酸化多糖;和b)至少一种病毒受体或其片段。在一个实施例中,(a)和(b)能够协同结合至少一种病毒包膜蛋白。在另一个实施例中,硫酸化多糖是硫酸乙酰肝素(HS)。在另一个实施例中,HS是蛋白聚糖(HSPG)。在另一个实施例中,HSPG包含两个或更多个硫酸化位点。在另一个实施例中,硫酸化位点包含丝氨酸-甘氨酸-天冬氨酸(SGD)基序。在另一个实施例中,SGD基序在至少一个酸性氨基酸残基的7、8、9和/或10个残基内。在另一个实施例中,至少一种病毒受体或其片段是针对选自由以下组成的组的病毒科:黄病毒科、冠状病毒科和嗜肝DNA病毒科。在另一个实施例中,病毒科是黄病毒科。在另一个实施例中,黄病毒科病毒选自由以下组成的组:HCV、西尼罗病毒和登革热病毒。在另一个实施例中,病毒是HCV。在另一个实施例中,至少一种病毒受体或其片段是CD81和/或清道夫受体B-1(SRB1)。在另一个实施例中,病毒是西尼罗病毒或登革热病毒。在另一个实施例中,至少一种病毒受体或其片段是AXL和/或TIM-1和/或TIM-4。在另一个实施例中,病毒科是冠状病毒科。在另一个实施例中,冠状病毒科病毒是中东呼吸综合征(MERS)。在另一个实施例中,至少一种病毒受体或其片段是CD26和/或CD26-叶片4(CD26-Blade4)和/或CD26-B4C。在另一个实施例中,冠状病毒科病毒是严重急性呼吸系统综合征(SARS)。在另一个实施例中,严重急性呼吸综合征(SARS)病毒是SARS-CoV或SARS-CoV-2。在另一个实施例中,至少一种病毒受体或其片段选自由以下组成的组:ACE2、CD147、唾液酸和SRB1。在另一个实施例中,至少一种病毒受体或其片段是ACE2。在另一个实施例中,硫酸化多糖是HSPG。在另一个实施例中,至少一种病毒受体或其片段是CD147。在另一个实施例中,硫酸化多糖是HSPG。在另一个实施例中,至少一种病毒受体或其片段是唾液酸。在另一个实施例中,硫酸化多糖是HSPG。在另一个实施例中,至少一种病毒受体或其片段是SRB1。在另一个实施例中,硫酸化多糖是HSPG。在另一个实施例中,冠状病毒科病毒是塞特拉科病毒(Setracovirus)。在另一个实施例中,塞特拉科病毒是人冠状病毒(hCoV)-NL63。在另一个实施例中,至少一种病毒受体或其片段是ACE2。在另一个实施例中,硫酸化多糖是HSPG。在另一个实施例中,病毒科是嗜肝DNA病毒科。在另一个实施例中,病毒是HBV。在另一个实施例中,至少一种病毒受体或其片段是NTCP(牛磺胆酸钠共同转运多肽)。在另一个实施例中,硫酸化多糖是HSPG。在另一个实施例中,本披露提供了一种药物组合物,其包含如本文所述的重组多肽。在另一个实施例中,本披露提供了一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向受试者施用治疗或预防有效量的如本文所述的药物组合物。在另一个实施例中,病毒感染是选自由黄病毒科、冠状病毒科和嗜肝DNA病毒科组成的组的病毒科的结果。在另一个实施例中,病毒科是黄病毒科。在另一个实施例中,黄病毒科病毒选自由以下组成的组:HCV、西尼罗病毒和登革热病毒。在另一个实施例中,病毒科是冠状病毒科。在另一个实施例中,冠状病毒科病毒是MERS、SARS或hCoV-NL63。在另一个实施例中,病毒科是嗜肝DNA病毒科。在另一个实施例中,嗜肝DNA病毒科病毒是HBV。在另一个实施例中,本披露提供了一种RNA分子,其包含:a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;和b)表达如本文所述的重组多肽的第二核糖核苷酸序列。在另一个实施例中,本披露提供了一种治疗性组合物,其包含:a)活病毒表达载体;和b)表达如本文所述的重组多肽的多核苷酸序列。在另一个实施例中,表达载体是腺病毒载体或牛痘载体。在另一个实施例中,腺病毒载体选自由以下组成的组:Ad5、Ad26和腺相关病毒(AAV)。在另一个实施例中,牛痘载体是金丝雀痘。
在另一个实施例中,本披露提供了一种表达系统,其包含编码如本文所述的重组多肽的多核苷酸序列。在另一个实施例中,本披露提供了用于治疗SARS-CoV-2感染的重组多肽,其包含与SEQ ID NO:31、37或45所示的序列具有至少95%序列同一性的氨基酸序列。在一个实施例中,本披露提供了编码如本文所述的重组多肽的多核苷酸,其中该多核苷酸与如SEQ ID NO:25-30所示的序列具有至少95%序列同一性。在另一个实施例中,本披露提供了编码如本文所述的重组多肽的多核苷酸,其中该多核苷酸与如SEQ ID NO:25、28、30、34-36和38所示的序列具有至少95%序列同一性。在另一个实施例中,本披露提供了编码如本文所述的重组多肽的多核苷酸,其中该多核苷酸与如SEQ ID NO:25、28、30和39-44所示的序列具有至少95%序列同一性。在另一个实施例中,本披露提供了用于治疗SARS-CoV-2感染的重组多肽,其包含如SEQ ID NO:31、37或45所示的氨基酸序列。在另一个实施例中,本披露提供了编码如本文所述的重组多肽的多核苷酸,其中该多核苷酸包含SEQ ID NO:25-30。在另一个实施例中,本披露提供了编码如本文所述的重组多肽的多核苷酸,其中该多核苷酸包含SEQ ID NO:25、28、30、34-36和38。在另一个实施例中,本披露提供了编码如本文所述的重组多肽的多核苷酸,其中该多核苷酸包含SEQ ID NO:25、28、30和39-44。
在另一个实施例中,本披露提供了一种药物组合物,其包含如本文所述的重组多肽。在另一个实施例中,本披露提供了一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向受试者施用治疗或预防有效量的如本文所述的药物组合物。在一个实施例中,病毒感染是冠状病毒科的结果。在另一个实施例中,冠状病毒科病毒是严重急性呼吸综合征(SARS)病毒或人冠状病毒(hCoV)-NL63。在另一个实施例中,严重急性呼吸综合征(SARS)病毒是SARS-CoV或SARS-CoV-2。在另一个实施例中,药物组合物通过呼吸途径或静脉内施用。在另一个实施例中,通过呼吸途径施用包括使用针对下呼吸道的吸入器,或使用针对上呼吸道的鼻内喷雾器。在另一个实施例中,这样的方法还包括施用肝素以治疗SARS-CoV、SARS-CoV-2或人冠状病毒(hCoV)-NL63感染。在另一个实施例中,肝素预防SARS-CoV、SARS-CoV-2或人冠状病毒(hCoV)-NL63病毒进入宿主细胞。
在另一个方面,本披露提供了一种重组多肽,其包含:a)Ig Fc片段;b)第一病毒受体,其中该受体是ACE2或其片段;和c)第二病毒受体。在一个实施例中,第二病毒受体选自由以下组成的组:HSPG、CD147、唾液酸和SRB1。在另一个实施例中,第二病毒受体是HSPG。在另一个实施例中,第二病毒受体是CD147。在另一个实施例中,第二病毒受体是唾液酸。在另一个实施例中,第二病毒受体是SRB1。在另一个实施例中,本文所述的多肽用于治疗SARS-CoV、SARS-CoV-2或人冠状病毒(hCoV)-NL63。在另一个实施例中,本披露提供了一种药物组合物,其包含如本文所述的重组多肽。在另一个实施例中,在另一个实施例中,本披露提供了在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向受试者施用治疗或预防有效量的如本文所述的药物组合物。在另一个实施例中,本披露提供了一种RNA分子,其包含:a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;和b)表达如本文所述的重组多肽的第二核糖核苷酸序列。在另一个实施例中,本披露提供了一种治疗性组合物,其包含:a)活病毒表达载体;和b)表达如本文所述的重组多肽的多核苷酸序列。
在另一个方面,本披露提供了一种重组多肽,其包含:a)Ig Fc片段;b)病毒受体或其片段;和c)链霉亲和素。在另一个实施例中,病毒受体选自由以下组成的组:HSPG、CD81、SRB1、CD26、ACE2、CD147、唾液酸、DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、NPC1和NTCP。在另一个实施例中,病毒受体是ACE2。在另一个实施例中,本文所述的重组多肽用于治疗SARS-CoV、SARS-CoV-2或人冠状病毒(hCoV)-NL63。在另一个实施例中,本披露提供了一种药物组合物,其包含如本文所述的重组多肽。在另一个实施例中,本披露提供了一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向受试者施用治疗或预防有效量的如本文所述的药物组合物。在另一个实施例中,本披露提供了一种RNA分子,其包含:a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;和b)表达如本文所述的重组多肽的第二核糖核苷酸序列。在另一个实施例中,本披露提供了一种治疗性组合物,其包含:a)活病毒表达载体;和b)表达如本文所述的重组多肽的多核苷酸序列。
在另一个方面,本披露提供了一种重组多肽,其包含:a)Ig Fc片段;b)第一病毒受体,和c)第二病毒受体。在一个实施例中,第一病毒受体选自由以下组成的组:DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、TIM-1和NPC1。在另一个实施例中,第二病毒受体选自由以下组成的组:DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、TIM-1和NPC1。在另一个实施例中,本文所述的重组多肽用于治疗寨卡病毒或埃博拉病毒。在另一个实施例中,本披露提供了一种药物组合物,其包含如本文所述的重组多肽。在另一个实施例中,本披露提供了一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向受试者施用治疗或预防有效量的如本文所述的药物组合物。在另一个实施例中,本披露提供了一种RNA分子,其包含:a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;和b)表达如本文所述的重组多肽的第二核糖核苷酸序列。在另一个实施例中,本披露提供了一种治疗性组合物,其包含:a)活病毒表达载体;和b)表达如本文所述的重组多肽的多核苷酸序列。
实施例1-一种包含与至少一种病毒受体缀合的Ig Fc片段的重组多肽。
实施例2-一种包含与2种病毒受体缀合的Fc片段的重组多肽。
实施例3-如实施例1或2所述的重组多肽,其中该至少一种病毒受体选自硫酸乙酰肝素蛋白聚糖(HSPG)、CD81、SRB1、CD26、ACE2、CD147、唾液酸、DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、NPC1和NTCP。
实施例5-如实施例1-4中任一项所述的重组多肽,其中该重组多肽是包含该重组多肽的多个拷贝(从而形成例如二聚体、三聚体、四聚体、八聚体、十聚体或更多)的复合物的一部分。
实施例6-如实施例1-5中任一项所述的重组多肽,其中该重组多肽的二聚体可以与二聚体复合物的多个拷贝复合。
实施例7-一种重组多肽,其包含:a)免疫球蛋白Fc片段和硫酸化多糖;和b)至少一种病毒受体或其片段。
实施例8-如实施例1-7中任一项所述的重组多肽,其中(a)和(b)能够协同结合至少一种病毒包膜蛋白。
实施例9-如实施例1-8中任一项所述的重组多肽,其中所该硫酸化多糖是硫酸乙酰肝素(HS)。
实施例10-如实施例1-9中任一项所述的重组多肽,其中该HS是蛋白聚糖(HSPG)。
实施例11-如实施例1-10中任一项所述的重组多肽,其中该HSPG含有两个或更多个硫酸化位点。
实施例12-如实施例1-11中任一项所述的重组多肽,其中该硫酸化位点包含丝氨酸-甘氨酸-天冬氨酸(SGD)基序。
实施例13-如实施例1-12中任一项所述的重组多肽,其中该SGD基序在至少一个酸性氨基酸残基的7、8、9和/或10个残基内。
实施例14-如实施例1-13中任一项所述的重组多肽,其中该至少一种病毒受体或其片段是针对选自由以下组成的组的病毒科:黄病毒科、冠状病毒科和嗜肝DNA病毒科。
实施例15-如实施例1-14中任一项所述的重组多肽,其中该病毒科是黄病毒科。
实施例16-如实施例1-15中任一项所述的重组多肽,其中该黄病毒科病毒选自由以下组成的组:HCV、西尼罗病毒和登革热病毒。
实施例17-如实施例1-16中任一项所述的重组多肽,其中该病毒是HCV。
实施例18-如实施例1-17中任一项所述的重组多肽,其中该至少一种病毒受体或其片段是CD81和/或清道夫受体B-1(SRB1)。
实施例19-如实施例1-18中任一项所述的重组多肽,其中该病毒是西尼罗病毒或登革热病毒。
实施例20-如实施例1-19中任一项所述的重组多肽,其中该至少一种病毒受体或其片段是AXL和/或TIM-1和/或TIM-4。
实施例21-如实施例1-20中任一项所述的重组多肽,其中该病毒科是冠状病毒科。
实施例22-如实施例1-21中任一项所述的重组多肽,其中该冠状病毒科病毒是中东呼吸综合征(MERS)。
实施例23-如实施例1-22中任一项所述的重组多肽,其中该至少一种病毒受体或其片段是CD26和/或CD26-叶片4和/或CD26-B4C。
实施例24-如实施例1-23中任一项所述的重组多肽,其中该冠状病毒科病毒是严重急性呼吸综合征(SARS)。
实施例25-如实施例1-24中任一项所述的重组多肽,其中该严重急性呼吸综合征(SARS)病毒是SARS-CoV或SARS-CoV-2。
实施例26-如实施例1-25中任一项所述的重组多肽,其中该至少一种病毒受体或其片段选自由以下组成的组:ACE2、CD147、唾液酸和SRB1。
实施例27-如实施例1-26中任一项所述的重组多肽,其中该至少一种病毒受体或其片段是ACE2。
实施例28-如实施例1-27中任一项所述的重组多肽,其中该硫酸化多糖是HSPG。
实施例29-如实施例1-28中任一项所述的重组多肽,其中该至少一种病毒受体或其片段是CD147。
实施例30-如实施例1-29中任一项所述的重组多肽,其中该硫酸化多糖是HSPG。
实施例31-如实施例1-30中任一项所述的重组多肽,其中该至少一种病毒受体或其片段是唾液酸。
实施例32-如实施例1-31中任一项所述的重组多肽,其中该硫酸化多糖是HSPG。
实施例33-如实施例1-32中任一项所述的重组多肽,其中该至少一种病毒受体或其片段是SRB1。
实施例34-如实施例1-33中任一项所述的重组多肽,其中该硫酸化多糖是HSPG。
实施例35-如实施例1-34中任一项所述的重组多肽,其中该冠状病毒科病毒是塞特拉科病毒。
实施例36-如实施例1-35中任一项所述的重组多肽,其中该塞特拉科病毒是人冠状病毒(hCoV)-NL63。
实施例37-如实施例1-36中任一项所述的重组多肽,其中该至少一种病毒受体或其片段是ACE2。
实施例38-如实施例1-37中任一项所述的重组多肽,其中该硫酸化多糖是HSPG。
实施例39-如实施例1-38中任一项所述的重组多肽,其中该病毒科是嗜肝DNA病毒科。
实施例40-如实施例1-39中任一项所述的重组多肽,其中该病毒是HBV。
实施例41-如实施例1-40中任一项所述的重组多肽,其中该至少一种病毒受体或其片段是NTCP(牛磺胆酸钠共同转运多肽)。
实施例42-如实施例1-41中任一项所述的重组多肽,其中该硫酸化多糖是HSPG。
实施例43-一种药物组合物,其包含如实施例1-42中任一项所述的重组多肽。
实施例44-一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向该受试者施用治疗或预防有效量的如实施例1-43中任一项所述的药物组合物。
实施例45-如实施例1-44中任一项所述的方法,其中该病毒感染是选自由黄病毒科、冠状病毒科和嗜肝DNA病毒科组成的组的病毒科的结果。
实施例46-如实施例1-45中任一项所述的方法,其中该病毒科是黄病毒科。
实施例47-如实施例1-46中任一项所述的方法,其中该黄病毒科病毒选自由以下组成的组:HCV、西尼罗病毒和登革热病毒。
实施例48-如实施例1-47中任一项所述的方法,其中该病毒科是冠状病毒科。
实施例49-如实施例1-48中任一项所述的方法,其中该冠状病毒科病毒是MERS、SARS或hCoV-NL63。
实施例50-如实施例1-49中任一项所述的方法,其中该病毒科是嗜肝DNA病毒科。
实施例51-如实施例1-50中任一项所述的方法,其中该嗜肝DNA病毒科病毒是HBV。
实施例52-一种RNA分子,其包含:a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;和b)表达如实施例1-51中任一项所述的重组多肽的第二核糖核苷酸序列。
实施例53-一种治疗性组合物,其包含:a)活病毒表达载体;和b)表达如实施例1-52中任一项所述的重组多肽的多核苷酸序列。
实施例54-如实施例1-53中任一项所述的治疗性组合物,其中该表达载体是腺病毒载体或牛痘载体。
实施例55-如实施例1-54中任一项所述的治疗性组合物,其中该腺病毒载体选自由以下组成的组:Ad5、Ad26和腺相关病毒(AAV)。
实施例56-如实施例1-55中任一项所述的治疗性组合物,其中该牛痘载体是金丝雀痘。
实施例57-一种表达系统,其包含编码如实施例1-56中任一项所述的重组多肽的多核苷酸序列。
实施例58-一种用于治疗SARS-CoV-2感染的重组多肽,该重组多肽包含与SEQ IDNO:31、37或45所示的序列具有至少95%序列同一性的氨基酸序列。
实施例59-一种编码如实施例1-58中任一项所述的重组多肽的多核苷酸,其中该多核苷酸与SEQ ID NO:25-30所示的序列具有至少95%序列同一性。
实施例60-一种编码如实施例1-59中任一项所述的重组多肽的多核苷酸,其中该多核苷酸与SEQ ID NO:25、28、30、34-36和38所示的序列具有至少95%序列同一性。
实施例61-一种编码如实施例1-60中任一项所述的重组多肽的多核苷酸,其中该多核苷酸与SEQ ID NO:25、28、30和39-44所示的序列具有至少95%序列同一性。
实施例62-一种用于治疗SARS-CoV-2感染的重组多肽,该重组多肽包含SEQ IDNO:31、37或45所示的氨基酸序列。
实施例63-一种编码如实施例1-62中任一项所述的重组多肽的多核苷酸,其中该多核苷酸包含SEQ ID NO:25-30。
实施例64-一种编码如实施例1-63中任一项所述的重组多肽的多核苷酸,其中该多核苷酸包含SEQ ID NO:25、28、30、34-36和38。
实施例65-一种编码如实施例1-64中任一项所述的重组多肽的多核苷酸,其中该多核苷酸包含SEQ ID NO:25、28、30和39-44。
实施例66-一种药物组合物,其包含如实施例1-65中任一项所述的重组多肽。
实施例67-一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向该受试者施用治疗或预防有效量的如实施例1-66中任一项所述的药物组合物。
实施例68-如实施例1-67中任一项所述的方法,其中该病毒感染是冠状病毒科的结果。
实施例69-如实施例1-68中任一项所述的方法,其中该冠状病毒科病毒是严重急性呼吸综合征(SARS)病毒或人冠状病毒(hCoV)-NL63。
实施例70-如实施例1-69中任一项所述的方法,其中该严重急性呼吸综合征(SARS)病毒是SARS-CoV或SARS-CoV-2。
实施例71-如实施例1-70中任一项所述的方法,其中该药物组合物通过呼吸途径或静脉内施用。
实施例72-如实施例1-71中任一项所述的方法,其中通过呼吸途径施用包括使用针对下呼吸道的吸入器,或使用针对上呼吸道的鼻内喷雾器。
实施例73-如实施例1-72中任一项所述的方法,其进一步包括施用肝素以治疗SARS-CoV、SARS-CoV-2或人冠状病毒(hCoV)-NL63感染。
实施例74-如实施例1-73中任一项所述的方法,其中该肝素预防SARS-CoV、SARS-CoV-2或人冠状病毒(hCoV)-NL63病毒进入宿主细胞。
实施例75-一种重组多肽,其包含:a)Ig Fc片段;b)第一病毒受体,其中该受体是ACE2或其片段;和c)第二病毒受体。
实施例76-如实施例1-75中任一项所述的重组多肽,其中该第二病毒受体选自由以下组成的组:HSPG、CD147、唾液酸和SRB1。
实施例77-如实施例1-76中任一项所述的重组多肽,其中该第二病毒受体是HSPG。
实施例78-如实施例1-77中任一项所述的重组多肽,其中该第二病毒受体是CD147。
实施例79-如实施例1-78中任一项所述的重组多肽,其中该第二病毒受体是唾液酸。
实施例80-如实施例1-79中任一项所述的重组多肽,其中该第二病毒受体是SRB1。
实施例81-如实施例1-80中任一项所述的重组多肽,用于治疗SARS-CoV、SARS-CoV-2或人冠状病毒(hCoV)-NL63。
实施例82-一种药物组合物,其包含如实施例1-81中任一项所述的重组多肽。
实施例83-一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向该受试者施用治疗或预防有效量的如实施例1-82中任一项所述的药物组合物。
实施例84-一种RNA分子,其包含:a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;和b)表达如实施例1-83中任一项所述的重组多肽的第二核糖核苷酸序列。
实施例85-一种治疗性组合物,其包含:a)活病毒表达载体;和b)表达如实施例1-84中任一项所述的重组多肽的多核苷酸序列。
实施例86-一种重组多肽,其包含:a)Ig Fc片段;b)病毒受体或其片段;和c)链霉亲和素。
实施例87-如实施例1-86中任一项所述的重组多肽,其中该病毒受体选自由以下组成的组:HSPG、CD81、SRB1、CD26、ACE2、CD147、唾液酸、DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、NPC1和NTCP。
实施例88-如实施例1-87中任一项所述的重组多肽,其中该病毒受体是ACE2。
实施例89-如实施例1-88中任一项所述的重组多肽,用于治疗SARS-CoV、SARS-CoV-2或人冠状病毒(hCoV)-NL63。
实施例90-一种药物组合物,其包含如实施例1-89中任一项所述的重组多肽。
实施例91-一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向该受试者施用治疗或预防有效量的如本文所述的药物组合物。
实施例92-一种RNA分子,其包含:a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;和b)表达如实施例1-91中任一项所述的重组多肽的第二核糖核苷酸序列。
实施例93-一种治疗性组合物,其包含:a)活病毒表达载体;和b)表达如实施例1-92中任一项所述的重组多肽的多核苷酸序列。
实施例94-一种重组多肽,其包含:a)Ig Fc片段;b)第一病毒受体,和c)第二病毒受体。
实施例95-如实施例1-94中任一项所述的重组多肽,其中该第一病毒受体选自由以下组成的组:DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、TIM-1和NPC1。
实施例96-如实施例1-95中任一项所述的重组多肽,其中该第二病毒受体选自由以下组成的组:DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、TIM-1和NPC1。
实施例97-如实施例1-96中任一项所述的重组多肽,用于治疗寨卡病毒。
实施例98-如实施例1-97中任一项所述的重组多肽,用于治疗埃博拉病毒。
实施例99-一种药物组合物,其包含如实施例1-98中任一项所述的重组多肽。
实施例100-一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向该受试者施用治疗或预防有效量的如实施例1-99中任一项所述的药物组合物。
实施例101-一种RNA分子,其包含:a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;和b)表达如实施例1-100中任一项所述的重组多肽的第二核糖核苷酸序列。
实施例102-一种治疗性组合物,其包含:a)活病毒表达载体;和b)表达如实施例1-101中任一项所述的重组多肽的多核苷酸序列。
附图说明
图1-显示如本文所述用于治疗或预防丙型肝炎病毒(HCV)的重组多肽的示意图,其具有Fc和病毒受体片段。
图2-显示用于治疗或预防HCV的重组多肽的变体。
图3-显示用于治疗或预防HCV的重组多肽的变体。
图4-显示如本文所述用于治疗或预防中东呼吸综合征(MERS)病毒的重组多肽的示意图,其具有Fc和病毒受体片段。
图5-显示SARS-CoV-2的受体Fc变体的示意图。
图6-显示人SRB1细胞外结构域(顶部)和全长序列(底部)的序列。
图7-显示人CD81全长序列(顶部)和细胞外结构域(底部)的序列。
图8-显示各种R-Ig蛋白在293T细胞中的表达,使用兔抗人IgG Ab-HRP,1:2000持续1小时。对凝胶泳道进行标记并且如下:(1)模拟;(2)模拟;(3)CD26-Fc-HS;(4)CD26-AA-Fc-HS;(5)Srb1-CD81-Fc-HS;(6)Srb1-AA-CD81-Fc-HS;(7)CD81-Fc-HS。CD26是指蛋白质的叶片-4部分。AA是指在信号肽N末端多出2个丙氨酸残基,以增加分泌。
图9-显示了证明纯化的Fc-HS和Fc-T3蛋白表达的SDS-PAGE凝胶。
图10-显示SDS-PAGE凝胶,证明肝素裂解。将肝素在30℃下用酶消化24h,通过20%SDS-PAGE分析,并通过阿尔新蓝/银染色可视化。
图11-显示模拟(对照)、pFc-HS、pFc-T3、pCD81-Fc-HS和pCD81-Fc-T3的GAG-糖基化。样品1:模拟;样品2:pFc-HS;样品3:pFc-T3;样品4:pCD81-Fc-HS;样品5:pCD81-Fc-T3。左侧显示蛋白质印迹分析。将DNA样品转染到293T细胞中。细胞裂解物(5μl,总共400μl)和条件培养基(5μl,总共50μl)被蛋白A珠捕获,在含有DTT的SDS凝胶缓冲液中煮沸,并进行10%SDS-PAGE。使用抗人IgG Fc-HRP进行蛋白质印迹分析。右侧显示用阿尔新蓝/银染色的GAG蛋白。将DNA转染到293T细胞中。细胞裂解物(5μl,总共400μl)和条件培养基(5μl,总共50μl)被蛋白A珠捕获,在含有DTT的SDS凝胶缓冲液中煮沸,并进行10%SDS-PAGE。用阿尔新蓝/银染色使凝胶可视化。缓慢迁移的漫反射带代表GAG。蓝点表示未糖基化蛋白的大小,双向箭头表示GAG糖基化蛋白。在细胞裂解物和培养基中发现每种蛋白质。只有分泌的蛋白质是GAG糖基化的;糖基化与分泌途径相偶联。
图12-显示HS在用肝素酶I或肝素酶III消化的293T细胞中的表达。培养基中的分泌蛋白与蛋白A珠结合并用肝素酶I或肝素酶III部分消化。通过10%SDS-PAGE分析消化的蛋白质,然后进行阿尔新蓝/银染色以观察GAG糖蛋白。
图13-显示基于逆转录病毒(鼠白血病病毒,MLV)的SARS-CoV-2假病毒颗粒(pp)(本文称为MLV-Spp,用于感染VeroE6细胞、表达ACE2的BHK细胞(BHK/ACE2)和表达ACE2的293T细胞(左下))的发光。
图14-显示选择稳定的靶细胞系,用于高度允许SARS-CoV-2感染表达TMPRSS2的VeroE6细胞。
图15-显示通过中和单克隆抗体抑制SARS-CoV-2假病毒感染。
图16A和图16B-图16A显示蛋白质印迹的SDS-PAGE凝胶,证明了在细胞培养基中的293T细胞中表达的蛋白质Ace2-Fc和Ace2-Fc-HS。在变性条件下对体积增加的蛋白质进行电泳。用抗人IgG-Fc探测蛋白质印迹。图16B显示蛋白质印迹的SDS-PAGE凝胶,证明了在Huh7细胞中表达的蛋白质Ace2p6-Fc、Ace2-Fc和Ace2-Fc-HS的纯化和表征。在变性条件下对体积增加的纯化蛋白质进行电泳。用抗人IgG-Fc探测蛋白质印迹。
图17A和图17B-图17A显示通过Luc活性测量的ACE2-Fc对VeroE6/TMPRSS2细胞的SARS-CoV假病毒进入的抑制。图17B显示通过Luc活性测量的ACE2-Fc对VeroE6/TMPRSS2细胞的SARS-CoV-2假病毒(Spp)进入。
图18A和图18B-图18A显示通过Luc活性测量的ACE2-Fc-HS对VeroE6/TMPRSS2细胞的SARS-CoV假病毒进入的抑制。图18B显示通过Luc活性测量的ACE2-Fc-HS对VeroE6/TMPRSS2细胞的SARS-CoV-2假病毒进入的抑制。
图19A和图19B-图19A显示P6Fc-HS的序列(完整序列,对应于SEQ ID NO:24,966bp,并且包含(按顺序)IL-2前导序列(SEQ ID NO:25)、ACE2(SEQ ID NO:26)、接头1(SEQID NO:27)、Fc部分(SEQ ID NO:28)、接头2(SEQ ID NO:29)和硫酸乙酰肝素(HS,SEQ IDNO:30)。图19B显示了P6Fc-HS的氨基酸序列,对应于SEQ ID NO:31。
图20A和图20B-图20A显示Ace2Fc-HS的序列(完整序列,对应于SEQ ID NO:32,3066bp,并且包含(按顺序)IL-2前导序列(SEQ ID NO:25)、接头1(SEQ ID NO:34)、ACE2(SEQ ID NO:35)、接头2(SEQ ID NO:36)、Fc(SEQ ID NO:28)、接头3(SEQ ID NO:38)和硫酸乙酰肝素(HS,SEQ ID NO:30))。图20B显示了Ace2Fc-HS的氨基酸序列,对应于SEQ ID NO:37。
图21A和图21B-图21A显示P61Fc-HS的序列(完整序列,对应于SEQ ID NO:38,1128bp,并且包含(按顺序)IL-2前导序列(SEQ ID NO:25)、接头1(SEQ ID NO:39)、ACE2-1部分(SEQ ID NO:40)、接头2(SEQ ID NO:41)、ACE2-2部分(SEQ ID NO:42)、接头3(SEQ IDNO:43)。Fc(SEQ ID NO:28)、接头4(SEQ ID NO:44)和硫酸乙酰肝素(HS,SEQ ID NO:30)。图21B显示了P61Fc-HS的氨基酸序列,对应于SEQ ID NO:45。
图22-显示当与增加浓度的肝素组合时,SARS-CoV-2假病毒进入VeroE6/TMmPRSSprss2细胞的抑制。
图23-显示通过Luc活性测量,当与增加浓度的肝素组合时,VeroE6细胞(左)中的SARS-CoV假病毒感染和Huh7细胞(右)中的MERS-CoV假病毒感染的抑制。
图24-显示描绘使用链霉亲和素(SA)和生物素在ACE2-Fc中的ACE2四聚化的示意图。
图25-显示描绘使用链霉亲和素(SA)和生物素在ACE2-Fc中的ACE2八聚化的示意图。
图26-显示描绘使用链霉亲和素(SA)和生物素化的AviTagTM在ACE2-Fc中的ACE2四聚化的示意图。
图27-显示描绘使用链霉亲和素(SA)和生物素化的AviTagTM在ACE2-Fc中的ACE2八聚化的示意图。
图28-显示描绘使用链霉亲和素(SA)和用肝素生物素化的AviTagTM在ACE2-Fc中的ACE2四聚化的示意图。
图29-显示描绘使用链霉亲和素(SA)和用肝素生物素化的AviTagTM在ACE2-Fc中的ACE2八聚化的示意图。
图30A和图30B-图30A显示细胞中以二聚体和四聚体ACE2的ACE2-Fc-SA(被SDS部分变性)的表达。图30B显示通过Luc活性测量的以ACE2四聚体的ACE2-Fc和ACE2-Fc-SA对VeroE6/TMPRSS2细胞中SARS-CoV-2假病毒感染的抑制。
图31A和图31B-图31A显示ACE2-Fc-链霉亲和素重组多肽(Ace2Fc-SA)的DNA序列(对应于SEQ ID NO:46)。图31B显示蛋白质序列(对应于SEQ ID NO:47)。IL2前导序列以大写的下划线文本显示;接头以小写、下划线、粗体显示;人ACE2以大写的常规文本显示;Fc区以大写斜体文本显示;链霉亲和素(SA)以小写斜体文本显示。
图32A和图32B-图32A显示ACE2-Fc-AviTagTM重组多肽(Ace2Fc-AviTagTM)的DNA序列(对应于SEQ ID NO:48)。图32B显示蛋白质序列(对应于SEQ ID NO:49)。IL2前导序列以大写的下划线文本显示;接头以小写、下划线、粗体显示;人ACE2以大写的常规文本显示;Fc区以大写斜体文本显示;AviTagTM以小写斜体文本显示。
图33A和图32B-图33A显示ACE2-Fc-Strep-Tag重组多肽(Ace2Fc-Strep-)的DNA序列(对应于SEQ ID NO:50)。图33B显示蛋白质序列(对应于SEQ ID NO:51)。IL2前导序列以大写的下划线文本显示;接头以小写、下划线、粗体显示;人ACE2以大写的常规文本显示;Fc区以大写斜体文本显示;Strep-Tag以小写斜体文本显示。
图34-显示ACE2-Fc和ACE2-Fc-HS对SARS-CoV-2变体D614G感染VeroE6/TMPRSS2细胞的抑制。
序列简要说明
SEQ ID NO:1-含有3个硫酸化位点的HS24肽的序列。
SEQ ID NO:2-含有2个硫酸化位点的HS21肽的序列。
SEQ ID NO:3-含有1个硫酸化位点的HS16肽的序列。
SEQ ID NO:4-人Ig k链前导序列。
SEQ ID NO:5-IL-2前导序列。
SEQ ID NO:6-eCD4-Ig中使用的人CD5前导肽的序列。
SEQ ID NO:7-人Ig k链前导序列。
SEQ ID NO:8-IL-2前导序列。
SEQ ID NO:9-eCD4-Ig中使用的人CD5前导肽的序列。
SEQ ID NO:10-人SRB1(CD36)细胞外结构域的序列,对应于全长序列的氨基酸33-443(见图6)。
SEQ ID NO:11-人SRB1(CD36)全长序列的序列(见图6)。
SEQ ID NO:12-智人IgG-1链C区的序列。
SEQ ID NO:13-具有带有上游7aa的铰链Fc(t)的人Ig-Fc序列。
SEQ ID NO:14-人CD81的序列,全长(见图7)。
SEQ ID NO:15-CD81胞外结构域(aa 113-201)的序列(见图7)。
SEQ ID NO:16-全长HPSG2的序列:登录号M85289;PUBMED 1569102。
SEQ ID NO:17-HCV-AB68、抗HV-1mAb、Vh片段的序列。
SEQ ID NO:18-人基底膜蛋白多糖(perlecan)GAG位点(氨基酸52-79)的序列,具有LDLR A1(氨基酸198-235);UniProtKB-P98160(PGBM_HUMAN)。
SEQ ID NO:19-T7启动子的序列。
SEQ ID NO:20-Fc-HS中存在的HS的氨基酸序列,获得自基底膜蛋白多糖。
SEQ ID NO:21-Fc-T3中存在的T3的氨基酸序列。
SEQ ID NO:22-来自磷脂酰肌醇聚糖(Glypican)5的氨基酸HS肽。
SEQ ID NO:23-来自多配体聚糖(Syndecan)4的氨基酸HS肽。
SEQ ID NO:24-P6Fc-HS的核苷酸序列(完整序列,966bp,如图19A所示),包含(按顺序)IL-2前导序列(SEQ ID NO:25)、ACE2(SEQ ID NO:26)、接头1(SEQ ID NO:27)、Fc(SEQID NO:28)、接头2(SEQ ID NO:29)和硫酸乙酰肝素(HS,SEQ ID NO:30)。
SEQ ID NO:25-IL-2前导序列。
SEQ ID NO:26-P6Fc-HS中ACE2的序列。
SEQ ID NO:27-P6Fc-HS中接头1的序列。
SEQ ID NO:28-Fc的序列。
SEQ ID NO:29-P6Fc-HS中接头2的序列。
SEQ ID NO:30-硫酸乙酰肝素的序列。
SEQ ID NO:31-P6Fc-HS的氨基酸序列(对应于SEQ ID NO:24,如图19B所示)。
SEQ ID NO:32-Ace2Fc-HS的核苷酸序列(完整序列,3066bp,如图20A所示),包含(按顺序)IL-2前导序列(SEQ ID NO:25)、接头1(SEQ ID NO:33)、ACE2(SEQ ID NO:34)、接头2(SEQ ID NO:35)、Fc(SEQ ID NO:28)、接头3(SEQ ID NO:36)和硫酸乙酰肝素(HS,SEQID NO:30)。
SEQ ID NO:33-Ace2Fc-HS中接头1的序列。
SEQ ID NO:34-Ace2Fc-HS中ACE2的序列。
SEQ ID NO:35-Ace2Fc-HS中接头2的序列。
SEQ ID NO:36-Ace2Fc-HS中接头3的序列。
SEQ ID NO:37-Ace2Fc-HS的氨基酸序列(对应于SEQ ID NO:32,如图20B所示)。
SEQ ID NO:38-P61Fc-HS的核苷酸序列(完整序列,1128bp,如图21A所示),包含(按顺序)IL-2前导序列(SEQ ID NO:25)、接头1(SEQ ID NO:39)、ACE2-1部分(SEQ ID NO:40)、接头2(SEQ ID NO:41)、ACE2-2部分(SEQ ID NO:42)、接头3(SEQ ID NO:43)。Fc(SEQID NO:28)、接头4(SEQ ID NO:44)和硫酸乙酰肝素(HS,SEQ ID NO:30)。
SEQ ID NO:39-P61Fc-HS中接头1的序列。
SEQ ID NO:40-P61Fc-HS中ACE2-1部分的序列。
SEQ ID NO:41-P61Fc-HS中接头2的序列。
SEQ ID NO:42-P61Fc-HS中ACE2-2部分的序列。
SEQ ID NO:43-P61Fc-HS中接头3的序列。
SEQ ID NO:44-P61Fc-HS中接头4的序列。
SEQ ID NO:45-P61Fc-HS的氨基酸序列(对应于SEQ ID NO:38,如图21B所示)。
SEQ ID NO:46-ACE2-Fc-SA的核苷酸序列,如图31A所示)
SEQ ID NO:47-ACE2-Fc-SA的氨基酸序列,如图31B所示)。
SEQ ID NO:48-ACE2-Fc-AviTagTM的核苷酸序列,如图32A所示)。
SEQ ID NO:49-ACE2-Fc-AviTagTM的氨基酸序列,如图32B所示)。
具体实施方式
包膜病毒使用它们的表面蛋白(例如刺突(S)蛋白或包膜(E或Env)蛋白(它们与宿主细胞表面的受体相互作用))通过受体介导的内吞作用进入细胞。Env蛋白和细胞表面受体之间的相互作用以“锁匙”方式工作。Env蛋白具有一个或多个结构受体结合结构域(RBD),其被一个或多个受体内的结合口袋识别。结合结构域的3D结构由氨基酸序列决定。某些病毒只使用一种细胞受体,而其他病毒则使用超过一种。对于利用多个受体的病毒,协同配体相互作用起着关键作用,并且结合过程可能是连续的,即第一配体的结合诱导第二配体的结合。发生该过程的病毒的实例包括HIV(其中CCR5的结合打开了CD4结合的结合位点)和HCV(其中HSPG和/或SRB1的结合允许CD81结合)。
病毒与宿主细胞上病毒受体结合的第二种机制是通过电荷相互作用。已知病毒Env蛋白具有带正电荷的结构域,该结构域在进化上是保守的。细胞受体的带负电的结构域参与了这一过程。这些位点可以是病毒感染细胞的唯一受体,也可以是第二受体。结合口袋的电荷可以由酸性氨基酸或通过例如宿主的管家酶对蛋白质的硫酸化提供。有2种已知的蛋白质硫酸化方式,其中一种通过酪氨酸硫酸化发生(如HIV的情况),另一种通过糖如硫酸乙酰肝素(HS)发生,这是HCV的情况。本披露利用其中蛋白质被糖(例如HS)硫酸化的情况。目前尚不清楚有多少包膜病毒使用基于糖的硫酸基团进行受体介导的进入过程。然而,不管特定病毒的机制如何,本文所述的Ig-Fc分子中存在的HS-硫酸化位点可能是促进病毒中和的协同配体结合相互作用的关键决定因素。
本领域已知eCD4-Ig与小的CCR5-模拟磺肽的融合蛋白与HIV-1Env蛋白紧密且协同地结合以防止宿主细胞的感染。然而,CCR5模拟肽的硫酸化对于融合蛋白在受试者中的长期抑制活性是必需的。据报道,酪氨酰蛋白磺基转移酶(TPST2)和融合蛋白在受试者中的共表达有助于维持受体的硫酸化水平,尽管这需要在受试者或患者中共表达多个外源序列。
许多病毒会导致慢性病,包括肝病、癌症和免疫缺陷。丙型肝炎病毒(HCV)是最多样化的人病毒之一,没有通用疫苗可用于预防或治疗感染。据估计,全世界约有1.7亿人持续感染HCV,而美国和欧洲约有800万人受到慢性感染。此外,只有约30%的HCV感染者完全康复,而其余70%的人发展为终末期肝病或原发性肝细胞癌,导致HCV成为肝移植的主要原因。
HCV通过使用HSPG和SRB1将自身附着于肝细胞并使用多种细胞表面受体(包括CD81、闭合蛋白(claudin)和封闭蛋白(occuludin))内化进入肝脏。SARS-CoV-2利用ACE2受体与硫酸乙酰肝素蛋白聚糖(HSPG)结合进入细胞。HSPG的糖胺聚糖组分是硫酸乙酰肝素(HS),其中一个值得注意的实例是肝素。肝素结合后,SARS-CoV-2刺突蛋白受体结合结构域发生结构变化。SARS-CoV-2感染会下调肺、心脏、血管、肝脏和肾脏等多个器官内皮细胞衬里中的ACE2受体,导致内皮炎症和血栓形成,这是导致COVID-19患者中多器官衰竭的原因。基于上述,本发明人已经确定与第一病毒受体和第二病毒受体(其已经被修饰为含有硫酸化多糖)两者结合的重组多肽的构建高效且有效地维持融合蛋白的硫酸化并增强重组多肽与病毒颗粒结合,从而阻止病毒进入宿主细胞。这表明本披露的重组多肽可以提供针对病毒感染的有效、长期和近乎普遍的保护。在其他实施例中,如本文所述的重组多肽也可用于治疗如本文所述的中东呼吸综合征(MERS)。
SARS-CoV-2是当前导致全球疾病和死亡的COVID-19全球大流行的原因。SARS-CoV-2是正向单链RNA病毒,属于冠状病毒科。它通过刺突(S)受体结合结构域(RBD)和血管紧张素转换酶2(ACE2)受体中的特定氨基酸残基之间的相互作用来感染人体细胞。包括SARS-CoV-2在内的冠状病毒的S蛋白被切割成两个独立的亚基,S1(结合受体)和S2(诱导病毒膜和细胞膜之间的融合),并以此发挥作用。这种切割发生在病毒粒子组装和分泌过程中的S1/S2弗林蛋白酶切割位点。与此相反,SARS-CoV的S蛋白没有被切割,而是作为单一蛋白发挥作用,尽管这两种蛋白在两者之间具有大约70%的同源性。此外,SARS-CoV-2的S蛋白在S1/S2切割位点处有PRRAR五肽插入,而SARS-CoV S蛋白中不存在这种五肽插入。SARS-CoV-2S蛋白的高精氨酸(R)含量导致病毒与HSPGR的预期更高电荷相互作用。
本披露提供了用于预防和治疗病毒感染的重组多肽、药物组合物、RNA分子和相关方法。免疫球蛋白(Ig)或其片段、可溶性或膜结合受体或其片段、间隔区、对特定病毒特异的抗体区域和/或硫酸化多糖或其他可硫酸化的化合物可以有利地组合成重组多肽以防止病毒进入细胞。如本文所述的此类重组多肽,以及用于治疗受试者或患者的载体、组合物和方法,可以使得能够治疗或预防任何病毒的感染,因为本披露绕过了病毒序列异质性。因此有可能捕获所有病毒基因型,表明本披露对感染性病毒的普遍性。
在一些实施例中,本披露描述了广泛用于治疗早期至晚期病毒感染的蛋白质产物、RNA产物和重组腺病毒载体产物。例如,如本文所述,本披露的重组多肽可以是Ace2-Fc重组多肽,或可以是Ace2-Fc-HS重组多肽。此类蛋白质产物可以如本文所述从哺乳动物细胞培养物中表达和纯化,并且可用于通过静脉内(IV)输注治疗本文所述的任何病毒,例如包括但不限于SARS-CoV、SARS-CoV-2、人冠状病毒NL63(HCoV-NL63)(它会引起普通感冒)。在其他实施例中,本文所述的RNA产物可以是RNA分子或其组合物,它们可用于用阳离子脂质体配制的体外T7转录系统,用于通过肌肉内(IM)或皮下(SC)施用来治疗本文所述的任何病毒。在其他实施例中,如本文所述的重组腺病毒载体产物可以是腺病毒、腺相关病毒(AAV)、Ad5或Ad26病毒颗粒或其组合物,它们可以从细胞培养物中表达和纯化以用于通过鼻或IM施用治疗本文所述的任何病毒。本文详细描述了这些和其他实施例。
在一些实施例中,本文所述的蛋白质产物、RNA产物或重组腺病毒载体产物可有效用于治疗涉及流行病或大流行病的病毒,例如COVID-19全球大流行病,或用于任何利用相同的细胞受体的未来病毒。在其他实施例中,本文所述的蛋白质产物、RNA产物或重组腺病毒载体产物对逃避或逃逸疫苗和/或单克隆抗体(Mabs)的病毒有效。这些病毒被受体捕获,因为它们的逃逸突变是自杀性的。本文所述的蛋白质产物、RNA产物或重组腺病毒载体产物提供了ACE2,一种维持许多器官内皮完整性的关键酶。SARS-CoV-2感染会降低ACE2,这是感染SARS-CoV-2的患者内皮血栓形成的主要原因。本文所述的蛋白质产物、RNA产物或重组腺病毒载体产物还提供效应器功能,例如互补固定或T细胞应答(抗体依赖性细胞毒性(ADCC))。
对于许多病毒,由于病毒包膜的变异性,没有可用的表面抗原测试。因此,在一些实施例中,本披露提供了一种用于病毒感染的快速即时检测以测量当前感染。因此,本披露旨在涵盖使用细胞表面受体对能够感染细胞的任何病毒进行诊断、治疗和预防。此类病毒包括包膜病毒和无包膜病毒。包膜病毒可包括在衣壳周围具有病毒包膜的任何病毒,例如包括但不限于HCV、MERS等。在其他实施例中,病毒可能在病毒衣壳周围缺乏病毒包膜并且能够使用细胞表面受体感染细胞。无包膜病毒的一个非限制性实例是小核糖核酸病毒,它包括小的细胞质病毒的大家族,包括但不限于鼻病毒、肠病毒、肝炎病毒等。
除非本文另有说明,否则重组多肽、药物组合物、RNA分子或组合物以及相关方法均可以根据本文示例的程序或本领域熟知的常规实践方法产生或进行。参见例如Methodsin Enzymology[酶学方法],第289卷:Solid-Phase Peptide Synthesis[固相肽合成],J.N.Abelson,M.I.Simon,G.B.Fields(编辑),学术出版社(Academic Press);第1版(1997)(ISBN-13:978-0121821906);美国专利号4,965,343和5,849,954;Sambrook等人,Molecular Cloning:A Laboratory Manual[分子克隆实验室手册],冷泉港出版社(ColdSpring Harbor Press),纽约,(第3版,2000);Brent等人,Current Protocols inMolecular Biology[分子生物学当前方案],约翰威利父子公司(John Wiley&Sons),Inc.(2003);Davis等人,Basic Methods in Molecular Biology[分子生物学的基本方法],爱思唯尔科学出版公司(Elsevier Science Publishing,Inc.),纽约,USA(1986);或Methodsin Enzymology:Guide to Molecular Cloning Techniques[酶学方法:分子克隆技术指南]第152卷,S.L.Berger和A.R.Kimmel编辑,学术出版公司(Academic Press Inc.),圣地亚哥,USA(1987);Current Protocols in Protein Science[蛋白质科学当前方案](CPPS)(John E.Coligan,等人编辑,约翰威利父子公司(John Wiley and Sons,Inc.)),CurrentProtocols in Cell Biology[细胞生物学当前方案](CPCB)(Juan S.Bonifacino等人编辑,约翰威利父子公司(John Wiley and Sons,Inc.)),和Culture of Animal Cells:AManual of Basic Technique[动物细胞培养:基本技术手册]作者R.Ian Freshney,出版社:Wiley-Liss;第5th版(2005),Animal Cell Culture Methods[动物细胞培养方法](Methods in Cell Biology[细胞生物学方法],第57卷,Jennie P.Mather和David Barnes编辑,学术出版社(Academic Press),第1版,1998)。以下部分为实践本披露的组合物和方法提供了另外的指导。
本披露的实施例提供了一种重组多肽,其包含:a)Ig Fc片段和硫酸化多糖;和b)至少一种病毒受体片段。在另一个实施例中,本披露提供了包含重组多肽的药物组合物,该重组多肽包含:a)Ig Fc片段和硫酸化多糖;和b)至少一种病毒受体片段。其他实施例提供了在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向受试者施用治疗或预防有效量的包含重组多肽的药物组合物,该重组多肽包含:a)Ig Fc片段和硫酸化多糖;和b)至少一种病毒受体片段。其他实施例提供了一种RNA分子,其包含:a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;和b)表达重组多肽的第二核糖核苷酸序列,该重组多肽包含:a)Ig Fc片段和硫酸化多糖;和b)至少一种病毒受体片段。其他实施例提供了一种治疗性组合物,其包含:a)活病毒表达载体;和b)表达重组多肽的多核苷酸序列,该重组多肽包括:a)Ig Fc片段和硫酸化多糖;和b)至少一种病毒受体片段。其他实施例提供了包含编码重组多肽的多核苷酸序列的表达系统,该重组多肽包含:a)Ig Fc片段和硫酸化多糖;和b)至少一种病毒受体片段。
用于预防病毒感染的重组多肽
在一些实施例中,本披露提供了一种重组多肽,其包含:a)Ig Fc片段和硫酸化多糖;和b)至少一种病毒受体片段。这种重组多肽通过一种或多种病毒受体片段与病毒颗粒上存在的蛋白质结合,模拟病毒与宿主细胞上的细胞表面受体的结合。在一些实施例中,重组多肽可以具有多于一种病毒受体片段,从而允许重组蛋白协同结合多于一种病毒蛋白。由该重组多肽捕获的病毒颗粒通过Ig Fc片段的效应器功能从循环中清除,前提是这些作用机制占据病毒蛋白并防止或阻断病毒与宿主细胞上的细胞表面受体结合,从而有效地防止病毒进入细胞并降低病毒的传染性。
在一些实施例中,如本文所述的抗体融合分子可以包含以下中的一个或多个:Fc区、一个或多个CH区、一个或多个CH区、Fab、Fab'、F(ab’)2、单链Fv(ScFv)和/或Fv片段、铰链区以及其片段或部分,以及抗体的对一个或多个所需靶表位具有特异性的任何部分。如本文所述,Ig Fc或其片段可以是抗体或抗体片段,或可以是单链、双链和/或多链蛋白,和/或是属于多克隆、单克隆、嵌合、双特异性和/或异源免疫球蛋白类别的糖蛋白。在一些实施例中,如本文所述的Ig Fc片段可以指单克隆抗体。在一些实施例中,这些免疫球蛋白的合成和/或遗传工程化的变体包括在本披露的范围内。
为了增加任何重组多肽或包含这些的组合物的活性或半衰期,如本文所述的一种或多种病毒受体片段可融合或结合至更大的分子或载体。例如,本文所述的病毒受体可以融合到免疫球蛋白(Ig)Fc结构域的全部或部分。这种融合赋予一种或多种病毒受体片段融合抗体效应器功能,包括介导抗体依赖性细胞介导的细胞毒性、进入粘膜区室和跨胎盘转运的能力。
因此,在一些实施例中,本文所述的重组多肽除了一种或多种病毒受体片段外,还可以含有免疫球蛋白的Fc结合区。在一些实施例中,本披露的重组多肽还可以包含免疫球蛋白分子或抗体的部分,例如包括但不限于Ig的恒定重链、可变重链、恒定轻链、可变轻链、铰链区和/或Fc结构域以及其变体的全部或部分。例如,本文所述的重组多肽可以与人IgG的部分组合。可以酌情使用任何类型的免疫球蛋白,例如包括IgG、IgA、IgM、IgD、IgE及其变体。
例如,本文所述的重组多肽可以通过在Ig-Fc片段的N-末端或C-末端之一或两者处连接病毒受体片段来构建。一种或多种病毒受体片段可以以任何构型直接连接在一起,或者它们可以被间隔区分开。在一些实施例中,这样的间隔区可能有益于病毒受体片段的正确放置,使得它们能够顺序地或协同地结合病毒包膜蛋白,和/或确保每个组分的正确功能。如本文所述的重组多肽的元件可以任何顺序连接。在一些实施例中,SRB1受体片段可以连接到CD81受体片段并由间隔物隔开,如图1-3中所示,用于治疗HCV。在其他实施例中,CD26或其片段CD26-B4C可以组合成重组多肽,如图4所示,用于治疗中东呼吸综合征(MERS)。这些构建体或包含在本披露范围内的其他构建体然后可以缀合至Ig-Fc区。在一些实施例中,硫酸化多糖,例如低分子量硫酸乙酰肝素,可以与Fc缀合以向本文所述的重组多肽提供负电荷。如本领域技术人员将理解的,根据本披露被鉴定为可用于包含在重组多肽或融合蛋白中的本文组分可以以多种方式被改变以包括变体,这些变体具有针对本文披露的任何病毒的任何一种或多种细胞表面受体以及免疫球蛋白(Ig)或Fc区的任何有用区域。此类重组多肽及其变体也包括在本披露的范围内。
在一些实施例中,本文所述的重组多肽可以是单体形式,或可以是多聚体形式,例如二聚体、三聚体、四聚体、六聚体、八聚体、十聚体等。图24-29展示了本披露的重组多肽的这种多聚体形式的可能排列。在下文详细描述的一些实施例中,单体可以与另一个单体连接以形成二聚体,然后其进一步多聚化成如本文所述的四聚体或八聚体。本发明的单体通过Fc-Fc整合共翻译地二聚化,然后通过链霉亲和素(SA)进一步形成四聚体,然后通过生物素-SA相互作用形成八聚体。本文详细描述了这些和其他实施例。
在一些实施例中,本文披露的重组多肽可以具有:a)Ig Fc片段和硫酸化多糖;和b)至少一种病毒受体片段,并且可以进一步包括本文披露的铰链结构域、接头或间隔物。至少一种病毒受体片段可以是本文披露的任何病毒受体或其片段,或病毒受体或其片段的组合,例如包括但不限于下表1中列出的病毒受体,例如CD81、SRB1、HSPG、CD26、CD26-叶片4、CD26-B4C、ACE2、CD147、唾液酸、DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、NPC1、NTCP等。本领域技术人员将认识到其他病毒受体可用于治疗病毒,并且这些旨在包含在本披露的范围内。在一些实施例中,本文所述的重组多肽中可包括多于一种病毒受体。在一些实施例中,病毒受体是用于治疗或预防SARS-CoV-2感染的ACE2受体。在一些实施例中,本文所述的重组多肽是具有两条相同多肽链的二聚体。在一些实施例中,多肽二聚体上的每个病毒受体是相同的。在一些实施例中,病毒受体是ACE2受体。
在一些实施例中,ACE2-Fc重组多肽的四聚化可以在细胞培养物中使用具有生物素结合位点的链霉抗生物素(SA)来完成,如图24所示。由于两个单独的ACE2-Fc重组蛋白(每个都是二聚体形成,以形成ACE2-Fc四聚体-SA)的SA基团的结合,将SA添加到重组多肽中将导致自发形成四聚体(本文称为ACE2-Fc-SA)(图24)。所得四聚体重组蛋白在细胞培养物中表达和分泌。
在一些实施例中,ACE2-Fc重组多肽的八聚化可以使用SA和Strep-tag在体外完成。如上所述,对于ACE2-Fc-SA四聚体,两个单独的ACE2-Fc重组蛋白(每个都是二聚体形式)的SA基团的结合导致自发形成ACE2-Fc-SA四聚体,然后使用例如Strep-tag II肽使其进一步多聚化,Strep-tag II肽将结合SA上的生物素结合位点以形成Fc八聚体,如图25所示。
在其他实施例中,ACE2-Fc重组多肽的四聚化可以在体外使用生物素化的AviTagTM和具有生物素结合位点的SA来完成。SA被添加到具有末端AviTagTM基团的ACE2-Fc二聚体(即ACE2-Fc-AviTagTM)中,由于每个ACE2-Fc-AviTagTM二聚体的生物素化AviTagTM与生物素结合位点的结合,导致自发形成四聚体。(图26)。
在一些实施例中,ACE2-Fc重组多肽的八聚体可以使用如前一段所述的ACE2-Fc-AviTagTM二聚体在体外完成。ACE2-Fc-AviTagTM二聚体与四聚体ACE2-Fc-SA组合形成八聚体重组多肽,如图27所示,这是由于ACE2-Fc-AviTagTM的末端生物素化AviTagTM在生物素结合位点与ACE2-Fc-SA四聚体结合的结果。
在其他实施例中,ACE2-Fc重组多肽的四聚化可以在体外使用用肝素生物素化的二聚ACE2-Fc-AviTagTM并将其与具有生物素结合位点的SA组合来完成。用肝素生物素化的AviTagTM基团与SA上的生物素结合位点结合,形成如图28所示的四聚体重组多肽。
在一些实施例中,ACE2-Fc重组多肽的八聚体化可以使用如前一段所述的用肝素生物素化的ACE2-Fc-AviTagTM二聚体在体外完成。用肝素生物素化的ACE2-Fc-AviTagTM二聚体与四聚体ACE2-Fc-SA组合形成八聚体重组多肽,如图29所示,这是由于ACE2-Fc-AviTagTM的末端生物素化AviTagTM在生物素结合位点与ACE2-Fc-SA四聚体结合的结果。
因此,在一些实施例中,本文所述的重组多肽可以包含一个或多个二聚体,每个二聚体可以包含至少两个病毒受体或其片段。如本文所述并至少在图24-30中呈现,根据本披露有用的重组多肽可以包含一个或多个相同的二聚体以构成四聚体或八聚体。二聚体可以如本文所述相同,或者它们可以彼此不同。在一些实施例中,本文所述的二聚体上的病毒受体或其片段都是ACE2。在一些实施例中,本文所述的重组多肽是四聚体或八聚体。这样的四聚体或八聚体可以如本文所述使用例如包含一个或多个链霉亲和素、一个或多个AviTagTM和/或一个或多个Strep-Tag来产生。如本文所述,链霉抗生物素可包含一个或多个生物素结合位点,其用于产生如本文所述的多聚体。如本文所述的AviTagTM可以被生物素化,例如用肝素生物素化。这样的多聚体重组多肽的结构在本文中描述,至少在图24-29中并且并如SEQ ID NO:46-51所示。对于这样的多聚体重组多肽,多聚体的每个多肽,例如二聚体、四聚体或八聚体,包含如SEQ ID NO:47、49或51所示的序列。
上述四聚化和八聚化方法可用于本文披露或本领域已知的任何病毒受体-因此任何病毒。有用的实施例可以包括使用ACE2受体作为用于感染的细胞受体的任何病毒,例如SARS-CoV、SARS-CoV-2和/或CoV-NL63。因此,本披露包括制备如本文所述的重组多肽的多聚体的方法,该方法包括使用如本文和实例中所述的ACE2-Fc重组多肽,和链霉亲和素(SA)、AviTagTM和/或Strep-tag的组合。
病毒受体
如本文所述,病毒通过病毒上存在的蛋白质与细胞表面受体结合进入宿主细胞。一些病毒可能与单个宿主细胞表面受体结合,而一些病毒可能与多个宿主细胞表面受体结合。在这种情况下,病毒与其受体的结合可能是连续的,也可能是协同的。在一些实施例中,病毒与细胞表面受体的结合可引起、促成或启动第二病毒蛋白与第二宿主细胞表面受体的结合。如本文所述的病毒受体片段旨在包括能够与天然受体竞争结合病毒蛋白的任何分子或肽序列。这样的肽或模拟物的实例是本领域众所周知的。
在某些情况下,已知病毒进入宿主细胞取决于宿主细胞表面受体的接近度或空间排列。病毒宿主细胞受体在本领域中是已知的并且可以随每个病毒科或单个病毒株而变化。表1提供了许多病毒的受体。
表1-病毒受体
SRB1,清道夫受体B-1;HSPG,硫酸乙酰肝素蛋白聚糖
在一些实施例中,病毒受体或其片段可以是宿主细胞表面受体的被病毒识别并且病毒将结合的任何片段。例如,如表中所示和本文所述,根据本披露的病毒受体片段可包括但不限于CD81、SRB1、HSPG、CD26、CD26-Blade4、CD26-B4C、ACE2、DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、NPC1、NTCP等。在一些实施例中,被HCV识别的病毒受体或其片段包括但不限于CD81和/或SRB1。在一些实施例中,被西尼罗病毒或登革热病毒识别的病毒受体或其片段包括但不限于AXL和/或TIM-1,和/或TIM-4。在一些实施例中,被寨卡病毒识别的病毒受体或其片段包括但不限于AXL和/或Tyro3。
在一些实施例中,被MERS识别的病毒受体或其片段包括但不限于CD26和/或CD26-叶片4和/或CD26-B4C。在一些实施例中,被SARS识别的病毒受体或其片段包括但不限于ACE2和/或HSPG。
在一些实施例中,被埃博拉病毒识别的病毒受体或其片段包括但不限于NPC1和/或TIM-1。
在一些实施例中,被HBV识别的病毒受体或其片段包括但不限于NTCP。可用于本披露的片段是在宿主细胞上发现的受体片段,其将与病毒结合并阻止病毒进入宿主细胞。如本领域技术人员将理解的,本文所述的重组多肽可以在认为合适时用将结合病毒并保持与病毒结合的任何病毒受体或其片段进行修饰。
许多病毒和/或病毒科使用作为第一或第二病毒受体的宿主细胞受体的不同组合。例如,如上表所示,包括但不限于HCV、Mers-CoV、Sars-CoV和HBV在内的许多病毒都使用HSPG作为第二病毒受体。
在一些实施例中,HSPG依赖性病毒可分为多个类别,如Cagno等人(Viruses[病毒]11(7):596,2019)所述,其通过引用并入本文。例如,对HSPG的依赖已在病毒的天然分离物上得到证实,这些病毒包括但不限于单纯疱疹病毒、登革热病毒、艾柯病毒(Echovirus)5、艾柯病毒6和北美东部马脑炎病毒。对HSPG的依赖性已在实验室病毒株上得到证实,包括但不限于巨细胞病毒、伪狂犬病毒、默克尔细胞多瘤病毒、乙型肝炎病毒/丁型肝炎病毒、牛痘病毒、腺病毒2(包括D型)、诺如病毒基因群II、Schmallenburg病毒、狂犬病病毒、猪水疱病病毒、Theiler鼠、脑脊髓炎病毒、人副肠孤病毒1、猪繁殖和呼吸综合征病毒、猪圆环病毒2、人疱疹病毒8(卡波西肉瘤疱疹病毒)、人乳头瘤病毒、丙型肝炎病毒、腺相关病毒2、人免疫缺陷病毒、丝状病毒、赤羽病毒、裂谷热病毒、鼻病毒54、肠道病毒71、柯萨奇病毒(Coxsackie virus)A9、亨德拉和尼帕病毒(Hendra and Nipah viruses)、人T细胞白血病病毒1型和戊型肝炎病毒。对HSPG的依赖性已从病毒的细胞培养适应中得到证实,包括但不限于口蹄疫病毒、委内瑞拉马脑炎病毒、辛德比斯病毒(Sindbis virus)、塞姆利基森林病毒(Semliki forest virus)、鼻病毒C15、鼻病毒8、鼻病毒89、柯萨奇病毒B3、柯萨奇病毒A24、黄热病病毒、日本脑炎病毒、西尼罗病毒、蜱传脑炎病毒、冠状病毒组1、冠状病毒OC43、基孔肯雅病毒(Chikungunya virus)和墨累谷脑炎病毒(Murray Valley encephalitisvirus)。对HSPG的依赖性已从病毒的人宿主内适应得到证实,这些病毒包括但不限于约翰坎宁安多瘤病毒(John Cunningham polyomavirus)、肠道病毒70、肠道病毒71和呼肠孤病毒。此外,包括但不限于呼吸道合胞病毒、副流感病毒3、副流感病毒A11、人偏肺病毒、寨卡病毒、腺病毒5(包括D型)和冠状病毒NL63在内的病毒也可能依赖于HSPG作为受体。
在一些实施例中,其他病毒,例如寨卡病毒和埃博拉病毒,虽然不使用完全相同的HSPG,但仍使用带电受体口袋。在一些实施例中,HSPG可以仅向受体口袋提供电荷,而本身不充当受体。在一些实施例中,本披露提供了识别并结合使用HSPG作为受体的病毒的重组多肽。在其他实施例中,如本文所述的重组多肽识别并结合使用HSPG作为电荷提供者和单独的不同受体的病毒。在一些实施例中,HBV使用HSPG作为低亲和力HBV受体和NTCP作为受体(Hu J.和Liu K.,Viruses[病毒]2017,9.56:doi:10.3390/v90300056)。
在一些实施例中,本披露的重组多肽的病毒受体或其片段与特定病毒的结合可能不仅取决于病毒包膜中或病毒包膜上存在的特定蛋白质,而且还可能取决于由病毒受体的特定氨基酸序列或其片段形成的结合袋的电荷。在一些实施例中,病毒蛋白或与其结合的细胞表面受体的净电荷可促进或抑制病毒与宿主细胞表面受体之间的结合。本领域已知某些病毒与由宿主细胞表面蛋白的特定结构域形成的带负电荷的结合口袋结合。在这方面,如本文所述,可通过添加硫酸化糖或硫酸化多糖向本披露的重组多肽提供负电荷。可以提供这种修饰以增强病毒与其一种或多种宿主细胞受体的结合。因此,在一些实施例中,如本文所述的重组多肽可被修饰以在如本文所述的一种或多种病毒受体或其片段上含有硫酸化糖。
在一些实施例中,本发明的硫酸化多糖可以是任何硫酸化糖或硫酸化多糖。硫酸化多糖可包括糖胺聚糖、糖连接素(glyconectin)、蛋白聚糖、岩藻依聚糖,例如包括但不限于硫酸乙酰肝素(HS)和硫酸软骨素(CS)。根据本披露有用的多糖可以是直链的或支链的,并且可以是天然存在的或人工合成的或经修饰的。在一些特定实施例中,如本文所述的硫酸化糖可以存在于蛋白聚糖上或是蛋白聚糖的一部分。蛋白聚糖可以用任何数量的多糖分子糖基化,例如包括1、2、3、4、5、6、7、8、9、10或更多个多糖分子。例如,在一些实施例中,可用于本披露的蛋白聚糖可以是硫酸乙酰肝素蛋白聚糖(HSPG)。
HSPG分为三大类(即多配体聚糖、磷脂酰肌醇聚糖和基底膜蛋白多糖)。大多数HSPG,例如包括但不限于多配体聚糖和磷脂酰肌醇聚糖,锚定在真核细胞的质膜中,而其他的,包括但不限于基底膜蛋白多糖、集聚蛋白和胶原蛋白XVII,则存在于细胞外基质(ECM)中。根据本披露,任何HSPG可用于本文所述的重组多肽中,例如包括但不限于多配体聚糖、磷脂酰肌醇聚糖和基底膜蛋白多糖。
如本文所用,“硫酸化”是指将磺基添加到糖或多糖上。硫酸化参与多种生物过程,包括病毒进入细胞、解毒、激素调节、分子调节、分子识别和细胞信号传导等,其中它在加强蛋白质-蛋白质相互作用中发挥作用。一些病毒株需要硫酸化以使病毒受体与其宿主细胞表面受体结合。在一些实施例中,细胞受体可以使用多种机制来硫酸化多糖,以产生带负电荷的结合口袋。例如,如本文所述,硫酸乙酰肝素蛋白聚糖受体(HSPGR)采用末端己糖糖链作为硫酸化位点。通过这种方式,许多病毒使用这个带电结构域作为进入细胞的受体。
除了细胞表面受体之外,一些病毒还使用第二病毒受体来识别和/或进入细胞。例如,如本文所述,HSPG被一些病毒用作结合和感染宿主细胞的辅助因子。在一些实施例中,HS或HSPG在细胞中普遍存在并且可以被许多病毒用作辅助因子。在一些实施例中,这些化合物可以促进与受体的结合。已知许多不同的病毒使用这样的受体,这些病毒包括但不限于黄病毒、冠状病毒和/或丝状病毒。因此,在一些实施例中,本披露提供了一种重组多肽,其提供了用于预防这些病毒感染的方法和组合物。
如本文所述的多糖或蛋白聚糖可包含一个或多个硫酸化位点,例如1、2、3、4、5、6、7、8、9或10个硫酸化位点等。同样,任何特定的蛋白聚糖,例如HSPG,可以包含一个或多个如本文所述的硫酸化位点。根据本披露,糖或多糖的硫酸化可发生在糖或多糖内的任何位置。例如,如本文所述,本披露的重组多肽可具有特定的氨基酸基序,其用作硫酸化位点,或用作将硫酸化引导至多糖中特定位置的手段。用作如本文所述的重组多肽的硫酸化位点的一种此类示例性基序是丝氨酸-甘氨酸-天冬氨酸(SGD)基序。然而,其他氨基酸基序或序列可替代地用作硫酸化和病毒识别位点,并且包括在本披露中。根据本披露,可用作硫酸化和病毒结合位点的蛋白质或多肽的任何氨基酸序列或存在于蛋白质或多肽中的通过适当的二级、三级或四级蛋白质结构形成的任何结构域包含在本披露中。
在一些实施例中,根据本披露用作硫酸化和病毒结合位点的氨基酸基序可以存在于蛋白质或多肽上的任何位置。例如,如本文所述,SGD基序可以位于蛋白质或多肽中特定氨基酸残基的一定距离内。某些氨基酸,如天冬氨酸和谷氨酸是酸性氨基酸,带负电荷,而其他氨基酸,如精氨酸、组氨酸和赖氨酸,是碱性氨基酸,带正电荷。根据本披露,SGD基序可以位于至少一个酸性氨基酸的一定数量的氨基酸残基内。例如,SGD基序可以位于至少一个酸性氨基酸残基的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个氨基酸内。在特定实施例中,如本文所述的SGD基序可以位于至少一个酸性氨基酸残基的7、8、9和/或10个氨基酸残基内。在一些实施例中,如本文所述的SGD基序可以用作硫酸化的识别位点,也可以用作硫酸化和病毒结合的位置。在一些特定实施例中,SGD基序可以被细胞管家酶识别,该酶可以将磺基添加到SGD基序的丝氨酸残基上。
在一些实施例中,如本文所述的重组多肽具有至少一种病毒受体或其片段。如本文所述,这样的病毒受体或其一个或多个片段能够使重组多肽与病毒结合,从而模拟宿主细胞上的细胞表面受体。在一些实施例中,本披露的重组多肽可以具有多于一种病毒受体或其片段,从而允许重组蛋白协同结合多于一种病毒蛋白。这种作用机制占据病毒蛋白,阻止或阻断病毒与宿主细胞表面受体的结合,有效阻止病毒进入细胞,降低病毒的传染性。
在一些实施例中,如本文所述的重组多肽可以预防利用一种或多种特定细胞表面受体进入细胞的任何病毒科或毒株的感染。在其他实施例中,如本文所述的重组多肽可以预防利用HSPG作为受体进入细胞的任何病毒科或毒株的感染。例如,本披露的重组多肽可以包含将与来自黄病毒科、冠状病毒科、嗜肝DNA病毒科和/或丝状病毒科的病毒结合的病毒受体。本领域技术人员将认识到,本披露的重组多肽可以与结合特定细胞表面受体的任何特定病毒科、毒株或分离物结合。本披露的重组多肽可被定制以抑制如本文所述的特定病毒的感染。
在一些实施例中,可能特别适用于本披露的重组多肽的病毒包括但不限于黄病毒科病毒,包括黄热病病毒、西尼罗病毒、登革热病毒、日本脑炎病毒、寨卡病毒、丙型肝炎病毒(HCV)、Pegivirus等。在一些实施例中,可能特别适合本披露的重组多肽的病毒包括但不限于冠状病毒科病毒,包括冠状病毒、严重急性呼吸综合征相关冠状病毒(SARS CoV)、中东呼吸综合征相关冠状病毒(MERS)等。在一些实施例中,可能特别适合本披露的重组多肽的病毒包括但不限于丝状病毒科病毒,包括埃博拉病毒等。
在一些实施例中,如本文所述的重组多肽可以作为具有如图1-3所示结构的融合蛋白施用于受试者或患者。在其他实施例中,如本文所述的重组多肽可以作为具有如图4所示结构的融合蛋白施用于受试者或患者。可替代地,在一些实施例中,如本文所述的重组多肽可包含分别与病毒蛋白结合以防止进入细胞的两种或更多种多肽、肽、组分或亚基。在一些实施例中,不同组分,例如肽或多核苷酸链,可以在施用于受试者或患者之前共价或非共价缀合。对于其中提供活病毒载体的本披露内容的实施例,这样的载体可以编码作为单一实体的重组融合蛋白,或者可以编码能够在体内组装成如本文所述的重组融合蛋白的单独的、不同的组分或亚基。
肝素是17-19kDa多糖,从猪肠中分离出来,经过酶消化,并通过HPLC进行大小分级。如本文和实例中所述,发现肝素作为附着抑制剂抑制SARS-CoV-2进入靶细胞。肝素是一组称为硫酸乙酰肝素的多糖的成员,它有助于病毒结合口袋中的负电荷。如本文所述,带正电荷的病毒包膜蛋白与靶宿主细胞上带负电荷的结合口袋结合。病毒通过硫酸乙酰肝素蛋白聚糖(HSPG)与宿主细胞的附着对于病毒通过ACE2受体进入是必要的。
如本文所述,发明人合成了基于逆转录病毒(鼠白血病病毒,MLV)的SARS-CoV、SARS-CoV-2和MERS-CoV假病毒颗粒(pp),本文称为MLV-Spp。从这些实验中,确定肝素是靶细胞(VeroE6或VeroE6/Tmprss2)中有效的SARS-CoV-2感染抑制剂,并且对SARS-CoV-2的抑制作用比对SARS-CoV或MERS-CoV的抑制作用更强。
编码重组多肽的表达系统和载体
如本文详述的,本披露提供了可施用给需要针对病毒感染进行长期体内保护或治疗的哺乳动物受试者的药物组合物和治疗性组合物。这样的组合物通常包含表达系统,例如编码或表达如本文所述的重组多核苷酸的多核苷酸序列、表达载体或病毒载体。本披露的组合物允许本文所述的重组多肽(其提供针对如本文所述的病毒感染的有效和长期保护)在受试者或患者(例如人或非人灵长类动物)中的最佳体内活性或共表达。
如本文所述的重组多肽的最佳表达可以通过各种机制实现。这种最佳表达可以使用编码重组多肽的表达载体的所期望结构设计,或通过在表达载体中使用适当调节元件来实现。此外,本披露的重组多肽在体内的最佳表达可以通过测量本文所述的重组多肽的细胞水平来进一步优化。可酌情使用用于确定多肽的适当水平的任何测定法。这样的测试都可以通过本领域熟知的标准测定或方案容易地进行。
在一些实施例中,如本文所述的重组多肽的硫酸化可通过常规实践方法评估,例如35SO4-掺入,以及与GAG-特异性阿尔新蓝/银染组合的凝胶测定。在其他实施例中,病毒中和活性可以使用本领域已知的任何测定(例如中和测定)来评估。
在一些优选的实施例中,编码如本文所述的重组多肽的多核苷酸序列与本文所述的基于病毒的表达载体或表达系统中的表达控制序列(例如,启动子序列)可操作地连接。适用于本披露的病毒载体的一些实例包括基于逆转录病毒的载体,例如慢病毒、腺病毒、腺相关病毒(AAV)和牛痘载体。在一些实施例中,可用于本披露的腺病毒载体可以是Ad5、Ad26。在一些实施例中,本披露的组合物可包含重组AAV载体(rAAV)或病毒颗粒,其含有表达如本文所述的重组多肽的载体。在一些实施例中,可用于本披露的牛痘载体可以是金丝雀痘载体。在一些实施例中,可以根据需要修饰载体的结构以优化重组多肽的表达或实现所期望的细胞水平,例如包括表达控制元件(例如,启动子或增强子序列)。
可以根据本披露使用本领域熟知的各种启动子序列。这些包括但不限于例如CMV启动子、延伸因子-I短(EFS)启动子、鸡肌动蛋白(CBA)启动子、EF-la启动子、人结蛋白(DES)启动子、Mini TK启动子和人甲状腺素结合球蛋白(TBG)启动子。此外,本发明的表达载体可以包括许多调节元件以实现重组多肽的最佳表达。例如,可以包括5'-增强子元件和/或5'-WPRE元件以提高重组多肽的表达。WPRE是一种转录后应答元件,与土拨鼠乙型肝炎病毒(WHYS)基因组的碱基对1093至1684具有100%的同源性。当用于哺乳动物表达盒的3’UTR中时,它可以显著提高mRNA稳定性和蛋白质产量。如本文所用,“表达盒”是指多核苷酸序列,该多核苷酸序列包含至少第一多核苷酸序列,该第一多核苷酸序列能够启动可操作地连接的第二多核苷酸序列的转录,并且任选地包含可操作地连接到第二多核苷酸序列的转录终止序列。如本文所用,表达盒可包含编码如本文所述的重组多肽的外源核酸,其可操作地连接至如本文所述的启动子。
通过在受试者或患者中表达如本文所述的重组多肽,有效和长期的体内保护以对抗和/或治疗受试者如人中的病毒感染。对于这样的方法,可以向受试者施用药物组合物,该药物组合物包含治疗或药学有效量的本披露的重组多肽或治疗性组合物或表达系统。在一些相关实施例中,本披露提供了治疗性组合物,其包含用于在受试者中最佳表达如本文所述的重组多肽的表达系统。表达系统可以是多核苷酸序列或表达载体,以及脂质体或其他含脂质的复合物,以及能够介导多核苷酸序列递送至宿主细胞或受试者的其他大分子复合物。多种表达载体或系统可用于在施用于受试者后表达本披露的重组多肽。在一些实施例中,表达载体或表达系统可以基于病毒载体。在一些其他实施例中,表达系统由含有如本文所述的重组多肽的编码序列的多核苷酸序列构成,包括脱氧核糖核酸和核糖核酸序列。在一些实施例中,表达载体或系统以重组病毒的形式施用于受试者。例如,重组病毒可以是重组腺相关病毒(AAV),例如自互补腺相关病毒(scAAV)载体。这种病毒递送方法允许安全、无干扰性和持续表达高水平的蛋白质治疗剂。
如上所述,当使用本披露的治疗性组合物预防或治疗受试者的病毒感染时,可以在治疗过程中检查重组多肽的表达水平。在一些实施例中,施用的重组多肽或组合物导致重组多肽在受试者中的表达量足以将受试者血浆中可检测到的病毒RNA的拷贝数减少至少2-、3-、4-、5-、6-、7-、8-、9-、10-、15-、20-、25-、30-、35-、40-、45-、50-、55-、60-、65-、70-、75-、80-、85-、90-、95-、100-、150-、200-、250-、300-、350-、400-、450-、500-倍、750-倍、1000-倍或更多。在一些优选的实施例中,用本披露的重组多肽或治疗性组合物或药物组合物治疗受试者或患者导致所治疗受试者的血液或血浆中病毒RNA减少至不可检测的水平。这种不可检测的水平可以定义为在实时逆转录酶聚合酶链反应(实时RT PCR)测定中,每mL血浆中病毒RNA的拷贝数少于50个。
如本文所述的表达载体可以包含进一步调节基因递送和/或基因表达或以其他方式提供有益特性的编码序列和其他组分或功能。这样的其他组分包括,例如,影响与细胞结合或靶向的组分(包括介导细胞类型或组织特异性结合的组分);影响细胞摄取载体的组分;摄取后影响转移的基因在细胞内定位的组分(例如介导核定位的试剂);以及影响基因表达的组分。这样的组分还可以包括标志物,例如可用于检测或选择已经摄取并正在表达由载体递送的核酸的细胞的可检测和/或可选择标志物。这样的组分可作为载体的天然特征提供(例如使用具有介导结合和摄取的组分或功能的某些病毒载体),或可修饰载体以提供此类功能。可选择标志物可以是阳性的、阴性的或双功能的。阳性可选择标志物允许选择携带该标志物的细胞,而阴性可选择标志物允许携带该标志物的细胞被选择性消除。已经描述了多种这样的标志物基因,包括双功能(即阳性/阴性)标志物(参见例如WO 92/08796;和WO 94/28143)。这样的标志物基因可以提供另外的控制措施,这在基因治疗环境中可能是有利的。大量这样的载体在本领域中是已知的并且通常是可获得的。
适用于本披露的表达载体或系统包括但不限于分离的多核苷酸序列,例如可以在染色体外维持的基于质粒的载体,以及病毒载体,例如重组腺病毒、逆转录病毒、慢病毒、疱疹病毒、痘病毒、乳头瘤病毒或腺相关病毒,包括病毒和非病毒载体和RNA,它们存在于脂质体中,例如中性或阳离子脂质体,例如DOSPA/DOPE、DOGS/DOPE或DMRIE/DOPE脂质体,和/或与其他分子缔合,例如阳离子脂质(DOTMA/DOPE)复合物。示例性基因病毒载体是本领域已知的并在下文描述。载体可以通过任何途径施用,包括但不限于肌肉内、口腔、直肠、静脉内或冠状动脉内施用,并且可以使用电穿孔和/或离子电渗疗法增强向细胞的转移。
一些实施例可以使用腺相关病毒载体或腺病毒载体以在受试者或患者中最佳地表达如本文所述的重组多肽。通过从基因组中缺失负责病毒基因表达的早期(ElA和ElB)基因,可以使腺病毒载体无法复制。它们可以以染色体外形式稳定地维持在宿主细胞中。这些载体具有转染复制细胞和非复制细胞的能力。腺相关病毒载体是指源自非致病性细小病毒的重组腺相关病毒(rAAV)。它们基本上不会引起细胞免疫应答,并在大多数系统中产生持续数月的转基因表达。与腺病毒一样,腺相关病毒载体也具有感染复制细胞和非复制细胞的能力,并且被认为对人没有致病性。
用于预防病毒感染的药物组合物或治疗性组合物
在一些实施例中,本披露提供了一种治疗性组合物或药物组合物,其包含活病毒表达载体和表达如本文所述的重组多肽的多核苷酸序列(DNA、RNA)。病毒载体在上面详细描述并且是本领域技术人员已知的。在一些实施例中,如本文所述的表达载体可以是腺病毒载体或牛痘载体。
在一些实施例中,如本文所述的重组多肽可以作为药物组合物或治疗性组合物提供给受试者或患者。本披露的组合物可以在单个单元中包含如本文所述的重组多肽,或者可替代地,在一些实施例中,如本文所述的重组多肽可以包含分别与病毒蛋白结合以防止进入细胞的两种或更多种组分或亚基。在一些实施例中,不同组分,例如肽或多核苷酸链,可以在施用于受试者或患者之前共价或非共价缀合。
如本文所述的重组多肽可以包含多个不同的多肽链(例如,免疫球蛋白重链和轻链),其中一个链包含一个或多个硫酸化位点但需要一个或多个其他多肽链以结合宿主细胞表面受体。
在一些实施例中,如本文所述的重组多肽可以作为完全组装的融合蛋白提供或施用于受试者或患者。可替代地,在一些实施例中,如本文所述的重组多肽可包含分别与病毒蛋白结合以防止进入细胞的两种或更多种组分或亚基。在一些实施例中,不同组分,例如肽或多核苷酸链,可以在施用于受试者或患者之前共价或非共价缀合。对于其中提供活病毒载体的本披露内容的实施例,这样的载体可以编码作为单一实体的重组融合蛋白,或者可以编码能够在体内组装成如本文所述的重组多肽的单独的、不同的组分或亚基。
本披露提供了药物组合物和使用治疗性组合物或表达系统来抑制、预防或治疗病毒感染的相关方法。还提供了本文所述的多核苷酸(DNA、RNA)、多肽和表达载体或系统在制备预防或治疗病毒感染的药物中的用途。药物组合物可以是治疗性配制品或预防性配制。通常,药物组合物可包含一种或多种活性成分和任选的一些非活性成分。在一些实施例中,活性成分可以是本文所述的重组多肽、表达载体或表达系统。在一些其他实施例中,活性成分可以除了本披露的表达系统之外还包括其他抗病毒剂。组合物可以另外包含一种或多种药学上可接受的媒剂和任选的其他治疗性成分(例如抗生素或抗病毒药物)。各种药学上可接受的添加剂也可用于这样的组合物中。
在一些实施例中,如本文所述的药物组合物中的表达系统可包含可最佳表达如本文所述的重组多肽的表达载体或病毒颗粒类型。通常,为实现特定结果而施用的一种或多种载体或病毒颗粒的量将取决于各种因素,包括但不限于所选择的基因和启动子、病症、患者特异性参数,例如身高、体重、年龄,以及是否要实现预防或治疗。本披露的载体或病毒颗粒可以方便地以适合施用到例如血流中(例如冠状动脉内)的配制品形式提供。合适的施用形式最好由执业医师或临床医生根据标准程序为每个患者单独确定。
本披露的药物组合物可以根据本领域熟知的标准程序制备。参见,例如,Remingtons Pharmaceutical Sciences[雷明顿制药科学],第19版,麦克出版公司(MackPublishing Company),伊斯顿,宾夕法尼亚州,1995;Sustained and Controlled ReleaseDrug Delivery Systems[缓控释药物递送系统],J.R.Robinson编辑,马塞尔德克尔公司(Marcel Dekker,Inc.),纽约,1978;美国专利号4,652,441;4,917,893;4,677,191;4,728,721;和4,675,189。本披露的药物组合物可以容易地用于预防或治疗病毒感染的多种治疗应用或预防应用中。对于处于发生病毒感染风险的受试者,可以施用本披露的重组多肽或组合物以提供针对病毒感染的预防性保护。取决于具体受试者和条件,蛋白质产物(例如,重组多肽)、RNA产物(例如,RNA分子或其组合物)或重组腺载体产物(例如,病毒、腺病毒或基于腺相关病毒的产物)、其组合物或本披露中描述的药物产品可以通过本领域普通技术人员已知的多种施用方式施用给受试者或患者,例如肌肉内、皮下、静脉内、动脉内、关节内、腹膜内、鼻内或肠胃外途径。在一些实施例中,如本文所述的用于治疗SARS-CoV或SARS-CoV-2的组合物可以通过鼻或呼吸途径施用,例如使用吸入器、喷雾器、输液器或呼吸器。在一些实施例中,如本文所述的组合物可施用给需要这样的治疗的受试者,施用时间和条件足以预防、抑制和/或改善所选疾病或病症或其一种或多种症状。对于治疗性应用,组合物可以包含治疗有效量的本文所述的表达系统。对于预防性应用,如本文所述的组合物可包含预防有效量的如本文所述的表达系统。表达系统(表达载体或病毒颗粒)的适当量可以根据要治疗或预防的特定疾病或病症、受试者的严重程度、年龄以及特定受试者的其他个人属性(例如,一般受试者的健康状况和受试者免疫系统的健壮性)。有效剂量的确定还可以通过动物模型研究(即灵长类动物、犬科动物等)、随后的人体临床试验以及显著降低受试者中靶向的疾病症状或病症的发生或严重性的施用方案来指导。在一些实施例中,如本文所述的重组多肽、组合物或药物的剂量可以是临床医生或医师认为合适的任何剂量。在一些实施例中,肝素的剂量可以是适用于患者的任何临床剂量,例如包括但不限于约0.1μM、约1μM或约10μM的浓度。在一些实施例中,可以使用10-100μM、或20-50μM、或20-100μM、或10-50μM等的剂量。在一些实施例中,肝素可以例如5,000-10,000单位、或10,000至20,000单位、或20,000至30,000单位、或30,000至40,000单位、或40,000至50,000单位等的剂量施用。在一些实施例中,肝素的剂量可以是0-15单位、或10-20单位、或18-25单位、或20-30单位、或25-40单位、或30-50单位、或40-70单位、或75-100单位、或90-150单位、或125-550单位、或500-750单位、或700-1,000单位、或1,000-3,000单位、或2,500-5,000单位、或5,000-7,500单位、或7,500-1,000单位。
对于预防性应用,本文所述的组合物可以在任何症状出现之前提供,例如在感染之前提供。免疫原性组合物的预防性施用可用于预防或改善任何随后的感染。因此,在一些实施例中,待治疗的受试者是具有病毒感染或有发生病毒感染风险(例如由于暴露于病毒或可能暴露于病毒)的人。在施用治疗有效量的所披露的治疗性组合物后,可以监测受试者或患者的病毒感染、与病毒感染相关的症状或两者。
对于治疗性应用,本文所述的组合物可以在疾病或感染的症状发作时或之后提供,例如在病毒感染的症状发展之后,或在诊断感染之后。因此,本文所述的组合物可在预期暴露于病毒之前提供,以减轻暴露或疑似暴露于病毒之后,或在感染实际开始之后感染和/或相关疾病症状的预期严重性、持续时间或程度。
在一些实施例中,本披露的载体或病毒颗粒可以以包含在一个或多个剂量中有效的量的载体的剂型提供。对于病毒载体,有效剂量可以是临床医生或从业者认为合适的任何范围。重组多肽、载体、病毒颗粒、表达系统或组合物的施用可以在缓冲液中,例如磷酸盐缓冲盐水,或其他合适的缓冲液或稀释剂中。缓冲液或稀释剂的量可能会有所不同,并由临床医生或从业者确定。对于RNA、单独的质粒DNA或与其他大分子复合的质粒DNA的递送,待施用的DNA量将是对接受者产生有益效果的量。例如,可以以单独剂量或分开的剂量施用0.0001至1mg或更多,例如,多达1g,例如,从0.001至0.5mg,或0.01至0.1mg DNA。对于本披露的重组多肽的递送,施用的量将是对接受者产生有益效果的量。例如,可以以单独剂量或分开的剂量施用0.0001至100g或更多,例如多达1g,例如0.001至0.5g,或0.01至0.1g重组多肽。
在一些实施例中,本披露的组合物可以与本领域已知的用于治疗或预防病毒感染的其他药剂组合。这些可包括本领域已知或可获得的用于治疗病毒感染的任何药物,例如抗体或其他抗病毒剂,例如复制酶抑制剂、蛋白酶抑制剂和融合蛋白抑制剂。组合物和一种或多种已知抗病毒剂的施用可以同时或顺序进行。
如本文所用,术语“序列同一性”、“序列相似性”或“同源性”用于描述两个或更多个核苷酸序列之间的序列关系。通过在特定数目的核苷酸上比较两个最佳比对的序列来确定两个序列之间的“序列同一性”百分比,其中比较窗口中序列的部分可以包含与参考序列相比的添加或缺失(即,空位)。两个序列被说成是相同的,如果每个位置的核苷酸都相同的话。在5'至3'方向上观察时的核苷酸序列被说成是在3'至5'方向上观察的第二核苷酸序列的“互补序列”或与其互补,如果第一核苷酸序列与第二序列或参考序列表现出完全互补性的话。如本文所用,当从5'至3'读取的序列之一的每个核苷酸都与当从3'至5'读取时的另一个序列的每个核苷酸互补时,则核酸序列分子被说成表现出“完全互补性”。与参考核苷酸序列互补的核苷酸序列将表现出与参考核苷酸序列的反向互补序列相同的序列。
本披露范围内考虑的多核苷酸和多肽也可以根据与本文具体例示的本披露的那些序列的更具体的同一性和/或相似性范围来定义。序列同一性通常大于60%,优选大于75%,更优选大于80%,甚至更优选大于90%,并且可以大于95%。序列与本文例示的序列相比的同一性和/或相似性可以是49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。除非另有规定,否则如本文所用,可以使用Karlin和Altschul(1990)(如在Karlin和Altschul(1993)中所修改)的算法来确定两个序列的百分比序列同一性和/或相似性。这种算法被并入Altschul等人(1990)的NBLAST和XBLAST程序中。可以用NBLAST程序(得分=100,字长=12)来执行BLAST检索,以获得具有所需百分比序列同一性的序列。为了获得用于比较目标的有空位的比对,可以使用如Altschul等人(1997)中所述的Gapped BLAST。当利用BLAST和GappedBLAST程序时,可以使用相应程序(NBLAST和XBLAST)的默认参数。参见NCBI/NIH网站。
用于预防病毒感染的RNA分子/组合物
在一些实施例中,本披露提供了用于治疗或预防病毒感染的RNA分子。这样的RNA分子可以包含具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;和表达如本文所述的重组多肽的第二核糖核苷酸序列。
如本文所用,“5'-帽”或“5'帽”是指掺入GTP“帽”结构代替转录后新转录的mRNA5'末端处第一个掺入的核苷酸上存在的游离三磷酸基团。5'-帽是RNA转录物转录后加工的一部分,涉及RNA转录物的5'末端与GTP分子之间的由鸟苷转移酶催化的反应。在mRNA翻译成蛋白质的过程中,5'-帽在mRNA的核糖体识别中发挥作用。
如本文所用,“IRES”是指能够将真核核糖体募集到mRNA的RNA元件或RNA分子区域。IRES允许启动蛋白质翻译,而不需要5'-帽来组装起始复合物。因此,在一些实施例中,将IRES引入如本文所述的RNA分子能够以不依赖帽的方式产生本披露的重组多肽,作为蛋白质合成更大过程的一部分。在真核翻译中,蛋白质翻译的起始通常发生在mRNA分子的5’末端。在一些实施例中,如本文所述的RNA分子中包含的IRES使重组多肽能够被施用这种分子的受试者或患者的细胞翻译。T7启动子(例如在SEQ ID NO:19中提供的)可以添加到IRES的上游。可以使用例如T7聚合酶在体外完成大规模RNA生产。RNA可以在有或没有脂质体的盐水中皮下注射。注射的RNA将在患者的细胞内翻译,并分泌所得翻译的重组多肽。
如本文所述的重组多肽可包含多个不同的多肽链(例如,免疫球蛋白重链和轻链),其中一条链包含如本文所述的硫酸化位点,但需要一个或多个其他多肽链以结合宿主细胞表面受体蛋白或其片段。
预防或治疗病毒感染的方法
在一些实施例中,本披露提供了一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向受试者施用治疗或预防有效量的如本文所述的药物组合物。这样的方法可以包括将本文所述的重组多肽施用给受试者或患者,或者可以包括施用编码这样的重组多肽的载体或表达系统。在其他实施例中,本披露的方法可以包括施用如本文所述的组合物,例如包含本披露的重组多肽的组合物。
如本文所述,本披露的方法可以治疗或预防受试者或患者感染来自黄病毒科或冠状病毒科病毒科的病毒。来自这些科的任何病毒都可以用本披露的方法进行治疗,如本文所述。在一些实施例中,可以用本披露的方法有利地治疗或预防的特定病毒可以包括但不限于HCV和MERS。如本文所述的组合物或重组多肽的施用可以在如本文所述的临床环境中,或可以在临床医生或从业者认为合适的替代环境中。用于施用这样的化合物或多肽的其他实施例在本文别处描述。
核酸的表达
可在表达构建体中提供可用于本披露的多核苷酸。本披露的表达构建体通常包括在要表达表达构建体的预期宿主细胞中起作用的调节元件。因此,本领域普通技术人员可以选择调节元件用于例如细菌宿主细胞、酵母宿主细胞、哺乳动物宿主细胞和人宿主细胞。用于表达核基因的调节元件包括启动子、转录终止序列、翻译终止序列、增强子和多聚腺苷酸化元件。如本文所用,术语“表达构建体”是指提供可操作地连接的核酸序列的转录的核酸序列的组合。如本文所用,术语“可操作地连接”是指所描述的组分的并列,其中组分处于允许它们以它们的预期方式起作用的关系中。通常,可操作地连接的组分处于连续的关系。
本披露的表达构建体可以包含与编码本披露的多肽的多核苷酸序列可操作地连接的启动子序列。可以使用本领域已知的标准技术将启动子掺入多核苷酸中。启动子的多个拷贝或多个启动子可以用于本披露的表达构建体中。在一个优选的实施例中,启动子与表达构建体中的转录起始位点的距离可以与其跟其天然遗传环境中的转录起始位点的距离大致相同。在不显著降低启动子活性的情况下,允许该距离有一些变化。转录起始位点通常包含在表达构建体中。
本披露的核表达构建体可以任选地包含转录终止序列、翻译终止序列、编码信号肽的序列和/或增强子元件。转录终止区通常可以从真核或病毒基因序列的3'非翻译区获得。转录终止序列可以位于编码序列的下游以提供有效终止。信号肽序列是一种短氨基酸序列,通常存在于蛋白质的氨基末端,负责将可操作地连接的成熟多肽重新定位到广泛范围的翻译后细胞目的地,范围从特定的细胞器区室到蛋白质作用位点和细胞外环境。通过使用可操作地连接的信号肽序列将基因产物靶向到预期的细胞和/或细胞外目的地被考虑用于与本披露的多肽一起使用。经典增强子是增加基因转录的顺式作用元件,也可以包含在表达构建体中。经典增强子元件是本领域已知的,包括但不限于巨细胞病毒(CMV)早期启动子增强子元件和SV40增强子元件。增强基因表达的内含子介导的增强子元件也是本领域已知的。这些元件必须存在于转录区域内并且是取向依赖性的。
指导从表达构建体转录的mRNA的多腺苷酸化的DNA序列也可以包括在表达构建体中,例如SV40聚A信号,并且包括但不限于章鱼碱合酶或胭脂碱合酶信号。
本披露的多核苷酸可以由RNA或DNA或其杂合体构成。本披露还涵盖那些在序列上与本文披露的多核苷酸互补的多核苷酸。本披露的多核苷酸和多肽能够以纯化或分离的形式提供。
核酸
可以使用本领域技术人员熟知的许多方法来分离和操作DNA分子。例如,如前所述,PCR技术可以用于扩增特定的起始DNA分子和/或产生起始DNA分子的变体。也可以通过本领域已知的任何技术(包括通过化学手段直接合成片段)获得DNA分子或其片段。因此,可以合成如本文所述的全部或部分核酸。
如本文所用,术语“核酸”和“多核苷酸”是指单链或双链形式的脱氧核糖核苷酸、核糖核苷酸或混合的脱氧核糖核苷酸和核糖核苷酸聚合物,并且除非另有限制,否则将涵盖天然核苷酸的能够以与天然存在的核苷酸类似的方式起作用的已知类似物。多核苷酸序列包括转录成RNA的DNA链序列和与转录的DNA链互补的链序列。多核苷酸序列还包括全长序列以及衍生自全长序列的较短序列。多核苷酸序列包括作为单独链或在双链体中的有义链和反义链。
试剂盒
本披露进一步提供了一种试剂盒,其包含一个或多个一次性容器,该容器包含如本文所述的重组多肽。在一些实施例中,本披露的试剂盒可以提供用于施用于受试者或患者的病毒载体。在一些实施例中,试剂盒可提供包含如本文所述的重组多肽的药物组合物,用于施用于受试者或患者。在其他实施例中,可酌情提供用于施用如本文所述的重组多肽、RNA、病毒载体和/或药物组合物的无菌试剂和/或供应品。试剂盒还可包含用于细胞转化和/或转染、病毒和/或细胞培养或两者的试剂。在一些实施例中,本文所述的试剂盒可包含用于进行体外转录以合成mRNA的试剂和材料,例如,本领域已知和可在例如体外转录试剂盒中获得的组分。
本披露的试剂盒中提供的组分可以包括例如可用于进行如本文所述方法的任何起始材料。这样的试剂盒可包含一种或多种这样的试剂或组分,用于多种测定,包括例如核酸测定,例如PCR或RT-PCR测定、萤光素酶(Luc)测定、细胞转化/转染、病毒/细胞培养、血液测定,即全血细胞计数(CBC)、病毒滴度/病毒载量测定、抗体测定、病毒抗原检测测定、病毒DNA或RNA检测测定、病毒中和测定、遗传互补测定或根据本披露有用的任何测定。对于在宿主中导致遗传或基因组改变或突变的病毒株,例如逆转录病毒,用于鉴定宿主基因组内的病毒序列的某些基因分型测定法可能是有用的并且包含在本披露中。组分可以视情况以冻干、脱水或干燥的形式提供,或者可以在水溶液或适合根据本披露使用的其他液体介质中提供。
可用于本披露的试剂盒还可以包括另外的试剂,例如缓冲液、底物、抗体、配体、检测试剂、培养基组分,例如盐(包括MgCl2)、聚合酶、脱氧核糖核苷酸、核糖核苷酸、表达载体等,用于DNA分离、DNA/RNA转染等的试剂,如本文所述。此类试剂或组分在本领域是熟知的。在适当的情况下,这样的试剂盒中包含的试剂可以作为引物对或多个引物对提供在相同的容器或培养基中。在一些实施例中,这样的试剂可以放置在第二或另外的不同容器(在其中可以放置另外的组合物或试剂)中,并适当地等分。可替代地,能够以单个容器手段提供试剂。本披露的试剂盒还可以包括包装组分、使用说明,包括适当时对各个组分的储存要求。如本文所述的这样的试剂盒可以配制用于临床环境,例如医院、治疗中心或临床环境,或者可以适当地配制用于个人使用。
定义
所提供的定义和方法定义了本披露,并且在本披露的实践中指导本领域普通技术人员。除非另有说明,否则术语应根据相关领域普通技术人员的常规用法来理解。分子生物学中常见术语的定义也可以在以下文献中找到:Alberts等人,Molecular Biology of TheCell[细胞分子生物学],第5版,加兰科学出版公司(Garland Science Publishing,Inc.):纽约,2007;Rieger等人,Glossary of Genetics:Classical and Molecular[遗传学术语:经典与分子],第5版,施普林格出版社(Springer-Verlag):纽约,1991;King等人,ADictionary of Genetics[遗传学词典],第6版,牛津大学出版社(Oxford UniversityPress):纽约,2002;和Lewin,Genes IX[基因IX],牛津大学出版社(Oxford UniversityPress):纽约,2007。使用如37CFR§1.822中阐述的DNA碱基命名法。
如本文所用,术语“抗原”或“免疫原”可互换使用,指能够在受试者中诱导免疫应答的物质,通常是蛋白质。该术语还指具有免疫活性的蛋白质,即一旦施用给受试者(直接或通过施用给受试者编码该蛋白质的核苷酸序列或载体)能够引起针对该蛋白质的体液和/或细胞类型的免疫应答。
提供功能相似氨基酸的保守氨基酸取代是本领域众所周知的。以下六个组各自包含彼此为保守取代的氨基酸:1)丙氨酸(A)、丝氨酸(S)、苏氨酸(T);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);精氨酸(R),赖氨酸(K);5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);和6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)。并非蛋白质中的所有残基位置都会容忍在其他方面“保守的”取代。例如,如果氨基酸残基对于蛋白质的功能是必需的,那么即使是在其他方面保守的取代也可能破坏该活性,例如,抗体与靶表位的特异性结合可能会被靶表位中的保守突变破坏。
在一些实施例中,通常可以在不影响本文所述重组多肽的生物活性的情况下进行保守氨基酸取代,例如用一种酸性或碱性氨基酸取代另一种。可以在本文披露的任何肽中进行这种性质的序列的微小变化,前提是这些变化不会显著降低(例如,降低15%或更多)肽或融合多肽中和慢病毒进入其宿主细胞中的能力。
如本文所用,“ACE2”或“ACE2R”是指血管紧张素转化酶2(ACE2)受体,其通常用作病毒受体。
如本文所用,“表位”是指抗原决定簇或受体结合结构域。表位是分子上的特定化学基团或肽序列,其具有抗原性,因此它们引发特定的免疫应答,例如,表位是B和/或T细胞对其作出应答的病毒Env蛋白或抗原的区域。可以由连续氨基酸或由于蛋白质的三级折叠并列的非连续氨基酸两者形成表位。
如本文所用,重组蛋白、组合物、化合物、药物、核酸分子或其他药剂的“有效量”是指足以产生所期望应答的量,例如减少或消除病症或疾病的体征或症状。例如,如本文所述,有效量可以是抑制病毒进入宿主细胞或抑制病毒复制或可测量地改变病毒感染的外在症状所必需的量。通常,该量足以显著抑制病毒复制或传染性。当施用于受试者时,通常使用将达到靶组织浓度(例如,在淋巴细胞中)的剂量,该靶组织浓度已显示在体外抑制病毒进入或复制。在一些实例中,“有效量”是治疗(包括预防)任何障碍或疾病的一种或多种症状和/或潜在原因的量。在一个实例中,有效量是治疗有效量。在一个实例中,有效量是防止特定疾病或病症的一种或多种体征或症状发展的量。
如本文所用,“融合蛋白”是指重组多肽或含有来自至少两种无关蛋白质的氨基酸序列(其已通过肽键连接在一起以形成单一蛋白质)的蛋白质。不相关的氨基酸序列可以彼此直接连接,或者它们可以使用接头序列连接。如本文所用,如果蛋白质的氨基酸序列在其一个或多个自然环境中(例如,细胞内)通常不通过肽键连接在一起,则蛋白质是不相关的。例如,如本文所述,一种或多种宿主细胞表面受体(例如CD81、ACE2、HSPG和/或SRB1)的氨基酸序列通常不被发现通过肽键连接在一起。
如本文所用,“基因递送”是指将外源多核苷酸引入细胞中用于基因转移,并且可以包括靶向、结合、摄取、转运、定位、复制子整合和表达。
如本文所用,“基因转移”是指将外源多核苷酸引入细胞,其可包括靶向、结合、摄取、转运、定位和复制子整合,但不同于且不暗示基因的后续表达。
如本文所用,“基因表达”或“表达”是指基因转录、翻译和翻译后修饰的过程。
如本文所用,“受试者”或“患者”是指分类为哺乳动物的任何动物,例如人和非人哺乳动物。非人动物的实例包括狗、猫、牛、马、绵羊、猪、山羊、兔等。除非另有说明,否则术语“患者”或“受试者”在本文中可互换使用。在一些实施例中,适合本披露的治疗应用的受试者可以是灵长类动物,例如人和非人灵长类动物。
如本文所用,将多核苷酸或载体施用给宿主细胞或受试者是指通过任何常规实施的方法引入细胞或受试者。这包括本领域熟知的“转导”、“转染”、“转化”或“进行转导”。这些术语均指将外源多核苷酸(例如,rAAV载体中的转基因)引入宿主细胞中导致多核苷酸表达(例如,转基因在细胞中表达)的标准过程,并且包括使用重组病毒将外源多核苷酸引入宿主细胞。多核苷酸在细胞中的转导、转染或转化可以通过本领域熟知的方法确定,包括但不限于蛋白质表达(包括稳态水平),例如通过ELISA、流式细胞术和蛋白质印迹,通过测定(例如,DNA印迹、RNA印迹、报告子功能(Luc)测定和/或凝胶迁移迁移率测定)测量DNA和RNA。用于引入外源多核苷酸的方法包括众所周知的技术,例如病毒感染或转染、脂转染、转化和电穿孔,以及其他非病毒基因递送技术。引入的多核苷酸可以稳定地或瞬时地维持在宿主细胞中。
在本披露中使用的转录调节序列通常包括至少一种转录启动子并且还可以包括一种或多种转录增强子和/或终止子。“可操作地连接”是指两个或更多个组分的布置,其中如此描述的组分处于允许它们以协调的方式起作用的关系。举例来说,如果TRS或启动子促进编码序列的转录,则转录调节序列或启动子与编码序列可操作地连接。可操作地连接的TRS通常与编码序列以顺式连接,但不一定直接与其相邻。
术语“治疗”或“减轻”包括向受试者施用化合物或药剂以预防或延迟疾病(例如病毒感染)的症状、并发症或生化指标的发作,减轻症状或阻止或抑制疾病、病症或障碍的进一步发展。需要治疗的受试者包括那些已经患有疾病或障碍的受试者以及有患上障碍的风险的受试者。治疗可以是预防性的(以防止或延迟疾病的发作,或防止其临床或亚临床症状的表现)或在疾病表现后治疗性抑制或减轻症状。
“载体”是在有或没有载剂情况下可以引入细胞中的核酸。能够指导编码一种或多种多肽的基因表达的载体称为“表达载体”。适用于本披露的载体的实例包括例如病毒载体、质粒载体、脂质体和其他基因递送媒剂。
如本文所用,“AAV”是腺相关病毒,并可用于指天然存在的野生型病毒本身或其衍生物。该术语涵盖所有亚型、血清型和假型,以及天然存在形式和重组形式,除非另有要求。如本文所用,术语“血清型”是指基于衣壳蛋白与确定的抗血清(例如包括AAV-1至AAV-8的血清型)的反应性由其他AAV鉴定并区别于其他AAV的AAV。例如,血清型AAV-2用于指包含由AAV-2的cap基因编码的衣壳蛋白和含有来自相同AAV-2血清型的5'和3’UTR序列的基因组的AAV。假型AAV是指包含来自一种血清型的衣壳蛋白和含有第二种血清型的5'-3’UTR的病毒基因组的AAV。预计假型rAAV具有衣壳血清型的细胞表面结合特性和与TPS血清型一致的遗传特性。缩写“rAAV”是指重组腺相关病毒颗粒或重组AAV载体(或“rAAV载体”)。“AAV病毒”或“AAV病毒颗粒”是指由至少一种AAV衣壳蛋白(优选由野生型AAV的所有衣壳蛋白)和包壳多核苷酸构成的病毒颗粒。如果颗粒包含异源多核苷酸(即,除野生型AAV基因组之外的多核苷酸,例如要递送至哺乳动物细胞的转基因),它通常被称为“rAAV”。
如本文所用,“结构域”是指包括整个多肽的氨基酸序列或多肽的功能部分的多肽。某些功能性子序列是已知的,如果它们不是已知的,可以通过截短已知序列并确定截短的序列是否产生功能性多肽来确定。
如本文所用,“表达构建体”是指包含编码的外源核酸蛋白的核酸构建体,该外源核酸蛋白可以被转录和翻译以在其被施用的接受体中发挥功能。在一些实施例中,这样的表达构建体可以包含DNA序列、RNA序列或其组合。在一些实施例中,可以将这样的构建体遗传工程化到适合于在受试者或患者(例如人患者)中施用的载体中。例如,如本文所述,本披露的构建体可包含编码重组多肽的核酸序列,该重组多肽包含:a)Ig Fc片段和硫酸化多糖;和b)至少一种病毒受体或其片段。
在一些实施例中,可以将表达构建体作为病毒载体提供给受试者或患者。病毒载体在本领域中是众所周知的并且可以是适用于本披露的任何病毒载体。例如,在一些实施例中,如本文所述的构建体可以是腺病毒载体。本领域技术人员将能够鉴定合适的病毒载体以施用于受试者或患者,例如人受试者。
如本文所用,“外源序列”是指源自宿主细胞外的核酸序列。外源序列可以是DNA序列、RNA序列或其组合。如本领域技术人员将理解的,可以根据本披露使用本领域可获得的任何类型的核酸。这样的核酸序列可以从与其被递送到的细胞不同的物种或相同的物种中获得。在一些实施例中,根据本披露的外源核酸序列可以编码如本文所述的重组多肽,其适合施用于受试者或患者。这样的重组多肽可以施用于受试者或患者以治疗或预防病毒感染。
在一些实施例中,用于描述和要求保护本披露的某些实施例的表示成分的量、性质如分子量、反应条件等的数字应理解为在一些情况下通过术语“约”修饰。在一些实施例中,术语“约”用于指示值包括用于确定该值的装置或方法的均值的标准差。在一些实施例中,书面描述和所附权利要求书中阐述的数值参数是近似值,其可以根据特定实施例寻求获得的所需性质而变化。在一些实施例中,数值参数应该根据报告的有效数字的数目并通过应用普通的舍入技术来解释。尽管阐述本披露的一些实施例的宽范围的数值范围和参数是近似值,但是具体实施例中阐述的数值尽可能精确地报告。在本披露的一些实施例中呈现的数值可能含有必然由在它们相应的测试测量中发现的标准差导致的某些误差。本文对值范围的描述仅旨在用作单独提及落入该范围内的每个单独值的简写方法。除非本文另有指示,否则每个单独值被并入说明书中,如同其在本文中单独描述一样。
在一些实施例中,在描述特定实施例的背景下(特别是在某些以下权利要求的背景下)使用的术语“一个”和“一种”以及“该”和类似提及可以被解释为涵盖单数和复数,除非另有特别说明。在一些实施例中,如本文(包括权利要求书)所用的术语“或”用于表示“和/或”,除非明确指出仅指代替代物或替代物是相互排斥的。
术语“包含”、“具有”和“包括”是开放式连接动词。一个或多个这些动词的任何形式或时态(如“包含(comprises)”、“包含(comprising)”、“具有(has)”、“具有(having)”、“包括(includes)”和“包括(including)”)也是开放式的。例如,“包括(comprises)”、“具有”或“包括(includes)”一个或多个步骤的任何方法不限于仅具有那些一个或多个步骤,并且还可以覆盖其他未列出的步骤。类似地,“包含”、“具有”或“包括”一个或多个特征的任何组合物或装置不限于仅具有那些一个或多个特征,并且可以覆盖其他未列出的特征。
在本文描述的所有方法能够以任何适合顺序进行,除非本文另外说明或另外与上下文明显矛盾。相对于本文的某些实施例提供的任何和所有实例或示例性语言(例如,“如”)的使用仅旨在更好地阐明本披露并且不对本披露的范围构成限制,除非另有声明。本说明书中的任何语言都不应该被解释为指示任何未要求保护的要素为实践本披露所必需。
本文披露的本披露的替代要素或实施例的分组不应该被解释为限制。每个组成员可以单独地提及和要求保护,或者与该组的其他成员或本文中找到的其他元素以任何组合提及和要求保护。出于方便或可专利性的原因,组的一个或多个成员可以包括在组中或从其中删除。
已经详细描述了本披露,清楚的是在不背离所附权利要求书限定的本披露的范围的情况下,修改、变化和等效实施例是可能的。此外,应该了解,本披露中的所有实例都作为非限制性实例提供。
实例
在以下实例中提供了本披露内容的实施例的实例。以下实例仅以说明的方式呈现,并且帮助本领域普通技术人员使用本披露。这些实例并不旨在以任何方式另外限制本披露内容的范围。
实例1.HSPGR硫酸化的最小结构域。
具有硫酸化位点的HSPG自然地在硫酸化位点充当某些病毒的受体。用1、2或3个SGD硫酸化位点产生硫酸乙酰肝素片段。HSmin是指具有16、21或24个氨基酸的小肽,该小肽包含具有1、2或3个硫酸化位点的识别信号,如下所示:
HS24:DDEYMLADSISGDDLGSGDLGSGD(SEQ ID NO:1)
HS21:DDEYMLADSISGDDLGSGDLG(SEQ ID NO:2)
Hs16:DDEYMLADSISGDDLG(SEQ ID NO:3)
内源性细胞酶在每个SGD基序的每个丝氨酸残基上添加磺基基团。所有上述序列在每个SGD基序的每个丝氨酸残基处都被硫酸化以产生单硫酸化肽、二硫酸化肽或三硫酸化肽。这些肽用于构建具有硫酸化Fc区的硫酸化融合蛋白,称为Fc-SO4。
将cDNA序列克隆到Fc编码序列的3’末端并在细胞中表达。
人HSPG2基因的序列对应于UniProtKB-P98160(PGBM_HUMAN)。
使用兔抗人IgG Ab-HRP,1:2000持续1小时,在293T细胞中评估各种R-Ig蛋白的表达(参见图8)。泳道3显示与Ig-Fc和硫酸乙酰肝素缀合的CD26受体片段的表达。泳道4显示相同的构建体,但在信号肽的N末端包含2个丙氨酸残基以增加重组多肽的分泌。泳道5显示了与CD81受体片段、Ig-Fc和硫酸乙酰肝素缀合的SRB1受体片段。泳道6显示与泳道5相同,但具有上述相同的2个丙氨酸残基以增加分泌。泳道7显示与Ig-Fc和硫酸乙酰肝素缀合的CD81受体片段。对于这个实例,CD26是指蛋白质的叶片-4部分。
实例2.编码序列。
含有受体编码区(例如,CD81、SRB1、HSPG、CD26)的人类DNA序列获自GenBank。这些蛋白质的胞外结构域(其中跨膜结构域被缺失)用于合成编码序列。HS24是取自HSPG 5'近端的小肽序列。该合成的DNA通过PCR扩增以克隆到质粒DNA中。人IgG1-Fc、铰链区和各种信号肽序列的编码序列类似地获得和通过PCR扩增。
实例3.编码序列。
通过重叠PCR生成了编码以下构建体的框内DNA盒:5'-信号肽-MCS(多克隆位点)-铰链-人IgFc-MCS-HS24肽-3'。将该盒插入带有人延伸因子启动子的表达载体pFUSEN-hG1Fc(英杰公司(InvivoGen))中,该载体利用hEF1/HTLV R-U5序列作为杂合启动子(Kim等人,Gene[基因]91:217-23,1990;Takebe,Mol Cell Biol[分子细胞生物学]9:4248-58,1988),和SV40聚A位点;或插入带有CMV启动子的表达载体pCl(普洛麦格公司(Promega))中,该载体使用CMVL.E.SV40具A位点的增强剂/启动子。这种新的表达载体的序列被证实并命名为pFc-HS。CD81序列的细胞外结构域被合成并框内添加到5’MCS以创建pCD81-Fc-HS。通过重叠PCR将SRB1的细胞外结构域添加到CD81的上游以创建pSRB1-CD81-Fc-HS。将CD26的胞外结构域插入pFc-HS的5’MCS以创建pCD26-Fc-HS。
实例4.细胞。
人胚胎肾细胞系HEK293T、人肝癌细胞系Huh7细胞和非洲绿猴肾细胞系COS细胞在37℃和5%CO2维持在含有10%FCS的杜氏改良伊戈尔培养基(DMEM)中。
实例5.体外转染和表达。
用Options-MEM(英杰公司)洗涤在培养皿上在完全培养基中过夜生长的亚汇合细胞。在转染之前,将DNA与Lipofectamine 2000(英杰公司)在Opti-MEM中混合并在室温孵育30分钟,然后添加到洗涤过的细胞。细胞在完全培养基中孵育6小时并进一步生长长达48小时。
实例6.纯化。
通过蛋白-A或蛋白-G琼脂糖柱层析从条件培养基或细胞裂解物中纯化重组受体-Fc-HS蛋白。
实例7.蛋白质印迹分析。
重组蛋白在还原条件下进行SDS-Page处理并转移到硝酸纤维素过滤器中。使用与辣根过氧化物酶(HRP)缀合的兔抗人IgG1使蛋白质可视化。
实例8.ELISA测定。
将96孔板的孔包被MERS刺突蛋白或HCV E1E2蛋白。包被的板被封闭(生物传奇公司(BioLegend),(圣地亚哥(San Diego),加利福尼亚州),与连续稀释的受体-Fc-HS蛋白在室温孵育2小时,与1/1000稀释的辣根过氧化物酶缀合山羊抗人Fc(LSBio,Inc公司)在室温下孵育1小时,洗涤,然后添加四甲基联苯胺(TMB)底物(BD生物科学公司(BDBioscience))。用2N H2SO4终止反应,吸光度读数在450nM。
实例9.病毒中和滴度的确定。
CD81-Fc-HS蛋白中和HCV感染的能力将通过使用如美国专利公开号2010/0227311A1中所述的活HCV病毒(JFH1)来测量。CD26-Fc-HS的能力将通过使用如所述的活MERS-CoV病毒来测量(Jung等人,Vaccine[疫苗]36:3468-76,2018)。
实例10.用于预防病毒感染的融合蛋白的构建。
使用例如免疫球蛋白(Ig)Fc片段、宿主细胞表面受体(例如CD81)片段和片段或第二受体(例如SRB1)和具有硫酸化多糖的肽(例如HS24(SEQ ID NO:1))构建重组多肽(即融合蛋白)。融合蛋白的受体片段结合病毒包膜蛋白并导致或能够结合第二受体。这种结合是协同的,并且比单独的任何一种分子都更稳定。分析了重组多肽结合细胞表面受体的能力。
实例11.重组多肽的体外/体内抑制活性。
在体外和体内的各种条件下评估重组多肽的活性。重组多肽对给定病毒包膜的亲和力通过定量ELISA使用纯化的病毒包膜蛋白来测量以确定结合常数。使用细胞培养物体外测量重组多肽的病毒中和潜力。在该测定中,将一定剂量的病毒与细胞培养物一起孵育以确定感染剂量。然后在感染细胞培养物之前将测量剂量的测试蛋白质与测试病毒进行预孵育以确定重组蛋白质的病毒中和滴度。将该中和滴度与具有已知值的单克隆抗体进行比较将提供重组蛋白效力的第一指示。可以在小动物模型中测试重组蛋白的功效。例如,可以在转基因小鼠模型中测试HCV,在该模型中,将患有严重联合免疫缺陷(SCID)的小鼠移植人肝脏,或者在该模型中敲除鼠CD81基因并表达人受体(如CD81)。这些小鼠可以感染HCV并进行评估。同样,可以在用人CD26转染的转基因小鼠中测试MERS,尽管这些小鼠保留鼠CD26的表达并且仅短暂地表达人CD26。可以对这些动物进行预防性应用测试,其中动物在静脉内给予激发剂量的病毒以监测病毒控制之前用测试蛋白质进行预处理。在治疗性应用中,给已经感染了测试病毒的动物施用测试蛋白以测量病毒血症和病毒清除的变化。黑猩猩是唯一被HCV感染的动物。初试黑猩猩可用于测试HCV重组多肽的预防潜力,而已经感染HCV的动物大腿可用于测试测试蛋白的治疗性应用。
实例12.RNA表达载体。
RNA表达载体可用于表达编码如本文所述的重组多肽的RNA。可以通过使用所期望RNA转录物的DNA编码序列以及用于翻译的5'-帽或IRES来制备构建体。如本文所述的RNA分子中包含的5'-帽或IRES使重组多肽能够被施用这种载体的受试者或患者的细胞翻译。在一些实施例中,大约20个核苷酸的T7启动子(SEQ ID NO:19)也可以添加到蛋白质编码序列的上游。可以使用例如T7聚合酶和5'-帽类似物在体外完成大规模RNA生产。产生的RNA可以在有或没有脂质体的情况下在盐水中肌肉内或皮下注射。注射的具有5'-帽的RNA将在患者的细胞内翻译,并分泌所得翻译的重组多肽。
实例13.通过将24-aa HS肽从基底膜蛋白多糖转移到Fc来产生Fc-HS蛋白。
硫酸乙酰肝素(HS)和硫酸软骨素(CS)是硫酸化GAG(糖胺聚糖)的两种主要形式。在HSPG生物合成途径中,HS和CS共享与氨基酸丝氨酸(Ser)相连的四糖,具体如下:(Ser)-木糖(Xyl)-半乳糖(Gal)-半乳糖(Gal)-葡萄糖醛酸(GlcA)。对于HS,第五糖是N-乙酰氨基葡萄糖(GlcNAc),而CH具有N-乙酰半乳糖胺(GalNAc)。此外,第六糖是GlcA。然后在HS和CH中重复多次第五和第六糖。
对于HS,重复二糖单元中的GlcA残基可以保留,也可以差向异构化为艾杜糖醛酸(IdoA)。然后将硫酸盐(SO4)添加到GlcNAc(多达三个,在碳2、3和6处)和添加到IdoU(一个,在碳2处)。一个值得注意的HS是肝素,它是一种抗凝血剂,从猪肠中纯化并按大小分级为低分子量(MW,15-kDa)物质。
Fc-HS具有23个氨基酸的HS-肽,其中3个Ser残基以粗体显示。预计它们是GAG-糖基化位点。Fc-T3具有23个氨基酸的肽,其中3个Ser残基被Thr替代。
Fc-HS和Fc-T3在293T细胞中表达,分泌的蛋白从培养基中纯化。在还原条件下对蛋白质进行10%SDS-PAGE,并通过考马斯蓝染色进行可视化。
实例14.肝素酶对肝素的切割。
肝素在30℃下用指定的酶消化24小时,通过20%SDS-PAGE分析,并通过阿尔新蓝/银染色可视化(图10)。肝素被肝素酶切割并被GAG特异性染料阿尔新蓝/银染色。肝素酶-I水解GlcNAc-IdoU,肝素酶III消化GlcNAc-GlcA。阿尔新蓝是一种阴离子染料,其可与HS中存在的硫酸盐基团相互作用。与银组合,它选择性地检测蛋白聚糖中存在的GAG链(Min等人,Anal Biochem[生物化学年鉴]209(1):169-75,1993)。
实例15.Fc-HS蛋白是GAG糖基化的。
当凝胶用HS特异性染料阿尔新蓝/银染色时,可检测到EHS条带。当Fc-HS中的3Ser突变为Fc-T3中的3Thr时,阿尔新蓝/银带(图11)被消除。在细胞裂解物和培养基中发现每种蛋白质。只有分泌的蛋白质是GAG糖基化的,糖基化与分泌途径相偶联。
实例16.与HS肽连接的Fc蛋白中的产生的硫酸乙酰肝素。
蛋白质在293T细胞中表达。培养基中的分泌蛋白与蛋白A珠结合并用肝素酶I或肝素酶III部分消化。通过10%SDS-PAGE分析消化的蛋白质,然后进行阿尔新蓝/银染色以观察GAG糖蛋白(图12)。
GAG-糖基化通过Fc-HS和CD81-Fc-HS样品中缓慢迁移的模糊条带的存在得以证实。这些模糊条带被肝素酶转化为梯。在不编码HS肽的CD81-Fc中缺少模糊条带/梯。HS主要以GlcA形式(肝素酶-III敏感)产生,一些以IdU形式(肝素酶-I敏感)产生。
HS GAG-链的三种不同来源如下(预测的O-连接GAG-糖基化位点的氨基酸残基以粗体显示):
实例17.基于逆转录病毒的SARS-CoV-2假病毒颗粒的产生。
如所述(J Visualized Expt[可视化实验杂志],2019 145,1-9),用鼠白血病病毒(MLV)核心和萤光素酶报告基因产生SARS-CoV-2假型(即假病毒)颗粒(Spp)。为此,获得了表达MLV gag和pol(细胞生物实验室公司(Cell Biolabs),#RTV 003)的包装细胞系(Pt-gp)和转移载体质粒pBabe(细胞生物实验室公司#RTV-001)(其编码GFP报告基因和MLVΨ-RNA包装信号,以及5'-和3'-侧翼MLV长末端重复(LTR)区域)。该载体经过修饰以包括果蝇萤光素酶(FLuc)和GFP,以创建pGFP-FLuc。还使用了第二质粒,该质粒编码目的SARS-CoV-2刺突(S)蛋白。按照制造商的方案,使用Lipofectamine 3000(赛默公司(Thermo))将这两种质粒共转染到包装细胞中。共转染后,病毒RNA和蛋白质在转染的细胞内表达,从而产生假型颗粒(pp)。在这些pp中,含有萤光素酶基因报告基因和包装信号的RNA被封装到新生颗粒中,这些颗粒从细胞中出芽到培养基中,其表面有S蛋白。收获培养基并通过离心(290g x7min)澄清以用于感染性测定。在靶细胞中感染后,含有萤光素酶报告基因和侧翼LTR的病毒RNA然后在细胞内释放,逆转录病毒聚合酶活性使其能够逆转录成DNA并整合到宿主细胞基因组中。然后用简单的萤光素酶活性测定对感染的细胞中pp的感染性进行量化。由于整合到宿主细胞基因组中的DNA序列仅包含萤光素酶基因,并且不含MLV或冠状病毒蛋白编码基因,因此它们本质上更安全。SARS-CoV-2Spp是用于研究病毒进入宿主细胞的天然病毒粒子的优秀替代物。见图13为单个细胞类型的发光结果。
获得了对SARS-CoV-2Spp感染的高度允许型细胞系。为此,用[0213]中所述的质粒DNA pCMV-TMPRSS2转染VeroE6细胞,通过Spp感染测定筛选多个克隆,选择一个细胞克隆(克隆7)作为稳定的VeroE6/TMPRSS2细胞系(图14)。
构建体和质粒。
SARS-CoV和MERS-CoV刺突糖蛋白序列分别取自Genbank登录号AY30120和AGN70962,并且用于合成每个cDNA。SARS-CoV-2S糖蛋白序列取自GenBank(登录号MN908947.3)。克隆到pCMV质粒中的密码子优化的S蛋白cDNA序列购自义翘神州公司(SinoBiological)(VG40589-UT),并且简称为pS。通过PCR制备C末端19个氨基酸缺失的S蛋白cDNA(d19)并重新插入pCMV14以创建pS-d19。制备了细胞质尾被HIV Env糖蛋白尾(CCSCGSCC)替代的S蛋白cDNA,并将其重新插入pCMV14以创建pS-HIV。ACE2是SARS-CoV和SARS-CoV-2的进入受体,其序列获自GenBank(登录号AF241254)。编码该序列的质粒购自义翘神州公司(HG10108-M)并克隆到pCMV14中以创建pCMV-ACE2。如本文所述产生三种构建体。ACE2的胞外结构域(aa 18-738)通过PCR扩增并插入pFc以创建pAce-2Fc,或插入pFc-HS以创建pAce2-Fc-HS(图20A和图20B中所示以及图5中示意的序列)。两种构建体都在蛋白质的N末端插入了2个氨基酸(Ala-Ala),以增加蛋白质分泌到细胞培养基中。ACE2的最小结构域(aa 22-44和aa 351-357)(据报道可抑制SARS-CoV进入细胞(Virology[病毒学]2006,350,15-25))被插入pFc以产生pAce2p6-Fc(图19A和图19B中所示的序列)。将可能与SARS-CoV-2刺突(S)蛋白接触的受体结构域(aa 19-44和aa 325-355与3个甘氨酸残基相连)插入pFc以产生p61-Fc(图21A和图21B所示的序列)。编码丝氨酸蛋白酶TMPRSS2的cDNA表达质粒购自义翘神州公司并且称为pCMV-Tmprss2。
在293T细胞中表达的ACE2-Fc和ACE2-Fc-HS被分泌到培养基中。条件培养基中体积增加的蛋白质在变性条件下进行电泳,如图16A所示。用抗人IgG-Fc检测蛋白质印迹,并使用凝胶中包含的已知量的Fc蛋白测定蛋白质。Huh7细胞中表达的蛋白质的纯化和表征显示在图16B中。如图所示,ACE2-Fc和ACE2-Fc-HS抑制SARS-CoV(分别为图17A和图18A)和SARS-CoV-2(分别为图17B和图18B)假病毒进入VeroE6/TMPRSS2细胞。构建体P6Fc-HS的序列提供为SEQ ID NO:25-30。构建体Ace2Fc-HS的序列提供为SEQ ID NO:25、28、30、34-36和38。构建体P61Fc-HS的序列提供为SEQ ID NO:25、28、30和39-44。
Spp制备:
(1)将Pt-gp细胞以6x106个细胞接种在10-cm培养皿中的DMEM完全培养基中,并细胞培养箱中在5%CO2在37℃孵育过夜(16-18小时)。
(2)除去细胞培养基,添加250μl Opti-MEM培养基,其中含有5μg pGFP-Luc、2.5μgpS、20μl Lipofectamine 3000。将细胞孵育6小时。
(3)洗涤细胞,在10ml完全培养基中培养48小时。
(4)通过离心清除含有Spp的培养基中的细胞碎片并等分冷冻。
Spp感染:
在94孔板中接种在含有10%FCS的100μl DMEM完全培养基中的1x104个细胞/孔。
(1)将板孵育。
(2)去除细胞培养上清液。同时,将pp与测试样品按指示在37℃在40μl体积的完全培养基中预孵育1小时。
(3)用40μl预孵育的pp溶液孵育细胞。
(4)将细胞在37℃、5%CO2细胞培养箱中孵育2小时。
(5)每孔添加60μl预热(37℃)DMEM-C培养基,调节体积为100μl。
(6)将细胞在37℃、5%CO2细胞培养箱中孵育48小时。
传染性定量:
萤光素酶测定系统(萤光素酶测定系统,普洛麦格E4030)用于传染性定量。
(1)将萤光素底物和5x萤光素酶测定裂解缓冲液解冻,直至达到室温。
(2)用无菌水将萤光素酶测定裂解缓冲液稀释至1x。
(3)用假型颗粒感染细胞的吸出上清液。
(4)每孔添加20μl 1x萤光素酶测定裂解缓冲液。
(5)将板置于摇床上并在室温下摇动孵育15分钟。
(6)为每孔准备微量离心管,每管添加20μl萤光素底物。
(7)打开光度计,通过将2μl裂解物转移到一个含有4μl荧光素底物的管中,一次一个孔进行萤光素酶活性测量。
(8)轻弹管以混合内容物,但要避免置换管壁上的液体。
(9)将管放入光度计装置中并盖上盖子。
(10)测量管的发光并记录相对光单位的测量值。
数据分析:
在双重转染到包装细胞中产生pp时,进行模拟转染,其中编码刺突编码序列的第二质粒被缺失。这种转染不产生pp,因此可从这些靶细胞测量的萤光素酶活性代表背景测量值。该值被称为dEnv,并从样品中的Luc值中减去以进行标准化。仅使用pp转导的细胞的标准化Luc值被视为100%感染。
实例18.肝素是SARS-CoV-2感染的有效抑制剂。
肝素被确定为靶细胞(组成型表达TMPRSS2的VeroE6或VeroE6细胞)中SARS-CoV-2感染的有效抑制剂。TMPRSS2在体外和体内通过蛋白水解激活SARS-CoV-2,因此VeroE6/TMPRSS2细胞可用于测定病毒的感染性。如图22所示,肝素以小于1μM范围内的TCID50阻断SARS-CoV-2病毒感染。此外,肝素对SARS-CoV-2的抑制比对SARS-CoV和MERS CoV的抑制更有效。
实例19.通过中和单克隆抗体抑制SARS-CoV-2假病毒感染。
SARS-CoV-2刺突S1中和小鼠单克隆抗体(Mab)购自义翘神州公司,并且用于测试其是否可用于预防SARS-CoV-2感染细胞。如图15所示,小鼠Mab能够在2nM左右中和(抑制)病毒感染,这与供应商(义翘神州公司)的报道一致。因此,该数据表明上文所述的pp测定提供了测量病毒中和的可靠方法。
实例20.Ace2-Fc和Ace2-Fc-HS在293T细胞中的表达。
如实例17中所述进行本文所述和在293T细胞中表达的重组多肽的纯化和表征。结果显示于图16B中。在变性条件下对体积增加的还原或未还原的蛋白质进行电泳。用抗人IgG-Fc探测蛋白质印迹。图16B显示蛋白质印迹的SDS-PAGE凝胶,证明与单独的对照Fc相比,在293T细胞中表达的蛋白质Ace2-Fc(左)和Ace2-Fc-HS(右)的纯化和表征。
实例21.肝素是SARS-CoV和MERS感染的有效抑制剂。
与上述实例18类似,肝素还被鉴定为VeroE6细胞中SARS-CoV假病毒感染和Huh7细胞中MERS-CoV假病毒感染的有效抑制剂。如图23所示,肝素以介于约1和2.5μM之间的TCID50阻断SARS-CoV病毒感染和MERS-CoV病毒感染。
实例22.ACE2-Fc重组蛋白的多聚化。
重组ACE2-Fc多肽可以制备成多聚体形式,例如二聚体、三聚体、四聚体、六聚体、八聚体、十聚体等。图24-29展示了本披露的重组多肽的这种多聚体形式的可能排列。
使用链霉亲和素(SA)和生物素的四聚体ACE2-Fc:
为了在细胞培养中制造ACE2-Fc重组多肽的四聚体形式,将具有生物素结合位点的链霉亲和素(SA)添加到二聚体ACE2-Fc分子的与ACE2病毒受体基团相对的末端中,以形成ACE2-Fc-SA二聚体。这些二聚体当在培养中组合在一起时,当SA基团缔合在一起时,会自发形成四聚体,从而形成ACE2-Fc-SA四聚体。该过程在图24中描绘。每个ACE2-Fc-SA二聚体的SA基团的缔合将产生四聚体,其中ACE2-Fc-SA二聚体首尾相连。所得四聚体重组蛋白在细胞培养物中表达和分泌。
使用链霉亲和素(SA)和生物素的八聚体ACE2-Fc:
为了在体外制备八聚体ACE2-Fc重组多肽,允许如上所述的ACE2-Fc-SA二聚体在体外形成四聚体。然后将ACE2-Fc-SA四聚体与在ACE2病毒受体基团相对的末端具有Strep-tag的二聚体ACE2-Fc组合。二聚体ACE2-Fc-Strep-tag将与SA基团上的生物素结合位点结合形成八聚体结构,如图25所示。
使用链霉亲和素(SA)和生物素化AviTagTM的四聚体ACE2-Fc:
为了在细胞培养中制备ACE2-Fc重组多肽的四聚体形式,将在与ACE2病毒受体基团相对的末端具有生物素化AviTagTM的二聚体ACE2-Fc与具有生物素结合位点的SA组合。存在于二聚体ACE2-Fc-AviTagTM上的生物素化AviTagTM基团将与SA基团上的生物素结合位点结合以形成四聚体结构,其中ACE2-Fc-AvitagTM二聚体首尾相连,如图26所示。
使用链霉亲和素(SA)和生物素化AviTagTM的八聚体ACE2-Fc:
为了在体外制备八聚体ACE2-Fc重组多肽,将如上所述的ACE2-Fc-AviTagTM二聚体与四聚体ACE2-Fc-SA组合。存在于二聚体ACE2-Fc-AviTagTM上的生物素化AviTagTM基团将与ACE2-Fc-SA四聚体的SA基团上的生物素结合位点结合形成八聚体结构,如图27所示。
使用链霉亲和素(SA)和用肝素生物素化的AviTagTM情况下的四聚体ACE2-Fc:
为了在细胞培养中制备ACE2-Fc重组多肽的四聚体形式,将在与ACE2病毒受体基团相对的末端具有用肝素生物素化的AviTagTM的二聚体ACE2-Fc与具有生物素结合位点的SA组合。存在于二聚体ACE2-Fc-AviTagTM上的经肝素生物素化的AviTagTM基团将与SA基团上的生物素结合位点结合以形成四聚体结构,其中ACE2-Fc-AviTagTM二聚体首尾相连,如图28所示。
使用链霉亲和素(SA)和用肝素生物素化的AviTagTM情况下的八聚体ACE2-Fc:
为了在体外制备八聚体ACE2-Fc重组多肽,将如上所述的ACE2-Fc-AviTagTM二聚体与四聚体ACE2-Fc-SA组合。存在于二聚体ACE2-Fc-AvitagTM上的生物素化AviTagTM基团将与ACE2-Fc-SA四聚体的SA基团上的生物素结合位点结合形成八聚体结构,如图29所示。
实例23.通过Luc活性测量的ACE2-Fc和ACE2-Fc-SA对VeroE6/TMPRSS2细胞中SARS-CoV-2假病毒感染的抑制。
先前实例中描述的ACE2-Fc和ACE2-Fc-SA构建体用于测试MLV-S19pp假病毒颗粒对VeroE6/TMPRSS2细胞的感染性,并且通过本文所述的萤光素酶(Luc)测定确定感染百分比。由SDS部分变性的细胞中ACE2-Fc-SA四聚体的表达示于图31A中。图30B显示ACE2-Fc和ACE2-Fc-SA都降低了SARS-CoV-2假病毒颗粒的感染百分比。此外,ACE2-Fc-SA比ACE2-Fc更快地降低感染百分比。ACE2-Fc和ACE2-Fc-HS还抑制在刺突蛋白中具有突变的SARS-CoV-2的特定变体(D614G)的感染(图34)。
序列表
<110> Han, Jang
<120> 用于治疗和预防病毒感染的方法和组合物
<130> HAN0001-401-PC
<150> 62/965,033
<151> 2020-01-23
<150> 63/050,473
<151> 2020-07-10
<160> 51
<170> PatentIn 3.5版
<210> 1
<211> 24
<212> PRT
<213> 人(human)
<400> 1
Asp Asp Glu Tyr Met Leu Ala Asp Ser Ile Ser Gly Asp Asp Leu Gly
1 5 10 15
Ser Gly Asp Leu Gly Ser Gly Asp
20
<210> 2
<211> 21
<212> PRT
<213> 人(human)
<400> 2
Asp Asp Glu Tyr Met Leu Ala Asp Ser Ile Ser Gly Asp Asp Leu Gly
1 5 10 15
Ser Gly Asp Leu Gly
20
<210> 3
<211> 16
<212> PRT
<213> 人(human)
<400> 3
Asp Asp Glu Tyr Met Leu Ala Asp Ser Ile Ser Gly Asp Asp Leu Gly
1 5 10 15
<210> 4
<211> 21
<212> PRT
<213> 人(human)
<400> 4
Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro
1 5 10 15
Gly Ser Thr Gly Asp
20
<210> 5
<211> 20
<212> PRT
<213> 人(human)
<400> 5
Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu
1 5 10 15
Val Thr Asn Ser
20
<210> 6
<211> 24
<212> PRT
<213> 人(human)
<400> 6
Met Pro Met Gly Ser Leu Gln Pro Leu Ala Thr Leu Tyr Leu Leu Gly
1 5 10 15
Met Leu Val Ala Ser Val Leu Ala
20
<210> 7
<211> 21
<212> PRT
<213> 人(human)
<400> 7
Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro
1 5 10 15
Gly Ser Thr Gly Asp
20
<210> 8
<211> 20
<212> PRT
<213> 人(human)
<400> 8
Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu
1 5 10 15
Val Thr Asn Ser
20
<210> 9
<211> 24
<212> PRT
<213> 人(human)
<400> 9
Met Pro Met Gly Ser Leu Gln Pro Leu Ala Thr Leu Tyr Leu Leu Gly
1 5 10 15
Met Leu Val Ala Ser Val Leu Ala
20
<210> 10
<211> 411
<212> PRT
<213> 人(human)
<400> 10
Pro Ser Leu Ile Lys Gln Gln Val Leu Lys Asn Val Arg Ile Asp Pro
1 5 10 15
Ser Ser Leu Ser Phe Asn Met Trp Lys Glu Ile Pro Ile Pro Phe Tyr
20 25 30
Leu Ser Val Tyr Phe Phe Asp Val Met Asn Pro Ser Glu Ile Leu Lys
35 40 45
Gly Glu Lys Pro Gln Val Arg Glu Arg Gly Pro Tyr Val Tyr Arg Glu
50 55 60
Phe Arg His Lys Ser Asn Ile Thr Phe Asn Asn Asn Asp Thr Val Ser
65 70 75 80
Phe Leu Glu Tyr Arg Thr Phe Gln Phe Gln Pro Ser Lys Ser His Gly
85 90 95
Ser Glu Ser Asp Tyr Ile Val Met Pro Asn Ile Leu Val Leu Gly Ala
100 105 110
Ala Val Met Met Glu Asn Lys Pro Met Thr Leu Lys Leu Ile Met Thr
115 120 125
Leu Ala Phe Thr Thr Leu Gly Glu Arg Ala Phe Met Asn Arg Thr Val
130 135 140
Gly Glu Ile Met Trp Gly Tyr Lys Asp Pro Leu Val Asn Leu Ile Asn
145 150 155 160
Lys Tyr Phe Pro Gly Met Phe Pro Phe Lys Asp Lys Phe Gly Leu Phe
165 170 175
Ala Glu Leu Asn Asn Ser Asp Ser Gly Leu Phe Thr Val Phe Thr Gly
180 185 190
Val Gln Asn Ile Ser Arg Ile His Leu Val Asp Lys Trp Asn Gly Leu
195 200 205
Ser Lys Val Asp Phe Trp His Ser Asp Gln Cys Asn Met Ile Asn Gly
210 215 220
Thr Ser Gly Gln Met Trp Pro Pro Phe Met Thr Pro Glu Ser Ser Leu
225 230 235 240
Glu Phe Tyr Ser Pro Glu Ala Cys Arg Ser Met Lys Leu Met Tyr Lys
245 250 255
Glu Ser Gly Val Phe Glu Gly Ile Pro Thr Tyr Arg Phe Val Ala Pro
260 265 270
Lys Thr Leu Phe Ala Asn Gly Ser Ile Tyr Pro Pro Asn Glu Gly Phe
275 280 285
Cys Pro Cys Leu Glu Ser Gly Ile Gln Asn Val Ser Thr Cys Arg Phe
290 295 300
Ser Ala Pro Leu Phe Leu Ser His Pro His Phe Leu Asn Ala Asp Pro
305 310 315 320
Val Leu Ala Glu Ala Val Thr Gly Leu His Pro Asn Gln Glu Ala His
325 330 335
Ser Leu Phe Leu Asp Ile His Pro Val Thr Gly Ile Pro Met Asn Cys
340 345 350
Ser Val Lys Leu Gln Leu Ser Leu Tyr Met Lys Ser Val Ala Gly Ile
355 360 365
Gly Gln Thr Gly Lys Ile Glu Pro Val Val Leu Pro Leu Leu Trp Phe
370 375 380
Ala Glu Ser Gly Ala Met Glu Gly Glu Thr Leu His Thr Phe Tyr Thr
385 390 395 400
Gln Leu Val Leu Met Pro Lys Val Met His Tyr
405 410
<210> 11
<211> 552
<212> PRT
<213> 人(human)
<400> 11
Met Gly Cys Ser Ala Lys Ala Arg Trp Ala Ala Gly Ala Leu Gly Val
1 5 10 15
Ala Gly Leu Leu Cys Ala Val Leu Gly Ala Val Met Ile Val Met Val
20 25 30
Pro Ser Leu Ile Lys Gln Gln Val Leu Lys Asn Val Arg Ile Asp Pro
35 40 45
Ser Ser Leu Ser Phe Asn Met Trp Lys Glu Ile Pro Ile Pro Phe Tyr
50 55 60
Leu Ser Val Tyr Phe Phe Asp Val Met Asn Pro Ser Glu Ile Leu Lys
65 70 75 80
Gly Glu Lys Pro Gln Val Arg Glu Arg Gly Pro Tyr Val Tyr Arg Glu
85 90 95
Phe Arg His Lys Ser Asn Ile Thr Phe Asn Asn Asn Asp Thr Val Ser
100 105 110
Phe Leu Glu Tyr Arg Thr Phe Gln Phe Gln Pro Ser Lys Ser His Gly
115 120 125
Ser Glu Ser Asp Tyr Ile Val Met Pro Asn Ile Leu Val Leu Gly Ala
130 135 140
Ala Val Met Met Glu Asn Lys Pro Met Thr Leu Lys Leu Ile Met Thr
145 150 155 160
Leu Ala Phe Thr Thr Leu Gly Glu Arg Ala Phe Met Asn Arg Thr Val
165 170 175
Gly Glu Ile Met Trp Gly Tyr Lys Asp Pro Leu Val Asn Leu Ile Asn
180 185 190
Lys Tyr Phe Pro Gly Met Phe Pro Phe Lys Asp Lys Phe Gly Leu Phe
195 200 205
Ala Glu Leu Asn Asn Ser Asp Ser Gly Leu Phe Thr Val Phe Thr Gly
210 215 220
Val Gln Asn Ile Ser Arg Ile His Leu Val Asp Lys Trp Asn Gly Leu
225 230 235 240
Ser Lys Val Asp Phe Trp His Ser Asp Gln Cys Asn Met Ile Asn Gly
245 250 255
Thr Ser Gly Gln Met Trp Pro Pro Phe Met Thr Pro Glu Ser Ser Leu
260 265 270
Glu Phe Tyr Ser Pro Glu Ala Cys Arg Ser Met Lys Leu Met Tyr Lys
275 280 285
Glu Ser Gly Val Phe Glu Gly Ile Pro Thr Tyr Arg Phe Val Ala Pro
290 295 300
Lys Thr Leu Phe Ala Asn Gly Ser Ile Tyr Pro Pro Asn Glu Gly Phe
305 310 315 320
Cys Pro Cys Leu Glu Ser Gly Ile Gln Asn Val Ser Thr Cys Arg Phe
325 330 335
Ser Ala Pro Leu Phe Leu Ser His Pro His Phe Leu Asn Ala Asp Pro
340 345 350
Val Leu Ala Glu Ala Val Thr Gly Leu His Pro Asn Gln Glu Ala His
355 360 365
Ser Leu Phe Leu Asp Ile His Pro Val Thr Gly Ile Pro Met Asn Cys
370 375 380
Ser Val Lys Leu Gln Leu Ser Leu Tyr Met Lys Ser Val Ala Gly Ile
385 390 395 400
Gly Gln Thr Gly Lys Ile Glu Pro Val Val Leu Pro Leu Leu Trp Phe
405 410 415
Ala Glu Ser Gly Ala Met Glu Gly Glu Thr Leu His Thr Phe Tyr Thr
420 425 430
Gln Leu Val Leu Met Pro Lys Val Met His Tyr Ala Gln Tyr Val Leu
435 440 445
Leu Ala Leu Gly Cys Val Leu Leu Leu Val Pro Val Ile Cys Gln Ile
450 455 460
Arg Ser Gln Val Gly Ala Gly Gln Arg Ala Ala Arg Ala Asp Ser His
465 470 475 480
Ser Leu Ala Cys Trp Gly Lys Gly Ala Ser Asp Arg Thr Leu Trp Pro
485 490 495
Thr Ala Ala Trp Ser Pro Pro Pro Ala Ala Val Leu Arg Leu Cys Arg
500 505 510
Ser Gly Ser Gly His Cys Trp Gly Leu Arg Ser Thr Leu Ala Ser Phe
515 520 525
Ala Cys Arg Val Ala Thr Thr Leu Pro Val Leu Glu Gly Leu Gly Pro
530 535 540
Ser Leu Gly Gly Gly Thr Gly Ser
545 550
<210> 12
<211> 330
<212> PRT
<213> 人(human)
<400> 12
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys
1 5 10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr
65 70 75 80
Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys
85 90 95
Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
100 105 110
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro
115 120 125
Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys
130 135 140
Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp
145 150 155 160
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175
Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
180 185 190
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn
195 200 205
Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
210 215 220
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225 230 235 240
Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
245 250 255
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn
260 265 270
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn
290 295 300
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
305 310 315 320
Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
325 330
<210> 13
<211> 232
<212> PRT
<213> 人(human)
<400> 13
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
1 5 10 15
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
20 25 30
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
35 40 45
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
50 55 60
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
65 70 75 80
Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
85 90 95
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
100 105 110
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
115 120 125
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr
130 135 140
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
145 150 155 160
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
165 170 175
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
180 185 190
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
195 200 205
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
210 215 220
Ser Leu Ser Leu Ser Pro Gly Lys
225 230
<210> 14
<211> 236
<212> PRT
<213> 人(human)
<400> 14
Met Gly Val Glu Gly Cys Thr Lys Cys Ile Lys Tyr Leu Leu Phe Val
1 5 10 15
Phe Asn Phe Val Phe Trp Leu Ala Gly Gly Val Ile Leu Gly Val Ala
20 25 30
Leu Trp Leu Arg His Asp Pro Gln Thr Thr Asn Leu Leu Tyr Leu Glu
35 40 45
Leu Gly Asp Lys Pro Ala Pro Asn Thr Phe Tyr Val Gly Ile Tyr Ile
50 55 60
Leu Ile Ala Val Gly Ala Val Met Met Phe Val Gly Phe Leu Gly Cys
65 70 75 80
Tyr Gly Ala Ile Gln Glu Ser Gln Cys Leu Leu Gly Thr Phe Phe Thr
85 90 95
Cys Leu Val Ile Leu Phe Ala Cys Glu Val Ala Ala Gly Ile Trp Gly
100 105 110
Phe Val Asn Lys Asp Gln Ile Ala Lys Asp Val Lys Gln Phe Tyr Asp
115 120 125
Gln Ala Leu Gln Gln Ala Val Val Asp Asp Asp Ala Asn Asn Ala Lys
130 135 140
Ala Val Val Lys Thr Phe His Glu Thr Leu Asp Cys Cys Gly Ser Ser
145 150 155 160
Thr Leu Thr Ala Leu Thr Thr Ser Val Leu Lys Asn Asn Leu Cys Pro
165 170 175
Ser Gly Ser Asn Ile Ile Ser Asn Leu Phe Lys Glu Asp Cys His Gln
180 185 190
Lys Ile Asp Asp Leu Phe Ser Gly Lys Leu Tyr Leu Ile Gly Ile Ala
195 200 205
Ala Ile Val Val Ala Val Ile Met Ile Phe Glu Met Ile Leu Ser Met
210 215 220
Val Leu Cys Cys Gly Ile Arg Asn Ser Ser Val Tyr
225 230 235
<210> 15
<211> 89
<212> PRT
<213> 人(human)
<400> 15
Phe Val Asn Lys Asp Gln Ile Ala Lys Asp Val Lys Gln Phe Tyr Asp
1 5 10 15
Gln Ala Leu Gln Gln Ala Val Val Asp Asp Asp Ala Asn Asn Ala Lys
20 25 30
Ala Val Val Lys Thr Phe His Glu Thr Leu Asp Cys Cys Gly Ser Ser
35 40 45
Thr Leu Thr Ala Leu Thr Thr Ser Val Leu Lys Asn Asn Leu Cys Pro
50 55 60
Ser Gly Ser Asn Ile Ile Ser Asn Leu Phe Lys Glu Asp Cys His Gln
65 70 75 80
Lys Ile Asp Asp Leu Phe Ser Gly Lys
85
<210> 16
<211> 14327
<212> DNA
<213> 人(human)
<400> 16
ggccggcgag cgggcggctg cgggcggcgc ggagcgggcg gcgcggagcg agcgagcgag 60
agagcggcgc gggccgggcc atggggtggc gggcgccggg cgcgctgctg ctggcgctgc 120
tgctgcacgg gcggctgctg gcggtgaccc atgggctgag ggcatacgat ggcttgtctc 180
tgcctgagga catagagacc gtcacagcaa gccaaatgcg ctggacacat tcgtaccttt 240
ctgatgatga gtacatgctg gctgacagca tctcaggaga cgacctgggc agtggggacc 300
tgggcagcgg ggacttccag atggtttatt tccgagccct ggtgaatttc actcgctcca 360
tcgagtacag ccctcagctg gaggatgcag gctccagaga gtttcgagag gtgtccgagg 420
ctgtggtaga cacgctggag tcggagtact tgaaaattcc cggagaccag gttgtcagtg 480
tggtgttcat caaggagctg gatggctggg tttttgtgga gctcgatgtg ggctcggaag 540
ggaatgcgga tggtgctcag attcaggaga tgctgctcag ggtcatctcc agcggctctg 600
tggcctccta cgtcacctct ccccagggat tccagttccg acgcctgggc acagtgcccc 660
agttcccaag agcctgcacg gaggccgagt ttgcctgcca cagctacaat gagtgtgtgg 720
ccctggagta tcgctgtgac cggcggcccg actgcaggga catgtctgat gagctcaatt 780
gtgaggagcc agtcctgggt atcagcccca cattctctct ccttgtggag acgacatctt 840
taccgccccg gccagagaca accatcatgc gacagccacc agtcacccac gctcctcagc 900
ccctgcttcc cggttccgtc aggcccctgc cctgtgggcc ccaggaggcc gcatgccgca 960
atgggcactg catccccaga gactacctct gcgacggaca ggaggactgc gaggacggca 1020
gcgatgagct agactgtggc cccccgccac cctgtgagcc caacgagttc ccctgcggga 1080
atggacattg tgccctcaag ctgtggcgct gcgatggtga ctttgactgt gaggaccgaa 1140
ctgatgaagc caactgcccc accaagcgtc ctgaggaagt gtgcgggccc acacagttcc 1200
gatgcgtctc taccaacatg tgcatcccag ccagcttcca ctgtgacgag gagagcgact 1260
gtcctgaccg gagcgacgag tttggctgca tgccccccca ggtggtgaca cctccccggg 1320
agtccatcca ggcttcccgg ggccagacag tgaccttcac ctgcgtggcc attggcgtcc 1380
ccacccccat catcaattgg aggctcaact ggggccacat cccctctcat cccagggtga 1440
cagtgaccag cgagggtggc cgtggcacac tgatcatccg tgatgtgaag gagtcagacc 1500
agggtgccta cacctgtgag gccatgaacg cccggggcat ggtgtttggc attcctgacg 1560
gtgtccttga gctcgtccca caacgaggcc cctgccctga cggccacttc tacctggagc 1620
acagcgccgc ctgcctgccc tgcttctgct ttggcatcac cagcgtgtgc cagagcaccc 1680
gccgcttccg ggaccagatc aggctgcgct ttgaccaacc cgatgacttc aagggtgtga 1740
atgtgacaat gcctgcgcag cccggcacgc cacccctctc ctccacgcag ctgcagatcg 1800
acccatccct gcacgagttc cagctagtag acctgtcccg ccgcttcctc gtccacgact 1860
ccttctgggc tctgcctgaa cagttcctgg gcaacaaggt ggactcctat ggcggctccc 1920
tgcgttacaa cgtgcgctac gagttggccc gtggcatgct ggagccagtg cagcggccgg 1980
acgtggtcct cgtgggtgcc gggtaccgcc tcctctcccg aggccacaca cccacccaac 2040
ctggtgctct gaaccagcgc caggtccagt tctctgagga gcactgggtc catgagtctg 2100
gccggccggt gcagcgcgcg gagctgctgc aggtgctgca gagcctggag gccgtgctca 2160
tccagaccgt gtacaacacc aagatggcta gcgtgggact tagcgacatc gccatggata 2220
ccaccgtcac ccatgccacc agccatggcc gtgcccacag tgtggaggag tgcagatgcc 2280
ccattggcta ttctggcttg tcctgcgaga gctgtgatgc ccacttcact cgggtgcctg 2340
gtgggcccta cctgggcacc tgctctggtt gcagttgcaa tggccatgcc agctcctgtg 2400
accctgtgta tggccactgc ctgaattgcc agcacaacac ggaggggcca cagtgcaaca 2460
agtgcaaggc tggcttcttt ggggacgcca tgaaggccac ggccacttcc tgccggccct 2520
gcccttgccc atacatcgat gcctcccgca gattctcaga cacttgcttc ctggacacgg 2580
atggccaagc cacatgtgac gcctgtgccc caggctacac tggccgccgc tgtgagagct 2640
gtgcccccgg atacgagggc aaccccatcc agcccggcgg gaagtgcagg cccgtcaacc 2700
aggagattgt gcgctgtgac gagcgtggca gcatggggac ctccggggag gcctgccgct 2760
gtaagaacaa tgtggtgggg cgcttgtgca atgaatgtgc tgacggctct ttccacctga 2820
gtacccgaaa ccccgatggc tgcctcaagt gcttctgcat gggtgtcagt cgccactgca 2880
ccagctcttc atggagccgt gcccagttgc atggggcctc tgaggagcct ggtcacttca 2940
gcctgaccaa cgccgcaagc acccacacca ccaacgaggg catcttctcc cccacgcccg 3000
gggaactggg attctcctcc ttccacagac tcttatctgg accctacttc tggagcctcc 3060
cttcacgctt cctgggggac aaggtgacct cctatggagg agagctgcgc ttcacagtga 3120
cccagaggtc ccagccgggc tccacacccc tgcacgggca gccgttggtg gtgctgcaag 3180
gtaacaacat catcctagag caccatgtgg cccaggagcc cagccccggc cagcccagca 3240
ccttcattgt gcctttccgg gagcaagcat ggcagcggcc cgatgggcag ccagccacac 3300
gggagcacct gctgatggca ctggcaggca tcgacaccct cctgatccga gcatcctacg 3360
cccagcagcc cgctgagagc agggtctctg gcatcagcat ggacgtggct gtgcccgagg 3420
aaaccggcca ggaccccgcg ctggaagtgg aacagtgctc ctgcccaccc gggtaccgtg 3480
ggccgtcctg ccaggactgt gacacaggct acacacgcac gcccagtggc ctctacctgg 3540
gtacctgtga acgctgcagc tgccatggcc actcagaggc ctgcgagcca gaaacaggtg 3600
cctgccaggg ctgccagcat cacacggagg gccctcggtg tgagcagtgc cagccaggat 3660
actacgggga cgcccagcgg gggacaccac aggactgcca gctgtgcccc tgctacggag 3720
accctgctgc cggccaggct gcccacactt gttttctgga cacagacggc caccccacct 3780
gtgatgcgtg ctccccaggc cacagtgggc gtcactgtga gaggtgcgcc cctggctact 3840
atggcaaccc cagccagggc cagccatgcc agagagacag ccaggtgcca gggcccatag 3900
gctgcaactg tgacccccaa ggcagcgtca gcagccagtg tgatgctgct ggtcagtgcc 3960
agtgcaaggc ccaggtagaa ggcctcactt gcagccactg ccggccccac cacttccacc 4020
tgagtgccag caacccagac ggctgcctgc cctgcttctg tatgggcatc acccagcagt 4080
gcgccagctc tgcctacaca cgccacctga tctccaccca ctttgcccct ggggacttcc 4140
aaggctttgc cctggtgaac ccacagcgaa acagccgcct gacaggagaa ttcactgtgg 4200
aacccgtgcc cgagggtgcc cagctctctt ttggcaactt tgcccaactc ggccatgagt 4260
ccttctactg gcagctgccg gagacatacc agggagacaa ggtggcggcc tacggtggga 4320
agttgcgata caccctctcc tacacagcag gcccacaggg cagcccactc tcggaccccg 4380
atgtgcagat cacgggcaac aacatcatgc tagtggcctc ccagccagcg ctgcagggcc 4440
cagagaggag gagctacgag atcatgttcc gagaggaatt ctggcgccgg cccgatgggc 4500
agccggccac acgcgagcac ctcctgatgg cactggccga cctggatgag ctcctgatcc 4560
gggccacgtt ctcctccgtg ccgctggtgg ccagcatcag cgcagtcagc ctggaggtcg 4620
cccagccggg gccctcaaac agaccccgcg ccctcgaggt ggaggagtgc cgctgcccgc 4680
caggctacat cggtctgtcc tgccaggact gtgcccccgg ctacacgcgc accgggagtg 4740
ggctctacct cggccactgc gagctatgtg aatgcaatgg ccactcagac ctgtgccacc 4800
cagagactgg ggcctgctcg caatgccagc acaacgccgc aggggagttc tgcgagcttt 4860
gtgcccctgg ctactacgga gatgccacag ccgggacgcc tgaggactgc cagccctgtg 4920
cctgcccact gaccaaccca gagaacatgt tttcccgcac ctgtgagagc ctgggagccg 4980
gcgggtaccg ctgcacggcc tgcgaacccg gctacactgg ccagtactgt gagcagtgtg 5040
gcccaggtta cgtgggtaac cccagtgtgc aagggggcca gtgcctgcca gagacaaacc 5100
aagccccact ggtggtcgag gtccatcctg ctcgaagcat agtgccccaa ggtggctccc 5160
actccctgcg gtgtcaggtc agtgggagcc caccccacta cttctattgg tcccgtgagg 5220
atgggcggcc tgtgcccagc ggcacccagc agcgacatca aggctccgag ctccacttcc 5280
ccagcgtcca gccctcggat gctggggtct acatttgcac ctgccgtaat ctccaccaat 5340
ccaataccag ccgggcagag ctgctggtca ctgaggctcc aagcaagccc atcacagtga 5400
ctgtggagga gcagcggagc cagagcgtgc gccccggagc tgacgtcacc ttcatctgca 5460
cagccaaaag caagtcccca gcctataccc tggtgtggac ccgcctgcac aacgggaaac 5520
tgcccacccg agccatggat ttcaatggca tcctgaccat tcgcaacgtc cagctgagtg 5580
atgcaggcac ctacgtgtgc accggctcca acatgtttgc catggaccag ggcacagcca 5640
ctctacatgt gcaggcctcg ggcaccttgt ccgcccccgt ggtctccatc catccgccac 5700
agctcacagt gcagcccggg caactggcgg agttccgctg cagcgccaca gggagcccca 5760
cgcccaccct cgagtggaca gggggccccg gcggccagct ccctgcgaag gcacaaatcc 5820
acggcggcat cctgcgcctg ccagctgtcg agcccacgga tcaggcccag tacttgtgcc 5880
gagcccacag cagcgctggg cagcaggtgg ccagggctgt gctccacgtg catgggggcg 5940
gtgggcccag agtccaagtg agcccagaga ggacccaggt ccacgcaggc cggaccgtca 6000
ggctgtactg cagggctgca ggcgtgccta gcgccaccat cacctggagg aaggaagggg 6060
gcagcctccc accacaggcc cggtcagagc gcacagacat cgcgacactg ctcatcccag 6120
ccatcacgac tgctgacgcc ggcttctacc tctgcgtggc caccagccct gcaggcactg 6180
cccaggcccg gatgcaagtg gttgtccttt cagcctcaga tgccagccca ccgggggtca 6240
agattgagtc ctcatcgcct tctgtgacag aagggcaaac actcgacctc aactgtgtgg 6300
tggcagggtc agcccatgcc caggtcacct ggtacaggcg agggggtagc ctgcctcccc 6360
acacccaggt gcacggctcc cgtctgcggc tcccccaggt ctcaccagct gattctggag 6420
aatatgtgtg ccgtgtggag aatggatcgg gccccaagga ggcctccatt actgtgtctg 6480
tgctccacgg cacccattct ggccccagct acaccccagt gcccggcagc acccggccca 6540
tccgcatcga gccctcctcc tcacacgtgg cggaagggca gaccctggat ctgaactgcg 6600
tggtgcccgg gcaggcccac gcccaggtca cgtggcacaa gcgtgggggc agcctccctg 6660
cccggcacca gacccacggc tcgctgctgc ggctgcacca ggtgaccccg gccgactcag 6720
gcgagtatgt gtgccatgtg gtgggcacct ccggccccct agaggcctca gtcctggtca 6780
ccatcgaagc ctctgtcatc cctggaccca tcccacctgt caggatcgag tcttcatcct 6840
ccacagtggc cgagggccag accctggatc tgagctgcgt ggtggcaggg caggcccacg 6900
cccaggtcac atggtacaag cgtgggggca gcctccctgc ccggcaccag gttcgtggct 6960
cccgcctgta catcttccag gcctcacctg ccgatgcggg acagtacgtc tgccgggcca 7020
gcaacggcat ggaggcctcc atcacggtca cagtaactgg gacccagggg gccaacttag 7080
cctaccctgc cggcagcacc cagcccatcc gcatcgagcc ctcctcctcg caagtggcgg 7140
aagggcagac cctggatctg aactgcgtgg tgcccgggca gtcccatgcc caggtcacgt 7200
ggcacaagcg tgggggcagc ctccctgtcc ggcaccagac ccacggctcc ctgctgagac 7260
tctaccaagc gtcccccgcc gactcgggcg agtacgtgtg ccgagtgttg ggcagctccg 7320
tgcctctaga ggcctctgtc ctggtcacca ttgagcctgc gggctcagtg cctgcacttg 7380
gggtcacccc cacggtccgg atcgagtcat cgtcttcgca agtggccgag gggcagaccc 7440
tggacctgaa ctgcctcgtt gctggtcagg cccatgccca ggtcacgtgg cacaagcgcg 7500
ggggcagcct cccggcccgg caccaggtgc atggctcgag gctacgcctg ctccaggtga 7560
ccccagctga ttcaggggag tacgtgtgcc gtgtggtcgg cagctcaggt acccaggaag 7620
cctcagtcct tgtcaccatc cagcagcgcc ttagtggctc ccactcccag ggtgtggcgt 7680
accccgtccg catcgagtcc tcctcagcct ccctggccaa tggacacacc ctggacctca 7740
actgcctggt tgccagccag gctccccaca ccatcacctg gtataagcgt ggaggcagct 7800
tacccagccg gcaccagatc gtgggctccc ggctgcggat ccctcaggtg actccggcag 7860
actcgggcga gtacgtgtgt cacgtcagta acggtgcagg ctcccgggag acctcgctca 7920
tcgtcaccat ccagggcagc ggttcctccc acgtgcccag cgtctcccca ccgatcagga 7980
tcgagtcgtc ttcccccacg gtggtggaag ggcagacctt ggatctgaac tgcgtggtcg 8040
ccaggcagcc ccaggctatc atcacatggt acaagcgtgg gggcagcctt ccctcccgac 8100
accagaccca tggctcccac ctgcggttgc accaaatgtc tgtggctgac tcgggcgagt 8160
atgtgtgccg ggccaacaac aacatcgatg ccctggaggc ctccatcgtc atctccgtct 8220
cccctagcgc cggcagcccc tccgcccctg gcagctccat gcccatcaga attgagtcat 8280
cctcctcaca cgtggccgaa ggggagaccc tggatctgaa ctgcgtggtc cccgggcagg 8340
cccatgccca ggtcacttgg cacaagcgtg ggggcagcct ccccagtcac catcagaccc 8400
gcggctcacg gctgcggctg caccatgtgt ccccggccga ctcgggtgaa tacgtgtgcc 8460
gggtgatggg cagctctggc cccctggagg cctcagtcct ggtcaccatc gaagcctctg 8520
gctcaagtgc tgtccacgtc cccgccccag gtggagcccc acccatccgc atcgagccct 8580
cctcctcccg agtggcagaa gggcagaccc tggatctgaa gtgcgtggtg cccgggcagg 8640
cccacgccca ggtcacatgg cacaagcgtg gaggaaacct ccctgcccgg caccaggtcc 8700
acggcccact gctgaggctg aaccaggtgt ccccggctga ctctggcgag tactcgtgcc 8760
aagtgaccgg aagctcaggc accctggagg catctgtcct ggtcacaatt gagccctcca 8820
gcccaggacc cattcctgct ccaggactgg cccagcccat ctacatcgag gcctcctctt 8880
cacacgtgac tgaagggcag actctggatc tgaactgtgt ggtgcccggg caggcccatg 8940
cccaggtcac gtggtacaag cgcgggggca gcctccccgc ccggcaccag acccatggct 9000
cccagctgcg gctccacctc gtctcccctg ccgactcagg cgagtatgtg tgtcgtgcag 9060
ccagcggccc aggccctgag caagaagcct ccttcacagt caccgtcccg cccagtgagg 9120
ggtcttccta ccgccttagg agcccggtca tctccatcga cccgcccagc agcaccgtgc 9180
agcagggcca ggatgccagc ttcaagtgcc tcatccatga cggggcagcc cccatcagcc 9240
tcgagtggaa gacccggaac caggagctgg aggacaacgt ccacatcagt cccaatggct 9300
ccatcatcac catcgtgggc acccggccca gcaaccacgg tacctaccgc tgcgtggcct 9360
ccaatgccta cggtgtggcc cagagtgtgg tgaacctcag tgtgcacggg ccccctacag 9420
tgtccgtgct ccccgagggc cccgtgtggg tgaaagtggg aaaggctgtc accctggagt 9480
gtgtcagtgc cggggagccc cgctcctctg ctcgttggac ccggatcagc agcacccctg 9540
ccaagttgga gcagcggaca tatgggctca tggacagcca cgcggtgctg cagatttcat 9600
cagctaaacc atcagatgcg ggcacttatg tgtgccttgc tcagaatgca ctaggcacag 9660
cacagaagca ggtggaggtg atcgtggaca cgggcgccat ggccccaggg gcccctcagg 9720
tccaagctga agaagctgag ctgactgtgg aggctggaca cacggccacc ttgcgctgct 9780
cagccacagg cagccccgcg cccaccatcc actggtccaa gctgcgttcc ccactgccct 9840
ggcagcaccg gctggaaggt gacacactca tcataccccg ggtagcccag caggactcgg 9900
gccagtacat ctgcaatgcc actagccctg ctgggcacgc tgaggccacc atcatcctgc 9960
acgtggagag cccaccatat gccaccacgg tcccagagca cgcttcggtg caggcagggg 10020
agacggtgca gctccagtgc ctggctcacg ggacaccccc actcaccttc cagtggagcc 10080
gcgtgggcag cagccttcct gggagggcga ccgccaggaa cgagctgctg cactttgagc 10140
gtgcagcccc tgaggactca ggccgctacc gctgccgggt caccaacaag gtgggctcag 10200
ccgaggcctt tgcccagctg ctcgtccaag gccctcccgg ctctctccct gccacctcca 10260
tcccagcagg gtccacgccc accgtgcagg tcacgcctca gctagagacc aagagcattg 10320
gggccagcgt tgagttccac tgtgctgtgc ccagcgacca gggtacccag ctccgttggt 10380
tcaaggaagg gggtcagctg cctccgggtc acagcgtgca ggatggggtg ctccgaatcc 10440
agaacttgga ccagagctgc caagggacgt atatatgcca ggcccatgga ccttggggga 10500
aggcccaggc cagtgcccag ctggttatcc aagccctgcc ctcggtgctc atcaacatcc 10560
ggacctctgt gcagaccgtg gtggttggcc acgccgtgga gttcgaatgc ctggcactgg 10620
gtgaccccaa gcctcaggtg acatggagca aagttggagg gcacctgcgg ccaggcattg 10680
tgcagagcgg aggtgtcgtc aggatcgccc acgtagagct ggctgatgcg ggacagtatc 10740
gctgcactgc caccaacgca gctggcacca cacaatccca cgtcctgctg cttgtgcaag 10800
ccttgcccca gatctcaatg ccccaagaag tccgtgtgcc tgctggttct gcagctgtct 10860
tcccctgcat agcctcaggc taccccactc ctgacatcag ctggagcaag ctggatggca 10920
gcctgccacc tgacagccgc ctggagaaca acatgctgat gctgccctca gtccgacccc 10980
aggacgcagg tacctacgtc tgcaccgcca ctaaccgcca gggcaaggtc aaagcctttg 11040
cccacctgca ggtgccagag cgggtggtgc cctacttcac gcagaccccc tactccttcc 11100
taccgctgcc caccatcaag gatgcctaca ggaagttcga gatcaagatc accttccggc 11160
ccgactcagc cgatgggatg ctgctgtaca atgggcagaa gcgagtccca gggagcccca 11220
ccaacctggc caaccggcag cccgacttca tctccttcgg cctcgtgggg ggaaggcccg 11280
agttccggtt cgatgcaggc tcaggcatgg ccaccatccg ccatcccaca ccactggccc 11340
tgggccattt ccacaccgtg accctgctgc gcagcctcac ccagggctcc ctgattgtgg 11400
gtgacctggc cccggtcaat gggacctccc agggcaagtt ccagggcctg gatctgaacg 11460
aggaactcta cctgggtggc tatcctgact atggtgccat ccccaaggcg gggctgagca 11520
gcggcttcat aggctgtgtc cgggagctgc gcatccaggg cgaggagatc gtcttccatg 11580
acctcaacct cacggcgcac ggcatctccc actgccccac ctgtcgggac cggccctgcc 11640
agaatggcgg tcagtgccat gactctgaga gcagcagcta cgtgtgcgtc tgcccagctg 11700
gcttcaccgg gagccgctgt gagcactcgc aggccctgca ctgccatcca gaggcctgtg 11760
ggcccgacgc cacctgtgtg aaccggcctg acggtcgagg ctacacctgc cgctgccacc 11820
tgggccgctc ggggttgcgg tgtgaggaag gtgtgacagt gaccaccccc tcgctgtcgg 11880
gtgctggctc ctacctggca ctgcccgccc tcaccaacac acaccacgag ctacgcctgg 11940
acgtggagtt caagccactc gcccctgacg gggtcctgct gttcagcggg gggaagagcg 12000
ggcctgtgga ggacttcgtg tccctggcga tggtgggcgg ccacctggag ttccgctatg 12060
agttggggtc agggctggcc gttctgcgga gcgccgagcc gctggccctg ggccgctggc 12120
accgtgtgtc tgcagagcgt ctcaacaagg acggcagcct gcgggtgaat ggtggacgcc 12180
ctgtgctgcg ctcctcgccc ggcaagagcc agggcctcaa cctgcacacc ctgctctacc 12240
tggggggtgt ggagccttcc gtgccactgt ccccggccac caacatgagc gctcacttcc 12300
gcggctgtgt gggcgaggtg tcagtgaatg gcaaacggct ggacctcacc tacagtttcc 12360
taggcagcca gggcatcggg caatgctatg atagctcccc atgtgagcgc cagccttgcc 12420
aacatggtgc cacgtgcatg cccgctggcg agtatgagtt ccagtgcctg tgtcgagatg 12480
gattcaaagg agacctgtgt gagcacgagg agaacccctg ccagctccgt gaaccctgtc 12540
tgcatggggg cacctgccag ggcacccgct gcctctgcct ccctggcttc tctggcccac 12600
gctgccaaca aggctctgga catggcatag cagagtccga ctggcatctt gaaggcagcg 12660
ggggcaatga tgcccctggg cagtacggag cctatttcca cgatgatggc ttcctcgcct 12720
tccctggcca tgtcttctcc aggagcctgc ccgaggtgcc cgagaccatc gagctggagg 12780
ttcggaccag cacagccagt ggcctcctgc tctggcaggg tgtggaggtg ggagaggccg 12840
gccaaggcaa ggacttcatc agcctcgggc ttcaagacgg gcaccttgtc ttcaggtacc 12900
agctgggtag tggggaggcc cgcctggtct ctgaggaccc catcaatgac ggcgagtggc 12960
accgggtgac agcactgcgg gagggccgca gaggttccat ccaagtcgac ggtgaggagc 13020
tggtcagcgg ccggtcccca ggtcccaacg tggcagtcaa cgccaagggc agcgtctaca 13080
tcggcggagc ccctgacgtg gccacgctga ccgggggcag attctcctcg ggcatcacag 13140
gctgtgtcaa gaacctggtg ctgcactcgg cccgacccgg cgccccgccc ccacagcccc 13200
tggacctgca gcaccgcgcc caggccgggg ccaacacacg cccctgcccc tcgtaggcac 13260
ctgcctgccc cacacggact cccgggccac gccccagccc gacaatgtcg agtatattat 13320
tattaatatt attatgaatt tttgtaagaa accgaggcga tgccacgctt tgctgctacc 13380
gccctgggct ggactggagg tgggcatgcc accctcacac acacagctgg gcaaagccac 13440
aaggctggcc agcaaggcag gttggatggg agtgggcacc tcagaaagtc accaggactt 13500
ggggtcagga acagtggctg ggtgggccca gaactgcccc cactgtcccc ctacccaccg 13560
atggagcccc cagatagagc tgggtggcct gtttctgcag cccttgggca gttctcactc 13620
ctaggagagc caacctcggc ttgtgggctg gtgccccaca gctacctgag acgggcatcg 13680
caggagtctc tgccacccac tcaggattgg gaattgtctt tagtgccggc tgtggagcaa 13740
aaggcagctc acccctgggc aggcggtccc catccccacc agctcgtttt tcagcacccc 13800
cacccacctc cacccagccc ctggcacctc ctctggcaga ctccccctcc taccacgtcc 13860
tcctggcctg cattcccacc ccctcctgcc agcacacagc ctggggtccc tccctcaggg 13920
gctgtaaggg aaggcccacc ccaactctta ccaggagctg ctacaggcag agcccagcac 13980
tgatagggcc ccgcccaccg ggccccgccc accccaggcc acatccccac ccatctggaa 14040
gtgaaggccc agggactcct ccaacagaca acggacggac ggatgccgct ggtgctcagg 14100
aagagctagt gccttaggtg ggggaaggca ggactcacga ctgagagaga gaggaggggg 14160
atatgaccac cctgccccat ctgcaggagc ctgaagatcc agctcaagtg ccatcctgcc 14220
agtggccccc agactgtggg gttgggacgc ctggcctctg tgtcctagaa gggaccctcc 14280
tgtggtcttt gtcttgattt ttcttaataa acggtgctat ccccgcc 14327
<210> 17
<211> 123
<212> PRT
<213> 人(human)
<400> 17
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Thr Ser Gly Phe Pro Phe Ser Ser Tyr
20 25 30
Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Val Ile Ser Tyr Asp Gly Ser Asn Glu His Ser Ile Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Arg Leu Tyr
65 70 75 80
Leu Gln Met Lys Ser Leu Arg Ala Glu Asp Met Ala Val Tyr Phe Cys
85 90 95
Val Arg Gly Ala His Arg Ser Ser Trp Ser Gly Lys Arg Phe Asp Tyr
100 105 110
Trp Gly Gln Gly Thr Leu Val Thr Ser Ser Ala
115 120
<210> 18
<211> 65
<212> PRT
<213> 人(human)
<400> 18
Tyr Leu Ser Asp Asp Glu Asp Met Leu Ala Asp Ser Ile Ser Gly Asp
1 5 10 15
Asp Leu Gly Ser Gly Asp Leu Gly Ser Gly Asp Phe Cys Thr Glu Ala
20 25 30
Glu Phe Ala Cys His Ser Tyr Asn Glu Cys Val Ala Leu Glu Tyr Arg
35 40 45
Cys Asp Arg Arg Pro Asp Cys Arg Asp Met Ser Asp Glu Leu Asn Cys
50 55 60
Glu
65
<210> 19
<211> 20
<212> DNA
<213> 噬菌体T7(Bacteriophage T7)
<400> 19
taatacgact cactataggg 20
<210> 20
<211> 23
<212> PRT
<213> 智人(Homo sapiens)
<400> 20
Asp Asp Glu Asp Met Ala Asp Ser Ile Ser Gly Asp Asp Leu Gly Ser
1 5 10 15
Gly Asp Leu Gly Ser Gly Asp
20
<210> 21
<211> 23
<212> PRT
<213> 智人(Homo sapiens)
<400> 21
Asp Asp Glu Asp Met Ala Asp Ser Ile Thr Gly Asp Asp Leu Gly Thr
1 5 10 15
Gly Asp Leu Gly Thr Gly Asp
20
<210> 22
<211> 30
<212> PRT
<213> 智人(Homo sapiens)
<400> 22
Gly Ser Gly Gly Gly Met Val Glu Gln Val Ser Gly Asp Cys Asp Asp
1 5 10 15
Glu Asp Gly Cys Gly Gly Ser Gly Ser Gly Glu Val Lys Arg
20 25 30
<210> 23
<211> 26
<212> PRT
<213> 智人(Homo sapiens)
<400> 23
Pro Gly Gln Glu Ser Asp Asp Phe Glu Leu Ser Gly Ser Gly Asp Leu
1 5 10 15
Asp Asp Leu Glu Asp Ser Met Ile Gly Pro
20 25
<210> 24
<211> 966
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P6Fc-HS 构建体(P6Fc-HS Construct)
<400> 24
atgtacagga tgcaactcct gtcttgcatt gcactaagtc ttgcacttgt cacgaattcg 60
gaggaacagg ccaagacatt tctggacaag tttaaccacg aagccgaaga cctgttctat 120
cagagctccg gcctggggaa gggcgacttc aggggctcga gtgctgagcc caaatcttgt 180
gacaaaactc acacatgccc accgtgccca gcacctgaac tcctgggggg accgtcagtc 240
ttcctcttcc ccccaaaacc caaggacacc ctcatgatct cccggacccc tgaggtcaca 300
tgcgtggtgg tggacgtgag ccacgaagac cctgaggtca agttcaactg gtacgtggac 360
ggcgtggagg tgcataatgc caagacaaag ccgcgggagg agcagtacaa cagcacgtac 420
cgtgtggtca gcgtcctcac cgtcctgcac caggactggc tgaatggcaa ggagtacaag 480
tgcaaggtct ccaacaaagc cctcccagcc cccatcgaga aaaccatctc caaagccaaa 540
gggcagcccc gagaaccaca ggtgtacacc ctgcccccat cccgggagga gatgaccaag 600
aaccaggtca gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag 660
tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc 720
gacggctcct tcttcctcta cagcaagctc accgtggaca agagcaggtg gcagcagggg 780
aacgtcttct catgctccgt gatgcatgag gctctgcaca accactacac gcagaagagc 840
ctctccctgt ctccgggtaa agcacgtacg ggcggcggcg gcggatccga tgatgagtac 900
atgctggctg acagcatctc aggagacgac ctgggcagtg gggatctcgg atcaggcgac 960
atctag 966
<210> 25
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> IL-2 前导序列(IL-2 Leader)
<400> 25
atgtacagga tgcaactcct gtcttgcatt gcactaagtc ttgcacttgt cacgaattcg 60
<210> 26
<211> 93
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自P6Fc-HS构建体的ACE2(ACE2 from P6Fc-HS construct)
<400> 26
gaggaacagg ccaagacatt tctggacaag tttaaccacg aagccgaaga cctgttctat 60
cagagctccg gcctggggaa gggcgacttc agg 93
<210> 27
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P6Fc-HS中的接头1(linker 1 in P6Fc-HS)
<400> 27
ggctcgagtg ctgagcccaa atcttgtgac aaaactcaca catgcccacc gtgcccagca 60
<210> 28
<211> 648
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Fc
<400> 28
cctgaactcc tggggggacc gtcagtcttc ctcttccccc caaaacccaa ggacaccctc 60
atgatctccc ggacccctga ggtcacatgc gtggtggtgg acgtgagcca cgaagaccct 120
gaggtcaagt tcaactggta cgtggacggc gtggaggtgc ataatgccaa gacaaagccg 180
cgggaggagc agtacaacag cacgtaccgt gtggtcagcg tcctcaccgt cctgcaccag 240
gactggctga atggcaagga gtacaagtgc aaggtctcca acaaagccct cccagccccc 300
atcgagaaaa ccatctccaa agccaaaggg cagccccgag aaccacaggt gtacaccctg 360
cccccatccc gggaggagat gaccaagaac caggtcagcc tgacctgcct ggtcaaaggc 420
ttctatccca gcgacatcgc cgtggagtgg gagagcaatg ggcagccgga gaacaactac 480
aagaccacgc ctcccgtgct ggactccgac ggctccttct tcctctacag caagctcacc 540
gtggacaaga gcaggtggca gcaggggaac gtcttctcat gctccgtgat gcatgaggct 600
ctgcacaacc actacacgca gaagagcctc tccctgtctc cgggtaaa 648
<210> 29
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P6Fc-HS中的接头2(linker 2 in P6Fc-HS)
<400> 29
gcacgtacgg gcggcggcgg cggatcc 27
<210> 30
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 硫酸乙酰肝素(heparan sulfate)
<400> 30
gatgatgagt acatgctggc tgacagcatc tcaggagacg acctgggcag tggggatctc 60
ggatcaggcg ac 72
<210> 31
<211> 321
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 全长P6Fc-HS构建体的氨基酸序列(Amino acid sequence of full-lengthP6Fc-HS construct)
<400> 31
Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu
1 5 10 15
Val Thr Asn Ser Glu Glu Gln Ala Lys Thr Phe Leu Asp Lys Phe Asn
20 25 30
His Glu Ala Glu Asp Leu Phe Tyr Gln Ser Ser Gly Leu Gly Lys Gly
35 40 45
Asp Phe Arg Gly Ser Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr His
50 55 60
Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val
65 70 75 80
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
85 90 95
Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu
100 105 110
Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
115 120 125
Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser
130 135 140
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
145 150 155 160
Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile
165 170 175
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
180 185 190
Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
195 200 205
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
210 215 220
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
225 230 235 240
Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg
245 250 255
Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
260 265 270
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Ala
275 280 285
Arg Thr Gly Gly Gly Gly Gly Ser Asp Asp Glu Tyr Met Leu Ala Asp
290 295 300
Ser Ile Ser Gly Asp Asp Leu Gly Ser Gly Asp Leu Gly Ser Gly Asp
305 310 315 320
Ile
<210> 32
<211> 3066
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 全长Ace2Fc-HS核苷酸序列(Full-length Ace2Fc-HS nucleotide sequence)
<400> 32
atgtacagga tgcaactcct gtcttgcatt gcactaagtc ttgcacttgt cacgaattcg 60
ggctcgaggg ctgctcagtc caccattgag gaacaggcca agacattttt ggacaagttt 120
aaccacgaag ccgaagacct gttctatcaa agttcacttg cttcttggaa ttataacacc 180
aatattactg aagagaatgt ccaaaacatg aataatgctg gggacaaatg gtctgccttt 240
ttaaaggaac agtccacact tgcccaaatg tatccactac aagaaattca gaatctcaca 300
gtcaagcttc agctgcaggc tcttcagcaa aatgggtctt cagtgctctc agaagacaag 360
agcaaacggt tgaacacaat tctaaataca atgagcacca tctacagtac tggaaaagtt 420
tgtaacccag ataatccaca agaatgctta ttacttgaac caggtttgaa tgaaataatg 480
gcaaacagtt tagactacaa tgagaggctc tgggcttggg aaagctggag atctgaggtc 540
ggcaagcagc tgaggccatt atatgaagag tatgtggtct tgaaaaatga gatggcaaga 600
gcaaatcatt atgaggacta tggggattat tggagaggag actatgaagt aaatggggta 660
gatggctatg actacagccg cggccagttg attgaagatg tggaacatac ctttgaagag 720
attaaaccat tatatgaaca tcttcatgcc tatgtgaggg caaagttgat gaatgcctat 780
ccttcctata tcagtccaat tggatgcctc cctgctcatt tgcttggtga tatgtggggt 840
agattttgga caaatctgta ctctttgaca gttccctttg gacagaaacc aaacatagat 900
gttactgatg caatggtgga ccaggcctgg gatgcacaga gaatattcaa ggaggccgag 960
aagttctttg tatctgttgg tcttcctaat atgactcaag gattctggga aaattccatg 1020
ctaacggacc caggaaatgt tcagaaagca gtctgccatc ccacagcttg ggacctgggg 1080
aagggcgact tcaggatcct tatgtgcaca aaggtgacaa tggacgactt cctgacagct 1140
catcatgaga tggggcatat ccagtatgat atggcatatg ctgcacaacc ttttctgcta 1200
agaaatggag ctaatgaagg attccatgaa gctgttgggg aaatcatgtc actttctgca 1260
gccacaccta agcatttaaa atccattggt cttctgtcac ccgattttca agaagacaat 1320
gaaacagaaa taaacttcct gctcaaacaa gcactcacga ttgttgggac tctgccattt 1380
acttacatgt tagagaagtg gaggtggatg gtctttaaag gggaaattcc caaagaccag 1440
tggatgaaaa agtggtggga gatgaagcga gagatagttg gggtggtgga acctgtgccc 1500
catgatgaaa catactgtga ccccgcatct ctgttccatg tttctaatga ttactcattc 1560
attcgatatt acacaaggac cctttaccaa ttccagtttc aagaagcact ttgtcaagca 1620
gctaaacatg aaggccctct gcacaaatgt gacatctcaa actctacaga agctggacag 1680
aaactgttca atatgctgag gcttggaaaa tcagaaccct ggaccctagc attggaaaat 1740
gttgtaggag caaagaacat gaatgtaagg ccactgctca actactttga gcccttattt 1800
acctggctga aagaccagaa caagaattct tttgtgggat ggagtaccga ctggagtcca 1860
tatgcagacc aaagcatcaa agtgaggata agcctaaaat cagctcttgg agataaagca 1920
tatgaatgga acgacaatga aatgtacctg ttccgatcat ctgttgcata tgctatgagg 1980
cagtactttt taaaagtaaa aaatcagatg attctttttg gggaggagga tgtgcgagtg 2040
gctaatttga aaccaagaat ctcctttaat ttctttgtca ctgcacctaa aaatgtgtct 2100
gatatcattc ctagaactga agttgaaaag gccatcagga tgtcccggag ccgtatcaat 2160
gatgctttcc gtctgaatga caacagccta gagtttctgg ggatacagcc aacacttgga 2220
cctcctaacc agccccctgt ttccgggccc tcgggctcga gtgctgagcc caaatcttgt 2280
gacaaaactc acacatgccc accgtgccca gcacctgaac tcctgggggg accgtcagtc 2340
ttcctcttcc ccccaaaacc caaggacacc ctcatgatct cccggacccc tgaggtcaca 2400
tgcgtggtgg tggacgtgag ccacgaagac cctgaggtca agttcaactg gtacgtggac 2460
ggcgtggagg tgcataatgc caagacaaag ccgcgggagg agcagtacaa cagcacgtac 2520
cgtgtggtca gcgtcctcac cgtcctgcac caggactggc tgaatggcaa ggagtacaag 2580
tgcaaggtct ccaacaaagc cctcccagcc cccatcgaga aaaccatctc caaagccaaa 2640
gggcagcccc gagaaccaca ggtgtacacc ctgcccccat cccgggagga gatgaccaag 2700
aaccaggtca gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag 2760
tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc 2820
gacggctcct tcttcctcta cagcaagctc accgtggaca agagcaggtg gcagcagggg 2880
aacgtcttct catgctccgt gatgcatgag gctctgcaca accactacac gcagaagagc 2940
ctctccctgt ctccgggtaa agcacgtacg ggcggcggcg gcggatccga tgatgagtac 3000
atgctggctg acagcatctc aggagacgac ctgggcagtg gggatctcgg atcaggcgac 3060
atctag 3066
<210> 33
<211> 9
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Ace2Fc-HS中的接头1(linker 1 in Ace2Fc-HS)
<400> 33
ggctcgagg 9
<210> 34
<211> 2175
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Ace2Fc-HS中的ACE2(ACE2 in Ace2Fc-HS)
<400> 34
gctgctcagt ccaccattga ggaacaggcc aagacatttt tggacaagtt taaccacgaa 60
gccgaagacc tgttctatca aagttcactt gcttcttgga attataacac caatattact 120
gaagagaatg tccaaaacat gaataatgct ggggacaaat ggtctgcctt tttaaaggaa 180
cagtccacac ttgcccaaat gtatccacta caagaaattc agaatctcac agtcaagctt 240
cagctgcagg ctcttcagca aaatgggtct tcagtgctct cagaagacaa gagcaaacgg 300
ttgaacacaa ttctaaatac aatgagcacc atctacagta ctggaaaagt ttgtaaccca 360
gataatccac aagaatgctt attacttgaa ccaggtttga atgaaataat ggcaaacagt 420
ttagactaca atgagaggct ctgggcttgg gaaagctgga gatctgaggt cggcaagcag 480
ctgaggccat tatatgaaga gtatgtggtc ttgaaaaatg agatggcaag agcaaatcat 540
tatgaggact atggggatta ttggagagga gactatgaag taaatggggt agatggctat 600
gactacagcc gcggccagtt gattgaagat gtggaacata cctttgaaga gattaaacca 660
ttatatgaac atcttcatgc ctatgtgagg gcaaagttga tgaatgccta tccttcctat 720
atcagtccaa ttggatgcct ccctgctcat ttgcttggtg atatgtgggg tagattttgg 780
acaaatctgt actctttgac agttcccttt ggacagaaac caaacataga tgttactgat 840
gcaatggtgg accaggcctg ggatgcacag agaatattca aggaggccga gaagttcttt 900
gtatctgttg gtcttcctaa tatgactcaa ggattctggg aaaattccat gctaacggac 960
ccaggaaatg ttcagaaagc agtctgccat cccacagctt gggacctggg gaagggcgac 1020
ttcaggatcc ttatgtgcac aaaggtgaca atggacgact tcctgacagc tcatcatgag 1080
atggggcata tccagtatga tatggcatat gctgcacaac cttttctgct aagaaatgga 1140
gctaatgaag gattccatga agctgttggg gaaatcatgt cactttctgc agccacacct 1200
aagcatttaa aatccattgg tcttctgtca cccgattttc aagaagacaa tgaaacagaa 1260
ataaacttcc tgctcaaaca agcactcacg attgttggga ctctgccatt tacttacatg 1320
ttagagaagt ggaggtggat ggtctttaaa ggggaaattc ccaaagacca gtggatgaaa 1380
aagtggtggg agatgaagcg agagatagtt ggggtggtgg aacctgtgcc ccatgatgaa 1440
acatactgtg accccgcatc tctgttccat gtttctaatg attactcatt cattcgatat 1500
tacacaagga ccctttacca attccagttt caagaagcac tttgtcaagc agctaaacat 1560
gaaggccctc tgcacaaatg tgacatctca aactctacag aagctggaca gaaactgttc 1620
aatatgctga ggcttggaaa atcagaaccc tggaccctag cattggaaaa tgttgtagga 1680
gcaaagaaca tgaatgtaag gccactgctc aactactttg agcccttatt tacctggctg 1740
aaagaccaga acaagaattc ttttgtggga tggagtaccg actggagtcc atatgcagac 1800
caaagcatca aagtgaggat aagcctaaaa tcagctcttg gagataaagc atatgaatgg 1860
aacgacaatg aaatgtacct gttccgatca tctgttgcat atgctatgag gcagtacttt 1920
ttaaaagtaa aaaatcagat gattcttttt ggggaggagg atgtgcgagt ggctaatttg 1980
aaaccaagaa tctcctttaa tttctttgtc actgcaccta aaaatgtgtc tgatatcatt 2040
cctagaactg aagttgaaaa ggccatcagg atgtcccgga gccgtatcaa tgatgctttc 2100
cgtctgaatg acaacagcct agagtttctg gggatacagc caacacttgg acctcctaac 2160
cagccccctg tttcc 2175
<210> 35
<211> 69
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Ace2Fc-HS中的接头2(linker 2 in Ace2Fc-HS)
<400> 35
gggccctcgg gctcgagtgc tgagcccaaa tcttgtgaca aaactcacac atgcccaccg 60
tgcccagca 69
<210> 36
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Ace2Fc-HS中的接头3(linker 3 in Ace2Fc-HS)
<400> 36
gcacgtacgg gcggcggcgg cggatcc 27
<210> 37
<211> 1021
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Ace2Fc-HS的氨基酸序列(Amino acid sequence of Ace2Fc-HS)
<400> 37
Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu
1 5 10 15
Val Thr Asn Ser Gly Ser Arg Ala Ala Gln Ser Thr Ile Glu Glu Gln
20 25 30
Ala Lys Thr Phe Leu Asp Lys Phe Asn His Glu Ala Glu Asp Leu Phe
35 40 45
Tyr Gln Ser Ser Leu Ala Ser Trp Asn Tyr Asn Thr Asn Ile Thr Glu
50 55 60
Glu Asn Val Gln Asn Met Asn Asn Ala Gly Asp Lys Trp Ser Ala Phe
65 70 75 80
Leu Lys Glu Gln Ser Thr Leu Ala Gln Met Tyr Pro Leu Gln Glu Ile
85 90 95
Gln Asn Leu Thr Val Lys Leu Gln Leu Gln Ala Leu Gln Gln Asn Gly
100 105 110
Ser Ser Val Leu Ser Glu Asp Lys Ser Lys Arg Leu Asn Thr Ile Leu
115 120 125
Asn Thr Met Ser Thr Ile Tyr Ser Thr Gly Lys Val Cys Asn Pro Asp
130 135 140
Asn Pro Gln Glu Cys Leu Leu Leu Glu Pro Gly Leu Asn Glu Ile Met
145 150 155 160
Ala Asn Ser Leu Asp Tyr Asn Glu Arg Leu Trp Ala Trp Glu Ser Trp
165 170 175
Arg Ser Glu Val Gly Lys Gln Leu Arg Pro Leu Tyr Glu Glu Tyr Val
180 185 190
Val Leu Lys Asn Glu Met Ala Arg Ala Asn His Tyr Glu Asp Tyr Gly
195 200 205
Asp Tyr Trp Arg Gly Asp Tyr Glu Val Asn Gly Val Asp Gly Tyr Asp
210 215 220
Tyr Ser Arg Gly Gln Leu Ile Glu Asp Val Glu His Thr Phe Glu Glu
225 230 235 240
Ile Lys Pro Leu Tyr Glu His Leu His Ala Tyr Val Arg Ala Lys Leu
245 250 255
Met Asn Ala Tyr Pro Ser Tyr Ile Ser Pro Ile Gly Cys Leu Pro Ala
260 265 270
His Leu Leu Gly Asp Met Trp Gly Arg Phe Trp Thr Asn Leu Tyr Ser
275 280 285
Leu Thr Val Pro Phe Gly Gln Lys Pro Asn Ile Asp Val Thr Asp Ala
290 295 300
Met Val Asp Gln Ala Trp Asp Ala Gln Arg Ile Phe Lys Glu Ala Glu
305 310 315 320
Lys Phe Phe Val Ser Val Gly Leu Pro Asn Met Thr Gln Gly Phe Trp
325 330 335
Glu Asn Ser Met Leu Thr Asp Pro Gly Asn Val Gln Lys Ala Val Cys
340 345 350
His Pro Thr Ala Trp Asp Leu Gly Lys Gly Asp Phe Arg Ile Leu Met
355 360 365
Cys Thr Lys Val Thr Met Asp Asp Phe Leu Thr Ala His His Glu Met
370 375 380
Gly His Ile Gln Tyr Asp Met Ala Tyr Ala Ala Gln Pro Phe Leu Leu
385 390 395 400
Arg Asn Gly Ala Asn Glu Gly Phe His Glu Ala Val Gly Glu Ile Met
405 410 415
Ser Leu Ser Ala Ala Thr Pro Lys His Leu Lys Ser Ile Gly Leu Leu
420 425 430
Ser Pro Asp Phe Gln Glu Asp Asn Glu Thr Glu Ile Asn Phe Leu Leu
435 440 445
Lys Gln Ala Leu Thr Ile Val Gly Thr Leu Pro Phe Thr Tyr Met Leu
450 455 460
Glu Lys Trp Arg Trp Met Val Phe Lys Gly Glu Ile Pro Lys Asp Gln
465 470 475 480
Trp Met Lys Lys Trp Trp Glu Met Lys Arg Glu Ile Val Gly Val Val
485 490 495
Glu Pro Val Pro His Asp Glu Thr Tyr Cys Asp Pro Ala Ser Leu Phe
500 505 510
His Val Ser Asn Asp Tyr Ser Phe Ile Arg Tyr Tyr Thr Arg Thr Leu
515 520 525
Tyr Gln Phe Gln Phe Gln Glu Ala Leu Cys Gln Ala Ala Lys His Glu
530 535 540
Gly Pro Leu His Lys Cys Asp Ile Ser Asn Ser Thr Glu Ala Gly Gln
545 550 555 560
Lys Leu Phe Asn Met Leu Arg Leu Gly Lys Ser Glu Pro Trp Thr Leu
565 570 575
Ala Leu Glu Asn Val Val Gly Ala Lys Asn Met Asn Val Arg Pro Leu
580 585 590
Leu Asn Tyr Phe Glu Pro Leu Phe Thr Trp Leu Lys Asp Gln Asn Lys
595 600 605
Asn Ser Phe Val Gly Trp Ser Thr Asp Trp Ser Pro Tyr Ala Asp Gln
610 615 620
Ser Ile Lys Val Arg Ile Ser Leu Lys Ser Ala Leu Gly Asp Lys Ala
625 630 635 640
Tyr Glu Trp Asn Asp Asn Glu Met Tyr Leu Phe Arg Ser Ser Val Ala
645 650 655
Tyr Ala Met Arg Gln Tyr Phe Leu Lys Val Lys Asn Gln Met Ile Leu
660 665 670
Phe Gly Glu Glu Asp Val Arg Val Ala Asn Leu Lys Pro Arg Ile Ser
675 680 685
Phe Asn Phe Phe Val Thr Ala Pro Lys Asn Val Ser Asp Ile Ile Pro
690 695 700
Arg Thr Glu Val Glu Lys Ala Ile Arg Met Ser Arg Ser Arg Ile Asn
705 710 715 720
Asp Ala Phe Arg Leu Asn Asp Asn Ser Leu Glu Phe Leu Gly Ile Gln
725 730 735
Pro Thr Leu Gly Pro Pro Asn Gln Pro Pro Val Ser Gly Pro Ser Gly
740 745 750
Ser Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro
755 760 765
Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro
770 775 780
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
785 790 795 800
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
805 810 815
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
820 825 830
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val
835 840 845
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
850 855 860
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
865 870 875 880
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu
885 890 895
Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe
900 905 910
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
915 920 925
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe
930 935 940
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
945 950 955 960
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
965 970 975
Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Ala Arg Thr Gly Gly
980 985 990
Gly Gly Gly Ser Asp Asp Glu Tyr Met Leu Ala Asp Ser Ile Ser Gly
995 1000 1005
Asp Asp Leu Gly Ser Gly Asp Leu Gly Ser Gly Asp Ile
1010 1015 1020
<210> 38
<211> 1227
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P61Fc-HS的完整核苷酸序列(Complete nucleotide sequence of P61Fc-HS)
<400> 38
atgtacagga tgcaactcct gtcttgcatt gcactaagtc ttgcacttgt cacgaattcg 60
gcagcagctg ctcagtccac cattgaggaa caggccaaga catttttgga caagtttaac 120
cacgaagccg aagacctgtt ctatcaaagt tcacttgctt cttggaatta taacaccaat 180
attactgaag agaatgtcca aaacatgaat aatgctgggg acaaatggtc tgccttttta 240
aaggaacagt ccacacttgc ccaaatgtat ccactacaag aaattcagaa tctcacagga 300
ggaggacaag gattctggga aaattccatg ctaacggacc caggaaatgt tcagaaagca 360
gtctgccatc ccacagcttg ggacctgggg aagggcgact tcagggggcc ctcgggctcg 420
agtgctgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc agcacctgaa 480
ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac cctcatgatc 540
tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga ccctgaggtc 600
aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa gccgcgggag 660
gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca ccaggactgg 720
ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc ccccatcgag 780
aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac cctgccccca 840
tcccgggagg agatgaccaa gaaccaggtc agcctgacct gcctggtcaa aggcttctat 900
cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa ctacaagacc 960
acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct caccgtggac 1020
aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga ggctctgcac 1080
aaccactaca cgcagaagag cctctccctg tctccgggta aagcacgtac gggcggcggc 1140
ggcggatccg atgatgagta catgctggct gacagcatct caggagacga cctgggcagt 1200
ggggatctcg gatcaggcga catctag 1227
<210> 39
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P61Fc-HS中的接头1(linker 1 in P61Fc-HS)
<400> 39
gcagca 6
<210> 40
<211> 231
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P61Fc-HS中的ACE2-1部分(ACE2-1 portion in P61Fc-HS)
<400> 40
gctgctcagt ccaccattga ggaacaggcc aagacatttt tggacaagtt taaccacgaa 60
gccgaagacc tgttctatca aagttcactt gcttcttgga attataacac caatattact 120
gaagagaatg tccaaaacat gaataatgct ggggacaaat ggtctgcctt tttaaaggaa 180
cagtccacac ttgcccaaat gtatccacta caagaaattc agaatctcac a 231
<210> 41
<211> 9
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P61Fc-HS中的接头2(linker 2 in P61Fc-HS)
<400> 41
ggaggagga 9
<210> 42
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P61Fc-HS中的ACE2-2部分(ACE2-2 portion in P61Fc-HS)
<400> 42
caaggattct gggaaaattc catgctaacg gacccaggaa atgttcagaa agcagtctgc 60
catcccacag cttgggacct ggggaagggc gacttcagg 99
<210> 43
<211> 69
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P61Fc-HS中的接头3(linker 3 in P61Fc-HS)
<400> 43
gggccctcgg gctcgagtgc tgagcccaaa tcttgtgaca aaactcacac atgcccaccg 60
tgcccagca 69
<210> 44
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P61Fc-HS中的接头4(linker 4 in P61Fc-HS)
<400> 44
gcacgtacgg gcggcggcgg cggatcc 27
<210> 45
<211> 408
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> P61Fc-HS的氨基酸序列(amino acid sequence of P61Fc-HS)
<400> 45
Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu
1 5 10 15
Val Thr Asn Ser Ala Ala Ala Ala Gln Ser Thr Ile Glu Glu Gln Ala
20 25 30
Lys Thr Phe Leu Asp Lys Phe Asn His Glu Ala Glu Asp Leu Phe Tyr
35 40 45
Gln Ser Ser Leu Ala Ser Trp Asn Tyr Asn Thr Asn Ile Thr Glu Glu
50 55 60
Asn Val Gln Asn Met Asn Asn Ala Gly Asp Lys Trp Ser Ala Phe Leu
65 70 75 80
Lys Glu Gln Ser Thr Leu Ala Gln Met Tyr Pro Leu Gln Glu Ile Gln
85 90 95
Asn Leu Thr Gly Gly Gly Gln Gly Phe Trp Glu Asn Ser Met Leu Thr
100 105 110
Asp Pro Gly Asn Val Gln Lys Ala Val Cys His Pro Thr Ala Trp Asp
115 120 125
Leu Gly Lys Gly Asp Phe Arg Gly Pro Ser Gly Ser Ser Ala Glu Pro
130 135 140
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
145 150 155 160
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
165 170 175
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
180 185 190
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
195 200 205
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
210 215 220
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
225 230 235 240
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
245 250 255
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
260 265 270
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
275 280 285
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
290 295 300
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
305 310 315 320
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
325 330 335
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
340 345 350
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
355 360 365
Ser Leu Ser Pro Gly Lys Ala Arg Thr Gly Gly Gly Gly Gly Ser Asp
370 375 380
Asp Glu Tyr Met Leu Ala Asp Ser Ile Ser Gly Asp Asp Leu Gly Ser
385 390 395 400
Gly Asp Leu Gly Ser Gly Asp Ile
405
<210> 46
<211> 3369
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> ACE2-Fc-SA DNA 序列(sequence)
<400> 46
atgtacagga tgcaactcct gtcttgcatt gcactaagtc ttgcacttgt cacgaattcg 60
ggctcgaggg ctgctcagtc caccattgag gaacaggcca agacattttt ggacaagttt 120
aaccacgaag ccgaagacct gttctatcaa agttcacttg cttcttggaa ttataacacc 180
aatattactg aagagaatgt ccaaaacatg aataatgctg gggacaaatg gtctgccttt 240
ttaaaggaac agtccacact tgcccaaatg tatccactac aagaaattca gaatctcaca 300
gtcaagcttc agctgcaggc tcttcagcaa aatgggtctt cagtgctctc agaagacaag 360
agcaaacggt tgaacacaat tctaaataca atgagcacca tctacagtac tggaaaagtt 420
tgtaacccag ataatccaca agaatgctta ttacttgaac caggtttgaa tgaaataatg 480
gcaaacagtt tagactacaa tgagaggctc tgggcttggg aaagctggag atctgaggtc 540
ggcaagcagc tgaggccatt atatgaagag tatgtggtct tgaaaaatga gatggcaaga 600
gcaaatcatt atgaggacta tggggattat tggagaggag actatgaagt aaatggggta 660
gatggctatg actacagccg cggccagttg attgaagatg tggaacatac ctttgaagag 720
attaaaccat tatatgaaca tcttcatgcc tatgtgaggg caaagttgat gaatgcctat 780
ccttcctata tcagtccaat tggatgcctc cctgctcatt tgcttggtga tatgtggggt 840
agattttgga caaatctgta ctctttgaca gttccctttg gacagaaacc aaacatagat 900
gttactgatg caatggtgga ccaggcctgg gatgcacaga gaatattcaa ggaggccgag 960
aagttctttg tatctgttgg tcttcctaat atgactcaag gattctggga aaattccatg 1020
ctaacggacc caggaaatgt tcagaaagca gtctgccatc ccacagcttg ggacctgggg 1080
aagggcgact tcaggatcct tatgtgcaca aaggtgacaa tggacgactt cctgacagct 1140
catcatgaga tggggcatat ccagtatgat atggcatatg ctgcacaacc ttttctgcta 1200
agaaatggag ctaatgaagg attccatgaa gctgttgggg aaatcatgtc actttctgca 1260
gccacaccta agcatttaaa atccattggt cttctgtcac ccgattttca agaagacaat 1320
gaaacagaaa taaacttcct gctcaaacaa gcactcacga ttgttgggac tctgccattt 1380
acttacatgt tagagaagtg gaggtggatg gtctttaaag gggaaattcc caaagaccag 1440
tggatgaaaa agtggtggga gatgaagcga gagatagttg gggtggtgga acctgtgccc 1500
catgatgaaa catactgtga ccccgcatct ctgttccatg tttctaatga ttactcattc 1560
attcgatatt acacaaggac cctttaccaa ttccagtttc aagaagcact ttgtcaagca 1620
gctaaacatg aaggccctct gcacaaatgt gacatctcaa actctacaga agctggacag 1680
aaactgttca atatgctgag gcttggaaaa tcagaaccct ggaccctagc attggaaaat 1740
gttgtaggag caaagaacat gaatgtaagg ccactgctca actactttga gcccttattt 1800
acctggctga aagaccagaa caagaattct tttgtgggat ggagtaccga ctggagtcca 1860
tatgcagacc aaagcatcaa agtgaggata agcctaaaat cagctcttgg agataaagca 1920
tatgaatgga acgacaatga aatgtacctg ttccgatcat ctgttgcata tgctatgagg 1980
cagtactttt taaaagtaaa aaatcagatg attctttttg gggaggagga tgtgcgagtg 2040
gctaatttga aaccaagaat ctcctttaat ttctttgtca ctgcacctaa aaatgtgtct 2100
gatatcattc ctagaactga agttgaaaag gccatcagga tgtcccggag ccgtatcaat 2160
gatgctttcc gtctgaatga caacagccta gagtttctgg ggatacagcc aacacttgga 2220
cctcctaacc agccccctgt ttccgggccc tcgggctcga gtgctgagcc caaatcttgt 2280
gacaaaactc acacatgccc accgtgccca gcacctgaac tcctgggggg accgtcagtc 2340
ttcctcttcc ccccaaaacc caaggacacc ctcatgatct cccggacccc tgaggtcaca 2400
tgcgtggtgg tggacgtgag ccacgaagac cctgaggtca agttcaactg gtacgtggac 2460
ggcgtggagg tgcataatgc caagacaaag ccgcgggagg agcagtacaa cagcacgtac 2520
cgtgtggtca gcgtcctcac cgtcctgcac caggactggc tgaatggcaa ggagtacaag 2580
tgcaaggtct ccaacaaagc cctcccagcc cccatcgaga aaaccatctc caaagccaaa 2640
gggcagcccc gagaaccaca ggtgtacacc ctgcccccat cccgggagga gatgaccaag 2700
aaccaggtca gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag 2760
tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc 2820
gacggctcct tcttcctcta cagcaagctc accgtggaca agagcaggtg gcagcagggg 2880
aacgtcttct catgctccgt gatgcatgag gctctgcaca accactacac gcagaagagc 2940
ctctccctgt ctccgggtaa agcacgtacg ggcggcggcg gcggatccga agctggcata 3000
acaggcacgt ggtacaatca actcgggagc acgtttattg tgacagcagg agcggatgga 3060
gcactgacgg ggacttacga gagtgctgtg ggtaacgccg agtctcgata tgtactgaca 3120
ggcagatacg atagcgcacc ggccaccgac ggttcaggaa cggccctggg ctggaccgtt 3180
gcttggaaga ataactacag gaacgcacac agtgcaacta catggtctgg ccagtacgtg 3240
gggggagcgg aagccaggat aaacacgcag tggctcctta ctagcggaac cacagaagcg 3300
aacgcatgga aatctacact ggtggggcat gacacgttta cgaaggtaaa accctctgcg 3360
gctagttag 3369
<210> 47
<211> 1122
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ACE2-Fc-SA 氨基酸序列(amino acid sequence)
<400> 47
Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu
1 5 10 15
Val Thr Asn Ser Gly Ser Arg Ala Ala Gln Ser Thr Ile Glu Glu Gln
20 25 30
Ala Lys Thr Phe Leu Asp Lys Phe Asn His Glu Ala Glu Asp Leu Phe
35 40 45
Tyr Gln Ser Ser Leu Ala Ser Trp Asn Tyr Asn Thr Asn Ile Thr Glu
50 55 60
Glu Asn Val Gln Asn Met Asn Asn Ala Gly Asp Lys Trp Ser Ala Phe
65 70 75 80
Leu Lys Glu Gln Ser Thr Leu Ala Gln Met Tyr Pro Leu Gln Glu Ile
85 90 95
Gln Asn Leu Thr Val Lys Leu Gln Leu Gln Ala Leu Gln Gln Asn Gly
100 105 110
Ser Ser Val Leu Ser Glu Asp Lys Ser Lys Arg Leu Asn Thr Ile Leu
115 120 125
Asn Thr Met Ser Thr Ile Tyr Ser Thr Gly Lys Val Cys Asn Pro Asp
130 135 140
Asn Pro Gln Glu Cys Leu Leu Leu Glu Pro Gly Leu Asn Glu Ile Met
145 150 155 160
Ala Asn Ser Leu Asp Tyr Asn Glu Arg Leu Trp Ala Trp Glu Ser Trp
165 170 175
Arg Ser Glu Val Gly Lys Gln Leu Arg Pro Leu Tyr Glu Glu Tyr Val
180 185 190
Val Leu Lys Asn Glu Met Ala Arg Ala Asn His Tyr Glu Asp Tyr Gly
195 200 205
Asp Tyr Trp Arg Gly Asp Tyr Glu Val Asn Gly Val Asp Gly Tyr Asp
210 215 220
Tyr Ser Arg Gly Gln Leu Ile Glu Asp Val Glu His Thr Phe Glu Glu
225 230 235 240
Ile Lys Pro Leu Tyr Glu His Leu His Ala Tyr Val Arg Ala Lys Leu
245 250 255
Met Asn Ala Tyr Pro Ser Tyr Ile Ser Pro Ile Gly Cys Leu Pro Ala
260 265 270
His Leu Leu Gly Asp Met Trp Gly Arg Phe Trp Thr Asn Leu Tyr Ser
275 280 285
Leu Thr Val Pro Phe Gly Gln Lys Pro Asn Ile Asp Val Thr Asp Ala
290 295 300
Met Val Asp Gln Ala Trp Asp Ala Gln Arg Ile Phe Lys Glu Ala Glu
305 310 315 320
Lys Phe Phe Val Ser Val Gly Leu Pro Asn Met Thr Gln Gly Phe Trp
325 330 335
Glu Asn Ser Met Leu Thr Asp Pro Gly Asn Val Gln Lys Ala Val Cys
340 345 350
His Pro Thr Ala Trp Asp Leu Gly Lys Gly Asp Phe Arg Ile Leu Met
355 360 365
Cys Thr Lys Val Thr Met Asp Asp Phe Leu Thr Ala His His Glu Met
370 375 380
Gly His Ile Gln Tyr Asp Met Ala Tyr Ala Ala Gln Pro Phe Leu Leu
385 390 395 400
Arg Asn Gly Ala Asn Glu Gly Phe His Glu Ala Val Gly Glu Ile Met
405 410 415
Ser Leu Ser Ala Ala Thr Pro Lys His Leu Lys Ser Ile Gly Leu Leu
420 425 430
Ser Pro Asp Phe Gln Glu Asp Asn Glu Thr Glu Ile Asn Phe Leu Leu
435 440 445
Lys Gln Ala Leu Thr Ile Val Gly Thr Leu Pro Phe Thr Tyr Met Leu
450 455 460
Glu Lys Trp Arg Trp Met Val Phe Lys Gly Glu Ile Pro Lys Asp Gln
465 470 475 480
Trp Met Lys Lys Trp Trp Glu Met Lys Arg Glu Ile Val Gly Val Val
485 490 495
Glu Pro Val Pro His Asp Glu Thr Tyr Cys Asp Pro Ala Ser Leu Phe
500 505 510
His Val Ser Asn Asp Tyr Ser Phe Ile Arg Tyr Tyr Thr Arg Thr Leu
515 520 525
Tyr Gln Phe Gln Phe Gln Glu Ala Leu Cys Gln Ala Ala Lys His Glu
530 535 540
Gly Pro Leu His Lys Cys Asp Ile Ser Asn Ser Thr Glu Ala Gly Gln
545 550 555 560
Lys Leu Phe Asn Met Leu Arg Leu Gly Lys Ser Glu Pro Trp Thr Leu
565 570 575
Ala Leu Glu Asn Val Val Gly Ala Lys Asn Met Asn Val Arg Pro Leu
580 585 590
Leu Asn Tyr Phe Glu Pro Leu Phe Thr Trp Leu Lys Asp Gln Asn Lys
595 600 605
Asn Ser Phe Val Gly Trp Ser Thr Asp Trp Ser Pro Tyr Ala Asp Gln
610 615 620
Ser Ile Lys Val Arg Ile Ser Leu Lys Ser Ala Leu Gly Asp Lys Ala
625 630 635 640
Tyr Glu Trp Asn Asp Asn Glu Met Tyr Leu Phe Arg Ser Ser Val Ala
645 650 655
Tyr Ala Met Arg Gln Tyr Phe Leu Lys Val Lys Asn Gln Met Ile Leu
660 665 670
Phe Gly Glu Glu Asp Val Arg Val Ala Asn Leu Lys Pro Arg Ile Ser
675 680 685
Phe Asn Phe Phe Val Thr Ala Pro Lys Asn Val Ser Asp Ile Ile Pro
690 695 700
Arg Thr Glu Val Glu Lys Ala Ile Arg Met Ser Arg Ser Arg Ile Asn
705 710 715 720
Asp Ala Phe Arg Leu Asn Asp Asn Ser Leu Glu Phe Leu Gly Ile Gln
725 730 735
Pro Thr Leu Gly Pro Pro Asn Gln Pro Pro Val Ser Gly Pro Ser Gly
740 745 750
Ser Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro
755 760 765
Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro
770 775 780
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
785 790 795 800
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
805 810 815
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
820 825 830
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val
835 840 845
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
850 855 860
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
865 870 875 880
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu
885 890 895
Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe
900 905 910
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
915 920 925
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe
930 935 940
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
945 950 955 960
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
965 970 975
Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Ala Arg Thr Gly Gly
980 985 990
Gly Gly Gly Ser Glu Ala Gly Ile Thr Gly Thr Trp Tyr Asn Gln Leu
995 1000 1005
Gly Ser Thr Phe Ile Val Thr Ala Gly Ala Asp Gly Ala Leu Thr
1010 1015 1020
Gly Thr Tyr Glu Ser Ala Val Gly Asn Ala Glu Ser Arg Tyr Val
1025 1030 1035
Leu Thr Gly Arg Tyr Asp Ser Ala Pro Ala Thr Asp Gly Ser Gly
1040 1045 1050
Thr Ala Leu Gly Trp Thr Val Ala Trp Lys Asn Asn Tyr Arg Asn
1055 1060 1065
Ala His Ser Ala Thr Thr Trp Ser Gly Gln Tyr Val Gly Gly Ala
1070 1075 1080
Glu Ala Arg Ile Asn Thr Gln Trp Leu Leu Thr Ser Gly Thr Thr
1085 1090 1095
Glu Ala Asn Ala Trp Lys Ser Thr Leu Val Gly His Asp Thr Phe
1100 1105 1110
Thr Lys Val Lys Pro Ser Ala Ala Ser
1115 1120
<210> 48
<211> 3036
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> ACE2-Fc-AviTag DNA 序列(sequence)
<400> 48
atgtacagga tgcaactcct gtcttgcatt gcactaagtc ttgcacttgt cacgaattcg 60
ggctcgaggg ctgctcagtc caccattgag gaacaggcca agacattttt ggacaagttt 120
aaccacgaag ccgaagacct gttctatcaa agttcacttg cttcttggaa ttataacacc 180
aatattactg aagagaatgt ccaaaacatg aataatgctg gggacaaatg gtctgccttt 240
ttaaaggaac agtccacact tgcccaaatg tatccactac aagaaattca gaatctcaca 300
gtcaagcttc agctgcaggc tcttcagcaa aatgggtctt cagtgctctc agaagacaag 360
agcaaacggt tgaacacaat tctaaataca atgagcacca tctacagtac tggaaaagtt 420
tgtaacccag ataatccaca agaatgctta ttacttgaac caggtttgaa tgaaataatg 480
gcaaacagtt tagactacaa tgagaggctc tgggcttggg aaagctggag atctgaggtc 540
ggcaagcagc tgaggccatt atatgaagag tatgtggtct tgaaaaatga gatggcaaga 600
gcaaatcatt atgaggacta tggggattat tggagaggag actatgaagt aaatggggta 660
gatggctatg actacagccg cggccagttg attgaagatg tggaacatac ctttgaagag 720
attaaaccat tatatgaaca tcttcatgcc tatgtgaggg caaagttgat gaatgcctat 780
ccttcctata tcagtccaat tggatgcctc cctgctcatt tgcttggtga tatgtggggt 840
agattttgga caaatctgta ctctttgaca gttccctttg gacagaaacc aaacatagat 900
gttactgatg caatggtgga ccaggcctgg gatgcacaga gaatattcaa ggaggccgag 960
aagttctttg tatctgttgg tcttcctaat atgactcaag gattctggga aaattccatg 1020
ctaacggacc caggaaatgt tcagaaagca gtctgccatc ccacagcttg ggacctgggg 1080
aagggcgact tcaggatcct tatgtgcaca aaggtgacaa tggacgactt cctgacagct 1140
catcatgaga tggggcatat ccagtatgat atggcatatg ctgcacaacc ttttctgcta 1200
agaaatggag ctaatgaagg attccatgaa gctgttgggg aaatcatgtc actttctgca 1260
gccacaccta agcatttaaa atccattggt cttctgtcac ccgattttca agaagacaat 1320
gaaacagaaa taaacttcct gctcaaacaa gcactcacga ttgttgggac tctgccattt 1380
acttacatgt tagagaagtg gaggtggatg gtctttaaag gggaaattcc caaagaccag 1440
tggatgaaaa agtggtggga gatgaagcga gagatagttg gggtggtgga acctgtgccc 1500
catgatgaaa catactgtga ccccgcatct ctgttccatg tttctaatga ttactcattc 1560
attcgatatt acacaaggac cctttaccaa ttccagtttc aagaagcact ttgtcaagca 1620
gctaaacatg aaggccctct gcacaaatgt gacatctcaa actctacaga agctggacag 1680
aaactgttca atatgctgag gcttggaaaa tcagaaccct ggaccctagc attggaaaat 1740
gttgtaggag caaagaacat gaatgtaagg ccactgctca actactttga gcccttattt 1800
acctggctga aagaccagaa caagaattct tttgtgggat ggagtaccga ctggagtcca 1860
tatgcagacc aaagcatcaa agtgaggata agcctaaaat cagctcttgg agataaagca 1920
tatgaatgga acgacaatga aatgtacctg ttccgatcat ctgttgcata tgctatgagg 1980
cagtactttt taaaagtaaa aaatcagatg attctttttg gggaggagga tgtgcgagtg 2040
gctaatttga aaccaagaat ctcctttaat ttctttgtca ctgcacctaa aaatgtgtct 2100
gatatcattc ctagaactga agttgaaaag gccatcagga tgtcccggag ccgtatcaat 2160
gatgctttcc gtctgaatga caacagccta gagtttctgg ggatacagcc aacacttgga 2220
cctcctaacc agccccctgt ttccgggccc tcgggctcga gtgctgagcc caaatcttgt 2280
gacaaaactc acacatgccc accgtgccca gcacctgaac tcctgggggg accgtcagtc 2340
ttcctcttcc ccccaaaacc caaggacacc ctcatgatct cccggacccc tgaggtcaca 2400
tgcgtggtgg tggacgtgag ccacgaagac cctgaggtca agttcaactg gtacgtggac 2460
ggcgtggagg tgcataatgc caagacaaag ccgcgggagg agcagtacaa cagcacgtac 2520
cgtgtggtca gcgtcctcac cgtcctgcac caggactggc tgaatggcaa ggagtacaag 2580
tgcaaggtct ccaacaaagc cctcccagcc cccatcgaga aaaccatctc caaagccaaa 2640
gggcagcccc gagaaccaca ggtgtacacc ctgcccccat cccgggagga gatgaccaag 2700
aaccaggtca gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag 2760
tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc 2820
gacggctcct tcttcctcta cagcaagctc accgtggaca agagcaggtg gcagcagggg 2880
aacgtcttct catgctccgt gatgcatgag gctctgcaca accactacac gcagaagagc 2940
ctctccctgt ctccgggtaa agcacgtacg ggcggcggcg gcggatccgg gctgaatgat 3000
attttcgaag cacagaaaat tgaatggcat gagtag 3036
<210> 49
<211> 1011
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ACE2-Fc-AviTag 氨基酸序列(amino acid sequence)
<400> 49
Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu
1 5 10 15
Val Thr Asn Ser Gly Ser Arg Ala Ala Gln Ser Thr Ile Glu Glu Gln
20 25 30
Ala Lys Thr Phe Leu Asp Lys Phe Asn His Glu Ala Glu Asp Leu Phe
35 40 45
Tyr Gln Ser Ser Leu Ala Ser Trp Asn Tyr Asn Thr Asn Ile Thr Glu
50 55 60
Glu Asn Val Gln Asn Met Asn Asn Ala Gly Asp Lys Trp Ser Ala Phe
65 70 75 80
Leu Lys Glu Gln Ser Thr Leu Ala Gln Met Tyr Pro Leu Gln Glu Ile
85 90 95
Gln Asn Leu Thr Val Lys Leu Gln Leu Gln Ala Leu Gln Gln Asn Gly
100 105 110
Ser Ser Val Leu Ser Glu Asp Lys Ser Lys Arg Leu Asn Thr Ile Leu
115 120 125
Asn Thr Met Ser Thr Ile Tyr Ser Thr Gly Lys Val Cys Asn Pro Asp
130 135 140
Asn Pro Gln Glu Cys Leu Leu Leu Glu Pro Gly Leu Asn Glu Ile Met
145 150 155 160
Ala Asn Ser Leu Asp Tyr Asn Glu Arg Leu Trp Ala Trp Glu Ser Trp
165 170 175
Arg Ser Glu Val Gly Lys Gln Leu Arg Pro Leu Tyr Glu Glu Tyr Val
180 185 190
Val Leu Lys Asn Glu Met Ala Arg Ala Asn His Tyr Glu Asp Tyr Gly
195 200 205
Asp Tyr Trp Arg Gly Asp Tyr Glu Val Asn Gly Val Asp Gly Tyr Asp
210 215 220
Tyr Ser Arg Gly Gln Leu Ile Glu Asp Val Glu His Thr Phe Glu Glu
225 230 235 240
Ile Lys Pro Leu Tyr Glu His Leu His Ala Tyr Val Arg Ala Lys Leu
245 250 255
Met Asn Ala Tyr Pro Ser Tyr Ile Ser Pro Ile Gly Cys Leu Pro Ala
260 265 270
His Leu Leu Gly Asp Met Trp Gly Arg Phe Trp Thr Asn Leu Tyr Ser
275 280 285
Leu Thr Val Pro Phe Gly Gln Lys Pro Asn Ile Asp Val Thr Asp Ala
290 295 300
Met Val Asp Gln Ala Trp Asp Ala Gln Arg Ile Phe Lys Glu Ala Glu
305 310 315 320
Lys Phe Phe Val Ser Val Gly Leu Pro Asn Met Thr Gln Gly Phe Trp
325 330 335
Glu Asn Ser Met Leu Thr Asp Pro Gly Asn Val Gln Lys Ala Val Cys
340 345 350
His Pro Thr Ala Trp Asp Leu Gly Lys Gly Asp Phe Arg Ile Leu Met
355 360 365
Cys Thr Lys Val Thr Met Asp Asp Phe Leu Thr Ala His His Glu Met
370 375 380
Gly His Ile Gln Tyr Asp Met Ala Tyr Ala Ala Gln Pro Phe Leu Leu
385 390 395 400
Arg Asn Gly Ala Asn Glu Gly Phe His Glu Ala Val Gly Glu Ile Met
405 410 415
Ser Leu Ser Ala Ala Thr Pro Lys His Leu Lys Ser Ile Gly Leu Leu
420 425 430
Ser Pro Asp Phe Gln Glu Asp Asn Glu Thr Glu Ile Asn Phe Leu Leu
435 440 445
Lys Gln Ala Leu Thr Ile Val Gly Thr Leu Pro Phe Thr Tyr Met Leu
450 455 460
Glu Lys Trp Arg Trp Met Val Phe Lys Gly Glu Ile Pro Lys Asp Gln
465 470 475 480
Trp Met Lys Lys Trp Trp Glu Met Lys Arg Glu Ile Val Gly Val Val
485 490 495
Glu Pro Val Pro His Asp Glu Thr Tyr Cys Asp Pro Ala Ser Leu Phe
500 505 510
His Val Ser Asn Asp Tyr Ser Phe Ile Arg Tyr Tyr Thr Arg Thr Leu
515 520 525
Tyr Gln Phe Gln Phe Gln Glu Ala Leu Cys Gln Ala Ala Lys His Glu
530 535 540
Gly Pro Leu His Lys Cys Asp Ile Ser Asn Ser Thr Glu Ala Gly Gln
545 550 555 560
Lys Leu Phe Asn Met Leu Arg Leu Gly Lys Ser Glu Pro Trp Thr Leu
565 570 575
Ala Leu Glu Asn Val Val Gly Ala Lys Asn Met Asn Val Arg Pro Leu
580 585 590
Leu Asn Tyr Phe Glu Pro Leu Phe Thr Trp Leu Lys Asp Gln Asn Lys
595 600 605
Asn Ser Phe Val Gly Trp Ser Thr Asp Trp Ser Pro Tyr Ala Asp Gln
610 615 620
Ser Ile Lys Val Arg Ile Ser Leu Lys Ser Ala Leu Gly Asp Lys Ala
625 630 635 640
Tyr Glu Trp Asn Asp Asn Glu Met Tyr Leu Phe Arg Ser Ser Val Ala
645 650 655
Tyr Ala Met Arg Gln Tyr Phe Leu Lys Val Lys Asn Gln Met Ile Leu
660 665 670
Phe Gly Glu Glu Asp Val Arg Val Ala Asn Leu Lys Pro Arg Ile Ser
675 680 685
Phe Asn Phe Phe Val Thr Ala Pro Lys Asn Val Ser Asp Ile Ile Pro
690 695 700
Arg Thr Glu Val Glu Lys Ala Ile Arg Met Ser Arg Ser Arg Ile Asn
705 710 715 720
Asp Ala Phe Arg Leu Asn Asp Asn Ser Leu Glu Phe Leu Gly Ile Gln
725 730 735
Pro Thr Leu Gly Pro Pro Asn Gln Pro Pro Val Ser Gly Pro Ser Gly
740 745 750
Ser Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro
755 760 765
Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro
770 775 780
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
785 790 795 800
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
805 810 815
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
820 825 830
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val
835 840 845
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
850 855 860
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
865 870 875 880
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu
885 890 895
Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe
900 905 910
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
915 920 925
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe
930 935 940
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
945 950 955 960
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
965 970 975
Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Ala Arg Thr Gly Gly
980 985 990
Gly Gly Gly Ser Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu
995 1000 1005
Trp His Glu
1010
<210> 50
<211> 2994
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> ACE2-Fc-Strep-Tag II DNA 序列(sequence)
<400> 50
atgtacagga tgcaactcct gtcttgcatt gcactaagtc ttgcacttgt cacgaattcg 60
ggctcgaggg ctgctcagtc caccattgag gaacaggcca agacattttt ggacaagttt 120
aaccacgaag ccgaagacct gttctatcaa agttcacttg cttcttggaa ttataacacc 180
aatattactg aagagaatgt ccaaaacatg aataatgctg gggacaaatg gtctgccttt 240
ttaaaggaac agtccacact tgcccaaatg tatccactac aagaaattca gaatctcaca 300
gtcaagcttc agctgcaggc tcttcagcaa aatgggtctt cagtgctctc agaagacaag 360
agcaaacggt tgaacacaat tctaaataca atgagcacca tctacagtac tggaaaagtt 420
tgtaacccag ataatccaca agaatgctta ttacttgaac caggtttgaa tgaaataatg 480
gcaaacagtt tagactacaa tgagaggctc tgggcttggg aaagctggag atctgaggtc 540
ggcaagcagc tgaggccatt atatgaagag tatgtggtct tgaaaaatga gatggcaaga 600
gcaaatcatt atgaggacta tggggattat tggagaggag actatgaagt aaatggggta 660
gatggctatg actacagccg cggccagttg attgaagatg tggaacatac ctttgaagag 720
attaaaccat tatatgaaca tcttcatgcc tatgtgaggg caaagttgat gaatgcctat 780
ccttcctata tcagtccaat tggatgcctc cctgctcatt tgcttggtga tatgtggggt 840
agattttgga caaatctgta ctctttgaca gttccctttg gacagaaacc aaacatagat 900
gttactgatg caatggtgga ccaggcctgg gatgcacaga gaatattcaa ggaggccgag 960
aagttctttg tatctgttgg tcttcctaat atgactcaag gattctggga aaattccatg 1020
ctaacggacc caggaaatgt tcagaaagca gtctgccatc ccacagcttg ggacctgggg 1080
aagggcgact tcaggatcct tatgtgcaca aaggtgacaa tggacgactt cctgacagct 1140
catcatgaga tggggcatat ccagtatgat atggcatatg ctgcacaacc ttttctgcta 1200
agaaatggag ctaatgaagg attccatgaa gctgttgggg aaatcatgtc actttctgca 1260
gccacaccta agcatttaaa atccattggt cttctgtcac ccgattttca agaagacaat 1320
gaaacagaaa taaacttcct gctcaaacaa gcactcacga ttgttgggac tctgccattt 1380
acttacatgt tagagaagtg gaggtggatg gtctttaaag gggaaattcc caaagaccag 1440
tggatgaaaa agtggtggga gatgaagcga gagatagttg gggtggtgga acctgtgccc 1500
catgatgaaa catactgtga ccccgcatct ctgttccatg tttctaatga ttactcattc 1560
attcgatatt acacaaggac cctttaccaa ttccagtttc aagaagcact ttgtcaagca 1620
gctaaacatg aaggccctct gcacaaatgt gacatctcaa actctacaga agctggacag 1680
aaactgttca atatgctgag gcttggaaaa tcagaaccct ggaccctagc attggaaaat 1740
gttgtaggag caaagaacat gaatgtaagg ccactgctca actactttga gcccttattt 1800
acctggctga aagaccagaa caagaattct tttgtgggat ggagtaccga ctggagtcca 1860
tatgcagacc aaagcatcaa agtgaggata agcctaaaat cagctcttgg agataaagca 1920
tatgaatgga acgacaatga aatgtacctg ttccgatcat ctgttgcata tgctatgagg 1980
cagtactttt taaaagtaaa aaatcagatg attctttttg gggaggagga tgtgcgagtg 2040
gctaatttga aaccaagaat ctcctttaat ttctttgtca ctgcacctaa aaatgtgtct 2100
gatatcattc ctagaactga agttgaaaag gccatcagga tgtcccggag ccgtatcaat 2160
gatgctttcc gtctgaatga caacagccta gagtttctgg ggatacagcc aacacttgga 2220
cctcctaacc agccccctgt ttccgggccc tcgggctcga gtgctgagcc caaatcttgt 2280
gacaaaactc acacatgccc accgtgccca gcacctgaac tcctgggggg accgtcagtc 2340
ttcctcttcc ccccaaaacc caaggacacc ctcatgatct cccggacccc tgaggtcaca 2400
tgcgtggtgg tggacgtgag ccacgaagac cctgaggtca agttcaactg gtacgtggac 2460
ggcgtggagg tgcataatgc caagacaaag ccgcgggagg agcagtacaa cagcacgtac 2520
cgtgtggtca gcgtcctcac cgtcctgcac caggactggc tgaatggcaa ggagtacaag 2580
tgcaaggtct ccaacaaagc cctcccagcc cccatcgaga aaaccatctc caaagccaaa 2640
gggcagcccc gagaaccaca ggtgtacacc ctgcccccat cccgggagga gatgaccaag 2700
aaccaggtca gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag 2760
tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc 2820
gacggctcct tcttcctcta cagcaagctc accgtggaca agagcaggtg gcagcagggg 2880
aacgtcttct catgctccgt gatgcatgag gctctgcaca accactacac gcagaagagc 2940
ctctccctgt ctccgggtaa agccgcctgg agtcatccac aattcgaaaa gtag 2994
<210> 51
<211> 997
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> ACE2-Fc-Strep-Tag II 氨基酸序列(amino acid sequence)
<400> 51
Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu
1 5 10 15
Val Thr Asn Ser Gly Ser Arg Ala Ala Gln Ser Thr Ile Glu Glu Gln
20 25 30
Ala Lys Thr Phe Leu Asp Lys Phe Asn His Glu Ala Glu Asp Leu Phe
35 40 45
Tyr Gln Ser Ser Leu Ala Ser Trp Asn Tyr Asn Thr Asn Ile Thr Glu
50 55 60
Glu Asn Val Gln Asn Met Asn Asn Ala Gly Asp Lys Trp Ser Ala Phe
65 70 75 80
Leu Lys Glu Gln Ser Thr Leu Ala Gln Met Tyr Pro Leu Gln Glu Ile
85 90 95
Gln Asn Leu Thr Val Lys Leu Gln Leu Gln Ala Leu Gln Gln Asn Gly
100 105 110
Ser Ser Val Leu Ser Glu Asp Lys Ser Lys Arg Leu Asn Thr Ile Leu
115 120 125
Asn Thr Met Ser Thr Ile Tyr Ser Thr Gly Lys Val Cys Asn Pro Asp
130 135 140
Asn Pro Gln Glu Cys Leu Leu Leu Glu Pro Gly Leu Asn Glu Ile Met
145 150 155 160
Ala Asn Ser Leu Asp Tyr Asn Glu Arg Leu Trp Ala Trp Glu Ser Trp
165 170 175
Arg Ser Glu Val Gly Lys Gln Leu Arg Pro Leu Tyr Glu Glu Tyr Val
180 185 190
Val Leu Lys Asn Glu Met Ala Arg Ala Asn His Tyr Glu Asp Tyr Gly
195 200 205
Asp Tyr Trp Arg Gly Asp Tyr Glu Val Asn Gly Val Asp Gly Tyr Asp
210 215 220
Tyr Ser Arg Gly Gln Leu Ile Glu Asp Val Glu His Thr Phe Glu Glu
225 230 235 240
Ile Lys Pro Leu Tyr Glu His Leu His Ala Tyr Val Arg Ala Lys Leu
245 250 255
Met Asn Ala Tyr Pro Ser Tyr Ile Ser Pro Ile Gly Cys Leu Pro Ala
260 265 270
His Leu Leu Gly Asp Met Trp Gly Arg Phe Trp Thr Asn Leu Tyr Ser
275 280 285
Leu Thr Val Pro Phe Gly Gln Lys Pro Asn Ile Asp Val Thr Asp Ala
290 295 300
Met Val Asp Gln Ala Trp Asp Ala Gln Arg Ile Phe Lys Glu Ala Glu
305 310 315 320
Lys Phe Phe Val Ser Val Gly Leu Pro Asn Met Thr Gln Gly Phe Trp
325 330 335
Glu Asn Ser Met Leu Thr Asp Pro Gly Asn Val Gln Lys Ala Val Cys
340 345 350
His Pro Thr Ala Trp Asp Leu Gly Lys Gly Asp Phe Arg Ile Leu Met
355 360 365
Cys Thr Lys Val Thr Met Asp Asp Phe Leu Thr Ala His His Glu Met
370 375 380
Gly His Ile Gln Tyr Asp Met Ala Tyr Ala Ala Gln Pro Phe Leu Leu
385 390 395 400
Arg Asn Gly Ala Asn Glu Gly Phe His Glu Ala Val Gly Glu Ile Met
405 410 415
Ser Leu Ser Ala Ala Thr Pro Lys His Leu Lys Ser Ile Gly Leu Leu
420 425 430
Ser Pro Asp Phe Gln Glu Asp Asn Glu Thr Glu Ile Asn Phe Leu Leu
435 440 445
Lys Gln Ala Leu Thr Ile Val Gly Thr Leu Pro Phe Thr Tyr Met Leu
450 455 460
Glu Lys Trp Arg Trp Met Val Phe Lys Gly Glu Ile Pro Lys Asp Gln
465 470 475 480
Trp Met Lys Lys Trp Trp Glu Met Lys Arg Glu Ile Val Gly Val Val
485 490 495
Glu Pro Val Pro His Asp Glu Thr Tyr Cys Asp Pro Ala Ser Leu Phe
500 505 510
His Val Ser Asn Asp Tyr Ser Phe Ile Arg Tyr Tyr Thr Arg Thr Leu
515 520 525
Tyr Gln Phe Gln Phe Gln Glu Ala Leu Cys Gln Ala Ala Lys His Glu
530 535 540
Gly Pro Leu His Lys Cys Asp Ile Ser Asn Ser Thr Glu Ala Gly Gln
545 550 555 560
Lys Leu Phe Asn Met Leu Arg Leu Gly Lys Ser Glu Pro Trp Thr Leu
565 570 575
Ala Leu Glu Asn Val Val Gly Ala Lys Asn Met Asn Val Arg Pro Leu
580 585 590
Leu Asn Tyr Phe Glu Pro Leu Phe Thr Trp Leu Lys Asp Gln Asn Lys
595 600 605
Asn Ser Phe Val Gly Trp Ser Thr Asp Trp Ser Pro Tyr Ala Asp Gln
610 615 620
Ser Ile Lys Val Arg Ile Ser Leu Lys Ser Ala Leu Gly Asp Lys Ala
625 630 635 640
Tyr Glu Trp Asn Asp Asn Glu Met Tyr Leu Phe Arg Ser Ser Val Ala
645 650 655
Tyr Ala Met Arg Gln Tyr Phe Leu Lys Val Lys Asn Gln Met Ile Leu
660 665 670
Phe Gly Glu Glu Asp Val Arg Val Ala Asn Leu Lys Pro Arg Ile Ser
675 680 685
Phe Asn Phe Phe Val Thr Ala Pro Lys Asn Val Ser Asp Ile Ile Pro
690 695 700
Arg Thr Glu Val Glu Lys Ala Ile Arg Met Ser Arg Ser Arg Ile Asn
705 710 715 720
Asp Ala Phe Arg Leu Asn Asp Asn Ser Leu Glu Phe Leu Gly Ile Gln
725 730 735
Pro Thr Leu Gly Pro Pro Asn Gln Pro Pro Val Ser Gly Pro Ser Gly
740 745 750
Ser Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro
755 760 765
Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro
770 775 780
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
785 790 795 800
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
805 810 815
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
820 825 830
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val
835 840 845
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
850 855 860
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
865 870 875 880
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu
885 890 895
Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe
900 905 910
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
915 920 925
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe
930 935 940
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
945 950 955 960
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
965 970 975
Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Ala Ala Trp Ser His
980 985 990
Pro Gln Phe Glu Lys
995
Claims (96)
1.一种重组多肽,其包含:
a)免疫球蛋白Fc片段和硫酸化多糖;以及
b)至少一种病毒受体或其片段。
2.如权利要求1所述的重组多肽,其中(a)和(b)能够协同结合至少一种病毒包膜蛋白。
3.如权利要求1所述的重组多肽,其中该硫酸化多糖是硫酸乙酰肝素(HS)。
4.如权利要求3所述的重组多肽,其中该HS是蛋白聚糖(HSPG)。
5.如权利要求4所述的重组多肽,其中该HSPG包含两个或更多个硫酸化位点。
6.如权利要求5所述的重组多肽,其中该硫酸化位点包含丝氨酸-甘氨酸-天冬氨酸(SGD)基序。
7.如权利要求6所述的重组多肽,其中该SGD基序在至少一个酸性氨基酸残基的7、8、9和/或10个残基内。
8.如权利要求1所述的重组多肽,其中该至少一种病毒受体或其片段是针对选自由以下组成的组的病毒科:黄病毒科、冠状病毒科和嗜肝DNA病毒科。
9.如权利要求8所述的重组多肽,其中该病毒科是黄病毒科。
10.如权利要求9所述的重组多肽,其中该黄病毒科病毒选自由以下组成的组:HCV、西尼罗病毒和登革热病毒。
11.如权利要求10所述的重组多肽,其中该病毒是HCV。
12.如权利要求11所述的重组多肽,其中该至少一种病毒受体或其片段是CD81和/或清道夫受体B-1(SRB1)。
13.如权利要求10所述的重组多肽,其中该病毒是西尼罗病毒或登革热病毒。
14.如权利要求13所述的重组多肽,其中该至少一种病毒受体或其片段是AXL和/或TIM-1和/或TIM-4。
15.如权利要求8所述的重组多肽,其中该病毒科是冠状病毒科。
16.如权利要求15所述的重组多肽,其中该冠状病毒科病毒是中东呼吸综合征(MERS)。
17.如权利要求16所述的重组多肽,其中该至少一种病毒受体或其片段是CD26和/或CD26-叶片4和/或CD26-B4C。
18.如权利要求15所述的重组多肽,其中该冠状病毒科病毒是严重急性呼吸系统综合征(SARS)。
19.如权利要求18所述的重组多肽,其中该严重急性呼吸综合征(SARS)病毒是SARS-CoV或SARS-CoV-2。
20.如权利要求19所述的重组多肽,其中该至少一种病毒受体或其片段选自由以下组成的组:ACE2、CD147、唾液酸和SRB1。
21.如权利要求20所述的重组多肽,其中该至少一种病毒受体或其片段是ACE2。
22.如权利要求21所述的重组多肽,其中该硫酸化多糖是HSPG。
23.如权利要求20所述的重组多肽,其中该至少一种病毒受体或其片段是CD147。
24.如权利要求21所述的重组多肽,其中该硫酸化多糖是HSPG。
25.如权利要求20所述的重组多肽,其中该至少一种病毒受体或其片段是唾液酸。
26.如权利要求25所述的重组多肽,其中该硫酸化多糖是HSPG。
27.如权利要求20所述的重组多肽,其中该至少一种病毒受体或其片段是SRB1。
28.如权利要求27所述的重组多肽,其中该硫酸化多糖是HSPG。
29.如权利要求15所述的重组多肽,其中该冠状病毒科病毒是塞特拉科病毒。
30.如权利要求29所述的重组多肽,其中该塞特拉科病毒是人冠状病毒(hCoV)-NL63。
31.如权利要求30所述的重组多肽,其中该至少一种病毒受体或其片段是ACE2。
32.如权利要求31所述的重组多肽,其中该硫酸化多糖是HSPG。
33.如权利要求8所述的重组多肽,其中该病毒科是嗜肝DNA病毒科。
34.如权利要求33所述的重组多肽,其中该病毒是HBV。
35.如权利要求34所述的重组多肽,其中该至少一种病毒受体或其片段是NTCP(牛磺胆酸钠共同转运多肽)。
36.如权利要求35所述的重组多肽,其中该硫酸化多糖是HSPG。
37.一种药物组合物,其包含如权利要求1-36中任一项所述的重组多肽。
38.一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向该受试者施用治疗或预防有效量的如权利要求37所述的药物组合物。
39.如权利要求38所述的方法,其中该病毒感染是选自由黄病毒科、冠状病毒科和嗜肝DNA病毒科组成的组的病毒科的结果。
40.如权利要求39所述的方法,其中该病毒科是黄病毒科。
41.如权利要求40所述的方法,其中该黄病毒科病毒选自由以下组成的组:HCV、西尼罗病毒和登革热病毒。
42.如权利要求39所述的方法,其中该病毒科是冠状病毒科。
43.如权利要求42所述的方法,其中该冠状病毒科病毒是MERS、SARS或hCoV-NL63。
44.如权利要求39所述的方法,其中该病毒科是嗜肝DNA病毒科。
45.如权利要求44所述的方法,其中该嗜肝DNA病毒科病毒是HBV。
46.一种RNA分子,其包含:
a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;以及
b)表达如权利要求1-36中任一项所述的重组多肽的第二核糖核苷酸序列。
47.一种治疗性组合物,其包含:
a)活病毒表达载体;以及
b)表达如权利要求1-36中任一项所述的重组多肽的多核苷酸序列。
48.如权利要求47所述的治疗性组合物,其中该表达载体是腺病毒载体或牛痘载体。
49.如权利要求48所述的治疗性组合物,其中该腺病毒载体选自由以下组成的组:Ad5、Ad26和腺相关病毒(AAV)。
50.如权利要求48所述的治疗性组合物,其中该牛痘载体是金丝雀痘。
51.一种表达系统,其包含编码如权利要求1-36中任一项所述的重组多肽的多核苷酸序列。
52.一种用于治疗SARS-CoV-2感染的重组多肽,该重组多肽包含与SEQ ID NO:31、37或45所示的序列具有至少95%序列同一性的氨基酸序列。
53.一种编码如权利要求52所述的重组多肽的多核苷酸,其中该多核苷酸与SEQ IDNO:25-30所示的序列具有至少95%序列同一性。
54.一种编码如权利要求52所述的重组多肽的多核苷酸,其中该多核苷酸与SEQ IDNO:25、28、30、34-36和38所示的序列具有至少95%序列同一性。
55.一种编码如权利要求52所述的重组多肽的多核苷酸,其中该多核苷酸与SEQ IDNO:25、28、30和39-44所示的序列具有至少95%序列同一性。
56.一种用于治疗SARS-CoV-2感染的重组多肽,该重组多肽包含SEQ ID NO:31、37或45所示的氨基酸序列。
57.一种编码如权利要求56所述的重组多肽的多核苷酸,其中该多核苷酸包含SEQ IDNO:25-30。
58.一种编码如权利要求56所述的重组多肽的多核苷酸,其中该多核苷酸包含SEQ IDNO:25、28、30、34-36和38。
59.一种编码如权利要求56所述的重组多肽的多核苷酸,其中该多核苷酸包含SEQ IDNO:25、28、30和39-44。
60.一种药物组合物,其包含如权利要求52-59中任一项所述的重组多肽。
61.一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向该受试者施用治疗或预防有效量的如权利要求60所述的药物组合物。
62.如权利要求61所述的方法,其中该病毒感染是冠状病毒科的结果。
63.如权利要求62所述的方法,其中该冠状病毒科病毒是严重急性呼吸综合征(SARS)病毒或人冠状病毒(hCoV)-NL63。
64.如权利要求63所述的方法,其中该严重急性呼吸综合征(SARS)病毒是SARS-CoV或SARS-CoV-2。
65.如权利要求61所述的方法,其中该药物组合物通过呼吸途径或静脉内施用。
66.如权利要求65所述的方法,其中通过呼吸途径施用包括使用针对下呼吸道的吸入器,或使用针对上呼吸道的鼻内喷雾器。
67.如权利要求61所述的方法,其进一步包括施用肝素以治疗SARS-CoV、SARS-CoV-2或人冠状病毒(hCoV)-NL63感染。
68.如权利要求67所述的方法,其中该肝素预防SARS-CoV、SARS-CoV-2或人冠状病毒(hCoV)-NL63病毒进入宿主细胞。
69.一种重组多肽,其包含:
a)Ig Fc片段;
b)第一病毒受体,其中该受体是ACE2或其片段;以及
c)第二病毒受体。
70.如权利要求69所述的重组多肽,其中该第二病毒受体选自由以下组成的组:HSPG、CD147、唾液酸和SRB1。
71.如权利要求70所述的重组多肽,其中该第二病毒受体是HSPG。
72.如权利要求70所述的重组多肽,其中该第二病毒受体是CD147。
73.如权利要求70所述的重组多肽,其中该第二病毒受体是唾液酸。
74.如权利要求70所述的重组多肽,其中该第二病毒受体是SRB1。
75.如权利要求69-74中任一项所述的重组多肽,用于治疗SARS-CoV、SARS-CoV-2或人冠状病毒(hCoV)-NL63。
76.一种药物组合物,其包含如权利要求69-75中任一项所述的重组多肽。
77.一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向该受试者施用治疗或预防有效量的如权利要求76所述的药物组合物。
78.一种RNA分子,其包含:
a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;以及
b)表达如权利要求69-75中任一项所述的重组多肽的第二核糖核苷酸序列。
79.一种治疗性组合物,其包含:
a)活病毒表达载体;以及
b)表达如权利要求69-75中任一项所述的重组多肽的多核苷酸序列。
80.一种重组多肽,其包含:
a)Ig Fc片段;
b)病毒受体或其片段;以及
c)链霉亲和素。
81.如权利要求80所述的重组多肽,其中该病毒受体选自由以下组成的组:HSPG、CD81、SRB1、CD26、ACE2、CD147、唾液酸、DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、NPC1和NTCP。
82.如权利要求81所述的重组多肽,其中该病毒受体是ACE2。
83.如权利要求80-82中任一项所述的重组多肽,用于治疗SARS-CoV、SARS-CoV-2或人冠状病毒(hCoV)-NL63。
84.一种药物组合物,其包含如权利要求80-83中任一项所述的重组多肽。
85.一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向该受试者施用治疗或预防有效量的如权利要求84所述的药物组合物。
86.一种RNA分子,其包含:
a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;以及
b)表达如权利要求80-83中任一项所述的重组多肽的第二核糖核苷酸序列。
87.一种治疗性组合物,其包含:
a)活病毒表达载体;以及
b)表达如权利要求80-83中任一项所述的重组多肽的多核苷酸序列。
88.一种重组多肽,其包含:
a)Ig Fc片段;
b)第一病毒受体,和
c)第二病毒受体。
89.如权利要求88所述的重组多肽,其中该第一病毒受体选自由以下组成的组:DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、TIM-1和NPC1。
90.如权利要求89所述的重组多肽,其中该第二病毒受体选自由以下组成的组:DC-SIGN(CD209)、AXL、Tyro3、TIM-1、PtdSer R(CD300a)、TIM-1和NPC1。
91.如权利要求90所述的重组多肽,用于治疗寨卡病毒。
92.如权利要求90所述的重组多肽,用于治疗埃博拉病毒。
93.一种药物组合物,其包含如权利要求88-92中任一项所述的重组多肽。
94.一种在有需要的受试者中预防或治疗病毒感染的方法,该方法包括向该受试者施用治疗或预防有效量的如权利要求93所述的药物组合物。
95.一种RNA分子,其包含:
a)具有5'-帽或表达内部核糖体进入位点(IRES)的第一核糖核苷酸序列;以及
b)表达如权利要求88-92中任一项所述的重组多肽的第二核糖核苷酸序列。
96.一种治疗性组合物,其包含:
a)活病毒表达载体;以及
b)表达如权利要求88-92中任一项所述的重组多肽的多核苷酸序列。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062965033P | 2020-01-23 | 2020-01-23 | |
US62/965,033 | 2020-01-23 | ||
US202063050473P | 2020-07-10 | 2020-07-10 | |
US63/050,473 | 2020-07-10 | ||
PCT/US2021/014818 WO2021151043A2 (en) | 2020-01-23 | 2021-01-23 | Methods and compositions for treating and preventing viral infection |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115943154A true CN115943154A (zh) | 2023-04-07 |
Family
ID=76991836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180010808.6A Pending CN115943154A (zh) | 2020-01-23 | 2021-01-23 | 用于治疗和预防病毒感染的方法和组合物 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20240002452A1 (zh) |
EP (1) | EP4093758A4 (zh) |
JP (1) | JP2023511125A (zh) |
KR (1) | KR20220136369A (zh) |
CN (1) | CN115943154A (zh) |
AU (1) | AU2021210993A1 (zh) |
BR (1) | BR112022014552A2 (zh) |
CA (1) | CA3165586A1 (zh) |
WO (1) | WO2021151043A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114989269A (zh) * | 2022-06-30 | 2022-09-02 | 天康制药(苏州)有限公司 | 一种牛赤羽免疫原性抗原及疫苗 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11518788B2 (en) | 2020-07-10 | 2022-12-06 | Avirus, Inc. | Methods and compositions for treating and preventing viral infection |
EP4147702A1 (en) * | 2021-09-13 | 2023-03-15 | Medizinische Universität Graz | Novel combination of heparin and ace2 decoys for the treatment of covid-19 |
CN118510893A (zh) * | 2021-11-11 | 2024-08-16 | 麦克法兰布奈特医疗研究与公共健康研究所有限公司 | 包括细胞进入受体和Fc区组分的抗病毒剂 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6297048B1 (en) * | 1992-02-04 | 2001-10-02 | Chiron Corporation | Hepatitis therapeutics |
US6511832B1 (en) * | 1999-10-06 | 2003-01-28 | Texas A&M University System | In vitro synthesis of capped and polyadenylated mRNAs using baculovirus RNA polymerase |
US7671018B2 (en) * | 2000-08-30 | 2010-03-02 | University Of Delaware | Delivery system for heparin-binding growth factors |
US10443049B2 (en) * | 2017-01-24 | 2019-10-15 | Northwestern University | Active low molecular weight variants of angiotensin converting enzyme 2 (ACE2) |
US11518788B2 (en) * | 2020-07-10 | 2022-12-06 | Avirus, Inc. | Methods and compositions for treating and preventing viral infection |
-
2021
- 2021-01-23 CN CN202180010808.6A patent/CN115943154A/zh active Pending
- 2021-01-23 EP EP21744864.6A patent/EP4093758A4/en active Pending
- 2021-01-23 CA CA3165586A patent/CA3165586A1/en active Pending
- 2021-01-23 WO PCT/US2021/014818 patent/WO2021151043A2/en active Application Filing
- 2021-01-23 JP JP2022544076A patent/JP2023511125A/ja active Pending
- 2021-01-23 KR KR1020227027998A patent/KR20220136369A/ko unknown
- 2021-01-23 AU AU2021210993A patent/AU2021210993A1/en active Pending
- 2021-01-23 BR BR112022014552A patent/BR112022014552A2/pt unknown
-
2022
- 2022-10-17 US US18/047,150 patent/US20240002452A1/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114989269A (zh) * | 2022-06-30 | 2022-09-02 | 天康制药(苏州)有限公司 | 一种牛赤羽免疫原性抗原及疫苗 |
CN114989269B (zh) * | 2022-06-30 | 2023-09-19 | 天康制药股份有限公司 | 一种牛赤羽免疫原性抗原及疫苗 |
Also Published As
Publication number | Publication date |
---|---|
US20240002452A1 (en) | 2024-01-04 |
AU2021210993A1 (en) | 2022-08-18 |
WO2021151043A2 (en) | 2021-07-29 |
CA3165586A1 (en) | 2021-07-29 |
WO2021151043A3 (en) | 2021-09-10 |
BR112022014552A2 (pt) | 2022-10-25 |
EP4093758A4 (en) | 2024-02-14 |
EP4093758A2 (en) | 2022-11-30 |
KR20220136369A (ko) | 2022-10-07 |
JP2023511125A (ja) | 2023-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020202119B2 (en) | Treatment of CD47+ disease cells with SIRP Alpha-Fc fusions | |
CN115943154A (zh) | 用于治疗和预防病毒感染的方法和组合物 | |
CN111793129B (zh) | 一种特异性结合冠状病毒的抗体或其抗原结合片段 | |
RU2732236C2 (ru) | Клетка | |
CN106928371B (zh) | 具有补体调节活性的重组补体因子h-免疫球蛋白融合蛋白及其制备方法与应用 | |
AU2014236451B2 (en) | Apelin fusion proteins and uses thereof | |
EP2016100B1 (en) | Hcv coreceptor and methods of use thereof | |
AU2001241100C1 (en) | Polypeptide inducing apoptosis | |
CN105111314B (zh) | 一种新型融合蛋白、药物组合物及其制备方法和用途 | |
TW200819463A (en) | Wnt antagonists and their use in the diagnosis and treatment of Wnt-mediated disorders | |
CN110746505B (zh) | 特异性结合间皮素的单克隆抗体及嵌合抗原受体 | |
US7825085B2 (en) | Fragments of NKp44 and NKp46 for targeting viral-infected and tumor cells | |
CN112912401A (zh) | 抗-l1细胞粘附分子抗体或其抗原结合片段及包含其的嵌合抗原受体 | |
KR20230060501A (ko) | 바이러스 치료제에서 다방성 생체이동을 위한 재료 및 방법 | |
US11518788B2 (en) | Methods and compositions for treating and preventing viral infection | |
CN111848816A (zh) | 融合蛋白及其用途 | |
CN116710120A (zh) | 重组ace2-fc融合分子及其制备和使用方法 | |
CN113271972A (zh) | 用于替代IVIG的多聚体杂交Fc蛋白 | |
CN110746508A (zh) | 特异性结合间皮素的单克隆抗体及嵌合抗原受体 | |
CN113480614B (zh) | 一类靶向pd-l1的超高亲和力小蛋白及用途 | |
CN115667506A (zh) | 重组ace2-fc融合分子及其制备和使用方法 | |
CN116917336A (zh) | 用于治疗病毒感染的方法和组合物 | |
CN114286863A (zh) | 一种双特异性嵌合抗原受体 | |
KR20230061710A (ko) | Cadm1을 인식하는 재조합 단백질 및 이를 유효성분으로 포함하는 암의 치료용 약학적 조성물 | |
CHERSI et al. | Short synthetic peptides derived from viral proteins compete with HIV gp120 for the binding to CD4 receptors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |