RU2808564C2 - Codon-optimized nucleic acid that encodes b-domain-deleted factor viii protein and its use - Google Patents
Codon-optimized nucleic acid that encodes b-domain-deleted factor viii protein and its use Download PDFInfo
- Publication number
- RU2808564C2 RU2808564C2 RU2022111734A RU2022111734A RU2808564C2 RU 2808564 C2 RU2808564 C2 RU 2808564C2 RU 2022111734 A RU2022111734 A RU 2022111734A RU 2022111734 A RU2022111734 A RU 2022111734A RU 2808564 C2 RU2808564 C2 RU 2808564C2
- Authority
- RU
- Russia
- Prior art keywords
- leu
- ser
- fviii
- aav
- val
- Prior art date
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 114
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 109
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 109
- 108010089996 B-domain-deleted factor VIII Proteins 0.000 title description 2
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 148
- 230000014509 gene expression Effects 0.000 claims abstract description 78
- 102000004169 proteins and genes Human genes 0.000 claims description 105
- 239000013604 expression vector Substances 0.000 claims description 72
- 239000002773 nucleotide Substances 0.000 claims description 62
- 125000003729 nucleotide group Chemical group 0.000 claims description 62
- 229960000301 factor viii Drugs 0.000 claims description 22
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 21
- 239000003114 blood coagulation factor Substances 0.000 claims description 20
- 239000000203 mixture Substances 0.000 claims description 16
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 15
- 239000008194 pharmaceutical composition Substances 0.000 claims description 13
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 10
- 230000008488 polyadenylation Effects 0.000 claims description 10
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 8
- 241000702421 Dependoparvovirus Species 0.000 claims description 7
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 7
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 2
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 claims 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims 1
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims 1
- 241000649045 Adeno-associated virus 10 Species 0.000 claims 1
- 241000649046 Adeno-associated virus 11 Species 0.000 claims 1
- 241000649047 Adeno-associated virus 12 Species 0.000 claims 1
- 241000300529 Adeno-associated virus 13 Species 0.000 claims 1
- 102100035426 DnaJ homolog subfamily B member 7 Human genes 0.000 claims 1
- 101100285903 Drosophila melanogaster Hsc70-2 gene Proteins 0.000 claims 1
- 101100178718 Drosophila melanogaster Hsc70-4 gene Proteins 0.000 claims 1
- 101100178723 Drosophila melanogaster Hsc70-5 gene Proteins 0.000 claims 1
- 101000804114 Homo sapiens DnaJ homolog subfamily B member 7 Proteins 0.000 claims 1
- 101150090950 Hsc70-1 gene Proteins 0.000 claims 1
- 101100150366 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sks2 gene Proteins 0.000 claims 1
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 239000013646 rAAV2 vector Substances 0.000 claims 1
- 108010054218 Factor VIII Proteins 0.000 abstract description 45
- 208000009292 Hemophilia A Diseases 0.000 abstract description 41
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 abstract description 33
- 102000001690 Factor VIII Human genes 0.000 abstract description 32
- 102100026735 Coagulation factor VIII Human genes 0.000 abstract description 30
- 201000003542 Factor VIII deficiency Diseases 0.000 abstract description 30
- 230000000694 effects Effects 0.000 abstract description 24
- 238000004519 manufacturing process Methods 0.000 abstract description 16
- 238000001415 gene therapy Methods 0.000 abstract description 15
- 239000000126 substance Substances 0.000 abstract description 5
- 229940126601 medicinal product Drugs 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 111
- 108020004414 DNA Proteins 0.000 description 37
- 239000013598 vector Substances 0.000 description 35
- 239000003814 drug Substances 0.000 description 24
- 229940079593 drug Drugs 0.000 description 23
- 108020004705 Codon Proteins 0.000 description 17
- 239000013612 plasmid Substances 0.000 description 16
- 239000000243 solution Substances 0.000 description 16
- 238000001890 transfection Methods 0.000 description 16
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 15
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 15
- 229940019700 blood coagulation factors Drugs 0.000 description 13
- 108090000765 processed proteins & peptides Proteins 0.000 description 13
- 108091033319 polynucleotide Proteins 0.000 description 12
- 102000040430 polynucleotide Human genes 0.000 description 12
- 239000002157 polynucleotide Substances 0.000 description 12
- 208000031220 Hemophilia Diseases 0.000 description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 description 11
- 238000005457 optimization Methods 0.000 description 11
- 238000001727 in vivo Methods 0.000 description 10
- 102000004196 processed proteins & peptides Human genes 0.000 description 10
- 238000002965 ELISA Methods 0.000 description 9
- 241001465754 Metazoa Species 0.000 description 9
- 239000012531 culture fluid Substances 0.000 description 9
- 238000000338 in vitro Methods 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- 238000011282 treatment Methods 0.000 description 9
- 108700019146 Transgenes Proteins 0.000 description 8
- 238000002347 injection Methods 0.000 description 8
- 239000007924 injection Substances 0.000 description 8
- 210000004962 mammalian cell Anatomy 0.000 description 8
- 239000013642 negative control Substances 0.000 description 8
- 210000002381 plasma Anatomy 0.000 description 8
- 230000003612 virological effect Effects 0.000 description 8
- 150000001413 amino acids Chemical group 0.000 description 7
- 108010077245 asparaginyl-proline Proteins 0.000 description 7
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 7
- 230000001580 bacterial effect Effects 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 238000010361 transduction Methods 0.000 description 7
- 230000026683 transduction Effects 0.000 description 7
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 6
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 6
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 description 6
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 108010056582 methionylglutamic acid Proteins 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 108010051242 phenylalanylserine Proteins 0.000 description 6
- 230000010076 replication Effects 0.000 description 6
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 5
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 5
- 108010079364 N-glycylalanine Proteins 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 238000001990 intravenous administration Methods 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 108010044292 tryptophyltyrosine Proteins 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 4
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 4
- 108010014173 Factor X Proteins 0.000 description 4
- 208000032843 Hemorrhage Diseases 0.000 description 4
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 4
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 4
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 4
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 4
- UIJVKVHLCQSPOJ-XIRDDKMYSA-N Lys-Ser-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O UIJVKVHLCQSPOJ-XIRDDKMYSA-N 0.000 description 4
- 241000699670 Mus sp. Species 0.000 description 4
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 4
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 4
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 4
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 4
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 208000034158 bleeding Diseases 0.000 description 4
- 230000000740 bleeding effect Effects 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 229940105778 coagulation factor viii Drugs 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 210000002889 endothelial cell Anatomy 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 108010040030 histidinoalanine Proteins 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 4
- 108010004914 prolylarginine Proteins 0.000 description 4
- 238000003259 recombinant expression Methods 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 241000701161 unidentified adenovirus Species 0.000 description 4
- 108010027345 wheylin-1 peptide Proteins 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 3
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 3
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 3
- 241000701022 Cytomegalovirus Species 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 3
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 3
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 3
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 3
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- VNRTXOUAOUZCFW-WDSOQIARSA-N Trp-Val-His Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O VNRTXOUAOUZCFW-WDSOQIARSA-N 0.000 description 3
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 3
- 239000013543 active substance Substances 0.000 description 3
- 230000001464 adherent effect Effects 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 230000023555 blood coagulation Effects 0.000 description 3
- 238000011088 calibration curve Methods 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 3
- 208000002085 hemarthrosis Diseases 0.000 description 3
- 102000057593 human F8 Human genes 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004952 protein activity Effects 0.000 description 3
- 238000009256 replacement therapy Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 108010078580 tyrosylleucine Proteins 0.000 description 3
- SADYNMDJGAWAEW-JKQORVJESA-N (2s)-2-[[(2s)-3-carboxy-2-[[(2s)-2-[[(2s)-2,6-diaminohexanoyl]amino]-3-methylbutanoyl]amino]propanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN SADYNMDJGAWAEW-JKQORVJESA-N 0.000 description 2
- WYPUMLRSQMKIJU-BPNCWPANSA-N Ala-Arg-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WYPUMLRSQMKIJU-BPNCWPANSA-N 0.000 description 2
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 2
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 2
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 2
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 2
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 2
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 2
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 2
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 2
- DEAGTWNKODHUIY-MRFFXTKBSA-N Ala-Tyr-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DEAGTWNKODHUIY-MRFFXTKBSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- OLDOLPWZEMHNIA-PJODQICGSA-N Arg-Ala-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OLDOLPWZEMHNIA-PJODQICGSA-N 0.000 description 2
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 2
- NUBPTCMEOCKWDO-DCAQKATOSA-N Arg-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N NUBPTCMEOCKWDO-DCAQKATOSA-N 0.000 description 2
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 2
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 2
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 2
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 2
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 2
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 2
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 2
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 2
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 2
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 2
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 2
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 2
- FBXMCPLCVYUWBO-BPUTZDHNSA-N Arg-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N FBXMCPLCVYUWBO-BPUTZDHNSA-N 0.000 description 2
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- CNBIWSCSSCAINS-UFYCRDLUSA-N Arg-Tyr-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNBIWSCSSCAINS-UFYCRDLUSA-N 0.000 description 2
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 2
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 2
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 2
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 2
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 2
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 2
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 2
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 2
- JQBCANGGAVVERB-CFMVVWHZSA-N Asn-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N JQBCANGGAVVERB-CFMVVWHZSA-N 0.000 description 2
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 2
- HMUKKNAMNSXDBB-CIUDSAMLSA-N Asn-Met-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMUKKNAMNSXDBB-CIUDSAMLSA-N 0.000 description 2
- KYQJHBWHRASMKG-ZLUOBGJFSA-N Asn-Ser-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O KYQJHBWHRASMKG-ZLUOBGJFSA-N 0.000 description 2
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 2
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 2
- KIJLEFNHWSXHRU-NUMRIWBASA-N Asp-Gln-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KIJLEFNHWSXHRU-NUMRIWBASA-N 0.000 description 2
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 2
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 2
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 2
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 2
- FIAKNCXQFFKSSI-ZLUOBGJFSA-N Asp-Ser-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O FIAKNCXQFFKSSI-ZLUOBGJFSA-N 0.000 description 2
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 2
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 2
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 2
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 2
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 2
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 238000011740 C57BL/6 mouse Methods 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- DCXGXDGGXVZVMY-GHCJXIJMSA-N Cys-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CS DCXGXDGGXVZVMY-GHCJXIJMSA-N 0.000 description 2
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 2
- VNXXMHTZQGGDSG-CIUDSAMLSA-N Cys-His-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O VNXXMHTZQGGDSG-CIUDSAMLSA-N 0.000 description 2
- OZHXXYOHPLLLMI-CIUDSAMLSA-N Cys-Lys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OZHXXYOHPLLLMI-CIUDSAMLSA-N 0.000 description 2
- CHRCKSPMGYDLIA-SRVKXCTJSA-N Cys-Phe-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O CHRCKSPMGYDLIA-SRVKXCTJSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 2
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 2
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 2
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 2
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 2
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 2
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 2
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 2
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 2
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 2
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 2
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 2
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 2
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 2
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 2
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 2
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 2
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 2
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 2
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 2
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 2
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 2
- LPHGXOWFAXFCPX-KKUMJFAQSA-N Glu-Pro-Phe Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O LPHGXOWFAXFCPX-KKUMJFAQSA-N 0.000 description 2
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 2
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 2
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 2
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 2
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 2
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 2
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 2
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- YYQGVXNKAXUTJU-YUMQZZPRSA-N Gly-Cys-His Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O YYQGVXNKAXUTJU-YUMQZZPRSA-N 0.000 description 2
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 2
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 2
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 2
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- 206010018852 Haematoma Diseases 0.000 description 2
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 2
- PGTISAJTWZPFGN-PEXQALLHSA-N His-Gly-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O PGTISAJTWZPFGN-PEXQALLHSA-N 0.000 description 2
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 2
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 2
- BPOHQCZZSFBSON-KKUMJFAQSA-N His-Leu-His Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BPOHQCZZSFBSON-KKUMJFAQSA-N 0.000 description 2
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 2
- DPQIPEAHIYMUEJ-IHRRRGAJSA-N His-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N DPQIPEAHIYMUEJ-IHRRRGAJSA-N 0.000 description 2
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 2
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 2
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 2
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 2
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 2
- JMSONHOUHFDOJH-GUBZILKMSA-N His-Ser-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 JMSONHOUHFDOJH-GUBZILKMSA-N 0.000 description 2
- FBVHRDXSCYELMI-PBCZWWQYSA-N His-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O FBVHRDXSCYELMI-PBCZWWQYSA-N 0.000 description 2
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 2
- ZGGWRNBSBOHIGH-HVTMNAMFSA-N Ile-Gln-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZGGWRNBSBOHIGH-HVTMNAMFSA-N 0.000 description 2
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 2
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 2
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 2
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 2
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 2
- XMYURPUVJSKTMC-KBIXCLLPSA-N Ile-Ser-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XMYURPUVJSKTMC-KBIXCLLPSA-N 0.000 description 2
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 2
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 2
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 2
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 2
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 2
- HMDDEJADNKQTBR-BZSNNMDCSA-N Leu-His-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMDDEJADNKQTBR-BZSNNMDCSA-N 0.000 description 2
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 2
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 2
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 2
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 2
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 2
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 2
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 2
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 2
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 2
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 2
- SQJSXOQXJYAVRV-SRVKXCTJSA-N Lys-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N SQJSXOQXJYAVRV-SRVKXCTJSA-N 0.000 description 2
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 2
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 2
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 2
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 2
- OEYKVQKYCHATHO-SZMVWBNQSA-N Lys-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N OEYKVQKYCHATHO-SZMVWBNQSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 2
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 2
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 2
- AWOMRHGUWFBDNU-ZPFDUUQYSA-N Met-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N AWOMRHGUWFBDNU-ZPFDUUQYSA-N 0.000 description 2
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 2
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 2
- SXWQMBGNFXAGAT-FJXKBIBVSA-N Met-Gly-Thr Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SXWQMBGNFXAGAT-FJXKBIBVSA-N 0.000 description 2
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 2
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 2
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 2
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 2
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 2
- PNHRPOWKRRJATF-IHRRRGAJSA-N Met-Tyr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 PNHRPOWKRRJATF-IHRRRGAJSA-N 0.000 description 2
- MUDYEFAKNSTFAI-JYJNAYRXSA-N Met-Tyr-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O MUDYEFAKNSTFAI-JYJNAYRXSA-N 0.000 description 2
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 2
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 2
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 2
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 2
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 2
- TXKWKTWYTIAZSV-KKUMJFAQSA-N Phe-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N TXKWKTWYTIAZSV-KKUMJFAQSA-N 0.000 description 2
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 2
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 2
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 2
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 2
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 2
- FQUUYTNBMIBOHS-IHRRRGAJSA-N Phe-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FQUUYTNBMIBOHS-IHRRRGAJSA-N 0.000 description 2
- ROOQMPCUFLDOSB-FHWLQOOXSA-N Phe-Phe-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=CC=C1 ROOQMPCUFLDOSB-FHWLQOOXSA-N 0.000 description 2
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 2
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 2
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 2
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 2
- YRHRGNUAXGUPTO-PMVMPFDFSA-N Phe-Trp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O)N YRHRGNUAXGUPTO-PMVMPFDFSA-N 0.000 description 2
- FCCBQBZXIAZNIG-LSJOCFKGSA-N Pro-Ala-His Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O FCCBQBZXIAZNIG-LSJOCFKGSA-N 0.000 description 2
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 2
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 2
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 2
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 2
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 2
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 2
- PUQRDHNIOONJJN-AVGNSLFASA-N Pro-Lys-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PUQRDHNIOONJJN-AVGNSLFASA-N 0.000 description 2
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 2
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 2
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 2
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 2
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 2
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 2
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 2
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 2
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 2
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 2
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 2
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 2
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 2
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 2
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 2
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 2
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 2
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 2
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 2
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 2
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 2
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 2
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 2
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 2
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- 101710172711 Structural protein Proteins 0.000 description 2
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 2
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 2
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 2
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 2
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 2
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 2
- LOHBIDZYHQQTDM-IXOXFDKPSA-N Thr-Cys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LOHBIDZYHQQTDM-IXOXFDKPSA-N 0.000 description 2
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 2
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 2
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 2
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 2
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 2
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 2
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 2
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 2
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- JLTQXEOXIJMCLZ-ZVZYQTTQSA-N Trp-Gln-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 JLTQXEOXIJMCLZ-ZVZYQTTQSA-N 0.000 description 2
- YVXIAOOYAKBAAI-SZMVWBNQSA-N Trp-Leu-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 YVXIAOOYAKBAAI-SZMVWBNQSA-N 0.000 description 2
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 2
- RERRMBXDSFMBQE-ZFWWWQNUSA-N Trp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERRMBXDSFMBQE-ZFWWWQNUSA-N 0.000 description 2
- HTGJDTPQYFMKNC-VFAJRCTISA-N Trp-Thr-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 HTGJDTPQYFMKNC-VFAJRCTISA-N 0.000 description 2
- STKZKWFOKOCSLW-UMPQAUOISA-N Trp-Thr-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 STKZKWFOKOCSLW-UMPQAUOISA-N 0.000 description 2
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 2
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 2
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 2
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 2
- PJWCWGXAVIVXQC-STECZYCISA-N Tyr-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PJWCWGXAVIVXQC-STECZYCISA-N 0.000 description 2
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 2
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 2
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 2
- FASACHWGQBNSRO-ZEWNOJEFSA-N Tyr-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FASACHWGQBNSRO-ZEWNOJEFSA-N 0.000 description 2
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 2
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 2
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 2
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 2
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 2
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 2
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 2
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 2
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 2
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 2
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 2
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 2
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 2
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 2
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 2
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 2
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 239000000853 adhesive Substances 0.000 description 2
- 230000001070 adhesive effect Effects 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 230000001857 anti-mycotic effect Effects 0.000 description 2
- 239000002543 antimycotic Substances 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 239000013024 dilution buffer Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000001647 drug administration Methods 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 210000002919 epithelial cell Anatomy 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 238000011194 good manufacturing practice Methods 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 230000000415 inactivating effect Effects 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000010253 intravenous injection Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 2
- 108010072591 lysyl-leucyl-alanyl-arginine Proteins 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010075702 lysyl-valyl-aspartyl-leucine Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 108010073101 phenylalanylleucine Proteins 0.000 description 2
- 150000003904 phospholipids Chemical class 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 210000004872 soft tissue Anatomy 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108010029384 tryptophyl-histidine Proteins 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- VIINVRPKMUZYOI-DCAQKATOSA-N Arg-Met-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIINVRPKMUZYOI-DCAQKATOSA-N 0.000 description 1
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 1
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 1
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- VJIQPOJMISSUPO-BVSLBCMMSA-N Arg-Trp-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VJIQPOJMISSUPO-BVSLBCMMSA-N 0.000 description 1
- 208000036487 Arthropathies Diseases 0.000 description 1
- NTXNUXPCNRDMAF-WFBYXXMGSA-N Asn-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC(N)=O)C)C(O)=O)=CNC2=C1 NTXNUXPCNRDMAF-WFBYXXMGSA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- QIRJQYQOIKBPBZ-IHRRRGAJSA-N Asn-Tyr-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QIRJQYQOIKBPBZ-IHRRRGAJSA-N 0.000 description 1
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- RQYMKRMRZWJGHC-BQBZGAKWSA-N Asp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N RQYMKRMRZWJGHC-BQBZGAKWSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- YQKYLDVPCOGIRB-SEKJGCFDSA-N Asp-Leu-Thr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YQKYLDVPCOGIRB-SEKJGCFDSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 1
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 206010008111 Cerebral haemorrhage Diseases 0.000 description 1
- 241000867607 Chlorocebus sabaeus Species 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 102100029117 Coagulation factor X Human genes 0.000 description 1
- 208000029767 Congenital, Hereditary, and Neonatal Diseases and Abnormalities Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- SZQCDCKIGWQAQN-FXQIFTODSA-N Cys-Arg-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O SZQCDCKIGWQAQN-FXQIFTODSA-N 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 108010000437 Deamino Arginine Vasopressin Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 239000006145 Eagle's minimal essential medium Substances 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010048049 Factor IXa Proteins 0.000 description 1
- 102000009123 Fibrin Human genes 0.000 description 1
- 108010073385 Fibrin Proteins 0.000 description 1
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 1
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- GFLNKSQHOBOMNM-AVGNSLFASA-N Gln-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GFLNKSQHOBOMNM-AVGNSLFASA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- ILKYYKRAULNYMS-JYJNAYRXSA-N Gln-Lys-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ILKYYKRAULNYMS-JYJNAYRXSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- XXGQRGQPGFYECI-WDSKDSINSA-N Gly-Cys-Glu Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(O)=O XXGQRGQPGFYECI-WDSKDSINSA-N 0.000 description 1
- LJXWZPHEMJSNRC-KBPBESRZSA-N Gly-Gln-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LJXWZPHEMJSNRC-KBPBESRZSA-N 0.000 description 1
- ZKLYPEGLWFVRGF-IUCAKERBSA-N Gly-His-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZKLYPEGLWFVRGF-IUCAKERBSA-N 0.000 description 1
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 206010062713 Haemorrhagic diathesis Diseases 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 1
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 1
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 1
- JATYGDHMDRAISQ-KKUMJFAQSA-N His-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O JATYGDHMDRAISQ-KKUMJFAQSA-N 0.000 description 1
- KDDKJKKQODQQBR-NHCYSSNCSA-N His-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KDDKJKKQODQQBR-NHCYSSNCSA-N 0.000 description 1
- 108700039609 IRW peptide Proteins 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- SNHYFFQZRFIRHO-CYDGBPFRSA-N Ile-Met-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N SNHYFFQZRFIRHO-CYDGBPFRSA-N 0.000 description 1
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- BLFXHAFTNYZEQE-VKOGCVSHSA-N Ile-Trp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BLFXHAFTNYZEQE-VKOGCVSHSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 206010023201 Joint contracture Diseases 0.000 description 1
- 208000012659 Joint disease Diseases 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- 244000207740 Lemna minor Species 0.000 description 1
- 235000006439 Lemna minor Nutrition 0.000 description 1
- GPXFZVUVPCFTMG-AVGNSLFASA-N Leu-Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C GPXFZVUVPCFTMG-AVGNSLFASA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- NJMXCOOEFLMZSR-AVGNSLFASA-N Leu-Met-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NJMXCOOEFLMZSR-AVGNSLFASA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 1
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 1
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 1
- WAAZECNCPVGPIV-RHYQMDGZSA-N Lys-Thr-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O WAAZECNCPVGPIV-RHYQMDGZSA-N 0.000 description 1
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 1
- 206010026865 Mass Diseases 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 1
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 1
- JACMWNXOOUYXCD-JYJNAYRXSA-N Met-Val-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JACMWNXOOUYXCD-JYJNAYRXSA-N 0.000 description 1
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- RUPXJRIDSUCQAN-PQNNUJSWSA-N N-[1,3-bis[3-[3-[5-[(2R,3R,4R,5R,6R)-3-acetamido-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxypentanoylamino]propylamino]-3-oxopropoxy]-2-[[3-[3-[5-[(2R,3R,4R,5R,6R)-3-acetamido-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxypentanoylamino]propylamino]-3-oxopropoxy]methyl]propan-2-yl]-12-[(2R,4R)-4-hydroxy-2-methylpyrrolidin-1-yl]-12-oxododecanamide Chemical compound C[C@@H]1C[C@@H](O)CN1C(=O)CCCCCCCCCCC(=O)NC(COCCC(=O)NCCCNC(=O)CCCCO[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1NC(C)=O)(COCCC(=O)NCCCNC(=O)CCCCO[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1NC(C)=O)COCCC(=O)NCCCNC(=O)CCCCO[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1NC(C)=O RUPXJRIDSUCQAN-PQNNUJSWSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 241000208125 Nicotiana Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- WGXOKDLDIWSOCV-MELADBBJSA-N Phe-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O WGXOKDLDIWSOCV-MELADBBJSA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 1
- WYPVCIACUMJRIB-JYJNAYRXSA-N Phe-Gln-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N WYPVCIACUMJRIB-JYJNAYRXSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- 241001505332 Polyomavirus sp. Species 0.000 description 1
- 235000001855 Portulaca oleracea Nutrition 0.000 description 1
- 206010051077 Post procedural haemorrhage Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- OLHDPZMYUSBGDE-GUBZILKMSA-N Pro-Arg-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O OLHDPZMYUSBGDE-GUBZILKMSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- VWXGFAIZUQBBBG-UWVGGRQHSA-N Pro-His-Gly Chemical compound C([C@@H](C(=O)NCC(=O)[O-])NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 VWXGFAIZUQBBBG-UWVGGRQHSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 206010038980 Retroperitoneal haemorrhage Diseases 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- UQGAAZXSCGWMFU-UBHSHLNASA-N Ser-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N UQGAAZXSCGWMFU-UBHSHLNASA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- 208000026552 Severe hemophilia A Diseases 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- JNKAYADBODLPMQ-HSHDSVGOSA-N Thr-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)=CNC2=C1 JNKAYADBODLPMQ-HSHDSVGOSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- NIWAGRRZHCMPOY-GMVOTWDCSA-N Trp-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NIWAGRRZHCMPOY-GMVOTWDCSA-N 0.000 description 1
- VIWQOOBRKCGSDK-RYQLBKOJSA-N Trp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O VIWQOOBRKCGSDK-RYQLBKOJSA-N 0.000 description 1
- ICNFHVUVCNWUAB-SZMVWBNQSA-N Trp-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ICNFHVUVCNWUAB-SZMVWBNQSA-N 0.000 description 1
- OFCKFBGRYHOKFP-IHPCNDPISA-N Trp-Asp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N OFCKFBGRYHOKFP-IHPCNDPISA-N 0.000 description 1
- GEGYPBOPIGNZIF-CWRNSKLLSA-N Trp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O GEGYPBOPIGNZIF-CWRNSKLLSA-N 0.000 description 1
- GLNADSQYFUSGOU-GPTZEZBUSA-J Trypan blue Chemical compound [Na+].[Na+].[Na+].[Na+].C1=C(S([O-])(=O)=O)C=C2C=C(S([O-])(=O)=O)C(/N=N/C3=CC=C(C=C3C)C=3C=C(C(=CC=3)\N=N\C=3C(=CC4=CC(=CC(N)=C4C=3O)S([O-])(=O)=O)S([O-])(=O)=O)C)=C(O)C2=C1N GLNADSQYFUSGOU-GPTZEZBUSA-J 0.000 description 1
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- PGEFRHBWGOJPJT-KKUMJFAQSA-N Tyr-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O PGEFRHBWGOJPJT-KKUMJFAQSA-N 0.000 description 1
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 1
- ULUXAIYMVXLDQP-PMVMPFDFSA-N Tyr-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CC4=CC=C(C=C4)O)N ULUXAIYMVXLDQP-PMVMPFDFSA-N 0.000 description 1
- JQOMHZMWQHXALX-FHWLQOOXSA-N Tyr-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JQOMHZMWQHXALX-FHWLQOOXSA-N 0.000 description 1
- IWZYXFRGWKEKBJ-GVXVVHGQSA-N Val-Gln-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IWZYXFRGWKEKBJ-GVXVVHGQSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 1
- LMVWCLDJNSBOEA-FKBYEOEOSA-N Val-Tyr-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N LMVWCLDJNSBOEA-FKBYEOEOSA-N 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 239000003686 blood clotting factor concentrate Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- YYRMJZQKEFZXMX-UHFFFAOYSA-L calcium bis(dihydrogenphosphate) Chemical compound [Ca+2].OP(O)([O-])=O.OP(O)([O-])=O YYRMJZQKEFZXMX-UHFFFAOYSA-L 0.000 description 1
- 229910001424 calcium ion Inorganic materials 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 108090001015 cancer procoagulant Proteins 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000013553 cell monolayer Substances 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000003593 chromogenic compound Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000013377 clone selection method Methods 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 229940105756 coagulation factor x Drugs 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229960004281 desmopressin Drugs 0.000 description 1
- NFLWUMRGJYTJIN-NXBWRCJVSA-N desmopressin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSCCC(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(N)=O)=O)CCC(=O)N)C1=CC=CC=C1 NFLWUMRGJYTJIN-NXBWRCJVSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 108010009297 diglycyl-histidine Proteins 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 229950006925 emicizumab Drugs 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 229950003499 fibrin Drugs 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229950002735 fitusiran Drugs 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 208000031169 hemorrhagic disease Diseases 0.000 description 1
- 230000023597 hemostasis Effects 0.000 description 1
- 239000002874 hemostatic agent Substances 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000002490 intestinal epithelial cell Anatomy 0.000 description 1
- 208000020658 intracerebral hemorrhage Diseases 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 238000011813 knockout mouse model Methods 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 235000019691 monocalcium phosphate Nutrition 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 230000036963 noncompetitive effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000001543 one-way ANOVA Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000000671 osmolytic effect Effects 0.000 description 1
- 239000002357 osmotic agent Substances 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 1
- 208000024335 physical disease Diseases 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 101150066583 rep gene Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 101150057323 sar gene Proteins 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000009097 single-agent therapy Methods 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 230000037436 splice-site mutation Effects 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000011272 standard treatment Methods 0.000 description 1
- 239000012089 stop solution Substances 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 230000001256 tonic effect Effects 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229940060306 valoctocogene roxaparvovec Drugs 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
Abstract
Description
Область техники, к которой относится изобретениеField of technology to which the invention relates
Настоящая заявка относится к области генетики, генной терапии и молекулярной биологии. Более конкретно, настоящее изобретение относится к кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом), экспрессионной кассете и вектору на ее основе, клетке-хозяину для получения FVIII-BDD, а также к различным применениям вышеуказанного вектора.This application relates to the fields of genetics, gene therapy and molecular biology. More specifically, the present invention relates to a codon-optimized nucleic acid that encodes the FVIII-BDD protein, an expression cassette and a vector based thereon, a host cell for producing FVIII-BDD, and various applications of the above vector.
Уровень техникиState of the art
Гемофилия - это рецессивное, Х-сцепленное, врожденное нарушение, ведущее к дефициту одного из белков, участвующих во вторичном гемостазе. Гемофилия А, или классическая гемофилия, - наиболее распространенная форма гемофилии; встречается у 1 из 5000 новорожденных мальчиков (Report on the annual global survey 2019, WFH https://www.wfh.org/en/our-work-research-data/annual-global-survey) и обусловлена дефицитом белка фактора свертывания VIII. Согласно данным Всероссийского общества гемофилии, в России насчитывается более 6,5 тыс.пациентов с гемофилией A (Report on the annual global survey 2019, WFH).Hemophilia is a recessive, X-linked, congenital disorder leading to a deficiency of one of the proteins involved in secondary hemostasis. Hemophilia A, or classical hemophilia, is the most common form of hemophilia; occurs in 1 in 5,000 newborn boys (Report on the annual global survey 2019, WFH https://www.wfh.org/en/our-work-research-data/annual-global-survey) and is caused by a deficiency of the coagulation factor VIII protein . According to the All-Russian Hemophilia Society, there are more than 6.5 thousand patients with hemophilia A in Russia (Report on the annual global survey 2019, WFH).
Фактор свертывания VIII (FVIII) - это белок размером 280 кДа, который секретируется в кровь преимущественно из синусоидальных эпителиальных клеток печени (Fahs SA, Hille МТ, Shi Q, Weiler Н, Montgomery RR. A conditional knockout mouse model reveals endothelial cells as the principal and possibly exclusive source of plasma factor VIII/ Blood. 2014 Jun 12;123(24):3706-13. doi: 10.1182/blood-2014-02-555151. Epub 2014 Apr 4. РМЮ: 24705491 и Everett LA, Cleuren AC, Khoriaty RN, Ginsburg D. Murine coagulation factor VIII is synthesized in endothelial cells/ Blood. 2014 Jun 12;123(24):3697-705. doi: 10.1182/blood-2014-02-554501. Epub 2014 Apr 9. PMTD: 24719406). Активированный FVIII циркулирует в организме в виде гетеродимера, состоящего из тяжелой (домены A1, А2, В) и легкой (домены A3, C1, С3) цепей, связанных друг с другом за счет нековалентных металл-зависимых взаимодействий. В результате процессинга FVIII в активированной форме белка присутствуют только домены А1-А3, C1, С2. Этот факт способствовал созданию рекомбинантного FVIII с удаленным В доменом (FVIII-BDD), который не уступает по своей активности полноразмерному FVIII (Pittman DD, Alderman EM, Tomkinson KN, Wang JH, Giles AR, Kaufman RJ. Biochemical, immunological, and in vivo functional characterization of B-domain-deleted factor VIII/ Blood. 1993 Jun l;81(ll):2925-35. PMID: 8499631). В отличии от других белков каскада свертывания крови, которые преимущественно относятся к протеазам, FVIII -гликопротеин. Однако он играет критичную роль в формировании теназного комплекса, который необходим для образования активированного фактора свертывания X (FXa), первого члена окончательного общего пути коагуляции, что в итоге приводит к образованию сшитого фибрина.Coagulation factor VIII (FVIII) is a 280 kDa protein that is secreted into the blood primarily from sinusoidal epithelial cells of the liver (Fahs SA, Hille MT, Shi Q, Weiler H, Montgomery RR. A conditional knockout mouse model reveals endothelial cells as the principal and possibly exclusive source of plasma factor VIII/ Blood. 2014 Jun 12;123(24):3706-13. doi: 10.1182/blood-2014-02-555151. Epub 2014 Apr 4. RMY: 24705491 and Everett LA, Cleuren AC , Khoriaty RN, Ginsburg D. Murine coagulation factor VIII is synthesized in endothelial cells/ Blood. 2014 Jun 12;123(24):3697-705. doi: 10.1182/blood-2014-02-554501. Epub 2014 Apr 9. PMTD : 24719406). Activated FVIII circulates in the body as a heterodimer consisting of heavy (domains A1, A2, B) and light (domains A3, C1, C3) chains linked to each other through non-covalent metal-dependent interactions. As a result of FVIII processing, only domains A1-A3, C1, C2 are present in the activated form of the protein. This fact contributed to the creation of recombinant FVIII with the B domain deleted (FVIII-BDD), which is not inferior in its activity to full-length FVIII (Pittman DD, Alderman EM, Tomkinson KN, Wang JH, Giles AR, Kaufman RJ. Biochemical, immunological, and in vivo functional characterization of B-domain-deleted factor VIII/ Blood. 1993 Jun l;81(ll):2925-35. PMID: 8499631). Unlike other proteins in the blood coagulation cascade, which are predominantly proteases, FVIII is a glycoprotein. However, it plays a critical role in the formation of the tenase complex, which is required for the formation of activated coagulation factor X (FXa), the first member of the final common coagulation pathway, which ultimately leads to the formation of cross-linked fibrin.
Более чем в половине случаев к тяжелой форме гемофилии А приводят инверсии в 1 или 22 интроне гена FVIII (Habart D, Kalabova D, Novotny M, Vorlova Z. Thirty-four novel mutations detected in factor VIII gene by multiplex CSGE: modeling of 13 novel amino acid substitutions/ J Thromb Haemost. 2003 Apr; 1(4):773-81. doi: 10.1046/j.1538-7836.2003.00149.x. PMID: 1287141/ В других случаях нарушения в последовательности FVIII связаны с различными мутациями, в том числе антисмысловыми мутациями, сдвигами рамки считывания, мутациями в сплайсинг-сайтах, делециями и инсерциями.In more than half of the cases, severe hemophilia A is caused by inversions in intron 1 or 22 of the FVIII gene (Habart D, Kalabova D, Novotny M, Vorlova Z. Thirty-four novel mutations detected in factor VIII gene by multiplex CSGE: modeling of 13 novel amino acid substitutions/ J Thromb Haemost. 2003 Apr; 1(4):773-81. doi: 10.1046/j.1538-7836.2003.00149.x. PMID: 1287141/ In other cases, disturbances in the FVIII sequence are associated with various mutations, including antisense mutations, frameshifts, splice site mutations, deletions and insertions.
Склонность к кровотечениям при гемофилии А взаимосвязана с определяемой активностью FVIII и классифицируется как легкая (0,05-0,40 ME / мл), умеренная (0,01-0,05 ME / мл) или тяжелая (<0,01 ME / мл). Пациенты с легкой формой гемофилии, как правило, испытывают аномальное кровотечение только в связи с оперативным вмешательством или полученными травмами. Напротив, у пациентов с умеренной формой гемофилии наблюдаются длительные реакции кровотечения на относительно незначительные травмы, а у пациентов с тяжелой формой заболевания часто возникают спонтанные кровотечения. Тяжелая форма гемофилии А проявляется спонтанными гемартрозом, гематомами мягких тканей, забрюшинными кровотечениями, внутримозговыми кровоизлияниями и отсроченными послеоперационными кровотечениями. Со временем осложнения от рецидивирующего гемартроза и гематом мягких тканей включают тяжелую артропатию, контрактуры суставов и псевдоопухоли, приводящие к хроническим заболеваниям. Доля пациентов с легкой, средней и тяжелой формами гемофилии А точно не установлена, но, согласно последним эпидемиологическим исследованиям, предполагается, что примерно 60% пациентов с гемофилией А имеют тяжелую форму (Report on the annual global survey 2019, WFH).Bleeding tendency in hemophilia A is related to detectable FVIII activity and is classified as mild (0.05-0.40 IU/ml), moderate (0.01-0.05 IU/ml) or severe (<0.01 IU/ml). ml). Patients with mild hemophilia typically experience abnormal bleeding only due to surgery or injury. In contrast, patients with moderate hemophilia experience prolonged bleeding reactions to relatively minor injuries, and patients with severe hemophilia often experience spontaneous bleeding. The severe form of hemophilia A is manifested by spontaneous hemarthrosis, soft tissue hematomas, retroperitoneal bleeding, intracerebral hemorrhage and delayed postoperative bleeding. Over time, complications from recurrent hemarthrosis and soft tissue hematomas include severe arthropathy, joint contractures, and pseudotumors leading to chronic disease. The proportion of patients with mild, moderate, and severe forms of hemophilia A is not precisely established, but recent epidemiological studies suggest that approximately 60% of patients with hemophilia A have severe form (Report on the annual global survey 2019, WFH).
На сегодняшний день стандартная схема лечения пациентов, страдающих гемофилией А, заключается в пожизненной заместительной терапии в виде инъекций рекомбинантного FVIII (Report on the annual global survey 2019, WFH). Несмотря на успех терапии гемофилии, существуют серьезные проблемы подобного подхода. Профилактическая заместительная терапия гемофилии А предполагает внутривенные инъекции рекомбинантного FVIII каждые три дня в течение всей жизни пациента с тяжелой формой заболевания. Подобный формат лечения является очень дорогостоящим и не гарантирует отсутствия осложнений, связанных в первую очередь с гемартрозом. В некоторых случаях у пациентов вырабатываются ингибирующие антитела. Ингибиторные формы гемофилии А чаще наблюдаются у пациентов с тяжелой формой заболевания и требуют применения альтернативных подходов к лечению и профилактике заболевания (Eckhardt CL, van der Bom JG, van der Naald M, Peters M, Kamphuisen PW, Fijnvandraat K. Surgery and inhibitor development in hemophilia A: a systematic review/ J Thromb Haemost. 2011 Oct; 9(10): 1948-58. doi: 10.1ll1/j. 1538-7836.2011.04467.x. PMID: 21838755).Today, the standard treatment regimen for patients suffering from hemophilia A is lifelong replacement therapy in the form of injections of recombinant FVIII (Report on the annual global survey 2019, WFH). Despite the success of hemophilia therapy, there are serious problems with this approach. Preventive replacement therapy for hemophilia A involves intravenous injections of recombinant FVIII every three days for the life of a patient with severe disease. This type of treatment is very expensive and does not guarantee the absence of complications associated primarily with hemarthrosis. In some cases, patients develop inhibitory antibodies. Inhibitory forms of hemophilia A are more often observed in patients with severe forms of the disease and require the use of alternative approaches to the treatment and prevention of the disease (Eckhardt CL, van der Bom JG, van der Naald M, Peters M, Kamphuisen PW, Fijnvandraat K. Surgery and inhibitor development in hemophilia A: a systematic review/ J Thromb Haemost. 2011 Oct; 9(10): 1948-58. doi: 10.1ll1/j. 1538-7836.2011.04467.x. PMID: 21838755).
Генная терапия гемофилии А посредством вирусных (экспрессионных) векторов на основе аденоассоциированных вирусов (AAV), кодирующих ген FVIII, показала впечатляющие результаты в серии доклинических и клинических исследований (Bunting S, Zhang L, Xie L, Bullens S, Mahimkar R, Fong S, Sandza K, Harmon D, Yates B, Handyside B, Sihn CR, Galicia N, Tsuruda L, O'Neill CA, Bagri A, Colosi P, Long S, Vehar G, Carter B. Gene Therapy with BMN 270 Results in Therapeutic Levels of FVIII in Mice and Primates and Normalization of Bleeding in Hemophilic Mice/ Mol Ther. 2018 Feb 7;26(2):496-509. doi: 10.1016/j.ymthe. 2017.12.009. Epub 2017 Dec 14.PMID: 29292164 и Peyvandi F, Garagiola I. Clinical advances in gene therapy updates on clinical trials of gene therapy in haemophilia/ Haemophilia. 2019 Sep;25(5):738-746. doi: 10.1111/hae. 13816. Epub 2019 Jul 8.PMTD: 31282050). В отличие от традиционных подходов к лечению гемофилии, генная терапия с использованием AAV позволяет поддерживать уровень экспрессии привнесенного FVIII на достаточном уровне в течение нескольких лет после однократного введения препарата пациентам (Long BR, Veron Р, Kuranda К, Hardet R, Mitchell N, Hayes GM, Wong WY, Lau K, Li M, Hock MB, Zoog SJ, Vettermann C, Mingozzi F, Schweighardt B. Early Phase Clinical Immunogenicity of Valoctocogene Roxaparvovec, an AAV5-Mediated Gene Therapy for Hemophilia А/ Mol Ther. 2021 Feb 3;29(2): 597-610. doi: 10.1016/j.ymthe.2020.12.008. Epub 2020 Dec 10. PMID: 33309883).Gene therapy for hemophilia A through adeno-associated virus (AAV)-based viral (expression) vectors encoding the FVIII gene has shown impressive results in a series of preclinical and clinical studies (Bunting S, Zhang L, Xie L, Bullens S, Mahimkar R, Fong S, Sandza K, Harmon D, Yates B, Handyside B, Sihn CR, Galicia N, Tsuruda L, O'Neill CA, Bagri A, Colosi P, Long S, Vehar G, Carter B. Gene Therapy with BMN 270 Results in Therapeutic Levels of FVIII in Mice and Primates and Normalization of Bleeding in Hemophilic Mice/ Mol Ther. 2018 Feb 7;26(2):496-509. doi: 10.1016/j.ymthe. 2017.12.009. Epub 2017 Dec 14. PMID: 29292164 and Peyvandi F, Garagiola I. Clinical advances in gene therapy updates on clinical trials of gene therapy in haemophilia/ Haemophilia. 2019 Sep;25(5):738-746. doi: 10.1111/hae. 13816. Epub 2019 Jul 8.PMTD : 31282050). In contrast to traditional approaches to the treatment of hemophilia, gene therapy using AAV allows the expression of introduced FVIII to be maintained at sufficient levels for several years after a single dose of the drug to patients (Long BR, Veron P, Kuranda K, Hardet R, Mitchell N, Hayes GM , Wong WY, Lau K, Li M, Hock MB, Zoog SJ, Vettermann C, Mingozzi F, Schweighardt B. Early Phase Clinical Immunogenicity of Valoctocogene Roxaparvovec, an AAV5-Mediated Gene Therapy for Hemophilia A/ Mol Ther. 2021 Feb 3; 29(2): 597-610. doi: 10.1016/j.ymthe.2020.12.008. Epub 2020 Dec 10. PMID: 33309883).
На данный момент, в мире нет ни одного зарегистрированного генотерапевтического препарата для лечения гемофилии А.At the moment, there is not a single registered gene therapy drug in the world for the treatment of hemophilia A.
Таким образом, является актуальным разработка генотерапевтического препарата для лечения гемофилии А, а также решений, которые позволят улучшить эффективность генотерапевтического препарата для лечения гемофилии А.Thus, it is relevant to develop a gene therapy drug for the treatment of hemophilia A, as well as solutions that will improve the effectiveness of a gene therapy drug for the treatment of hemophilia A.
Раскрытие сущности изобретенияDisclosure of the invention
Одной из насущных целей исследований в области разработки эффективной генотерапии является кодон-оптимизация генов интереса в составе векторов для получения максимального уровня продукции белка интереса, что, в свою очередь, позволит использовать для достижения значимого эффекта более низкие дозы вектора.One of the urgent goals of research in the development of effective gene therapy is codon optimization of genes of interest in vectors to obtain the maximum level of production of the protein of interest, which, in turn, will allow the use of lower doses of the vector to achieve a significant effect.
Авторы изобретения неожиданно обнаружили, что кодон-оптимизиро ванная нуклеиновая кислота, которая кодирует белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) с аминокислотной последовательностью SEQ ID NO: 11 и включает нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 2 (вариант FVIII-BDDco-v1), SEQ ID NO: 3 (вариант FVIII-BDDco-v2), SEQ ID NO: 4 (вариант FVIII-BDDco-v3) или SEQ ID NO: 5 (вариант FVIII-BDDco-v4), неожиданно приводит к увеличению уровня экспрессии гена FVIII-BDD, увеличению уровня продукции белка фактора свертывания крови VIII-BDD, а также увеличению уровня активности белка фактора свертывания крови VIII-BDD в несколько раз по сравнению с геном дикого типа, кодирующим фактор свертывания крови VIII-BDD (FVIII-BDD-wt). Данные варианты кодон-оптимизированной нуклеиновой кислоты по изобретению с нуклеотидной последовательностью, которую выбирают из группы: SEQ ID NO: 2 (вариант FVIII-BDDco-v1), SEQ ID NO: 3 (вариант FVIII-BDDco-v2), SEQ ID NO: 4 (вариант FVIII-BDDco-v3) или SEQ ID NO: 5 (вариант FVIII-BDDco-v4) входят в состав экспрессионной кассеты и вектора на ее основе.The inventors have unexpectedly discovered that a codon-optimized nucleic acid that encodes the FVIII-BDD protein with the amino acid sequence SEQ ID NO: 11 and includes a nucleotide sequence selected from the group: SEQ ID NO : 2 (variant FVIII-BDDco-v1), SEQ ID NO: 3 (variant FVIII-BDDco-v2), SEQ ID NO: 4 (variant FVIII-BDDco-v3) or SEQ ID NO: 5 (variant FVIII-BDDco- v4), unexpectedly leads to an increase in the expression level of the FVIII-BDD gene, an increase in the level of production of the blood coagulation factor VIII-BDD protein, as well as an increase in the level of activity of the blood coagulation factor VIII-BDD protein several times compared to the wild-type gene encoding the coagulation factor blood VIII-BDD (FVIII-BDD-wt). These variants of a codon-optimized nucleic acid according to the invention with a nucleotide sequence selected from the group: SEQ ID NO: 2 (option FVIII-BDDco-v1), SEQ ID NO: 3 (option FVIII-BDDco-v2), SEQ ID NO: 4 (variant FVIII-BDDco-v3) or SEQ ID NO: 5 (variant FVIII-BDDco-v4) are included in the expression cassette and the vector based on it.
Определения и общие методыDefinitions and general methods
Если иное не определено в настоящем документе, научные и технические термины, используемые в связи с настоящим изобретением, будут иметь значения, которые обычно понятны специалистам в данной области.Unless otherwise defined herein, scientific and technical terms used in connection with the present invention will have meanings that are commonly understood by those skilled in the art.
Кроме того, если по контексту не требуется иное, термины в единственном числе включают в себя термины во множественном числе, и термины во множественном числе включают в себя термины в единственном числе. Как правило, используемая классификация и методы культивирования клеток, молекулярной биологии, иммунологии, микробиологии, генетики, аналитической химии, химии органического синтеза, медицинской и фармацевтической химии, а также гибридизации и химии белка и нуклеиновых кислот, описанные в настоящем документе, хорошо известны специалистам и широко применяются в данной области. Ферментативные реакции и способы очистки осуществляют в соответствии с инструкциями производителя, как это обычно осуществляется в данной области, или как описано в настоящем документе.In addition, unless the context otherwise requires, terms in the singular include plural terms, and plural terms include singular terms. In general, the classification and methods of cell culture, molecular biology, immunology, microbiology, genetics, analytical chemistry, organic synthesis chemistry, medicinal and pharmaceutical chemistry, and hybridization and protein and nucleic acid chemistry described herein are well known to those skilled in the art. widely used in this field. Enzymatic reactions and purification methods are carried out in accordance with the manufacturer's instructions, as is typically carried out in the art, or as described herein.
Определения «встречающийся в природе», «нативный» или «дикого типа» используют для описания объекта, который можно обнаружить в природе как отличающийся от получаемого искусственно. Например, белок или нуклеотидная последовательность, присутствующие в организме, в том числе в составе вируса, которые можно изолировать из источника в природе, и которые не модифицированы умышленно специалистом в лаборатории, являются встречающимися в природе.The terms “naturally occurring,” “native,” or “wild type” are used to describe an object that can be found in nature to be different from that produced artificially. For example, a protein or nucleotide sequence that is present in an organism, including a virus, that can be isolated from a source in nature, and that has not been intentionally modified by a person skilled in the laboratory, is naturally occurring.
В настоящем описании и в последующей формуле изобретения, если контекстом не предусмотрено иное, слова «включать» и «содержать» или их вариации, такие как «включает», «включающий», «содержит» или «содержащий», следует понимать как включение указанного целого или группы целых, но не исключение любого другого целого или группы целых.In the present specification and in the following claims, unless the context otherwise requires, the words “include” and “comprise” or variations thereof such as “includes”, “comprising”, “contains” or “comprising” are to be understood as including the specified whole or group of wholes, but not to the exclusion of any other whole or group of wholes.
Белок (Пептид)Protein (Peptide)
В настоящем описании термины «пептид», «полипептид» и «белок» используют взаимозаменяемо, и они относятся к соединению, состоящему из аминокислотных остатков, ковалентно связанных пептидными связями. Полипептиды включают природные пептиды, рекомбинантные пептиды, синтетические пептиды или их комбинацию.As used herein, the terms "peptide", "polypeptide" and "protein" are used interchangeably and refer to a compound consisting of amino acid residues covalently linked by peptide bonds. Polypeptides include natural peptides, recombinant peptides, synthetic peptides, or a combination thereof.
Молекулы нуклеиновых кислотNucleic acid molecules
Термины «нуклеиновая кислота», «нуклеиновая последовательность» или «нуклеиновокислотная последовательность», «полинуклеотид», «олигонуклеотид», «полинуклеотидная последовательность» и «нуклеотидная последовательность», которые используются равнозначно в данном описании, обозначают четкую последовательность нуклеотидов, модифицированных или не модифицированных, определяющую фрагмент или участок нуклеиновой кислоты, содержащую или не содержащую неприродные нуклеотиды и являющуюся либо двухцепочечной ДНК или РНК, либо одно цепочечной ДНК или РНК, либо продуктами транскрипции указанных ДНК.The terms "nucleic acid", "nucleic sequence" or "nucleic acid sequence", "polynucleotide", "oligonucleotide", "polynucleotide sequence" and "nucleotide sequence", as used interchangeably herein, refer to a distinct sequence of nucleotides, modified or unmodified , defining a fragment or region of nucleic acid, containing or not containing unnatural nucleotides and being either double-stranded DNA or RNA, or single-stranded DNA or RNA, or transcription products of these DNAs.
Как применяют в настоящем описании, полинуклеотиды включают, в качестве неограничивающих примеров, все последовательности нуклеиновой кислоты, получаемые любыми способами, доступными в этой области, включая, в качестве неограничивающих примеров, рекомбинантные способы, т.е. клонирование последовательностей нуклеиновой кислоты из рекомбинантной библиотеки или генома клетки, использование обычной технологии клонирования и ПЦР и т.п., и способами синтеза.As used herein, polynucleotides include, but are not limited to, all nucleic acid sequences produced by any methods available in the art, including, but not limited to, recombinant methods, i.e. cloning nucleic acid sequences from a recombinant library or cell genome, using conventional cloning and PCR technology, etc., and synthesis methods.
Здесь также следует упомянуть, что данное изобретение не относится к нуклеотидным последовательностям в их природной хромосомной среде, т.е. в природном состоянии. Последовательности данного изобретения были выделены и/или очищены, т.е. были взяты прямо или косвенно, например, путем копирования, при этом их среда была по меньшей мере частично модифицирована. Таким образом, также здесь следует подразумевать изолированные нуклеиновые кислоты, полученные путем генетической рекомбинации, например, с помощью принимающих клеток (клеток-хозяев), или полученные путем химического синтеза.It should also be mentioned here that this invention does not relate to nucleotide sequences in their natural chromosomal environment, i.e. in its natural state. The sequences of the present invention have been isolated and/or purified, i.e. were taken directly or indirectly, for example by copying, and their environment was at least partially modified. Thus, it should also be understood here as isolated nucleic acids obtained by genetic recombination, for example by host cells, or obtained by chemical synthesis.
Термин нуклеотидная последовательность охватывает его комплемент, если не указано иное. Таким образом, нуклеиновую кислоту, имеющую определенную последовательность следует понимать как охватывающие ее комплементарную цепь с ее комплементарной последовательностью.The term nucleotide sequence covers its complement unless otherwise specified. Thus, a nucleic acid having a specific sequence should be understood as comprising its complementary strand with its complementary sequence.
ВекторVector
Термин «вектор» при использовании в настоящем документе означает молекулу нуклеиновой кислоты, способную транспортировать другую нуклеиновую кислоту, с которой она соединена. Кроме того, термин «вектор» в данном настоящем документе означает рекомбинантную вирусную частицу, способную транспортировать нуклеиновую кислоту.The term “vector” as used herein means a nucleic acid molecule capable of transporting another nucleic acid to which it is linked. In addition, the term “vector” as used herein means a recombinant viral particle capable of transporting a nucleic acid.
Как применяют в настоящем описании, термин «экспрессия» определяют как транскрипцию и/или трансляцию конкретной нуклеотидной последовательности, запускаемую ее промотором.As used herein, the term “expression” is defined as the transcription and/or translation of a particular nucleotide sequence driven by its promoter.
ПрименениеApplication
«Генная терапия» представляет собой вставку генов в клетки и/или ткани субъекта для лечения заболевания, обычно, наследственных заболеваний, при этом дефектный мутантный аллель заменяется или дополняется функциональным аллелем.“Gene therapy” is the insertion of genes into the cells and/or tissues of a subject to treat a disease, usually an inherited disease, whereby a defective mutant allele is replaced or supplemented with a functional allele.
«Лечить», «лечение» и «терапия» относятся к методу смягчения или устранения биологического расстройства и/или по меньшей мере одного из сопутствующих ему симптомов.“Treat,” “cure,” and “therapy” refer to a method of alleviating or eliminating a biological disorder and/or at least one of its associated symptoms.
Термин «субъект», «пациент», «индивидуум» и т.п. используют в настоящем описании взаимозаменяемо, и они относятся к любому животному, которое поддается воздействию способами, представленными в настоящем описании. В конкретных неограничивающих вариантах осуществления субъект, пациент или индивидуум является человеком. Вышеупомянутый субъект может быть мужского или женского пола любого возраста.The term “subject”, “patient”, “individual”, etc. are used interchangeably herein and refer to any animal that can be treated by the methods presented herein. In specific non-limiting embodiments, the subject, patient, or individual is a human. The above subject may be male or female of any age.
«Терапевтически эффективным количеством» или «эффективным количеством» считается количество вводимого терапевтического агента, которое избавит в определенной степени от одного или нескольких симптомов заболевания, по поводу которого проводится лечение.A "therapeutically effective amount" or "effective amount" is considered to be the amount of a therapeutic agent administered that will relieve, to a certain extent, one or more symptoms of the disease being treated.
Подробное описание изобретенияDetailed Description of the Invention
Нуклеиновая кислотаNucleic acid
В одном из аспектов настоящее изобретение относится к выделенной кодон-оптимизированной нуклеиновой кислоте, которая кодирует белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) с аминокислотной последовательностью SEQ ID NO: 11 и включает нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4 или SEQ ID NO: 5.In one aspect, the present invention provides an isolated codon-optimized nucleic acid that encodes a FVIII-BDD (Blood Domain Deleted Factor VIII) protein with the amino acid sequence of SEQ ID NO: 11 and includes a nucleotide sequence selected from the group: SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4 or SEQ ID NO: 5.
«Выделенная» молекула нуклеиновой кислоты представляет собой молекулу нуклеиновой кислоты, которая идентифицирована и отделена от по меньшей мере одной молекулы нуклеиновой кислоты-примеси. Выделенная молекула нуклеиновой кислоты отличается от той формы или набора, в которых она находится в естественных условиях. Таким образом, выделенная молекула нуклеиновой кислоты отличается от молекулы нуклеиновой кислоты, существующей в клетках в естественных условиях.An "isolated" nucleic acid molecule is a nucleic acid molecule that has been identified and separated from at least one contaminant nucleic acid molecule. The isolated nucleic acid molecule differs from the form or set in which it occurs naturally. Thus, the isolated nucleic acid molecule is different from the nucleic acid molecule that naturally exists in cells.
Одним из свойств генетического кода является вырожденность - способность разных кодонов (тринуклеотидов) кодировать одну и ту же аминокислоту. Такие кодоны, которые дают одну и ту же аминокислоту в процессе трансляции, называются синонимичными. В природных последовательностях выбор одного из синонимичных кодонов осуществляется случайным образом в процессе эволюции, однако частоты использования синонимичных кодонов отличаются: для каждой аминокислоты есть более и менее предпочтительные. Кодон-оптимизация - это широко используемая в мире техника, направленная на повышение продуктивности наработки белковых молекул, которая заключается в рациональном сопоставлении каждой аминокислоте в белковой последовательности одного из подходящих синонимичных кодонов. Один из распространенных принципов кодон-оптимизации подразумевает использование наиболее частых кодонов, впоследствии были предложены и другие подходы, такие как гармонизация (воспроизведение распределения частот используемых кодонов), но и они не всегда дают увеличение продуктивности. Помимо частот кодонов на эффективность наработки может влиять GC-состав последовательности (отношение количества гуанинов и цитозинов к суммарной длине последовательности), в частности, было показано, что завышенный GC-состав ассоциирован с повышением количества мРНК в клетках млекопитающих Grzegorz Kudla ЕТ AL., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, June 2006, Volume 4, Issue 6, el80, pp. 933-942). Также стоит отметить, что устойчивые элементы вторичной структуры мРНК, т.е. имеющие низкую свободную энергию фолдинга, могут снижать эффективность.One of the properties of the genetic code is degeneracy - the ability of different codons (trinucleotides) to encode the same amino acid. Such codons that give the same amino acid during translation are called synonymous. In natural sequences, the choice of one of the synonymous codons is carried out randomly in the process of evolution, but the frequencies of use of synonymous codons differ: for each amino acid there are more and less preferable ones. Codon optimization is a technique widely used in the world aimed at increasing the productivity of protein molecules, which consists in rationally matching each amino acid in the protein sequence with one of the suitable synonymous codons. One of the common principles of codon optimization involves the use of the most frequent codons; subsequently, other approaches were proposed, such as harmonization (reproducing the distribution of frequencies of used codons), but they do not always increase productivity. In addition to codon frequencies, the production efficiency can be influenced by the GC composition of the sequence (the ratio of the number of guanines and cytosines to the total length of the sequence); in particular, it has been shown that an increased GC composition is associated with an increase in the amount of mRNA in mammalian cells Grzegorz Kudla ET AL., High Guanine and Cytosine Content Increases mRNA Levels in Mammalian Cells, June 2006, Volume 4, Issue 6, el80, pp. 933-942). It is also worth noting that stable elements of the secondary structure of mRNA, i.e. having low free energy of folding may reduce efficiency.
Различные варианты кодон-оптимизации последовательности гена интереса могут приводить к следующему (в сравнение с геном дикого типа):Various options for codon optimization of the sequence of the gene of interest can lead to the following (compared to the wild type gene):
а) уровень экспрессии генов интереса будет незначительно увеличен;a) the level of expression of genes of interest will be slightly increased;
б) уровень экспрессии генов интереса будет значительно увеличен;b) the level of expression of genes of interest will be significantly increased;
в) уровень экспрессии генов интереса останется приблизительно на том же уровне;c) the level of expression of genes of interest will remain approximately at the same level;
г) уровень экспрессии генов интереса будет понижен.d) the level of expression of genes of interest will be reduced.
Для получения вышеуказанной кодон-оптимизированной нуклеиновой кислоты по изобретению была проведена кодон-оптимизации нуклеиновой кислоты дикого типа с нуклеотидной последовательностью SEQ ID NO: 1.To obtain the above codon-optimized nucleic acid of the invention, codon optimization of the wild-type nucleic acid with the nucleotide sequence SEQ ID NO: 1 was carried out.
В результате кодон-оптимизации нуклеиновой кислоты дикого типа, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 1 был получен ряд кодон-оптимизированных нуклеиновых кислот, которые были в дальнейшем протестированы на уровень продукции белка по сравнению с контролем FVIII-BDD-wt (нуклеиновая кислота дикого типа с SEQ ID N0:1).Codon optimization of the wild-type nucleic acid that encodes the FVIII-BDD protein with the nucleotide sequence SEQ ID NO: 1 resulted in a series of codon-optimized nucleic acids that were further tested for levels of protein production compared to the FVIII-BDD control -wt (wild type nucleic acid SEQ ID NO:1).
Все кодон-оптимизированные нуклеиновые кислоты приводили к увеличению уровня продукции белка FVIII-BDD по сравнению с нуклеиновой кислотой дикого типа, при этом ряд кодон-оптимизированных нуклеиновых кислот приводил к незначительному увеличению уровня продукции белка FVIII-BDD по сравнению с нуклеиновой кислотой дикого типа. В свою очередь, кодон-оптимизированная нуклеиновая кислота по изобретению, которую выбирают из группы: SEQ ID NO: 2 (вариант FVIII-BDDco-v1), SEQ ID NO: 3 (вариант FVIII-BDDco-v2), SEQ ID NO: 4 (вариант FVIII-BDDco-v3) или SEQ ID NO: 5 (вариант FVIII-BDDco-v4), неожиданно приводит к увеличению уровня экспрессии гена FVIII-BDD, увеличению уровня продукции белка фактора свертывания крови VIII-BDD, а также увеличению уровня активности белка фактора свертывания крови VIII-BDD в несколько раз по сравнению с геном дикого типа (FVIII-BDD-wt).All codon-optimized nucleic acids resulted in increased levels of FVIII-BDD protein production compared to wild-type nucleic acid, while a number of codon-optimized nucleic acids resulted in a slight increase in FVIII-BDD protein production compared to wild-type nucleic acid. In turn, a codon-optimized nucleic acid according to the invention, which is selected from the group: SEQ ID NO: 2 (option FVIII-BDDco-v1), SEQ ID NO: 3 (option FVIII-BDDco-v2), SEQ ID NO: 4 (variant FVIII-BDDco-v3) or SEQ ID NO: 5 (variant FVIII-BDDco-v4), unexpectedly leads to an increase in the expression level of the FVIII-BDD gene, an increase in the production of blood clotting factor VIII-BDD protein, and an increase in the level of activity of the blood coagulation factor VIII-BDD protein several times compared to the wild-type gene (FVIII-BDD-wt).
Экспрессионная кассета. Экспрессионный вектор.Expression cassette. Expression vector.
В одном из аспектов настоящее изобретение относится к экспрессионной кассете, которая включает любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD.In one aspect, the present invention provides an expression cassette that includes any of the above codon-optimized nucleic acids encoding the FVIII-BDD protein.
Термин «кассета, которая экспрессирует» или «экспрессионная кассета» при использовании в данном документе, в частности, относится к фрагменту ДНК, который способен в соответствующей обстановке запускать экспрессию полинуклеотида, кодирующего представляющий интерес полипептид, последовательность которого включена в указанную экспрессионную кассету. При введении в клетку-хозяина экспрессионная кассета помимо прочего способна задействовать клеточные механизмы для транскрипции полинуклеотида, кодирующего представляющий интерес полипептид, в РНК, которая затем обычно дополнительно процессируется и, наконец, транслируется в представляющий интерес полипептид. Экспрессионная кассета может содержаться в экспрессионном векторе.The term “cassette that expresses” or “expression cassette” as used herein specifically refers to a fragment of DNA that is capable, under appropriate circumstances, of driving the expression of a polynucleotide encoding a polypeptide of interest, the sequence of which is included in the expression cassette. When introduced into a host cell, the expression cassette is, among other things, capable of engaging cellular machinery to transcribe the polynucleotide encoding the polypeptide of interest into RNA, which is then typically further processed and finally translated into the polypeptide of interest. The expression cassette may be contained in an expression vector.
Экспрессионная кассета по настоящему изобретению содержит в качестве элемента промотор. Термин «промотор», используемый в настоящем документе, в частности, относится к элементу ДНК, который способствует транскрипции полинуклеотида, с которым функционально связан промотор. Промотор может также составлять часть элемента «промотор/энхансер». Хотя физические границы между элементами «промотор» и «энхансер» не всегда ясны, термин «промотор» обычно относится к месту на молекуле нуклеиновой кислоты, с которым связывается РНК-полимераза и/или связанные с ней факторы, и с которого инициируется транскрипция. Энхансеры усиливают активность промотора во времени, а также пространственно. В данной области известно множество промоторов, которые транскрипционно активны в широком диапазоне типов клеток. Промоторы могут быть разделены на два класса: на тех, которые функционируют конститутивно, и тех, которые регулируются индукцией или снятием репрессии. Для экспрессии белка пригодны оба класса. Промоторы, которые используются для продукции высокого уровня полипептидов в эукариотических клетках и, в частности, в клетках млекопитающих, должны быть сильными и, предпочтительно, должны быть активными в широком диапазоне типов клеток. Сильные конститутивные промоторы, которые способны запускать экспрессию во многих типах клеток, хорошо известны в данной области и, поэтому, нет необходимости в их подробном описании в данном документе.The expression cassette of the present invention contains a promoter element. The term "promoter" as used herein specifically refers to a DNA element that promotes transcription of a polynucleotide to which the promoter is operably linked. A promoter may also form part of a promoter/enhancer element. Although the physical boundaries between promoter and enhancer elements are not always clear, the term promoter generally refers to the location on a nucleic acid molecule to which RNA polymerase and/or associated factors bind and from which transcription is initiated. Enhancers enhance promoter activity temporally as well as spatially. There are many promoters known in the art that are transcriptionally active in a wide range of cell types. Promoters can be divided into two classes: those that function constitutively and those that are regulated by induction or release of repression. Both classes are suitable for protein expression. Promoters that are used to produce high levels of polypeptides in eukaryotic cells and, in particular, mammalian cells must be strong and preferably must be active in a wide range of cell types. Potent constitutive promoters that are capable of driving expression in many cell types are well known in the art and therefore need not be described in detail herein.
Согласно одному варианту осуществления изобретения промотор HLP используется в экспрессионной кассете по настоящему изобретению.According to one embodiment of the invention, the HLP promoter is used in the expression cassette of the present invention.
В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the expression cassette includes the following elements in a 5' to 3' direction:
левый (первый) ITR (инвертированные концевые повторы);left (first) ITR (inverted terminal repeats);
промотор;promoter;
нуклеиновую кислоту, кодирующую сигнальный пептид;a nucleic acid encoding a signal peptide;
любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD;any of the above codon-optimized nucleic acids encoding the FVIII-BDD protein;
сигнал полиаденилирования;polyadenylation signal;
правый (второй) ITR.right (second) ITR.
Вышеуказанные структурные элементы экспрессионной кассеты являются функционально связанными между собой.The above structural elements of the expression cassette are functionally related to each other.
В контексте настоящего описания термин «функционально связанный» относится к связи полинуклеотидных (или полипептидных) элементов в функциональную связь. Нуклеиновая кислота является «функционально связанной», если она находится в условиях функциональной связи с другой последовательностью нуклеиновой кислоты. Например, регуляторная последовательность транскрипции функционально связана с кодирующей последовательностью, если она влияет на транскрипцию указанной кодирующей последовательности. Термин «функционально связанный» означает, что связанные последовательности ДНК являются, как правило, непрерывными, и при необходимости соединения двух участков, кодирующих белок, являются также непрерывными и находятся в рамке считывания.As used herein, the term "operably linked" refers to the linking of polynucleotide (or polypeptide) elements into a functional link. A nucleic acid is "operably linked" if it is in a functional relationship with another nucleic acid sequence. For example, a transcription control sequence is operably linked to a coding sequence if it affects the transcription of said coding sequence. The term "operably linked" means that the linked DNA sequences are generally contiguous and, where appropriate, junctions of two protein-coding regions are also contiguous and in frame.
В некоторых вариантах экспрессионная кассета включает левый (первый) ITR с нуклеотидной последовательностью SEQ ID NO: 13.In some embodiments, the expression cassette includes a left (first) ITR with the nucleotide sequence of SEQ ID NO: 13.
В некоторых вариантах экспрессионная кассета включает промотор HLP с нуклеотидной последовательностью SEQ ID NO: 14.In some embodiments, the expression cassette includes an HLP promoter having the nucleotide sequence of SEQ ID NO: 14.
В некоторых вариантах экспрессионная кассета включает сигнал полиаденилирования с нуклеотидной последовательностью SEQ ID NO: 15.In some embodiments, the expression cassette includes a polyadenylation signal with the nucleotide sequence of SEQ ID NO: 15.
В некоторых вариантах экспрессионная кассета включает правый (второй) ITR с нуклеотидной последовательностью SEQ ID NO: 16.In some embodiments, the expression cassette includes a right (second) ITR with the nucleotide sequence of SEQ ID NO: 16.
В некоторых вариантах нуклеиновая кислоту, кодирующая сигнальный пептид, имеет нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20 или SEQ ID NO: 21.In some embodiments, the nucleic acid encoding the signal peptide has a nucleotide sequence selected from the group: SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20, or SEQ ID NO: 21.
В некоторых вариантах кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным пептидом (вариант FVIII-BDDco-v1), имеет нуклеотидную последовательность SEQ ID NO: 7.In some embodiments, the codon-optimized nucleic acid encoding the FVIII-BDD protein with a signal peptide (FVIII-BDDco-v1 variant) has the nucleotide sequence of SEQ ID NO: 7.
В некоторых вариантах кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным пептидом (вариант FVIII-BDDco-v2), имеет нуклеотидную последовательность SEQ ID NO: 8.In some embodiments, the codon-optimized nucleic acid encoding the FVIII-BDD protein with a signal peptide (FVIII-BDDco-v2 variant) has the nucleotide sequence of SEQ ID NO: 8.
В некоторых вариантах кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным пептидом (вариант FVIII-BDDco-v3), имеет нуклеотидную последовательность SEQ ID NO: 9.In some embodiments, the codon-optimized nucleic acid encoding the FVIII-BDD protein with a signal peptide (FVIII-BDDco-v3 variant) has the nucleotide sequence of SEQ ID NO: 9.
В некоторых вариантах кодон-оптимизированная нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным пептидом (вариант FVIII-BDDco-v4), имеет нуклеотидную последовательность SEQ ID NO: 10.In some embodiments, the codon-optimized nucleic acid encoding the FVIII-BDD protein with a signal peptide (FVIII-BDDco-v4 variant) has the nucleotide sequence of SEQ ID NO: 10.
В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the expression cassette includes the following elements in a 5' to 3' direction:
левый (первый) ITR (инвертированные концевые повторы) с нуклеотидной последовательностью SEQ ID NO: 13;left (first) ITR (inverted terminal repeats) with nucleotide sequence SEQ ID NO: 13;
промотор с нуклеотидной последовательностью SEQ ID NO: 14;promoter with nucleotide sequence SEQ ID NO: 14;
нуклеиновую кислоту, кодирующую сигнальный пептид, который имеет нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20 или SEQ ID NO: 21;a nucleic acid encoding a signal peptide that has a nucleotide sequence selected from the group: SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20 or SEQ ID NO: 21;
любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD;any of the above codon-optimized nucleic acids encoding the FVIII-BDD protein;
сигнал полиаденилирования с нуклеотидной последовательностью SEQ ID NO: 15;polyadenylation signal with nucleotide sequence SEQ ID NO: 15;
правый (второй) ITR с нуклеотидной последовательностью SEQ ID NO: 16.right (second) ITR with nucleotide sequence SEQ ID NO: 16.
В некоторых вариантах экспрессионная кассета включает следующие элементы в направлении от 5'-конца к 3'-концу:In some embodiments, the expression cassette includes the following elements in a 5' to 3' direction:
левый (первый) ITR (инвертированные концевые повторы) с нуклеотидной последовательностью SEQ ID NO: 13;left (first) ITR (inverted terminal repeats) with nucleotide sequence SEQ ID NO: 13;
промотор с нуклеотидной последовательностью SEQ ID NO: 14;promoter with nucleotide sequence SEQ ID NO: 14;
кодон-оптимизированную нуклеиновую кислоту, кодирующую белок FVIII-BDD с сигнальным пептидом, которая имеет нуклеотидную последовательность, которую выбирают из группы: SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9 или SEQ ID NO: 10;a codon-optimized nucleic acid encoding a FVIII-BDD protein with a signal peptide, which has a nucleotide sequence selected from the group: SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9 or SEQ ID NO: 10;
сигнал полиаденилирования с нуклеотидной последовательностью SEQ ID NO: 15;polyadenylation signal with nucleotide sequence SEQ ID NO: 15;
правый (второй) ITR с нуклеотидной последовательностью SEQ ID NO: 16.right (second) ITR with nucleotide sequence SEQ ID NO: 16.
В одном из аспектов настоящее изобретение относится к экспрессионному вектору, который включает любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD, или любую из вышеуказанных экспрессионных кассет.In one aspect, the present invention provides an expression vector that includes any of the above codon-optimized nucleic acids encoding the FVIII-BDD protein or any of the above expression cassettes.
В некоторых вариантах осуществления изобретения вектор представляет собой плазмиду, т.е. кольцевую двухцепочечную часть ДНК, в которую могут быть вставлены дополнительные сегменты ДНК.In some embodiments, the vector is a plasmid, i.e. a circular, double-stranded piece of DNA into which additional DNA segments can be inserted.
В некоторых вариантах осуществления изобретения вектор представляет собой вирусный (экспрессионный) вектор, в котором дополнительные сегменты ДНК могут быть вставлены в вирусный геном.In some embodiments, the vector is a viral (expression) vector in which additional DNA segments can be inserted into the viral genome.
В некоторых вариантах осуществления изобретения векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, имеющие бактериальный сайт инициации репликации и эписомные векторы). В других вариантах осуществления изобретения векторы (например, неэписомальные векторы) могут быть интегрированы в геном клетки-хозяина при введении в клетку-хозяина, и таким образом реплицируются вместе с геном хозяина. Более того, некоторые векторы способны направлять экспрессию генов, с которыми они функционально соединены. Такие векторы упоминаются в данном документе как «рекомбинантные экспрессирующие векторы» (или просто «экспрессирующие векторы» («вектор экспрессии» или «экспрессионный вектор»)).In some embodiments, the vectors are capable of autonomous replication in the host cell into which they are introduced (eg, bacterial vectors having a bacterial origin of replication and episomal vectors). In other embodiments, vectors (eg, non-episomal vectors) can be integrated into the host cell genome upon introduction into the host cell, and thus replicate along with the host gene. Moreover, some vectors are capable of directing the expression of genes to which they are operably linked. Such vectors are referred to herein as “recombinant expression vectors” (or simply “expression vectors” (“expression vector” or “expression vector”)).
Экспрессионные векторы включают плазмиды, ретро вирусы, аденовирусы, аденоассоциированные вирусы (AAV), вирусы растений, такие как вирус мозаики цветной капусты, вирусы табачной мозаики, космиды, YAC, EBV и тому подобное. Молекулы ДНК могут быть вставлены в вектор таким образом, что последовательности, контролирующие транскрипцию и трансляцию в векторе, выполняют предусмотренную функцию регуляции транскрипции и трансляции ДНК. Экспрессионный вектор и последовательности контроля экспрессии могут быть выбраны таким образом, чтобы быть совместимыми с используемой экспрессирующей клеткой-хозяином. Молекулы ДНК могут быть введены в экспрессионный вектор стандартными способами (например, лигированием комплементарных сайтов рестрикции или лигированием тупых концов, если сайты рестрикции отсутствуют).Expression vectors include plasmids, retroviruses, adenoviruses, adeno-associated viruses (AAV), plant viruses such as cauliflower mosaic virus, tobacco mosaic virus, cosmid, YAC, EBV and the like. DNA molecules can be inserted into a vector such that the transcription and translation control sequences in the vector perform the intended function of regulating DNA transcription and translation. The expression vector and expression control sequences can be selected to be compatible with the expression host cell used. DNA molecules can be introduced into an expression vector by standard methods (eg, ligation of complementary restriction sites or blunt-end ligation if restriction sites are missing).
В некоторых вариантах экспрессионный вектор представляет собой рекомбинантный аденоассоциированный вирус (AAV).In some embodiments, the expression vector is a recombinant adeno-associated virus (AAV).
В некоторых вариантах AAV выбирают из группы, включающей следующие серо типы AAV: In some embodiments, the AAV is selected from the group consisting of the following AAV serotypes:
В некоторых вариантах осуществления изобретения вектор или кассета может включать последовательность контроля экспрессии. Термин «последовательность контроля экспрессии», используемый в данном описании, означает полинуклеотидные последовательности, которые необходимы для воздействия на экспрессию и процессинг кодирующих последовательностей, к которым они вставлены. Специалистам в этой области будет понятно, что дизайн экспрессионного вектора или кассеты, включая выбор последовательностей контроля экспрессии, может зависеть от таких факторов, как выбор типа клетки-хозяина для трансформации, требуемый уровень экспрессии белка, и т.д. Последовательности контроля экспрессии включают соответствующие последовательности инициации транскрипции, терминации, промотора и энхансера; эффективные сигналы процессинга РНК, такие как сплайсинг и сигналы полиаденилирования; последовательности, которые стабилизируют цитоплазматическую мРНК; последовательности, которые повышают эффективность трансляции (т.е. консенсусная последовательность Козака); последовательности, которые повышают стабильность белка; и, при желании, последовательности, которые усиливают секрецию белка. Характер таких контролирующих последовательностей различается в зависимости от организма-хозяина; в прокариотах такие контролирующие последовательности, как правило, включают промотор, сайт связывания рибосомы, а также последовательности терминации транскрипции; в эукариотах, как правило, такие контролирующие последовательности включают промоторы и последовательности терминации транскрипции. Предпочтительные последовательности контроля экспрессии для экспрессирующей клетки-хозяина млекопитающего включают вирусные элементы обеспечивающие высокий уровень экспрессии белков в клетках млекопитающих, таких как промоторы и/или энхансеры, полученные из ретровирусной LTR, цитомегаловируса (CMV) (например, CMV промотора/энхансера), обезьяньего вируса 40 (SV40) (например, SV40 промотора/энхансера), аденовируса, (например, большого позднего промотора аденовируса (AdMLP)), вирус полиомы, а также сильных промоторов млекопитающих, таких как TTR промотор, промотор нативных иммуноглобулинов, промотор актина, а также промотор HLP (hybrid liver-specific promotor). Последовательности контроля экспрессии включают, как минимум, все компоненты, наличие которых имеет важное значение для экспрессии и процессинга.In some embodiments, the vector or cassette may include an expression control sequence. The term "expression control sequence" as used herein refers to polynucleotide sequences that are necessary to influence the expression and processing of the coding sequences to which they are inserted. Those skilled in the art will appreciate that the design of an expression vector or cassette, including the choice of expression control sequences, may depend on factors such as the choice of host cell type for transformation, the desired level of protein expression, etc. Expression control sequences include the corresponding transcription initiation, termination, promoter and enhancer sequences; efficient RNA processing signals such as splicing and polyadenylation signals; sequences that stabilize cytoplasmic mRNA; sequences that increase translation efficiency (ie, the Kozak consensus sequence); sequences that increase protein stability; and, if desired, sequences that enhance protein secretion. The nature of such control sequences varies depending on the host organism; in prokaryotes, such control sequences typically include a promoter, a ribosome binding site, and transcription termination sequences; in eukaryotes, such control sequences typically include promoters and transcription termination sequences. Preferred expression control sequences for a mammalian host expression cell include viral elements that provide high level expression of proteins in mammalian cells, such as promoters and/or enhancers derived from a retroviral LTR, cytomegalovirus (CMV) (eg, CMV promoter/enhancer), simian virus 40 (SV40) (eg, SV40 promoter/enhancer), adenovirus (eg, adenovirus large late promoter (AdMLP)), polyoma virus, as well as strong mammalian promoters such as the TTR promoter, native immunoglobulin promoter, actin promoter, and HLP promoter (hybrid liver-specific promoter). Expression control sequences include, at a minimum, all components whose presence is essential for expression and processing.
В дополнение к вышеуказанным генам и последовательностям контроля экспрессии, рекомбинантные векторы экспрессии изобретения могут нести дополнительные последовательности, такие как последовательности, которые регулируют репликацию вектора в клетках-хозяевах (например, точки начала репликации) и гены селектируемого маркера. Ген селектируемого маркера облегчает селекцию клеток-хозяев, в которые был введен вектор или кассету.In addition to the above genes and expression control sequences, the recombinant expression vectors of the invention may carry additional sequences, such as sequences that regulate replication of the vector in host cells (eg, origins of replication) and selectable marker genes. The selectable marker gene facilitates selection of host cells into which the vector or cassette has been introduced.
В одном из вариантов настоящего изобретения экспрессионный вектор относится к вектору, содержащему одну или несколько интересующих полинуклеотидных последовательностей, интересующих генов или трансгенов, которые фланкированы парвовирусными или инвертированными концевыми повторяющимися последовательностями (ITR).In one embodiment of the present invention, an expression vector refers to a vector containing one or more polynucleotide sequences of interest, genes or transgenes of interest that are flanked by parvovirus or inverted terminal repeat (ITR) sequences.
Ни кассета, ни вектор по изобретению не содержит нуклеотидные последовательности генов, кодирующих неструктурные белки (Rep) и структурные белки (Сар) аденоассоциированного вируса.Neither the cassette nor the vector according to the invention contains nucleotide sequences of genes encoding non-structural proteins (Rep) and structural proteins (Cap) of the adeno-associated virus.
Клетка-хозяинHost cell
В одном из аспектов настоящее изобретение относится к клетке-хозяину для получения белка FVIII-BDD или для получения любого из вышеуказанных экспрессионных векторов, которая содержит любую из вышеуказанных кодон-оптимизированных нуклеиновых кислот, кодирующих белок FVIII-BDD.In one aspect, the present invention provides a host cell for producing the FVIII-BDD protein or for producing any of the above expression vectors, which contains any of the above codon-optimized nucleic acids encoding the FVIII-BDD protein.
Термин «клетка-хозяин» при использовании в данном документе означает клетку, в которую введен рекомбинантный экспрессионный вектор или кассету по изобретению. Настоящее изобретение относится к клеткам-хозяевам, которые могут включать, например, вектор в соответствии с настоящим изобретением, описанным выше. Следует понимать, что «клетка-хозяин» означает не только конкретную заявленную клетку, но также и потомство такой клетки. Поскольку модификации могут проходить в последующих поколениях вследствие мутации или воздействий окружающей среды, такое потомство не может, на самом деле, быть идентичным родительской клетке, но такие клетки по-прежнему включены в объем термина «клетка-хозяин» при использовании в настоящем документе.The term “host cell” as used herein means a cell into which a recombinant expression vector or cassette of the invention is introduced. The present invention relates to host cells, which may include, for example, a vector in accordance with the present invention described above. It should be understood that "host cell" means not only the specific cell claimed, but also the progeny of such a cell. Since modifications may occur in subsequent generations due to mutation or environmental influences, such progeny may not, in fact, be identical to the parent cell, but such cells are still included within the scope of the term “host cell” as used herein.
Экспрессионные векторы или кассеты по изобретению могут быть использованы для трансфекции клетки млекопитающего, клетки растения, бактериальной или дрожжевой клетки-хозяина. Трансфекция может происходить любым известным способом для введения полинуклеотидов в клетку хозяина. Способы введения гетерологичных полинуклеотидов в клетки млекопитающих хорошо известны в данной области и включают декстран опосредованную трансфекцию, трансфекцию комплексом нуклеиновой кислоты и позитивно заряженного полимера, трансфекцию преципитатом нуклеиновой кислоты и фосфата кальция, полибрен опосредованную трансфекцию, слияние протопластов, трансфекцию инкапсулированными в липосомы полинуклеотидами и прямую микроинъекцию ДНК в ядра. В дополнение молекулы нуклеиновых кислот могут быть введены в клетки млекопитающих вирусными (экспрессионными) векторами.Expression vectors or cassettes of the invention can be used to transfect a mammalian cell, plant cell, bacterial or yeast host cell. Transfection can occur by any known method for introducing polynucleotides into a host cell. Methods for introducing heterologous polynucleotides into mammalian cells are well known in the art and include dextran-mediated transfection, nucleic acid-positively charged polymer complex transfection, nucleic acid-calcium phosphate precipitate transfection, polybrene-mediated transfection, protoplast fusion, transfection with liposome-encapsulated polynucleotides, and direct microinjection. DNA into nuclei. In addition, nucleic acid molecules can be introduced into mammalian cells by viral (expression) vectors.
Клеточные линии млекопитающих, используемые в качестве хозяев для трансформации, хорошо известны в данной области и включают множество иммортализованных доступных клеточных линий. К ним относятся, например, клетки яичников китайского хомячка (СНО), NS0 клетки, клетки SP2, НЕК-293Т клетки, 293 Фристайл клетки (Invitrogen), NIH-3T3 клетки, клетки HeLa, клетки почек хомячка (ВНК), клетки почек африканских зеленых мартышек (COS), клетки гепатоцеллюлярной карциномы человека (например, Hep G2), А549 клетки, SK-HEP1, HUH7, Нер-RG и ряд других клеточных линий. Клеточные линии выбираются путем определения, какие клеточные линии имеют высокие уровни экспрессии и обеспечивают необходимые характеристики продуцируемого белка. Другими клеточными линиями, которые могут быть использованы, являются клеточные линии насекомых, такие как Sf9 или Sf21 клетки. Когда векторы рекомбинантной экспрессии по изобретению вводятся в клетки-хозяева млекопитающих белок FVIII-BDD продуцируется путем культивирования клеток-хозяев в течение времени, достаточного для экспрессии слитого белка в клетках-хозяевах или, предпочтительнее, выделения слитого белка в питательную среду, в которой выращиваются клетки-хозяева. Слитый белок может быть выделен из питательной среды с использованием стандартных методов очистки белка. Клетки-хозяева растений, например, включают Nicotiana, Arabidopsis, ряску, кукурузу, пшеницу, картофель и т.д. Клетки бактерий хозяина включают виды Escherichia и Streptomyces. Дрожжевые клетки-хозяева включают Schizosaccharomyces pombe, Saccharomyces cerevisiae и Pichia pastoris.Mammalian cell lines used as hosts for transformation are well known in the art and include many immortalized cell lines available. These include, for example, Chinese hamster ovary (CHO) cells, NS0 cells, SP2 cells, HEK-293T cells, 293 Freestyle cells (Invitrogen), NIH-3T3 cells, HeLa cells, hamster kidney (HK) cells, African kidney cells green monkeys (COS), human hepatocellular carcinoma cells (for example, Hep G2), A549 cells, SK-HEP1, HUH7, Hep-RG and a number of other cell lines. Cell lines are selected by determining which cell lines have high levels of expression and provide the desired characteristics of the protein produced. Other cell lines that can be used are insect cell lines such as Sf9 or Sf21 cells. When the recombinant expression vectors of the invention are introduced into mammalian host cells, the FVIII-BDD protein is produced by culturing the host cells for a time sufficient to express the fusion protein in the host cells or, preferably, releasing the fusion protein into the growth medium in which the cells are grown -owners. The fusion protein can be isolated from the culture medium using standard protein purification methods. Plant host cells, for example, include Nicotiana, Arabidopsis, duckweed, corn, wheat, potato, etc. Host bacterial cells include Escherichia and Streptomyces species. Yeast host cells include Schizosaccharomyces pombe, Saccharomyces cerevisiae and Pichia pastoris.
Вышеуказанная клетка-хозяин не относится к клетке-хозяину, полученной с использованием человеческих эмбрионов.The above host cell does not refer to a host cell obtained using human embryos.
Вышеуказанная клетка-хозяин не относится к клетке-хозяину, полученной с модификации генетической целостности клеток зародышевой линии человека.The above host cell does not refer to a host cell obtained by modifying the genetic integrity of human germline cells.
Фармацевтическая композицияPharmaceutical composition
В одном из аспектов настоящее изобретение относится к фармацевтической композиции для доставки гена FVIII-BDD в целевые клетки, который включает любой из вышеуказанных экспрессионных векторов или кассет.In one aspect, the present invention relates to a pharmaceutical composition for delivering the FVIII-BDD gene to target cells, which includes any of the above expression vectors or cassettes.
В некоторых вариантах фармацевтическая композиция для доставки гена FVIII-BDD в целевые клетки включает любой из вышеуказанных экспрессионных векторов или кассет в сочетании с одним или несколькими фармацевтически приемлемыми эксципиентами.In some embodiments, a pharmaceutical composition for delivering the FVIII-BDD gene to target cells includes any of the above expression vectors or cassettes in combination with one or more pharmaceutically acceptable excipients.
Действующее вещество в вышеуказанной композиции находится в эффективном количестве, например, в биологически эффективном количестве.The active substance in the above composition is in an effective amount, for example, in a biologically effective amount.
«Фармацевтическая композиция» обозначает композицию, включающую в себя любой из вышеуказанных экспрессионных векторов по изобретению и, по крайней мере, один из компонентов, выбранных из группы, состоящей из фармацевтически приемлемых и фармакологически совместимых эксипиентов, наполнителей, растворителей, разбавителей, носителей, вспомогательных средств, распределяющих средств или средств доставки."Pharmaceutical composition" means a composition comprising any of the above expression vectors of the invention and at least one of the components selected from the group consisting of pharmaceutically acceptable and pharmacologically compatible excipients, excipients, solvents, diluents, carriers, auxiliaries , distribution or delivery vehicles.
Фармацевтические композиции по настоящему изобретению и способы их изготовления будут бесспорно очевидными для специалистов в этой области. Производство фармацевтических композиций предпочтительно должно соответствовать требованиям GMP (надлежащей производственной практики).The pharmaceutical compositions of the present invention and methods for their manufacture will be readily apparent to those skilled in the art. The production of pharmaceutical compositions should preferably comply with GMP (Good Manufacturing Practices) requirements.
В некоторых вариантах осуществления фармацевтической композиции она может включать буферную композицию, тонические агенты (осмолитик или осмотический агент), стабилизаторы и/или солюбилизаторы.In some embodiments of the pharmaceutical composition, it may include a buffer composition, tonic agents (osmolytic or osmotic agent), stabilizers and/or solubilizers.
«Фармацевтически приемлемым» считается материал, который не имеет биологических или других противопоказаний, например, материал можно вводить субъекту без каких-либо нежелательных биологических эффектов. Таким образом, такие фармацевтические композиции можно использовать, например, для трансфекции клетки ex vivo или для введения in vivo любого из вышеуказанных экспрессионных векторов по изобретению непосредственно субъекту.A "pharmaceutically acceptable" material is one that has no biological or other contraindications, e.g., the material can be administered to a subject without causing any undesirable biological effects. Thus, such pharmaceutical compositions can be used, for example, for ex vivo transfection of a cell or for in vivo administration of any of the above expression vectors of the invention directly to a subject.
Термин «эксципиент» или «вспомогательное вещество» используется в данном документе для описания любого компонента, отличающегося от ранее описанных по данному изобретению. Это вещества неорганического или органического происхождения, используемые в процессе производства, изготовления лекарственных препаратов для придания им необходимых физико-химических свойств.The term "excipient" or "excipient" is used herein to describe any component other than those previously described in this invention. These are substances of inorganic or organic origin, used in the production process of medicines to give them the necessary physical and chemical properties.
Фармацевтическая композиция по изобретению является стабильной.The pharmaceutical composition according to the invention is stable.
Фармацевтическая композиция является «стабильной», если активный агент сохраняет свою физическую стабильность и/или химическую стабильность и/или биологическую активность в течение заявленного срока годности при температуре хранения, например, при 2-8°С. Предпочтительно, чтобы активный агент сохранял и физическую, и химическую стабильность, а также биологическую активность. Период хранения выбирается на основании результатов исследования стабильности при ускоренном и естественном хранении.A pharmaceutical composition is “stable” if the active agent retains its physical stability and/or chemical stability and/or biological activity through its stated shelf life at storage temperature, for example, 2-8°C. It is preferred that the active agent retains both physical and chemical stability as well as biological activity. The storage period is selected based on the results of stability studies during accelerated and natural storage.
В некоторых вариантах фармацевтическая композиция представляет собой раствор для внутривенного введения.In some embodiments, the pharmaceutical composition is a solution for intravenous administration.
В некоторых вариантах фармацевтическая композиция представляет собой концентрат для приготовления раствора для внутривенного введения.In some embodiments, the pharmaceutical composition is a concentrate for the preparation of a solution for intravenous administration.
ПрименениеApplication
В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных экспрессионных кассет или векторов или вышеуказанной композиции для доставки гена FVIII-BDD в целевые клетки.In one aspect, the present invention relates to the use of any of the above expression cassettes or vectors or the above composition for delivering the FVIII-BDD gene to target cells.
В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных экспрессионных кассет или векторов или вышеуказанной композиции для обеспечения белком FVIII-BDD субъекта, который имеет гемофилию А и/или не имеет функциональных копий гена FVIII.In one aspect, the present invention relates to the use of any of the above expression cassettes or vectors or the above composition for providing the FVIII-BDD protein to a subject who has hemophilia A and/or does not have functional copies of the FVIII gene.
Под отсутствием функциональных копий гена FVIII подразумеваются инактивирующие мутации или делеции во всех копиях гена FVIII в геноме, которые приводят к потере или дефекту функции гена FVIII.Absence of functional copies of the FVIII gene refers to inactivating mutations or deletions in all copies of the FVIII gene in the genome that result in loss or defective function of the FVIII gene.
В одном из аспектов настоящее изобретение относится к способу обеспечения белком FVIII-BDD субъекта с гемофилией А, который включает введение терапевтически эффективного количества любого из вышеуказанных экспрессионных векторов или вышеуказанной композиции в клетки субъекта, нуждающегося в этом.In one aspect, the present invention provides a method of providing FVIII-BDD protein to a subject with hemophilia A, which comprises administering a therapeutically effective amount of any of the above expression vectors or the above composition to cells of a subject in need thereof.
В одном из аспектов настоящее изобретение относится к способу доставки гена FVIII-BDD в целевые клетки субъекта с гемофилией А, который включает введение любого из вышеуказанных экспрессионных векторов или вышеуказанной композиции в клетки субъекта.In one aspect, the present invention relates to a method of delivering the FVIII-BDD gene to target cells of a subject with hemophilia A, which includes introducing any of the above expression vectors or the above composition into the cells of the subject.
Под субъектом, нуждающимся в доставке гена FVIII-BDD в целевые клетки, или субъектом, нуждающимся в обеспечении белком FVIII-BDD, подразумевается субъект, который имеет гемофилию А, или субъект, который имеет дефицит фактора свертывания крови FVIII, или субъект, который имеет инактивирующие мутации или делеции в гене FVIII, которые приводят к потере или дефекту функции гена FVIII.By a subject requiring delivery of the FVIII-BDD gene to target cells or a subject requiring provision of the FVIII-BDD protein is meant a subject who has hemophilia A, or a subject who has a deficiency of coagulation factor FVIII, or a subject who has inactivating mutations or deletions in the FVIII gene that result in loss or defective function of the FVIII gene.
В одном из аспектов настоящее изобретение относится к применению любого из вышеуказанных экспрессионных векторов или вышеуказанной композиции для лечения гемофилии А у субъекта, который имеет гемофилию А.In one aspect, the present invention relates to the use of any of the above expression vectors or the above composition for the treatment of hemophilia A in a subject who has hemophilia A.
В одном из аспектов настоящее изобретение относится к способу лечения гемофилии А у субъекта, который включает ведение терапевтически эффективного количества любого из вышеуказанных экспрессионных векторов или вышеуказанной композиции субъекту, который имеет гемофилию А.In one aspect, the present invention provides a method of treating hemophilia A in a subject, which includes administering a therapeutically effective amount of any of the above expression vectors or the above composition to a subject who has hemophilia A.
В некоторых вариантах гемофилия А представляет собой тяжелую форму гемофилии А (активность фактора VIII <1%) или среднетяжелую форму гемофилии А (активность фактора VIII 1-5%).In some embodiments, hemophilia A is a severe form of hemophilia A (factor VIII activity <1%) or a moderate form of hemophilia A (factor VIII activity 1-5%).
Примеры способов введения включают в себя местное применение, интраназальное, ингаляционное, чрезслизистое, трансдермальное, энтеральное (например, пероральное, ректальное), парентеральное (например, внутривенное, подкожное, внутрикожное, внутримышечное) введения, а также инъекции непосредственно в ткань или в орган.Examples of routes of administration include topical, intranasal, inhalational, transmucosal, transdermal, enteral (eg, oral, rectal), parenteral (eg, intravenous, subcutaneous, intradermal, intramuscular) administration, and injection directly into a tissue or organ.
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов или вышеуказанная композиция вводится субъекту как внутривенная инфузия.In some embodiments, any of the above expression vectors or the above composition is administered to a subject as an intravenous infusion.
Любой из вышеуказанных экспрессионных векторов вводят в организм в эффективном количестве. Любой из вышеуказанных экспрессионных векторов предпочтительно вводят в организм в биологически эффективном количестве. «Биологически эффективное» количество экспрессио иного вектора представляет собой количество, которое достаточно, чтобы вызвать трансдукцию клеток и экспрессию последовательности нуклеиновой кислоты в клетке. Если экспрессионный вектор вводят в клетку in vivo, «биологически эффективное» количество экспрессио иного вектора представляет собой количество, которое достаточно, чтобы вызвать трансдукцию клеток-мишеней и экспрессию последовательности нуклеиновой кислоты в клетке-мишени.Any of the above expression vectors is introduced into the body in an effective amount. Any of the above expression vectors is preferably administered to the body in a biologically effective amount. A "biologically effective" amount of an expression vector is an amount that is sufficient to cause cell transduction and expression of a nucleic acid sequence in the cell. If an expression vector is introduced into a cell in vivo, a "biologically effective" amount of the expression vector is an amount that is sufficient to cause transduction of target cells and expression of a nucleic acid sequence in the target cell.
Дозировки любого из вышеуказанных экспрессионных векторов по данному изобретению будут зависеть от способа введения конкретного вектора, и их можно определять рутинными способами.The dosages of any of the above expression vectors of this invention will depend on the method of administration of the particular vector, and can be determined by routine methods.
Клетка для введения любого из вышеуказанных экспрессионных кассет или векторов по данному изобретению может быть клеткой любого типа, включая в себя без ограничения, эпителиальные клетки (например, эпителиальные клетки кожи, дыхательных путей и кишечника), печеночные клетки, мышечные клетки, клетки селезенки, фибробласты, эндотелиальные клетки и тому подобное.The cell for administering any of the above expression cassettes or vectors of this invention may be any cell type, including, but not limited to, epithelial cells (eg, skin, respiratory and intestinal epithelial cells), liver cells, muscle cells, spleen cells, fibroblasts , endothelial cells and the like.
Любой из вышеуказанных экспрессионных кассет или векторов по данному изобретению не используется для модификации генетической целостности клеток зародышевой линии человека.Any of the above expression cassettes or vectors of this invention are not used to modify the genetic integrity of human germline cells.
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе применяют в формате монотерапии.In some embodiments, any of the above expression vectors according to this invention, as well as a drug based on it, are used in a monotherapy format.
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе применяют в комбинации с заместительной терапией концентратами факторов свертывания, десмопрессином и/или ингибиторами фибринолиза.In some embodiments, any of the above expression vectors of this invention, as well as a drug based thereon, are used in combination with replacement therapy with clotting factor concentrates, desmopressin and/or fibrinolysis inhibitors.
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе применяют в комбинации с моноклональным антителом (например, эмицизумаб).In some embodiments, any of the above expression vectors of this invention, as well as a drug based thereon, are used in combination with a monoclonal antibody (eg, emicizumab).
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе применяют в комбинации с препаратами на базе технологии РНК-интерференции (например, фитусиран).In some applications, any of the above expression vectors of this invention, as well as a drug based on it, is used in combination with drugs based on RNA interference technology (for example, fitusiran).
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе вводят субъекту однократно.In some embodiments, any of the above expression vectors of this invention, as well as a drug based thereon, is administered to a subject in a single dose.
В некоторых вариантах применения любой из вышеуказанных экспрессионных векторов по данному изобретению, а также препарат на его основе вводят субъекту многократно.In some embodiments, any of the above expression vectors of this invention, as well as a drug based thereon, are administered to a subject multiple times.
Краткое описание чертежейBrief description of drawings
Фигура 1 представляет собой схему плазмиды pAAV-hFVIII-BDD, которая содержит последовательность гена фактора свертывания крови VIII (FVIII) человека, выбранную из SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5. Так же последовательность плазмиды содержит следующие элементы:Figure 1 is a diagram of plasmid pAAV-hFVIII-BDD, which contains the human coagulation factor VIII (FVIII) gene sequence selected from SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 or SEQ ID NO:5. The plasmid sequence also contains the following elements:
AmpR - ген бета-лактамазы, обеспечивающий устойчивость к ампициллину;AmpR - beta-lactamase gene that provides resistance to ampicillin;
pUC origin- pUC ориджин репликации в бактериях;pUC origin - pUC origin of replication in bacteria;
ITR инвертированные терминальные повторы;ITR inverted terminal repeats;
HLP promoter - искусственный тканеспецифичный промотор;HLP promoter - artificial tissue-specific promoter;
sPA искусственная последовательность сигнала полиаденилирования, для повышения стабильности мРНК.sPA is an artificial polyadenylation signal sequence to improve mRNA stability.
Фигура 2 представляет собой график, который показывает увеличение уровня продукции белка FVIII-BDD в культуральную жидкость после трансфекции кодон-оптимизированными нуклеиновыми кислотами, кодирующими белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) по сравнению с нуклеиновой кислотой, кодирующей белок FVIII-BDD, дикого типа.Figure 2 is a graph that shows the increase in the level of production of FVIII-BDD protein in the culture fluid after transfection with codon-optimized nucleic acids encoding FVIII-BDD protein (blood coagulation factor VIII with B domain deleted) compared to nucleic acid encoding FVIII protein -BDD, wild type.
Уровень белка FVIII-BDD после трансфекции клеток:FVIII-BDD protein level after cell transfection:
1 - нуклеиновой кислотой дикого типа, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 1.1 is a wild-type nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 1.
2 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.2 - a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 2.
3 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 3.3 - a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 3.
4 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 4.4 - a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 4.
5 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 5.5 - a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 5.
Фигура 3. представляет собой график, который показывает увеличение уровня активности белка FVIII-BDD в культуральной жидкости после трансфекции кодон-оптимизированными нуклеиновыми кислотами, кодирующими белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) по сравнению с нуклеиновой кислотой, кодирующей белок FVIII-BDD, дикого типа.Figure 3 is a graph that shows the increase in the level of FVIII-BDD protein activity in culture fluid after transfection with codon-optimized nucleic acids encoding FVIII-BDD protein (coagulation factor VIII with B domain deleted) compared to nucleic acid encoding the protein FVIII-BDD, wild type.
Уровень активности FVIII-BDD после трансфекции клеток:Level of FVIII-BDD activity after cell transfection:
1 - нуклеиновой кислотой дикого типа, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 1.1 is a wild-type nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 1.
2 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.2 - a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 2.
3 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 3.3 - a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 3.
4 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 4.4 - a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 4.
5 - кодон-оптимизированной нуклеиновой кислотой, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 5.5 - a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 5.
Фигура 4 представляет собой график, который показывает увеличение уровня продукции белка FVIII-BDD при доставке in vitro нуклеиновых кислот в виде экспрессионного вектора на основе AAV, содержащего кодон-оптимизированную нуклеиновую кислоту, кодирующими белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) по сравнению с экспрессионный вектором на основе AAV, содержащим нуклеиновую кислоту дикого типа, кодирующую белок FVIII-BDD.Figure 4 is a graph that shows the increase in the level of FVIII-BDD protein production when nucleic acids are delivered in vitro as an AAV-based expression vector containing a codon-optimized nucleic acid encoding the FVIII-BDD protein (coagulation factor VIII with B domain deleted ) compared to an AAV-based expression vector containing wild-type nucleic acid encoding the FVIII-BDD protein.
Уровень белка FVIII-BDD после трансдукции клеток:FVIII-BDD protein level after cell transduction:
1 - контрольным раствор без AAV (негативный контроль).1 - control solution without AAV (negative control).
2 - экспрессионными векторами на основе AAV серотипа 6, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.2 - expression vectors based on AAV serotype 6 containing a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 2.
3 - экспрессионными векторами на основе AAV серотипа 6, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 5.3 - expression vectors based on AAV serotype 6 containing a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 5.
4 - экспрессионными векторами на основе AAV серотипа 5, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.4 - expression vectors based on AAV serotype 5 containing a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 2.
Фигура 5 представляет собой график, который показывает увеличение уровня активности белка FVIII-BDD при доставке in vitro нуклеиновых кислот в виде экспрессионного вектора на основе AAV, содержащего кодон-оптимизированную нуклеиновую кислоту, кодирующими белок FVIII-BDD (фактор свертывания крови VIII с делетированным В доменом) по сравнению с экспрессионный вектором на основе AAV, содержащим нуклеиновую кислоту дикого типа, кодирующую белок FVIII-BDD.Figure 5 is a graph that shows the increase in the level of FVIII-BDD protein activity when delivered in vitro nucleic acids in the form of an AAV-based expression vector containing a codon-optimized nucleic acid encoding the FVIII-BDD protein (blood clotting factor VIII with B domain deleted ) compared to an AAV-based expression vector containing wild-type nucleic acid encoding the FVIII-BDD protein.
Уровень активности FVIII-BDD после трансдукции клеток:Level of FVIII-BDD activity after cell transduction:
1 - контрольным раствор без AAV (негативный контроль).1 - control solution without AAV (negative control).
2 - экспрессионными векторами на основе AAV серотипа 6, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.2 - expression vectors based on AAV serotype 6 containing a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 2.
3 - экспрессионными векторами на основе AAV серотипа 6, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 5.3 - expression vectors based on AAV serotype 6 containing a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 5.
4 - экспрессионными векторами на основе AAV серотипа 5, содержащими кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.4 - expression vectors based on AAV serotype 5 containing a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 2.
Фигура 6 представляет собой график, который показывает увеличение уровня белка FVIII-BDD при доставке кодон-оптимизированной нуклеиновой кислоты, кодирующей белок FVIII-BDD, in vivo мышам линии В6.129S-F8tmlSmoc (HemA) в виде экспрессионного вектора на основе AAV.Figure 6 is a graph that shows the increase in FVIII-BDD protein levels when codon-optimized nucleic acid encoding FVIII-BDD protein is delivered in vivo to B6.129S-F8tmlSmoc (HemA) mice as an AAV-based expression vector.
Уровень белка FVIII-BDD в плазме крови животных после инъекции:The level of FVIII-BDD protein in the blood plasma of animals after injection:
1 - контрольного раствора без AAV (негативный контроль).1 - control solution without AAV (negative control).
2 - экспрессионного вектора на основе AAV серотипа 5, содержащего кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.2 - an expression vector based on AAV serotype 5 containing a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 2.
3 - экспрессионного вектора на основе AAV серотипа 6, содержащего кодон-оптимизированную нуклеиновую кислоту, которая кодирует белок FVIII-BDD, с нуклеотидной последовательностью SEQ ID NO: 2.3 - an expression vector based on AAV serotype 6 containing a codon-optimized nucleic acid that encodes the FVIII-BDD protein, with the nucleotide sequence SEQ ID NO: 2.
ПримерыExamples
Для наилучшего понимания изобретения приводятся следующие примеры. Эти примеры приведены только в иллюстративных целях и не должны толковаться как ограничивающие сферу применения изобретения в любой форме.For a better understanding of the invention, the following examples are provided. These examples are provided for illustrative purposes only and should not be construed as limiting the scope of the invention in any form.
Все публикации, патенты и патентные заявки, указанные в этой спецификации включены в данный документ путем отсылки. Хотя вышеупомянутое изобретение было довольно подробно описано путем иллюстрации и примера в целях исключения двусмысленного толкования, специалистам в данной области на основе идей, раскрытых в данном изобретении, будет вполне понятно, что могут быть внесены определенные изменения и модификации без отклонения от сущности и объема прилагаемых вариантов осуществления изобретения.All publications, patents and patent applications referenced in this specification are incorporated herein by reference. Although the foregoing invention has been described in some detail by way of illustration and example in order to avoid ambiguity, those skilled in the art will appreciate from the teachings disclosed herein that certain changes and modifications may be made without departing from the spirit and scope of the appended embodiments. implementation of the invention.
Материалы и общие методыMaterials and general methods
Методы рекомбинантной ДНКRecombinant DNA Methods
Для манипуляций с ДНК использовали стандартные методы, описанные у Sambrook J. и др., Molecular cloning: A laboratory manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989. Реагенты для молекулярной биологии использовали согласно инструкциям производителей. Вкратце, плазмидную ДНК нарабатывали для дальнейших манипуляций в клетках Е. coli, выращиваемых под селективным давлением с антибиотиками для того, чтобы плазмиды не терялись в клеточной популяции. Плазмидную ДНК выделяли из клеток коммерческими наборами, измеряли концентрацию и использовали для клонирования с помощью обработки эндонуклеазами рестрикции или методами ПЦР-амплификации. Фрагменты ДНК лигировали между собой с помощью лигаз и трансформировали в бактериальные клетки для отбора клонов и дальнейших наработок. Все полученные генетические конструкции подтверждали по паттернам рестрикции и полным секвенированием по Сэнгеру.For DNA manipulation, standard methods were used as described in Sambrook J. et al., Molecular cloning: A laboratory manual; Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989. Molecular biology reagents were used according to the manufacturers' instructions. Briefly, plasmid DNA was produced for further manipulation in E. coli cells grown under selective pressure with antibiotics to ensure that plasmids were not lost in the cell population. Plasmid DNA was isolated from cells using commercial kits, the concentration was measured, and used for cloning using restriction endonuclease treatment or PCR amplification methods. DNA fragments were ligated with each other using ligases and transformed into bacterial cells for clone selection and further development. All obtained genetic constructs were confirmed by restriction patterns and full Sanger sequencing.
Синтез геновGene synthesis
Требуемые сегменты генов получали из олигонуклеотидов, созданных путем химического синтеза. Генные фрагменты длиной от 300 до 1000 п. н., которые фланкированы уникальными сайтами рестрикции, собирали путем ренатурации олигонуклеотидов друг на друге с последующей ГЩР-амплификацией с крайних праймеров. В результате получали смесь фрагментов, включая нужный. Фрагменты клонировали по сайтам рестрикции в промежуточные векторы, после чего последовательности ДНК субклонированных фрагментов подтверждали путем секвенирования ДНК.The required gene segments were obtained from oligonucleotides created by chemical synthesis. Gene fragments from 300 to 1000 bp in length, which are flanked by unique restriction sites, were assembled by renaturation of oligonucleotides on each other, followed by HSR amplification from extreme primers. As a result, a mixture of fragments was obtained, including the desired one. The fragments were cloned at restriction sites into intermediate vectors, after which the DNA sequences of the subcloned fragments were confirmed by DNA sequencing.
Определение последовательностей ДНКDetermination of DNA sequences
Последовательности ДНК определяли путем секвенирования по Сэнгеру. Анализ последовательностей ДНК и белков и обработку данных о последовательностях осуществляли в программе SnapGene 4.2 и выше для создания, картирования, анализа, аннотирования и иллюстрации последовательностей.DNA sequences were determined by Sanger sequencing. DNA and protein sequence analysis and sequence data processing were performed using SnapGene 4.2 and higher to generate, map, analyze, annotate, and illustrate sequences.
Культивирование клеточных культурCell culture cultivation
В экспериментах были использованы клеточные линии НЕК293 (Human Embryonic Kidney clone 293), SK-HEP1 (human adenocarcinoma endothelial cell line) и HUH7 (human hepatocellular carcinoma cell lines). Суспензионные клетки HEK293, используемые для наработки AAV, культивировались в стандартных условиях при 37°С и 5% CO2 на полной питательной среде без FBS и антибиотика. Адгезионные клетки SK-HEP1, используемые для проверки эффективности препаратов AAV, культивировались в стандартных условиях при 37°С и 5% СО2, на полной питательной среде ЕМЕМ с добавлением 10% FBS, антибиотика/антимикотика. Адгезионные клетки HUH7, используемые для проверки эффективности препаратов AAV, культивировались в стандартных условиях при 37°С и 5% СО2, на полной питательной среде DMEM с добавлением 10% FBS, антибиотика/антимикотика. Пересев клеток осуществлялся при достижении 80-90% конфлюентности. Для диссоциации клеточного монослоя использовался TrypLE Select enzyme (10х). Жизнеспособность клеток оценивалась с помощью окраски Trypan Blue и одноразовых камер для подсчета клеток с помощью автоматического счетчика Countess II.The cell lines HEK293 (Human Embryonic Kidney clone 293), SK-HEP1 (human adenocarcinoma endothelial cell line) and HUH7 (human hepatocellular carcinoma cell lines) were used in the experiments. Suspension HEK293 cells used for AAV production were cultured under standard conditions at 37°C and 5% CO 2 in complete nutrient medium without FBS and antibiotic. Adherent SK-HEP1 cells used to test the effectiveness of AAV drugs were cultured under standard conditions at 37°C and 5% CO 2 in complete EMEM nutrient medium supplemented with 10% FBS, an antibiotic/antimycotic. Adherent HUH7 cells used to test the effectiveness of AAV drugs were cultured under standard conditions at 37°C and 5% CO 2 in complete DMEM medium supplemented with 10% FBS, an antibiotic/antimycotic. Cell reseeding was carried out when 80-90% confluency was achieved. TrypLE Select enzyme (10x) was used to dissociate the cell monolayer. Cell viability was assessed using Trypan Blue staining and disposable cell counting chambers using a Countess II automated counter.
Трансфекция клеточных культурTransfection of cell cultures
Для оценки функциональности новых кодон-оптимизированных нуклеиновых кислот, которые кодируют белок FVIII-BDD, при трансфекции использовались плазмиды, содержащие экспрессио иную кассету для экспрессии различных вариантов трансгенов hFVIII-BDD. Клетки линии SK-HEP1 заранее засевали в лунки 12-луночных планшетов с плотностью 10000 кл/см2. Через сутки вносились плазмиды в одинаковой копийности в составе комплекса с Lipofectamine 3000. На 7 день после трансфекции определяли содержание белка FVIII-BDD и его активность в культуральной жидкости методом ИФА и хромогенного теста. Работы по оценке уровня и активности белка FVIII-BDD в культуральной жидкости проводились в 6 независимых экспериментах. Для негативного контроля были использованы интактные клетки линии SK-HEP1.To evaluate the functionality of new codon-optimized nucleic acids that encode the FVIII-BDD protein, plasmids containing a different expression cassette for the expression of various variants of hFVIII-BDD transgenes were used during transfection. Cells of the SK-HEP1 line were pre-seeded into the wells of 12-well plates with a density of 10,000 cells/ cm2 . A day later, plasmids were introduced in the same copy number as part of a complex with Lipofectamine 3000. On the 7th day after transfection, the content of the FVIII-BDD protein and its activity in the culture liquid were determined by ELISA and chromogenic test. Work to assess the level and activity of the FVIII-BDD protein in the culture liquid was carried out in 6 independent experiments. Intact SK-HEP1 cells were used as a negative control.
Сборка и очистка экспрессионных векторов на основе AAVAssembly and purification of AAV-based expression vectors
Для сборки экспрессионных векторов на основе AAV, содержащих варианты гена FVIII-BDD, использовали клетки-продуценты НЕК293, которые трансфецировали 3-мя плазмидами:To assemble expression vectors based on AAV containing variants of the FVIII-BDD gene, HEK293 producer cells were used, which were transfected with 3 plasmids:
1) плазмиды, содержащие экспрессионную кассету AAV для экспрессии различных вариантов трансгенов hFVIII-BDD (Фиг. 1.);1) plasmids containing an AAV expression cassette for the expression of various variants of hFVIII-BDD transgenes (Fig. 1);
2) плазмида для экспрессии гена Сар серотипа AAV6 или AAV5 и гена Rep серотипа AAV2. Каждый ген с помощью альтернативных рамок считывания кодирует несколько белковых продуктов;2) a plasmid for the expression of the Sar gene of serotype AAV6 or AAV5 and the Rep gene of serotype AAV2. Each gene encodes multiple protein products using alternative reading frames;
3) плазмида для экспрессии генов аденовируса Ad5, необходимых для сборки и упаковки капсидов AAV.3) a plasmid for the expression of Ad5 adenovirus genes necessary for the assembly and packaging of AAV capsids.
Через 72 часа клетки лизировали и проводили очистку и концентрирование векторов с помощью методов фильтрации, хроматографии и ультрацентифугирования. Титр вирусных векторов определяли с помощью количественной 1ТЦР с праймерами и пробой, специфичными к участку рекомбинантного вирусного генома, и выражали в виде количества копий вирусных геномов на 1 мл.After 72 hours, the cells were lysed and the vectors were purified and concentrated using filtration, chromatography and ultracentifugation methods. The titer of viral vectors was determined using quantitative 1TCR with primers and probe specific to a region of the recombinant viral genome and expressed as the number of copies of viral genomes per 1 ml.
Трансдукция клеточных культурTransduction of cell cultures
Клеточную линию HUH7 заранее засевали в лунки 12-луночных планшетов с плотностью 10000 кл/см2. После прикрепления клеток к адгезивной подложке, вносились препараты AAV при MOI 500000 вг/кл. На 7 день после трансдукции определяли содержание белка FVIII-BDD и его активность в культуральной жидкости методом ИФА и хромогенным тестом. Работы по оценке уровня и активности белка FVilli в культуральной жидкости проводились в 6 независимых экспериментах. Для негативного контроля были использованы интактные клетки.The HUH7 cell line was pre-seeded into the wells of 12-well plates with a density of 10,000 cells/ cm2 . After cell attachment to the adhesive substrate, AAV preparations were applied at an MOI of 500,000 vg/cell. On day 7 after transduction, the content of the FVIII-BDD protein and its activity in the culture liquid was determined by ELISA and chromogenic test. Work to assess the level and activity of FVilli protein in the culture liquid was carried out in 6 independent experiments. Intact cells were used for negative control.
Определение количества белка фактора свертывания крови VIII-BDD методом ИФАDetermination of the amount of blood coagulation factor VIII-BDD protein by ELISA
Оценка содержания белка фактора свертывания крови VIII-BDD в культуральной жидкости после трансфекции клеток целевыми кандидатами проводилась «сэндвич»-методом неконкурентного твердофазного иммуноферментного анализа (ИФА). Вкратце, разведенные в буфере для разведений образцы культуральной жидкости, вносились в лунки 96-луночного планшета, сенсибилизированные первичными специфическими к фактору свертывания крови VIII-BDD антителами. В этот же планшет вносились стандарты для построения калибровочной кривой, контроли. Планшет инкубировался 1 час при температуре 37°С. Производили отмывку лунок планшета отмывочным буфером перед внесением биотинилированных антител, раствора конъюгата стрептавидин-пероксидазы и ТМВ. Вносился раствор со специфическими биотинилированными детектирующими антителами к фактору VIII-BDD и планшет инкубировался 30 минут при температуре 37°С. Далее к образовавшемуся комплексу добавлялся раствор конъюгата стрептавидин-пероксидазы и планшет инкубировался 30 минут при температуре 37°С. Для визуализации ферментативной реакции вносился раствор ТМВ. По достижении нужной степени интенсивности окрашивания во все лунки добавляется стоп-раствор для остановки реакции. Далее измерялась оптическая плотность растворов в лунках планшета. Концентрация фактора свертывания крови VIII-BDD в исследуемых образцах определялась по калибровочной кривой с учетом предварительного разведения образцов.Assessment of the protein content of blood coagulation factor VIII-BDD in the culture fluid after transfection of cells with target candidates was carried out using the “sandwich” method of non-competitive enzyme-linked immunosorbent assay (ELISA). Briefly, culture fluid samples diluted in dilution buffer were added to wells of a 96-well plate coated with primary coagulation factor VIII-BDD-specific antibodies. Standards for constructing a calibration curve and controls were added to the same tablet. The plate was incubated for 1 hour at 37°C. The wells of the plate were washed with washing buffer before adding biotinylated antibodies, a solution of streptavidin-peroxidase conjugate and TMB. A solution with specific biotinylated detection antibodies to factor VIII-BDD was added and the plate was incubated for 30 minutes at 37°C. Next, a solution of streptavidin-peroxidase conjugate was added to the resulting complex and the plate was incubated for 30 minutes at 37°C. To visualize the enzymatic reaction, a TMB solution was added. Once the desired degree of color intensity is achieved, a stop solution is added to all wells to stop the reaction. Next, the optical density of the solutions in the wells of the plate was measured. The concentration of blood coagulation factor VIII-BDD in the studied samples was determined using a calibration curve, taking into account preliminary dilution of the samples.
Определение уровня активности белка фактора свертывания крови VIII-BDD методом ИФАDetermination of the level of protein activity of blood coagulation factor VIII-BDD by ELISA
Оценка активности белка фактора свертывания крови VIII в культуральной жидкости после трансфекции клеток линии целевыми кандидатами проводилась при помощи хромогенного теста. Суть теста заключается в том, что в присутствии ионов кальция, фосфолипидов и фактора IXa фактор X переходит в активированную форму Ха, фактор VIII действует как кофактор в этой реакции, и скорость активации фактора X линейно связана с количество фактора VIII. Вкратце, разведенные в буфере для разведений образцы культуральной жидкости, стандарты для построения калибровочной кривой и контроли вносились в лунки 96-луночного планшета. Планшет инкубировался 3 минуты при температуре 37°С. Во все лунки планшета вносили раствор Factor reagent, содержащий фактор ГХа, фактор X, тромбин, CaCl2 и фосфолипиды. Планшет инкубировался 4 минуты при температуре 37°С. Во все лунки планшета вносили раствор хромогенного субстрата S-2765+I-2581. Планшет инкубировался 7 минут при температуре 37°С. По достижению нужной степени интенсивности окрашивания во все лунки добавляли 20% раствор уксусной кислоты для остановки реакции. Далее измерялась оптическая плотность растворов в лунках планшета. Активность фактора свертывания крови VIII в исследуемых образцах определялась по калибровочной кривой с учетом предварительного разведения образцов.The activity of blood coagulation factor VIII protein in the culture fluid after transfection of the cell line with target candidates was assessed using a chromogenic test. The essence of the test is that in the presence of calcium ions, phospholipids and factor IXa, factor X transforms into the activated form of Xa, factor VIII acts as a cofactor in this reaction, and the rate of activation of factor X is linearly related to the amount of factor VIII. Briefly, culture fluid samples, standard curve standards, and controls diluted in dilution buffer were added to the wells of a 96-well plate. The plate was incubated for 3 minutes at 37°C. A Factor reagent solution containing factor GCa, factor X, thrombin, CaCl 2 and phospholipids was added to all wells of the plate. The plate was incubated for 4 minutes at 37°C. A solution of the chromogenic substrate S-2765+I-2581 was added to all wells of the plate. The plate was incubated for 7 minutes at 37°C. Once the desired degree of color intensity was achieved, a 20% acetic acid solution was added to all wells to stop the reaction. Next, the optical density of the solutions in the wells of the plate was measured. The activity of blood coagulation factor VIII in the studied samples was determined using a calibration curve, taking into account the preliminary dilution of the samples.
Проведение in vivo исследования на лабораторных животныхConducting in vivo studies on laboratory animals
Для экспериментов были использованы мыши линии C57BL/6 (самцы возрастом 6-8 недель). Препараты вводили животным однократно путем внутривенного введения в хвостовую вену. Группе животных отрицательного контроля вводился буферный раствор, не содержащий AAV.C57BL/6 mice (males, 6-8 weeks old) were used for the experiments. The drugs were administered to animals once by intravenous injection into the tail vein. A group of negative control animals was injected with a buffer solution that did not contain AAV.
Отбор плазмы крови производился в день инъекции до введения препаратов, далее - на 35 и 56 дни после введения экспрессионных векторов. Статистический анализ данныхBlood plasma was collected on the day of injection before administration of the drugs, then on days 35 and 56 after administration of expression vectors. Statistical data analysis
Результаты представлены в виде среднего значения±стандартное отклонение (SD), для сравнения результатов эксперимента использовали однофакторный дисперсионный анализ с поправкой на множественные попарные сравнения по методу Даннета (One-way ANOVA), и они были определены как статистически значимые.Results are presented as mean ± standard deviation (SD), and Dunnett's One-way ANOVA was used to compare experimental results and were determined to be statistically significant.
Пример 1: Модификация последовательности гена hFVIII-BDD с помощью разработанного алгоритма кодон-оптимизацииExample 1: Modification of the hFVIII-BDD gene sequence using the developed codon optimization algorithm
Разработанные генетические конструкции представляют собой нуклеотидные последовательности, кодирующие экспрессионную кассету с геном человеческого фактора свертывания крови VIII с делетированным В доменом (FVIII-BDD).The developed genetic constructs are nucleotide sequences encoding an expression cassette with the human blood coagulation factor VIII gene with the B domain deleted (FVIII-BDD).
Конечная экспрессионная кассета содержит все необходимые элементы как для экспрессии гена, так и сборки в составе генома рекомбинантного AAV (Фигура 1):The final expression cassette contains all the necessary elements for both gene expression and assembly into the recombinant AAV genome (Figure 1):
1) терминальные повторы ITR на концах последовательности, которая инкапсидируется в экспрессионный вектор;1) terminal ITR repeats at the ends of the sequence that is encapsidated into the expression vector;
2) элементы для экспрессии целевого гена (промотор, трансген, сайт полиаденилирования);2) elements for expression of the target gene (promoter, transgene, polyadenylation site);
3) ориджин бактериальной репликации и ген устойчивости к антибиотику для наработки плазмидной ДНК в бактериальных клетках.3) the origin of bacterial replication and the antibiotic resistance gene for the production of plasmid DNA in bacterial cells.
В качестве нуклеиновой кислоты дикого типа использовалась нуклеиновая кислота, которая кодирует белок человеческого фактора свертывания крови VIII с делетированным В доменом, и включает нуклеотидную последовательность SEQ ID NO: 1. Данная нуклеиновая кислота используется в составе экспрессионной кассеты в качестве контроля.The wild-type nucleic acid was a nucleic acid that encodes the human coagulation factor VIII protein with the B domain deleted and includes the nucleotide sequence SEQ ID NO: 1. This nucleic acid is used as a control in the expression cassette.
Дополнительно с целью повышения эффективности экспрессии природная нуклеотидная последовательность гена фактора свертывания крови VIII с делетированным В доменом была модифицирована с помощью алгоритма кодон-оптимизации.Additionally, in order to increase the efficiency of expression, the natural nucleotide sequence of the blood coagulation factor VIII gene with the deleted B domain was modified using a codon optimization algorithm.
В результате кодон-оптимизации нуклеиновой кислоты, соответствующей последовательности SEQ ID NO: 1, был получен ряд кодон-оптимизированных нуклеиновых кислот SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5, которые были в дальнейшем протестированы на уровень экспрессии белка фактора свертывания крови VIII-BDD и его активности по сравнению с контролем (нуклеиновая кислота SEQ ID NO: 1) в составе экспрессионной кассеты (Фигура 1).As a result of codon optimization of the nucleic acid corresponding to the sequence of SEQ ID NO: 1, a number of codon-optimized nucleic acids of SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 or SEQ ID NO:5 were obtained that were further tested for the level of protein expression of blood coagulation factor VIII-BDD and its activity in comparison with the control (nucleic acid SEQ ID NO: 1) in the expression cassette (Figure 1).
Пример 2. Проверка работоспособности кодон-оптимизированных вариантов последовательности гена FVIII с делетированным В доменом in vitroExample 2. Testing the performance of codon-optimized variants of the FVIII gene sequence with the B domain deleted in vitro
Полученные нами кодон-оптимизированные нуклеиновые кислоты, выбранные из SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5, кодирующие белок FVIII-BDD, были проверены при трансфекции клеток линии SK-HEP1 in vitro в составе экспрессионной кассеты, состоящей из левого (первого) ITR (инвертированные концевые повторы), тканеспецифичного промотора, трансгена, сигнала полиаденилирования, правого (второго) ITR, где трансгеном является одна из последовательностей SEQ ID NO: 2-5. В качестве контроля трансген представлял собой нуклеиновую кислоту без оптимизации, которая кодирует белок человеческого FVIII с делетированным В доменом, соответствующая последовательности SEQ ID NO:l.The codon-optimized nucleic acids we obtained, selected from SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 or SEQ ID NO:5, encoding the FVIII-BDD protein, were tested by transfecting SK-HEP1 cells in vitro as part of an expression cassette consisting of a left (first) ITR (inverted terminal repeats), a tissue-specific promoter, a transgene, a polyadenylation signal, a right (second) ITR, where the transgene is one of the sequences SEQ ID NO: 2-5. As a control, the transgene was an unoptimized nucleic acid that encodes a human FVIII protein with the B domain deleted, corresponding to the sequence SEQ ID NO:l.
Использование всех нуклеиновых кислот, выбранных из SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5, кодирующих белок FVIII-BDD, привели к увеличению уровня продукции (Фигура 2) и активности (Фигура 3) белка FVIII-BDD по сравнению с использованием нуклеиновой кислоты SEQ ID NO: 1 без оптимизации.Use of all nucleic acids selected from SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 or SEQ ID NO:5 encoding the FVIII-BDD protein resulted in increased levels of production (Figure 2) and activity (Figure 3) FVIII-BDD protein compared to using nucleic acid SEQ ID NO: 1 without optimization.
Кроме того, полученные нами кодон-оптимизированные нуклеиновые кислоты, кодирующие белок фактора свертывания крови VIII с делетированным В доменом (SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 или SEQ ID NO:5), способны приводить к увеличению экспрессии белка FVIII-BDD in vitro в клетке-хозяине по сравнению с использованием нуклеиновой кислоты SEQ ID NO:l без оптимизации. Таким образом, кодон-оптимизированные нуклеиновые кислоты по изобретению обладают высоким потенциалом для получения рекомбинантного белка FVIII-BDD для терапии Гемофилии А.In addition, our codon-optimized nucleic acids encoding the coagulation factor VIII protein with the B domain deleted (SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4 or SEQ ID NO:5) can lead to increasing the expression of FVIII-BDD protein in vitro in a host cell compared to using the nucleic acid SEQ ID NO:l without optimization. Thus, the codon-optimized nucleic acids of the invention have high potential for producing recombinant FVIII-BDD protein for the treatment of Hemophilia A.
Пример 3. Создание и проверка работоспособности экспрессионных векторов, несущих кодон-оптимизированные варианты последовательности гена FVIII-BDD in vitroExample 3. Creation and performance testing of expression vectors carrying codon-optimized variants of the FVIII-BDD gene sequence in vitro
Для того чтобы показать эффективность доставки разработанных кодон-оптимизированных нуклеиновых кислот при помощи экспрессионного вектора in vitro, плазмиды, кодирующие целевые генетические конструкции вместе с остальными необходимыми плазмидами были использованы для наработки экспрессионных векторов на основе аденоассоциированного вируса серотипа 5, несущего нуклеотидную последовательность SEQ ID NO:2 (далее упоминается как AAV5-FVIII-BDDco-vl), и на основе аденоассоциированного вируса серотипа 6, несущего нуклеотидную последовательность SEQ ID N0:2 (далее упоминается как AAV6-FVIII-BDDco-vl) или нуклеотидную последовательность SEQ ID NO:5 (далее упоминается как AAV6-FVIII-BDDco-v4). Очищенные препараты AAV5-FVIII-BDDco-vl, AAV6-FVIII-BDDco-vl и AAV6-FVIII-BDDco-v4, используемые для проведения in vitro и in vivo исследований, были подготовлены с применением стандартных буферов и эксципиентов, которые являются безопасными и не изменяют свойств AAV.In order to demonstrate the efficiency of delivery of the developed codon-optimized nucleic acids using an expression vector in vitro, plasmids encoding the target genetic constructs along with other necessary plasmids were used to develop expression vectors based on adeno-associated virus serotype 5 carrying the nucleotide sequence SEQ ID NO: 2 (hereinafter referred to as AAV5-FVIII-BDDco-vl), and based on an adeno-associated virus serotype 6 carrying the nucleotide sequence SEQ ID NO:2 (hereinafter referred to as AAV6-FVIII-BDDco-vl) or the nucleotide sequence SEQ ID NO:5 (hereinafter referred to as AAV6-FVIII-BDDco-v4). The purified preparations of AAV5-FVIII-BDDco-vl, AAV6-FVIII-BDDco-vl and AAV6-FVIII-BDDco-v4 used for in vitro and in vivo studies were prepared using standard buffers and excipients that are safe and not change the properties of AAV.
Препараты AAV5-FVIII-BDDco-vl, AAV6-FVIII-BDDco-vl и AAV6-FVIII-BDDco-v4 были протестированы in vitro с использованием адгезионной клеточной линии HUH7 (Фиг. 4 и 5). В лунки 12-луночных планшетов были посеяны клетки линии с плотностью 10 ООО кл/см2. После прикрепления клеток к адгезивной подложке, вносились препараты AAV при MOI 500000 вг/кл. На 7 день после трансдукции определяли содержание белка FVIII-BDD и его активность в культуральной жидкости методом ИФА. Все образцы были поставлены в трипликатах. Для негативного контроля были использованы интактные клетки.The formulations AAV5-FVIII-BDDco-vl, AAV6-FVIII-BDDco-vl and AAV6-FVIII-BDDco-v4 were tested in vitro using the adherent cell line HUH7 (Figures 4 and 5). Line cells with a density of 10 000 cells/cm2 were seeded into the wells of 12-well plates. After cell attachment to the adhesive substrate, AAV preparations were applied at an MOI of 500,000 vg/cell. On day 7 after transduction, the content of the FVIII-BDD protein and its activity in the culture liquid were determined by ELISA. All samples were supplied in triplicates. Intact cells were used for negative control.
Было показано, что разработанные нами экспрессионные векторы AAV5-FVIII-BDDco-v1, AAV6-FVIII-BDDco-v1 и AAV6-FVIII-BDDco-v4, несущие кодон-оптимизированные версии гена фактора свертывания крови VIII-BDD, позволяют эффективно доставить трансген фактора свертывания крови VIII-BDD в клетки HUH7 и обеспечить продукцию целевого белка, что подтверждается при анализе культуральной жидкости методом ИФА (Фигура 4) и анализом активности (Фигура 5) белка фактора свертывания крови VIII-BDD. Доставка SEQ ID N0:2 при помощи экспрессионного вектора на основе AAV серотипа 5 приводит к продукции белка FVIII-BDD в культуральной жидкости на уровне 129 нг/мл и активности 97%. Доставка SEQ ID NO:2 при помощи экспрессионного вектора на основе AAV серотипа 6 приводит к продукции белка FVIII-BDD в культуральной жидкости на уровне 104 нг/мл и активности 91%. Доставка SEQ ID NO:5 при помощи экспрессионного вектора на основе AAV серотипа 6 приводит к продукции белка FVIII-BDD в культуральной жидкости на уровне 61 нг/мл и активности 68%.It was shown that the expression vectors AAV5-FVIII-BDDco-v1, AAV6-FVIII-BDDco-v1 and AAV6-FVIII-BDDco-v4 developed by us, carrying codon-optimized versions of the blood coagulation factor VIII-BDD gene, allow efficient delivery of the factor transgene blood coagulation VIII-BDD into HUH7 cells and ensure the production of the target protein, which is confirmed by analyzing the culture liquid by ELISA (Figure 4) and analyzing the activity (Figure 5) of the blood coagulation factor VIII-BDD protein. Delivery of SEQ ID NO:2 using an AAV serotype 5 expression vector results in the production of FVIII-BDD protein in the culture fluid at a level of 129 ng/ml and an activity of 97%. Delivery of SEQ ID NO:2 using an AAV serotype 6 expression vector results in production of FVIII-BDD protein in the culture fluid at a level of 104 ng/ml and an activity of 91%. Delivery of SEQ ID NO:5 using an AAV serotype 6 expression vector results in production of FVIII-BDD protein in the culture fluid at a level of 61 ng/ml and an activity of 68%.
Пример 4. Проверка работоспособности препаратов AAV5-FVIII-BDDco-vl и AAV6-FVIII-BDDco-v1 in vivoExample 4. Testing the performance of drugs AAV5-FVIII-BDDco-vl and AAV6-FVIII-BDDco-v1 in vivo
Для того чтобы показать эффективность доставки разработанных кодон-оптимизированных нуклеиновых кислот при доставке в составе экспрессионного вектора in vivo, выбранные препараты AAV5-FVIII-BDDco-v1 и AAV6-FVIII-BDDco-v1 были введены лабораторным мышам линии C57BL/6. В исследовании использовали дозу AAV препаратов равную 6х1013 вг/мышь. В качестве негативного контроля был использованы контрольный раствор без AAV. Препараты вводили животным однократно путем внутривенного гидродинамического введения в хвостовую вену. Отбор плазмы крови производился в день инъекции до введения препаратов (0 день), далее на 35 и 56 дни после введения препаратов. В образцах плазмы крови определяли уровень белка фактора свертывания крови VIII-BDD методом ИФА, как было описано выше.In order to demonstrate the delivery efficiency of the designed codon-optimized nucleic acids when delivered as part of an expression vector in vivo, the selected drugs AAV5-FVIII-BDDco-v1 and AAV6-FVIII-BDDco-v1 were administered to C57BL/6 laboratory mice. The study used a dose of AAV drugs equal to 6x1013 vg/mouse. A control solution without AAV was used as a negative control. The drugs were administered to animals once by intravenous hydrodynamic injection into the tail vein. Blood plasma was collected on the day of injection before drug administration (day 0), then on days 35 and 56 after drug administration. In blood plasma samples, the level of blood coagulation factor VIII-BDD protein was determined by ELISA, as described above.
В результате проведенных in vivo исследований было показано, что в случае использования обоих препаратов AAV5-FVIII-BDDco-vl и AAV6-FVIII-BDDco-vl, содержащих кодон-оптимизированную последовательность гена фактора свертывания крови VIII-BDD SEQ ID NO:2, наблюдается достоверное увеличение количества фактора VIII-BDD в плазме крови животных на 35 и на 56 дни (Фигура 6). В случае использования препарата AAV5-FVIII-BDDco-vl, содержащего кодон-оптимизированную последовательность гена фактора свертывания крови VIII-BDD SEQ ID NO:2 в плазме крови животных на 35 и 56 дни после инъекции наблюдалась экспрессия FVIII-BDD на уровне 304 и 279 нг/мл, соответственно. В случае использования препарата AAV6-FVIII-BDDco-v1, содержащего кодон-оптимизированную последовательность гена фактора свертывания крови VIII-BDD SEQ ID N0:2 в плазме крови животных на 35 и 56 дни после инъекции наблюдалась экспрессия FVIII-BDD на уровне 415 и 459 нг/мл, соответственно.As a result of in vivo studies, it was shown that in the case of using both drugs AAV5-FVIII-BDDco-vl and AAV6-FVIII-BDDco-vl, containing a codon-optimized sequence of the blood clotting factor VIII-BDD gene SEQ ID NO: 2, a significant increase in the amount of factor VIII-BDD in the blood plasma of animals on days 35 and 56 (Figure 6). In the case of using the drug AAV5-FVIII-BDDco-vl, containing the codon-optimized sequence of the gene for blood coagulation factor VIII-BDD SEQ ID NO: 2, expression of FVIII-BDD at levels 304 and 279 was observed in the blood plasma of animals on days 35 and 56 after injection ng/ml, respectively. In the case of using the drug AAV6-FVIII-BDDco-v1 containing the codon-optimized sequence of the gene for blood coagulation factor VIII-BDD SEQ ID N0:2 in the blood plasma of animals on days 35 and 56 after injection, FVIII-BDD expression was observed at levels 415 and 459 ng/ml, respectively.
Таким образом, разработанные экспрессионные вектора на основе AAV5 и AAV6, несущие кодон-оптимизированные версии гена фактора свертывания крови VIII с делетированным В доменом (AAV5-FVIII-BDDco-vl и AAV6-FVIII-BDDco-vl) способны приводить к экспрессии белка FVIII-BDD in vivo и обладают высоким потенциалом для генной терапии Гемофилии А.Thus, the developed expression vectors based on AAV5 and AAV6, carrying codon-optimized versions of the coagulation factor VIII gene with the B domain deleted (AAV5-FVIII-BDDco-vl and AAV6-FVIII-BDDco-vl) are capable of leading to the expression of the FVIII- BDD in vivo and have high potential for gene therapy for Hemophilia A.
--->--->
Перечень последовательностей List of sequences
<110> АО "БИОКАД"<110> JSC "BIOCAD"
<120> Кодон-оптимизированная нуклеиновая кислота, которая кодирует <120> Codon-optimized nucleic acid that encodes
белок фактора свёртывания крови VIII c делетированным B доменом, и ее coagulation factor VIII protein with deleted B domain, and its
применениеapplication
<160> 22<160> 22
<170> BiSSAP 1.3.6<170> BiSSAP 1.3.6
<210> 1<210> 1
<211> 4314<211> 4314
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> нуклеиновая кислота, кодирующая белок FVIII-BDD (фактор<223> nucleic acid encoding the FVIII-BDD protein (factor
свёртывания крови VIII c делетированным B доменом) (дикого blood coagulation VIII with deleted B domain) (wild
типа)type)
<400> 1<400> 1
gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat
60 60
ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc
120 120
aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac
180 180
atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt
240 240
tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct
300 300
gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa
360 360
agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc
420 420
ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct
480 480
catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga
540 540
gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct
600 600
gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg
660 660
gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg
720 720
tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg
780 780
ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac
840 840
catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg
900 900
atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg
960 960
gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat
10201020
gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt
10801080
gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa
11401140
acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc
12001200
gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt
12601260
aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa
13201320
gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca
13801380
ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc
14401440
actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat
15001500
tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg
15601560
ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag
16201620
agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat
16801680
caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat
17401740
gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga
18001800
gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat
18601860
gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta
19201920
agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac
19801980
aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg
20402040
tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga
21002100
ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag
21602160
gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga
22202220
agcttctctc aaaacccacc agtcttgaaa cgccatcaac gggaaataac tcgtactact agcttctctc aaaacccacc agtcttgaaa cgccatcaac gggaaataac tcgtactact
22802280
cttcagtcag atcaagagga aattgactat gatgatacca tatcagttga aatgaagaag cttcagtcag atcaagagga aattgactat gatgatacca tatcagttga aatgaagaag
23402340
gaagattttg acatttatga tgaggatgaa aatcagagcc cccgcagctt tcaaaagaaa gaagattttg acatttatga tgaggatgaa aatcagagcc cccgcagctt tcaaaagaaa
24002400
acacgacact attttattgc tgcagtggag aggctctggg attatgggat gagtagctcc acacgacact attttattgc tgcagtggag aggctctggg attatgggat gagtagctcc
24602460
ccacatgttc taagaaacag ggctcagagt ggcagtgtcc ctcagttcaa gaaagttgtt ccacatgttc taagaaacag ggctcagagt ggcagtgtcc ctcagttcaa gaaagttgtt
25202520
ttccaggaat ttactgatgg ctcctttact cagcccttat accgtggaga actaaatgaa ttccaggaat ttactgatgg ctcctttact cagcccttat accgtggaga actaaatgaa
25802580
catttgggac tcctggggcc atatataaga gcagaagttg aagataatat catggtaact catttgggac tcctggggcc atatataaga gcagaagttg aagataatat catggtaact
26402640
ttcagaaatc aggcctctcg tccctattcc ttctattcta gccttatttc ttatgaggaa ttcagaaatc aggcctctcg tccctattcc ttctattcta gccttatttc ttatgaggaa
27002700
gatcagaggc aaggagcaga acctagaaaa aactttgtca agcctaatga aaccaaaact gatcagaggc aaggagcaga acctagaaaa aactttgtca agcctaatga aaccaaaact
27602760
tacttttgga aagtgcaaca tcatatggca cccactaaag atgagtttga ctgcaaagcc tacttttgga aagtgcaaca tcatatggca cccactaaag atgagtttga ctgcaaagcc
28202820
tgggcttatt tctctgatgt tgacctggaa aaagatgtgc actcaggcct gattggaccc tgggcttatt tctctgatgt tgacctggaa aaagatgtgc actcaggcct gattggaccc
28802880
cttctggtct gccacactaa cacactgaac cctgctcatg ggagacaagt gacagtacag cttctggtct gccacactaa cacactgaac cctgctcatg ggagacaagt gacagtacag
29402940
gaatttgctc tgtttttcac catctttgat gagaccaaaa gctggtactt cactgaaaat gaatttgctc tgtttttcac catctttgat gagaccaaaa gctggtactt cactgaaaat
30003000
atggaaagaa actgcagggc tccctgcaat atccagatgg aagatcccac ttttaaagag atggaaagaa actgcagggc tccctgcaat atccagatgg aagatcccac ttttaaagag
30603060
aattatcgct tccatgcaat caatggctac ataatggata cactacctgg cttagtaatg aattatcgct tccatgcaat caatggctac ataatggata cactacctgg cttagtaatg
31203120
gctcaggatc aaaggattcg atggtatctg ctcagcatgg gcagcaatga aaacatccat gctcaggatc aaaggattcg atggtatctg ctcagcatgg gcagcaatga aaacatccat
31803180
tctattcatt tcagtggaca tgtgttcact gtacgaaaaa aagaggagta taaaatggca tctattcatt tcagtggaca tgtgttcact gtacgaaaaa aagaggagta taaaatggca
32403240
ctgtacaatc tctatccagg tgtttttgag acagtggaaa tgttaccatc caaagctgga ctgtacaatc tctatccagg tgtttttgag acagtggaaa tgttaccatc caaagctgga
33003300
atttggcggg tggaatgcct tattggcgag catctacatg ctgggatgag cacacttttt atttggcggg tggaatgcct tattggcgag catctacatg ctgggatgag cacacttttt
33603360
ctggtgtaca gcaataagtg tcagactccc ctgggaatgg cttctggaca cattagagat ctggtgtaca gcaataagtg tcagactccc ctgggaatgg cttctggaca cattagagat
34203420
tttcagatta cagcttcagg acaatatgga cagtgggccc caaagctggc cagacttcat tttcagatta cagcttcagg acaatatgga cagtgggccc caaagctggc cagacttcat
34803480
tattccggat caatcaatgc ctggagcacc aaggagccct tttcttggat caaggtggat tattccggat caatcaatgc ctggagcacc aaggagccct tttcttggat caaggtggat
35403540
ctgttggcac caatgattat tcacggcatc aagacccagg gtgcccgtca gaagttctcc ctgttggcac caatgattat tcacggcatc aagacccagg gtgcccgtca gaagttctcc
36003600
agcctctaca tctctcagtt tatcatcatg tatagtcttg atgggaagaa gtggcagact agcctctaca tctctcagtt tatcatcatg tatagtcttg atgggaagaa gtggcagact
36603660
tatcgaggaa attccactgg aaccttaatg gtcttctttg gcaatgtgga ttcatctggg tatcgaggaa attccactgg aaccttaatg gtcttctttg gcaatgtgga ttcatctggg
37203720
ataaaacaca atatttttaa ccctccaatt attgctcgat acatccgttt gcacccaact ataaaacaca atatttttaa ccctccaatt attgctcgat acatccgttt gcacccaact
37803780
cattatagca ttcgcagcac tcttcgcatg gagttgatgg gctgtgattt aaatagttgc cattatagca ttcgcagcac tcttcgcatg gagttgatgg gctgtgattt aaatagttgc
38403840
agcatgccat tgggaatgga gagtaaagca atatcagatg cacagattac tgcttcatcc agcatgccat tgggaatgga gagtaaagca atatcagatg cacagattac tgcttcatcc
39003900
tactttacca atatgtttgc cacctggtct ccttcaaaag ctcgacttca cctccaaggg tactttacca atatgtttgc cacctggtct ccttcaaaag ctcgacttca cctccaaggg
39603960
aggagtaatg cctggagacc tcaggtgaat aatccaaaag agtggctgca agtggacttc aggagtaatg cctggagacc tcaggtgaat aatccaaaag agtggctgca agtggacttc
40204020
cagaagacaa tgaaagtcac aggagtaact actcagggag taaaatctct gcttaccagc cagaagacaa tgaaagtcac aggagtaact actcagggag taaaatctct gcttaccagc
40804080
atgtatgtga aggagttcct catctccagc agtcaagatg gccatcagtg gactctcttt atgtatgtga aggagttcct catctccagc agtcaagatg gccatcagtg gactctcttt
41404140
tttcagaatg gcaaagtaaa ggtttttcag ggaaatcaag actccttcac acctgtggtg tttcagaatg gcaaagtaaa ggtttttcag ggaaatcaag actccttcac acctgtggtg
42004200
aactctctag acccaccgtt actgactcgc taccttcgaa ttcaccccca gagttgggtg aactctctag acccaccgtt actgactcgc taccttcgaa ttcaccccca gagttgggtg
42604260
caccagattg ccctgaggat ggaggttctg ggctgcgagg cacaggacct ctac caccagattg ccctgaggat ggaggttctg ggctgcgagg cacaggacct ctac
43144314
<210> 2<210> 2
<211> 4314<211> 4314
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Кодон-оптимизированная нуклеотидная последовательность,<223> Codon-optimized nucleotide sequence,
кодирующая белок FVIII-BDD (вариант FVIII-BDDco-v1) encoding the FVIII-BDD protein (variant FVIII-BDDco-v1)
<400> 2<400> 2
gccaccagaa ggtactacct gggcgccgtg gagctgagct gggactacat gcagagcgac gccaccagaa ggtactacct gggcgccgtg gagctgagct gggactacat gcagagcgac
60 60
ctgggcgagc tgcctgtgga cgccagattc ccccccagag tgcctaagag cttccccttc ctgggcgagc tgcctgtgga cgccagattc ccccccagag tgcctaagag cttccccttc
120 120
aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcaccgacca cctgttcaac aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcaccgacca cctgttcaac
180 180
atcgccaagc ccagaccccc ctggatgggc ctgctgggcc ctaccatcca ggccgaggtg atcgccaagc ccagaccccc ctggatgggc ctgctgggcc ctaccatcca ggccgaggtg
240 240
tacgacaccg tggtgatcac cctgaagaac atggccagcc accccgtgag cctgcacgcc tacgacaccg tggtgatcac cctgaagaac atggccagcc accccgtgag cctgcacgcc
300 300
gtgggcgtga gctactggaa ggccagcgag ggcgccgagt acgacgacca gaccagccag gtgggcgtga gctactggaa ggccagcgag ggcgccgagt acgacgacca gaccagccag
360 360
agagagaagg aggacgacaa ggtgttcccc ggcggcagcc acacctacgt gtggcaggtg agagagaagg aggacgacaa ggtgttcccc ggcggcagcc acacctacgt gtggcaggtg
420 420
ctgaaggaga acggccccat ggccagcgac cccctgtgcc tgacctacag ctacctgagc ctgaaggaga acggccccat ggccagcgac cccctgtgcc tgacctacag ctacctgagc
480 480
cacgtggacc tggtgaagga cctgaacagc ggcctgatcg gcgccctgct ggtgtgcaga cacgtggacc tggtgaagga cctgaacagc ggcctgatcg gcgccctgct ggtgtgcaga
540 540
gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc gagggcagcc tggccaagga gaagaccag accctgcaca agttcatcct gctgttcgcc
600 600
gtgttcgacg agggcaagag ctggcacagc gagaccaaga acagcctgat gcaggacaga gtgttcgacg agggcaagag ctggcacagc gagaccaaga acagcctgat gcaggacaga
660 660
gacgccgcca gcgccagagc ctggcccaag atgcacaccg tgaacggcta cgtgaacagg gacgccgcca gcgccagagc ctggcccaag atgcacaccg tgaacggcta cgtgaacagg
720 720
agcctgcccg gcctgatcgg ctgccacaga aagagcgtgt actggcacgt gatcggcatg agcctgcccg gcctgatcgg ctgccacaga aagagcgtgt actggcacgt gatcggcatg
780 780
ggcaccaccc ccgaggtgca cagcatcttc ctggagggcc acaccttcct ggtgaggaac ggcaccaccc ccgaggtgca cagcatcttc ctggagggcc acaccttcct ggtgaggaac
840 840
cacagacagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg cacagacagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg
900 900
atggacctgg gccagttcct gctgttctgc cacatcagca gccaccagca cgacggcatg atggacctgg gccagttcct gctgttctgc cacatcagca gccaccagca cgacggcatg
960 960
gaggcctacg tgaaggtgga cagctgcccc gaggagcccc agctgagaat gaagaacaac gaggcctacg tgaaggtgga cagctgcccc gaggagcccc agctgagaat gaagaacaac
10201020
gaggaggccg aggactacga cgacgacctg accgacagcg agatggacgt ggtgagattc gaggaggccg aggactacga cgacgacctg accgacagcg agatggacgt ggtgagattc
10801080
gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag
11401140
acctgggtgc actacatcgc cgccgaggag gaggactggg actacgcccc cctggtgctg acctgggtgc actacatcgc cgccgaggag gaggactggg actacgcccc cctggtgctg
12001200
gcccccgacg acagaagcta caagagccag tacctgaaca acggccccca gaggatcggc gcccccgacg acagaagcta caagagccag tacctgaaca acggccccca gaggatcggc
12601260
agaaagtaca agaaggtgcg gttcatggcc tacaccgacg agaccttcaa gaccagggag agaaagtaca agaaggtgcg gttcatggcc tacaccgacg agaccttcaa gaccagggag
13201320
gccatccagc acgagagcgg catcctgggc cctctgctgt acggcgaggt gggcgacacc gccatccagc acgagagcgg catcctgggc cctctgctgt acggcgaggt gggcgacacc
13801380
ctgctgatca tcttcaagaa ccaggccagc agaccctaca acatctaccc ccacggcatc ctgctgatca tcttcaagaa ccaggccagc agaccctaca acatctaccc ccacggcatc
14401440
accgacgtga gacccctgta cagcagaaga ctgcccaagg gcgtgaagca cctgaaggac accgacgtga gacccctgta cagcagaaga ctgcccaagg gcgtgaagca cctgaaggac
15001500
ttccccatcc tgcccggcga gatcttcaag tacaagtgga ccgtgaccgt ggaggacggc ttccccatcc tgcccggcga gatcttcaag tacaagtgga ccgtgaccgt ggaggacggc
15601560
cccaccaaga gcgaccccag atgcctgacc agatactaca gcagcttcgt gaacatggag cccaccaaga gcgaccccag atgcctgacc agatactaca gcagcttcgt gaacatggag
16201620
cgggacctgg ccagcggcct gatcggcccc ctgctgatct gctacaagga gagcgtggac cgggacctgg ccagcggcct gatcggcccc ctgctgatct gctacaagga gagcgtggac
16801680
cagagaggca accagatcat gagcgacaag cggaacgtga tcctgttcag cgtgttcgac cagagaggca accagatcat gagcgacaag cggaacgtga tcctgttcag cgtgttcgac
17401740
gagaaccgga gctggtacct gaccgagaac atccagaggt tcctgcccaa ccccgccggc gagaaccgga gctggtacct gaccgagaac atccagaggt tcctgcccaa ccccgccggc
18001800
gtgcagctgg aggaccccga gttccaggcc agcaacatca tgcacagcat caacggctac gtgcagctgg aggaccccga gttccaggcc agcaacatca tgcacagcat caacggctac
18601860
gtgttcgaca gcctgcagct gagcgtgtgc ctgcacgagg tggcctactg gtacatcctg gtgttcgaca gcctgcagct gagcgtgtgc ctgcacgagg tggcctactg gtacatcctg
19201920
agcatcggcg cccagaccga cttcctgagc gtgttcttca gcggctacac cttcaagcac agcatcggcg cccagaccga cttcctgagc gtgttcttca gcggctacac cttcaagcac
19801980
aagatggtgt acgaggacac cctgaccctg ttccccttca gcggcgagac cgtgttcatg aagatggtgt acgaggacac cctgaccctg ttccccttca gcggcgagac cgtgttcatg
20402040
agcatggaga accccggcct gtggatcctg ggctgccaca acagcgactt cagaaacaga agcatggaga accccggcct gtggatcctg ggctgccaca acagcgactt cagaaacaga
21002100
ggcatgaccg ccctgctgaa ggtgagcagc tgcgacaaga acaccggcga ctactacgag ggcatgaccg ccctgctgaa ggtgagcagc tgcgacaaga acaccggcga ctactacgag
21602160
gacagctacg aggacatcag cgcctacctg ctgagcaaga acaacgccat cgagcccagg gacagctacg aggacatcag cgcctacctg ctgagcaaga acaacgccat cgagcccagg
22202220
agcttcagcc agaacccccc cgtgctgaag agacaccaga gagagatcac caggaccacc agcttcagcc agaacccccc cgtgctgaag agacaccaga gagagatcac caggaccacc
22802280
ctgcagagcg accaggagga gatcgactac gacgacacca tcagcgtgga gatgaagaag ctgcagagcg accaggagga gatcgactac gacgacacca tcagcgtgga gatgaagaag
23402340
gaggacttcg acatctacga cgaggacgag aaccagagcc ccagaagctt ccagaagaag gaggacttcg acatctacga cgaggacgag aaccagagcc ccagaagctt ccagaagaag
24002400
accaggcact acttcatcgc cgccgtggag agactgtggg actacggcat gagcagcagc accaggcact acttcatcgc cgccgtggag agactgtggg actacggcat gagcagcagc
24602460
ccccacgtgc tgagaaacag agcccagagc ggcagcgtgc cccagttcaa gaaggtggtg ccccacgtgc tgagaaacag agcccagagc ggcagcgtgc cccagttcaa gaaggtggtg
25202520
ttccaggagt tcaccgacgg cagcttcacc cagcccctgt acagaggcga gctgaacgag ttccaggagt tcaccgacgg cagcttcacc cagcccctgt acagaggcga gctgaacgag
25802580
cacctgggcc tgctgggccc ctacatcaga gccgaggtgg aggacaacat catggtgacc cacctgggcc tgctgggccc ctacatcaga gccgaggtgg aggacaacat catggtgacc
26402640
ttccggaacc aggccagcag accctacagc ttctacagca gcctgatcag ctacgaggag ttccggaacc aggccagcag accctacagc ttctacagca gcctgatcag ctacgaggag
27002700
gaccagaggc agggcgccga gcccagaaag aacttcgtga agcccaacga gaccaagacc gaccagaggc agggcgccga gcccagaaag aacttcgtga agcccaacga gaccaagacc
27602760
tacttctgga aggtgcagca ccacatggcc cccaccaagg acgagttcga ctgcaaggcc tacttctgga aggtgcagca ccacatggcc cccaccaagg acgagttcga ctgcaaggcc
28202820
tgggcctact tcagcgacgt ggacctggag aaggacgtgc acagcggcct gatcggcccc tgggcctact tcagcgacgt ggacctggag aaggacgtgc acagcggcct gatcggcccc
28802880
ctgctggtgt gccacaccaa caccctgaac cccgcccacg gcagacaggt gaccgtgcag ctgctggtgt gccacaccaa caccctgaac cccgcccacg gcagacaggt gaccgtgcag
29402940
gagttcgccc tgttcttcac catcttcgac gagaccaaga gctggtactt caccgagaac gagttcgccc tgttcttcac catcttcgac gagaccaaga gctggtactt caccgagaac
30003000
atggagcgga actgcagagc cccctgcaac atccagatgg aggaccccac cttcaaggag atggagcgga actgcagagc cccctgcaac atccagatgg aggaccccac cttcaaggag
30603060
aactacaggt tccacgccat caacggctac atcatggaca ccctgcccgg cctggtgatg aactacaggt tccacgccat caacggctac atcatggaca ccctgcccgg cctggtgatg
31203120
gcccaggacc agagaatcag atggtacctg ctgagcatgg gcagcaacga gaacatccac gcccaggacc agagaatcag atggtacctg ctgagcatgg gcagcaacga gaacatccac
31803180
agcatccact tcagcggcca cgtgttcacc gtgaggaaga aggaggagta caagatggcc agcatccact tcagcggcca cgtgttcacc gtgaggaaga aggaggagta caagatggcc
32403240
ctgtacaacc tgtaccccgg cgtgttcgag accgtggaga tgctgcccag caaggccggc ctgtacaacc tgtaccccgg cgtgttcgag accgtggaga tgctgcccag caaggccggc
33003300
atctggagag tggagtgcct gatcggcgag cacctgcacg ccggcatgag caccctgttc atctggagag tggagtgcct gatcggcgag cacctgcacg ccggcatgag caccctgttc
33603360
ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg ccagcggcca catcagagac ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg ccagcggcca catcagagac
34203420
ttccagatca ccgccagcgg ccagtacggc cagtgggccc ccaagctggc cagactgcac ttccagatca ccgccagcgg ccagtacggc cagtgggccc ccaagctggc cagactgcac
34803480
tacagcggca gcatcaacgc ctggagcacc aaggagccct tcagctggat caaggtggac tacagcggca gcatcaacgc ctggagcacc aaggagccct tcagctggat caaggtggac
35403540
ctgctggccc ccatgatcat ccacggcatc aagacccagg gcgccagaca gaagttcagc ctgctggccc ccatgatcat ccacggcatc aagacccagg gcgccagaca gaagttcagc
36003600
agcctgtaca tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc agcctgtaca tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc
36603660
tacagaggca acagcaccgg caccctgatg gtgttcttcg gcaacgtgga cagcagcggc tacagaggca acagcaccgg caccctgatg gtgttcttcg gcaacgtgga cagcagcggc
37203720
atcaagcaca acatcttcaa cccccccatc atcgcccggt acatcaggct gcaccccacc atcaagcaca acatcttcaa cccccccatc atcgcccggt acatcaggct gcaccccacc
37803780
cactacagca tcaggagcac cctgagaatg gagctgatgg gctgcgacct gaacagctgc cactacagca tcaggagcac cctgagaatg gagctgatgg gctgcgacct gaacagctgc
38403840
agcatgcccc tgggcatgga gagcaaggcc atcagcgacg cccagatcac cgccagcagc agcatgcccc tgggcatgga gagcaaggcc atcagcgacg cccagatcac cgccagcagc
39003900
tacttcacca acatgttcgc cacctggagc cccagcaagg ccagactgca cctgcagggc tacttcacca acatgttcgc cacctggagc cccagcaagg ccagactgca cctgcagggc
39603960
agaagcaacg cctggagacc ccaggtgaac aaccccaagg agtggctgca ggtggacttc agaagcaacg cctggagacc ccaggtgaac aaccccaagg agtggctgca ggtggacttc
40204020
cagaagacca tgaaggtgac cggcgtgacc acccagggcg tgaagagcct gctgaccagc cagaagacca tgaaggtgac cggcgtgacc acccagggcg tgaagagcct gctgaccagc
40804080
atgtacgtga aggagttcct gatcagcagc agccaggacg gccaccagtg gaccctgttc atgtacgtga aggagttcct gatcagcagc agccaggacg gccaccagtg gaccctgttc
41404140
ttccagaacg gcaaggtgaa ggtgttccag ggcaaccagg acagcttcac ccccgtggtg ttccagaacg gcaaggtgaa ggtgttccag ggcaaccagg acagcttcac ccccgtggtg
42004200
aacagcctgg acccccccct gctgaccaga tacctgagaa tccaccccca gagctgggtg aacagcctgg acccccccct gctgaccaga tacctgagaa tccaccccca gagctgggtg
42604260
caccagatcg ccctgagaat ggaggtgctg ggctgcgagg cccaggacct gtac caccagatcg ccctgagaat ggaggtgctg ggctgcgagg cccaggacct gtac
43144314
<210> 3<210> 3
<211> 4314<211> 4314
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Кодон-оптимизированная нуклеотидная последовательность,<223> Codon-optimized nucleotide sequence,
кодирующая белок FVIII-BDD (вариант FVIII-BDDco-v2) encoding the FVIII-BDD protein (variant FVIII-BDDco-v2)
<400> 3<400> 3
gccacaagaa gatactatct gggcgccgtg gagctgagct gggattatat gcagtccgac gccacaagaa gatactatct gggcgccgtg gagctgagct gggattatat gcagtccgac
60 60
ctgggcgagc tgccagtgga tgctagattc cctcctagag tgcctaagag ctttccattc ctgggcgagc tgccagtgga tgctagattc cctcctagag tgcctaagag ctttccattc
120 120
aatacctccg tggtgtacaa gaagaccctg ttcgtggagt ttaccgacca cctgttcaac aatacctccg tggtgtacaa gaagaccctg ttcgtggagt ttaccgacca cctgttcaac
180 180
atcgccaaac ctagaccacc ttggatggga ctgctgggcc caactattca ggccgaagtg atcgccaaac ctagaccacc ttggatggga ctgctgggcc caactattca ggccgaagtg
240 240
tacgataccg tggtgatcac tctgaagaat atggcctccc accctgtgag cctgcatgca tacgataccg tggtgatcac tctgaagaat atggcctccc accctgtgag cctgcatgca
300 300
gttggcgtga gctattggaa ggccagcgag ggagccgaat acgatgacca gaccagccag gttggcgtga gctattggaa ggccagcgag ggagccgaat acgatgacca gaccagccag
360 360
agggagaagg aagacgacaa ggtgtttccc ggaggaagcc acacctatgt gtggcaggtg agggaagg aagacgacaa ggtgtttccc ggaggaagcc acacctatgt gtggcaggtg
420 420
ctgaaggaga atggacctat ggccagcgat ccactgtgcc tgacctactc ttatctgagc ctgaaggaga atggacctat ggccagcgat ccactgtgcc tgacctactc ttatctgagc
480 480
cacgtggacc tggtgaagga cctgaatagc ggcctgattg gcgcactgct ggtgtgtaga cacgtggacc tggtgaagga cctgaatagc ggcctgattg gcgcactgct ggtgtgtaga
540 540
gagggatctc tggccaaaga gaagacccag accctgcaca agtttatcct gctgtttgcc gagggatctc tggccaaaga gaagaccag accctgcaca agtttatcct gctgtttgcc
600 600
gtgtttgacg agggcaaatc ttggcacagc gagaccaaaa acagcctgat gcaggataga gtgtttgacg agggcaaatc ttggcacagc gagaccaaaa acagcctgat gcaggataga
660 660
gacgcagcct ctgctagagc ttggcctaag atgcacaccg tgaatggcta cgtgaacaga gacgcagcct ctgctagagc ttggcctaag atgcacaccg tgaatggcta cgtgaacaga
720 720
tccctgcccg gcctgattgg atgtcacaga aagagcgtgt actggcacgt gatcggaatg tccctgcccg gcctgattgg atgtcacaga aagagcgtgt actggcacgt gatcggaatg
780 780
ggaactaccc cagaagtgca cagcatcttt ctggagggac acacctttct ggtgcggaat ggaactaccc cagaagtgca cagcatcttt ctggagggac acacctttct ggtgcggaat
840 840
catagacagg ccagcctgga aatcagccct attacctttc tgaccgccca gacactgctg catagacagg ccagcctgga aatcagccct attacctttc tgaccgccca gacactgctg
900 900
atggatctgg gacagtttct gctgttctgc cacatcagct ctcaccagca tgacggaatg atggatctgg gacagtttct gctgttctgc cacatcagct ctcaccagca tgacggaatg
960 960
gaagcctacg tgaaggtgga cagctgccct gaggaaccac agctgaggat gaagaataac gaagcctacg tgaaggtgga cagctgccct gaggaaccac agctgaggat gaagaataac
10201020
gaggaggccg aggattacga cgatgacctg accgattctg agatggacgt ggtgagattc gaggaggccg aggattacga cgatgacctg accgattctg agatggacgt ggtgagattc
10801080
gacgacgata actctccctc cttcatccag atcagatccg tggccaaaaa gcaccctaaa gacgacgata actctccctc cttcatccag atcagatccg tggccaaaaa gcaccctaaa
11401140
acctgggtgc actatatcgc cgcagaggaa gaagactggg attacgcacc tctggtgctg acctgggtgc actatatcgc cgcagaggaa gaagactggg attacgcacc tctggtgctg
12001200
gcccctgatg acagatctta taagtctcag tacctgaaca acggccctca gagaatcggc gcccctgatg acagatctta taagtctcag tacctgaaca acggccctca gagaatcggc
12601260
aggaagtaca agaaggtgag attcatggcc tacacagacg agacattcaa gaccagagag aggaagtaca agaaggtgag attcatggcc tacacagacg agacattcaa gaccagagag
13201320
gccattcagc acgagtccgg cattctggga ccactgctgt acggagaggt gggcgataca gccattcagc acgagtccgg cattctggga ccactgctgt acggagaggt gggcgataca
13801380
ctgctgatca tcttcaaaaa tcaggccagc aggccctaca acatctaccc acatggcatc ctgctgatca tcttcaaaaa tcaggccagc aggccctaca acatctaccc acatggcatc
14401440
acagacgtga ggcctctgta cagcagaaga ctgcctaaag gcgtgaagca cctgaaggac agacgtga ggcctctgta cagcagaaga ctgcctaaag gcgtgaagca cctgaaggac
15001500
ttccccattc tgccaggcga gattttcaag tacaagtgga cagtgaccgt ggaggatgga ttccccattc tgccaggcga gattttcaag tacaagtgga cagtgaccgt ggaggatgga
15601560
cccacaaagt ctgaccctag atgcctgacc aggtactata gctccttcgt gaacatggaa cccacaaagt ctgaccctag atgcctgacc aggtactata gctccttcgt gaacatggaa
16201620
agggatctgg cctctggact gattggccca ctgctgatct gctacaagga atccgtggac agggatctgg cctctggact gattggccca ctgctgatct gctacaagga atccgtggac
16801680
cagagaggaa accagatcat gagcgataag aggaatgtga tcctgttcag cgtgttcgat cagagaggaa accagatcat gagcgataag aggaatgtga tcctgttcag cgtgttcgat
17401740
gagaacagga gctggtatct gaccgagaac atccagagat tcctgccaaa tccagccggc gagaacagga gctggtatct gaccgagaac atccagagat tcctgccaaa tccagccggc
18001800
gtgcagctgg aagatcctga atttcaggcc tccaatatca tgcactccat caatggctac gtgcagctgg aagatcctga atttcaggcc tccaatatca tgcactccat caatggctac
18601860
gtgtttgaca gcctgcagct gtctgtgtgt ctgcacgaag tggcctactg gtacatcctg gtgtttgaca gcctgcagct gtctgtgtgt ctgcacgaag tggcctactg gtacatcctg
19201920
agcattggag cccagaccga ctttctgagc gtgtttttct ctggctacac cttcaagcac agcattggag cccagaccga ctttctgagc gtgtttttct ctggctacac cttcaagcac
19801980
aagatggtgt acgaggacac cctgacactg ttcccattct caggcgaaac cgtgtttatg aagatggtgt acgaggacac cctgacactg ttcccattct caggcgaaac cgtgtttatg
20402040
agcatggaga acccaggact gtggattctg ggctgccaca actccgactt caggaataga agcatggaga acccaggact gtggattctg ggctgccaca actccgactt caggaataga
21002100
ggaatgaccg ccctgctgaa agtgagcagc tgcgataaga acaccggcga ttattacgag ggaatgaccg ccctgctgaa agtgagcagc tgcgataaga acaccggcga ttattacgag
21602160
gactcctacg aggatatcag cgcctacctg ctgtccaaaa acaatgccat cgagcccagg gactcctacg aggatatcag cgcctacctg ctgtccaaaa acaatgccat cgagcccagg
22202220
agcttctccc agaatccacc tgtgctgaaa agacaccaga gggagatcac cagaaccaca agcttctccc agaatccacc tgtgctgaaa agacaccaga ggggagatcac cagaaccaca
22802280
ctgcagtctg atcaggagga gatcgactat gacgacacca tcagcgtgga gatgaagaag ctgcagtctg atcaggagga gatcgactat gacgacacca tcagcgtgga gatgaagaag
23402340
gaggactttg atatctacga cgaggatgag aaccagagcc ccaggagctt tcagaagaag gaggactttg atatctacga cgaggatgag aaccagagcc ccaggagctt tcagaagaag
24002400
accaggcact acttcatcgc cgcagtggag agactgtggg actacggaat gtcttcctcc accaggcact acttcatcgc cgcagtggag agactgtggg actacggaat gtcttcctcc
24602460
cctcacgtgc tgagaaatag agcccagtct ggaagcgtgc cacagtttaa gaaggtggtg cctcacgtgc tgagaaatag agcccagtct ggaagcgtgc cacagtttaa gaaggtggtg
25202520
ttccaggagt ttaccgacgg ctctttcacc cagccactgt atagaggcga actgaacgaa ttccaggagt ttaccgacgg ctctttcacc cagccactgt atagaggcga actgaacgaa
25802580
cacctgggcc tgctgggacc ttatatcaga gccgaagtgg aggacaacat catggtgacc cacctgggcc tgctgggacc ttatatcaga gccgaagtgg aggacaacat catggtgacc
26402640
ttcagaaacc aggccagcag accttacagc ttctactcca gcctgatcag ctacgaagag ttcagaaacc aggccagcag accttacagc ttctactcca gcctgatcag ctacgaagag
27002700
gatcagagac agggcgccga acctaggaaa aattttgtga agccaaacga gaccaagacc gatcagagac agggcgccga acctaggaaa aattttgtga agccaaacga gaccaagacc
27602760
tacttttgga aggtgcagca tcacatggcc cccaccaagg atgagttcga ttgtaaagcc tacttttgga aggtgcagca tcacatggcc cccaccaagg atgagttcga ttgtaaagcc
28202820
tgggcctact tctccgatgt ggacctggaa aaggatgtgc acagcggact gatcggacca tgggcctact tctccgatgt ggacctggaa aaggatgtgc acagcggact gatcggacca
28802880
ctgctggtgt gccacacaaa taccctgaac cctgcccacg gaagacaggt gacagtgcag ctgctggtgt gccacacaaa taccctgaac cctgcccacg gaagacaggt gacagtgcag
29402940
gaatttgccc tgttcttcac catctttgac gagaccaagt cctggtactt caccgagaac gaatttgccc tgttcttcac catctttgac gagaccaagt cctggtactt caccgagaac
30003000
atggagagaa actgcagagc cccttgcaac attcagatgg aggacccaac attcaaggag atggagagaa actgcagagc cccttgcaac attcagatgg aggacccaac attcaaggag
30603060
aactacaggt tccacgccat caatggctac atcatggata cactgcctgg cctggtgatg aactacaggt tccacgccat caatggctac atcatggata cactgcctgg cctggtgatg
31203120
gcccaggatc agagaattag gtggtacctg ctgtctatgg gctccaatga gaatatccac gcccaggatc agagaattag gtggtacctg ctgtctatgg gctccaatga gaatatccac
31803180
tccatccact tcagcggcca cgtgttcacc gtgagaaaga aagaggagta caagatggcc tccatccact tcagcggcca cgtgttcacc gtgagaaaga aagaggagta caagatggcc
32403240
ctgtacaacc tgtacccagg cgtgtttgag accgtggaga tgctgccttc taaagctggc ctgtacaacc tgtacccagg cgtgtttgag accgtggaga tgctgccttc taaagctggc
33003300
atctggagag tggagtgcct gatcggcgag catctgcatg ctggaatgtc taccctgttt atctggagag tggagtgcct gatcggcgag catctgcatg ctggaatgtc taccctgttt
33603360
ctggtgtact ccaacaagtg ccagacacct ctgggcatgg cttctggaca tatcagagac ctggtgtact ccaacaagtg cgacaacct ctgggcatgg cttctggaca tatcagagac
34203420
tttcagatca ccgcctccgg ccagtacgga caatgggctc caaagctggc cagactgcat tttcagatca ccgcctccgg ccagtacgga caatgggctc caaagctggc cagactgcat
34803480
tactctggct ctattaatgc ctggagcacc aaggagccct tttcctggat caaggtggat tactctggct ctattaatgc ctggagcacc aaggagccct tttcctggat caaggtggat
35403540
ctgctggccc ccatgattat ccacggcatc aaaacccagg gcgccaggca gaagttttct ctgctggccc ccatgattat ccacggcatc aaaacccagg gcgccaggca gaagttttct
36003600
tccctgtaca tcagccagtt catcatcatg tacagcctgg atggcaagaa gtggcagacc tccctgtaca tcagccagtt catcatcatg tacagcctgg atggcaagaa gtggcagacc
36603660
tacagaggca atagcaccgg aaccctgatg gtgtttttcg gcaacgtgga ctcctccggc tacagaggca atagcaccgg aaccctgatg gtgtttttcg gcaacgtgga ctcctccggc
37203720
attaagcaca atatcttcaa cccacctatc atcgccaggt acatcagact gcaccccacc attaagcaca atatcttcaa cccacctatc atcgccaggt acatcagact gcaccccacc
37803780
cactactcta tcagaagcac cctgaggatg gaactgatgg gctgtgacct gaattcctgt cactactcta tcagaagcac cctgaggatg gaactgatgg gctgtgacct gaattcctgt
38403840
agcatgcctc tgggaatgga gtctaaagcc atcagtgacg cccagattac cgccagcagc agcatgcctc tgggaatgga gtctaaagcc atcagtgacg cccagattac cgccagcagc
39003900
tactttacca acatgtttgc tacatggtcc ccctctaagg ccagactgca cctgcaggga tactttacca acatgtttgc tacatggtcc ccctctaagg ccagactgca cctgcaggga
39603960
agatctaacg cctggagacc acaggtgaac aaccccaaag aatggctgca ggtggatttt agatctaacg cctggagacc acaggtgaac aaccccaaag aatggctgca ggtggatttt
40204020
cagaagacca tgaaagtgac cggcgtgaca acacagggcg tgaaatctct gctgacctct cagaagacca tgaaagtgac cggcgtgaca acacagggcg tgaaatctct gctgacctct
40804080
atgtacgtga aggagtttct gatcagcagc agccaggacg gccatcagtg gaccctgttt atgtacgtga aggagtttct gatcagcagc agccaggacg gccatcagtg gaccctgttt
41404140
tttcagaatg gcaaggtgaa ggtgttccag ggcaatcagg actcattcac tccagtggtg tttcagaatg gcaaggtgaa ggtgttccag ggcaatcagg actcattcac tccagtggtg
42004200
aacagcctgg acccacctct gctgaccaga tacctgagaa ttcacccaca gtcctgggtg aacagcctgg acccacctct gctgaccaga tacctgagaa ttcacccaca gtcctgggtg
42604260
catcagatcg ccctgagaat ggaagtgctg ggatgtgagg cacaggacct gtac catcagatcg ccctgagaat ggaagtgctg ggatgtgagg cacaggacct gtac
43144314
<210> 4<210> 4
<211> 4314<211> 4314
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Кодон-оптимизированная нуклеотидная последовательность,<223> Codon-optimized nucleotide sequence,
кодирующая белок FVIII-BDD (вариант FVIII-BDDco-v3) encoding the FVIII-BDD protein (variant FVIII-BDDco-v3)
<400> 4<400> 4
gccacaagga ggtactatct gggcgccgtg gaactgagct gggactatat gcagagcgac gccacaagga ggtactatct gggcgccgtg gaactgagct gggactatat gcagagcgac
60 60
ctgggagagc tgcctgtgga tgccagattt ccacctaggg tgcccaagag cttccccttc ctggggagagc tgcctgtgga tgccagattt ccacctaggg tgcccaagag cttccccttc
120 120
aatacaagcg tggtgtacaa gaagaccctg ttcgtggagt ttaccgacca cctgttcaac aatacaagcg tggtgtacaa gaagaccctg ttcgtggagt ttaccgacca cctgttcaac
180 180
atcgccaagc ctagacctcc ttggatggga ctgctgggcc ctaccattca ggccgaagtg atcgccaagc ctagacctcc ttggatggga ctgctgggcc ctaccattca ggccgaagtg
240 240
tacgacacag tggtgatcac cctgaagaat atggccagcc atccagtgtc cctgcacgca tacgacacag tggtgatcac cctgaagaat atggccagcc atccagtgtc cctgcacgca
300 300
gtgggagtgt cttattggaa ggcctctgag ggcgccgagt acgatgatca gaccagccag gtgggagtgt cttattggaa ggcctctgag ggcgccgagt acgatgatca gaccagccag
360 360
agagagaagg aggacgacaa ggtgttcccc ggaggaagcc acacctacgt gtggcaggtg agagagaagg aggacgacaa ggtgttcccc ggaggaagcc acacctacgt gtggcaggtg
420 420
ctgaaagaga atggcccaat ggcctccgac cccctgtgtc tgacatacag ctacctgagc ctgaaagaga atggcccaat ggcctccgac cccctgtgtc tgacatacag ctacctgagc
480 480
cacgtggacc tggtgaagga cctgaactct ggcctgatcg gagctctgct ggtgtgtaga cacgtggacc tggtgaagga cctgaactct ggcctgatcg gagctctgct ggtgtgtaga
540 540
gaaggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgtttgcc gaaggcagcc tggccaagga gaagaccag accctgcaca agttcatcct gctgtttgcc
600 600
gtgttcgatg agggcaaaag ctggcattcc gagaccaaga attccctgat gcaggatagg gtgttcgatg agggcaaaag ctggcattcc gagaccaaga attccctgat gcaggatagg
660 660
gacgctgcca gcgctagagc ctggcctaag atgcacactg tgaatggcta cgtgaaccgg gacgctgcca gcgctagagc ctggcctaag atgcacactg tgaatggcta cgtgaaccgg
720 720
agcctgccag gcctgatcgg ctgtcacaga aagagcgtgt actggcacgt gatcggcatg agcctgccag gcctgatcgg ctgtcacaga aagagcgtgt actggcacgt gatcggcatg
780 780
ggcaccactc ctgaggtgca ctctatcttt ctggaaggcc acacctttct ggtgcggaac ggcaccactc ctgaggtgca ctctatcttt ctggaaggcc acacctttct ggtgcggaac
840 840
catagacagg cctccctgga aatcagcccc atcacctttc tgaccgccca gaccctgctg catagacagg cctccctgga aatcagcccc atcacctttc tgaccgccca gaccctgctg
900 900
atggatctgg gacagttcct gctgttttgc cacatctcct ctcaccagca cgacggaatg atggatctgg gacagttcct gctgttttgc cacatctcct ctcaccagca cgacggaatg
960 960
gaggcctacg tgaaagtgga cagctgtcct gaagaacctc agctgcggat gaagaataac gaggcctacg tgaaagtgga cagctgtcct gaagaacctc agctgcggat gaagaataac
10201020
gaggaggccg aggactacga cgatgacctg accgatagcg agatggacgt ggtgagattc gaggaggccg aggactacga cgatgacctg accgatagcg agatggacgt ggtgagattc
10801080
gacgacgata acagccccag cttcatccag atcagatccg tggccaagaa gcaccccaag gacgacgata acagccccag cttcatccag atcagatccg tggccaagaa gcaccccaag
11401140
acatgggtgc actatatcgc cgcagaggag gaggattggg actacgcacc tctggtgctg acatgggtgc actatatcgc cgcagaggag gaggattggg actacgcacc tctggtgctg
12001200
gctcctgacg atagatccta caagtcccag tacctgaaca acggccccca gagaatcggc gctcctgacg atagatccta caagtcccag tacctgaaca acggccccca gagaatcggc
12601260
agaaagtaca agaaggtgag attcatggcc tacaccgacg agacctttaa gaccagagag agaaagtaca agaaggtgag attcatggcc tacaccgacg agacctttaa gaccagagag
13201320
gccatccagc acgagagcgg cattctggga ccactgctgt atggagaggt gggcgataca gccatccagc acgagagcgg cattctggga ccactgctgt atggagaggt gggcgataca
13801380
ctgctgatca tcttcaagaa tcaggcctcc cggccataca acatctatcc acacggcatc ctgctgatca tcttcaagaa tcaggcctcc cggccataca acatctatcc acacggcatc
14401440
accgacgtga gaccactgta ctccaggaga ctgcccaagg gcgtgaagca cctgaaggac accgacgtga gaccactgta ctccaggaga ctgcccaagg gcgtgaagca cctgaaggac
15001500
ttccctattc tgccaggcga gatcttcaag tacaagtgga cagtgaccgt ggaagacgga ttccctattc tgccaggcga gatcttcaag tacaagtgga cagtgaccgt ggaagacgga
15601560
cctaccaaaa gcgaccccag atgcctgacc cggtactact ccagcttcgt gaacatggag cctaccaaaa gcgaccccag atgcctgacc cggtactact ccagcttcgt gaacatggag
16201620
agagatctgg ccagcggact gattggacct ctgctgattt gttacaagga gagcgtggac agagatctgg ccagcggact gattggacct ctgctgattt gttacaagga gagcgtggac
16801680
cagaggggca accagattat gagcgacaag cggaatgtga tcctgttctc cgtgttcgac cagaggggca accagattat gagcgacaag cggaatgtga tcctgttctc cgtgttcgac
17401740
gagaaccgca gctggtatct gaccgagaat atccagaggt tcctgccaaa ccccgccggc gagaaccgca gctggtatct gaccgagaat atccagaggt tcctgccaaa ccccgccggc
18001800
gttcagctgg aagatccaga gtttcaggcc tccaacatca tgcacagcat caatggctac gttcagctgg aagatccaga gtttcaggcc tccaacatca tgcacagcat caatggctac
18601860
gtgttcgaca gcctgcagct gtccgtgtgt ctgcatgaag tggcctactg gtatatcctg gtgttcgaca gcctgcagct gtccgtgtgt ctgcatgaag tggcctactg gtatatcctg
19201920
agcatcggcg cccagaccga ttttctgtcc gtgtttttct ccggctacac cttcaagcac agcatcggcg cccagaccga ttttctgtcc gtgtttttct ccggctacac cttcaagcac
19801980
aagatggtgt acgaggacac cctgaccctg tttcctttta gcggcgaaac cgtgttcatg aagatggtgt acgaggacac cctgaccctg tttcctttta gcggcgaaac cgtgttcatg
20402040
agcatggaga acccaggact gtggattctg ggctgtcaca acagcgactt cagaaatcgg agcatggaga acccaggact gtggattctg ggctgtcaca acagcgactt cagaaatcgg
21002100
ggcatgaccg ctctgctgaa ggtgagctct tgtgacaaaa ataccggcga ctactacgag ggcatgaccg ctctgctgaa ggtgagctct tgtgacaaaa ataccggcga ctactacgag
21602160
gacagctacg aggatatcag cgcctacctg ctgagcaaga acaacgccat cgagccaaga gacagctacg aggatatcag cgcctacctg ctgagcaaga acaacgccat cgagccaaga
22202220
agcttcagcc agaatccccc cgtgctgaag agacatcaga gggagatcac cagaaccacc agcttcagcc agaatccccc cgtgctgaag agacatcaga gggagatcac cagaaccacc
22802280
ctgcagagcg accaggagga gatcgattac gacgacacca tcagcgtgga gatgaagaag ctgcagagcg accaggagga gatcgattac gacgacacca tcagcgtgga gatgaagaag
23402340
gaggatttcg acatctacga cgaggacgag aatcagagcc caaggagctt tcagaagaag gaggatttcg acatctacga cgaggacgag aatcagagcc caagggagctt tcagaagaag
24002400
acccggcact acttcatcgc tgccgtggag agactgtggg attatggcat gagctccagc acccggcact acttcatcgc tgccgtggag agactgtggg attatggcat gagctccagc
24602460
cctcacgtgc tgagaaatag agcccagtct ggctccgtgc cccagttcaa gaaagtggtg cctcacgtgc tgagaaatag agcccagtct ggctccgtgc cccagttcaa gaaagtggtg
25202520
ttccaggaat tcaccgacgg cagctttacc cagcccctgt atagaggcga actgaatgaa ttccaggaat tcaccgacgg cagctttacc cagcccctgt atagaggcga actgaatgaa
25802580
cacctgggcc tgctgggacc ttacatcaga gccgaagtgg aggacaacat catggtgacc cacctgggcc tgctgggacc ttacatcaga gccgaagtgg aggacaacat catggtgacc
26402640
tttaggaatc aggccagcag accctacagc ttctatagct ccctgatctc ctacgaggag tttaggaatc aggccagcag accctacagc ttctatagct ccctgatctc ctacgaggag
27002700
gaccagagac agggcgctga gccaagaaag aatttcgtga agcccaacga gaccaagacc gaccagagac agggcgctga gccaagaaag aatttcgtga agcccaacga gaccaagacc
27602760
tacttctgga aagtgcagca ccacatggcc cctaccaagg atgagttcga ctgtaaagcc tacttctgga aagtgcagca ccacatggcc cctaccaagg atgagttcga ctgtaaagcc
28202820
tgggcctact tcagcgacgt ggacctggag aaggacgtgc actccggact gatcggacca tgggcctact tcagcgacgt ggacctggag aaggacgtgc actccggact gatcggacca
28802880
ctgctggtgt gccacacaaa caccctgaac cctgcccatg gaagacaggt gactgtgcag ctgctggtgt gccacacaaa caccctgaac cctgcccatg gaagacaggt gactgtgcag
29402940
gaattcgccc tgttctttac catcttcgac gagaccaagt cctggtactt caccgagaat gaattcgccc tgttctttac catcttcgac gagaccaagt cctggtactt caccgagaat
30003000
atggagagga attgcagagc cccctgtaac atccagatgg aggaccccac ctttaaggag atggagagga attgcagagc cccctgtaac atccagatgg aggaccccac ctttaaggag
30603060
aattacaggt ttcacgccat caacggctac atcatggaca cactgccagg cctggtgatg aattacaggt ttcacgccat caacggctac atcatggaca cactgccagg cctggtgatg
31203120
gcacaggatc agaggatcag atggtatctg ctgagcatgg gctccaacga gaacatccac gcacaggatc agaggatcag atggtatctg ctgagcatgg gctccaacga gaacatccac
31803180
tccatccact tcagcggcca cgtgtttacc gtgagaaaga aggaggagta caagatggcc tccatccact tcagcggcca cgtgtttacc gtgagaaaga aggagggata caagatggcc
32403240
ctgtacaacc tgtatcccgg cgtgttcgaa accgtggaga tgctgccttc caaagccgga ctgtacaacc tgtatcccgg cgtgttcgaa accgtggaga tgctgccttc caaagccgga
33003300
atctggagag tggagtgcct gattggcgag cacctgcacg ctggaatgtc caccctgttc atctggagag tggagtgcct gattggcgag cacctgcacg ctggaatgtc caccctgttc
33603360
ctggtgtata gcaacaagtg ccagaccccc ctgggcatgg ctagcggaca cattagagac ctggtgtata gcaacaagtg ccagaccccc ctgggcatgg ctagcggaca cattagagac
34203420
tttcagatca ccgcctccgg ccagtacgga cagtgggccc caaaactggc taggctgcat tttcagatca ccgcctccgg ccagtacgga cagtgggccc caaaactggc taggctgcat
34803480
tacagcggct ccatcaatgc ctggtccacc aaggagccat tcagctggat caaagtggat tacagcggct ccatcaatgc ctggtccacc aaggagccat tcagctggat caaagtggat
35403540
ctgctggccc ccatgatcat ccacggcatt aagacacagg gcgccaggca gaagttcagc ctgctggccc ccatgatcat ccacggcatt aagacacagg gcgccaggca gaagttcagc
36003600
tctctgtaca tctcccagtt catcatcatg tactccctgg acggcaagaa gtggcagacc tctctgtaca tctcccagtt catcatcatg tactccctgg acggcaagaa gtggcagacc
36603660
tacaggggca atagcaccgg cacactgatg gtgtttttcg gcaacgtgga ctcttccggc tacaggggca atagcaccgg cacactgatg gtgtttttcg gcaacgtgga ctcttccggc
37203720
atcaagcaca acatctttaa cccccctatc atcgccaggt acatcaggct gcaccccact atcaagcaca acatctttaa cccccctatc atcgccaggt acatcaggct gcaccccact
37803780
cactacagca tcagatccac cctgagaatg gagctgatgg gatgcgacct gaacagctgc cactacagca tcagatccac cctgagaatg gagctgatgg gatgcgacct gaacagctgc
38403840
agcatgcccc tgggcatgga gagcaaggcc atttctgacg cccagatcac cgccagcagc agcatgcccc tgggcatgga gagcaaggcc atttctgacg cccagatcac cgccagcagc
39003900
tatttcacca atatgttcgc tacctggagc cccagcaagg ccagactgca tctgcagggc tatttcacca atatgttcgc tacctggagc cccagcaagg ccagactgca tctgcagggc
39603960
agaagcaacg cctggagacc acaggtgaac aatcctaaag agtggctgca ggtggacttc agaagcaacg cctggagacc acaggtgaac aatcctaaag agtggctgca ggtggacttc
40204020
cagaagacca tgaaggtgac cggcgtgaca acccagggcg tgaaatctct gctgacctcc cagaagacca tgaaggtgac cggcgtgaca acccagggcg tgaaatctct gctgacctcc
40804080
atgtacgtga aggagttcct gatctcctcc agccaggatg gccatcagtg gaccctgttc atgtacgtga aggagttcct gatctcctcc agccaggatg gccatcagtg gaccctgttc
41404140
ttccagaacg gcaaggtgaa agtgttccag ggcaaccagg acagctttac ccctgtggtg ttccagaacg gcaaggtgaa agtgttccag ggcaaccagg acagctttac ccctgtggtg
42004200
aactctctgg atccccccct gctgaccagg tacctgagaa ttcaccccca gagctgggtg aactctctgg atccccccct gctgaccagg tacctgagaa ttcaccccca gagctgggtg
42604260
caccagatcg ccctgagaat ggaagtgctg ggatgcgagg cacaggacct gtac caccagatcg ccctgagaat ggaagtgctg ggatgcgagg cacaggacct gtac
43144314
<210> 5<210> 5
<211> 4314<211> 4314
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Кодон-оптимизированная нуклеотидная последовательность,<223> Codon-optimized nucleotide sequence,
кодирующая белок FVIII-BDD (вариант FVIII-BDDco-v4) encoding the FVIII-BDD protein (variant FVIII-BDDco-v4)
<400> 5<400> 5
gctacccgga ggtactacct gggcgctgtg gagctgagct gggactacat gcagagcgat gctacccgga ggtactacct gggcgctgtg gagctgagct gggactacat gcagagcgat
60 60
ctgggcgagc tgcccgtgga tgccagattt cccccaagag tgcctaagtc cttccccttc ctgggcgagc tgcccgtgga tgccagattt cccccaagag tgcctaagtc cttccccttc
120 120
aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcaccgacca cctgttcaac aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcaccgacca cctgttcaac
180 180
atcgccaagc caaggccccc ctggatggga ctgctgggac ctacaattca ggccgaggtg atcgccaagc caaggccccc ctggatggga ctgctgggac ctacaattca ggccgaggtg
240 240
tacgataccg tggtgatcac cctgaagaac atggcctccc acccagtgtc cctgcatgcc tacgataccg tggtgatcac cctgaagaac atggcctccc acccagtgtc cctgcatgcc
300 300
gtgggcgtga gctactggaa ggcttctgaa ggcgccgagt acgacgacca gaccagccag gtgggcgtga gctactggaa ggcttctgaa ggcgccgagt acgacgacca gaccagccag
360 360
agggagaagg aggacgacaa ggtgttccca ggcggatctc acacctacgt gtggcaggtg agggaagg aggacgacaa ggtgttccca ggcggatctc acacctacgt gtggcaggtg
420 420
ctgaaggaga atggcccaat ggccagcgac ccactgtgtc tgacctacag ctacctgtcc ctgaaggaga atggcccaat ggccagcgac ccactgtgtc tgacctacag ctacctgtcc
480 480
cacgtggacc tggtgaagga cctgaactcc ggcctgatcg gcgccctgct ggtgtgtaga cacgtggacc tggtgaagga cctgaactcc ggcctgatcg gcgccctgct ggtgtgtaga
540 540
gaaggatctc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc gaaggatctc tggccaagga gaagaccag accctgcaca agttcatcct gctgttcgcc
600 600
gtgtttgacg agggcaagag ctggcattcc gagaccaaga acagcctgat gcaggacaga gtgtttgacg agggcaagag ctggcattcc gagaccaaga acagcctgat gcaggacaga
660 660
gacgcagcca gcgctagagc ctggcccaag atgcacaccg tgaatggcta cgtgaaccgg gacgcagcca gcgctagagc ctggcccaag atgcacaccg tgaatggcta cgtgaaccgg
720 720
tccctgccag gcctgatcgg ctgtcacaga aaaagcgtgt actggcacgt gatcggcatg tccctgccag gcctgatcgg ctgtcacaga aaaagcgtgt actggcacgt gatcggcatg
780 780
ggcaccacac ccgaggtgca cagcatcttt ctggagggcc acaccttcct ggtgagaaac ggcaccacac ccgaggtgca cagcatcttt ctggagggcc acaccttcct ggtgagaaac
840 840
cacaggcagg cctccctgga gatctccccc atcacctttc tgaccgccca gaccctgctg cacaggcagg cctccctgga gatctccccc atcacctttc tgaccgccca gaccctgctg
900 900
atggatctgg gccagttcct gctgttctgc cacatcagct cccaccagca cgacggaatg atggatctgg gccagttcct gctgttctgc cacatcagct cccaccagca cgacggaatg
960 960
gaggcctacg tgaaggtgga tagctgcccc gaggagcccc agctgagaat gaagaacaac gaggcctacg tgaaggtgga tagctgcccc gaggagcccc agctgagaat gaagaacaac
10201020
gaggaggccg aggactacga cgatgacctg accgattccg agatggacgt ggtgcgcttc gaggaggccg aggactacga cgatgacctg accgattccg agatggacgt ggtgcgcttc
10801080
gacgacgata atagccccag cttcatccag atcagatccg tggccaagaa gcacccaaag gacgacgata atagccccag cttcatccag atcagatccg tggccaagaa gcacccaaag
11401140
acctgggtgc actacatcgc tgccgaggag gaggactggg attacgcccc actggtgctg acctgggtgc actacatcgc tgccgaggag gaggactggg attacgcccc actggtgctg
12001200
gcccctgatg acagatccta caagagccag tacctgaaca acggccccca gagaatcggc gcccctgatg acagatccta caagagccag tacctgaaca acggccccca gagaatcggc
12601260
cggaagtaca agaaggtgag attcatggcc tacaccgacg agaccttcaa gaccagggaa cggaagtaca agaaggtgag attcatggcc tacaccgacg agaccttcaa gaccagggaa
13201320
gccatccagc acgagagcgg catcctggga ccactgctgt acggagaagt gggcgatacc gccatccagc acgagagcgg catcctggga ccactgctgt acggagaagt gggcgatacc
13801380
ctgctgatca tcttcaagaa ccaggcctcc cggccctaca acatctaccc ccacggcatc ctgctgatca tcttcaagaa ccaggcctcc cggccctaca acatctaccc ccacggcatc
14401440
accgacgtga ggccactgta cagcaggagg ctgcccaagg gcgtgaagca cctgaaggac accgacgtga ggccactgta cagcaggagg ctgcccaagg gcgtgaagca cctgaaggac
15001500
ttccccatcc tgcccggcga gatctttaag tacaagtgga ccgtgaccgt ggaggacggc ttccccatcc tgcccggcga gatctttaag tacaagtgga ccgtgaccgt ggaggacggc
15601560
ccaaccaaga gcgacccaag atgcctgacc aggtactact cctccttcgt gaacatggag ccaaccaaga gcgacccaag atgcctgacc aggtactact cctccttcgt gaacatggag
16201620
cgggatctgg ccagcggact gattggccct ctgctgatct gctacaagga gagcgtggac cgggatctgg ccagcggact gattggccct ctgctgatct gctacaagga gagcgtggac
16801680
cagcgcggca atcagatcat gagcgacaag agaaacgtga tcctgttcag cgtgttcgac cagcgcggca atcagatcat gagcgacaag agaaacgtga tcctgttcag cgtgttcgac
17401740
gagaatcgca gctggtacct gaccgagaac atccagaggt tcctgcccaa cccagccggc gagaatcgca gctggtacct gaccgagaac atccagaggt tcctgcccaa cccagccggc
18001800
gtgcagctgg aagatcctga atttcaggcc agcaacatca tgcactccat caacggctac gtgcagctgg aagatcctga atttcaggcc agcaacatca tgcactccat caacggctac
18601860
gtgttcgact ccctgcagct gagcgtgtgt ctgcacgaag tggcctactg gtacatcctg gtgttcgact ccctgcagct gagcgtgtgt ctgcacgaag tggcctactg gtacatcctg
19201920
agcatcggcg cccagaccga cttcctgtcc gtgttctttt ccggctacac cttcaagcac agcatcggcg cccagaccga cttcctgtcc gtgttctttt ccggctacac cttcaagcac
19801980
aagatggtgt acgaggacac cctgaccctg ttccccttta gcggcgagac cgtgttcatg aagatggtgt acgaggacac cctgaccctg ttccccttta gcggcgagac cgtgttcatg
20402040
agcatggaga acccaggcct gtggattctg ggctgccaca acagcgactt ccgcaatagg agcatggaga acccaggcct gtggattctg ggctgccaca acagcgactt ccgcaatagg
21002100
ggcatgaccg ccctgctgaa agtgtccagc tgcgataaga acaccggcga ctactacgag ggcatgaccg ccctgctgaa agtgtccagc tgcgataaga acaccggcga ctactacgag
21602160
gacagctacg aggacatctc cgcctacctg ctgagcaaga acaacgccat cgagcccaga gacagctacg aggacatctc cgcctacctg ctgagcaaga acaacgccat cgagcccaga
22202220
tccttcagcc agaaccctcc agtgctgaag aggcaccagc gcgagatcac cagaaccacc tccttcagcc agaaccctcc agtgctgaag aggcaccagc gcgagatcac cagaaccacc
22802280
ctgcagtctg atcaggagga gatcgactac gacgacacca tcagcgtgga gatgaagaag ctgcagtctg atcaggagga gatcgactac gacgacacca tcagcgtgga gatgaagaag
23402340
gaggacttcg acatctacga cgaggacgag aaccagagcc ctaggtcctt ccagaagaag gaggacttcg acatctacga cgaggacgag aaccagagcc ctaggtcctt ccagaagaag
24002400
acccggcact acttcatcgc cgcagtggag aggctgtggg attacggcat gagcagctcc acccggcact acttcatcgc cgcagtggag aggctgtggg attacggcat gagcagctcc
24602460
ccacacgtgc tgagaaatag ggcccagagc ggcagcgtgc cccagttcaa aaaggtggtg ccacacgtgc tgagaaatag ggcccagagc ggcagcgtgc cccagttcaa aaaggtggtg
25202520
ttccaggagt tcaccgacgg ctccttcacc cagcccctgt acagaggcga gctgaatgag ttccaggagt tcaccgacgg ctccttcacc cagcccctgt acagaggcga gctgaatgag
25802580
cacctgggcc tgctgggacc ctacatcaga gcagaggtgg aggacaacat catggtgacc cacctgggcc tgctgggacc ctacatcaga gcagaggtgg aggacaacat catggtgacc
26402640
ttcaggaacc aggccagcag accctacagc ttctacagca gcctgatcag ctacgaggag ttcaggaacc aggccagcag accctacagc ttctacagca gcctgatcag ctacgaggag
27002700
gaccagagac agggagccga gccacgcaag aacttcgtga agcccaacga gaccaagacc gaccagagac agggagccga gccacgcaag aacttcgtga agcccaacga gaccaagacc
27602760
tacttctgga aggtgcagca ccacatggcc cccaccaagg acgagttcga ttgtaaagcc tacttctgga aggtgcagca ccacatggcc cccaccaagg acgagttcga ttgtaaagcc
28202820
tgggcctact tcagcgacgt ggacctggag aaggacgtgc acagcggcct gatcggacct tgggcctact tcagcgacgt ggacctggag aaggacgtgc acagcggcct gatcggacct
28802880
ctgctggtgt gtcataccaa caccctgaac cccgcccacg gcagacaggt gactgtgcag ctgctggtgt gtcataccaa caccctgaac cccgcccacg gcagacaggt gactgtgcag
29402940
gagtttgccc tgttcttcac catcttcgac gagaccaaga gctggtactt caccgagaac gagtttgccc tgttcttcac catcttcgac gagaccaaga gctggtactt caccgagaac
30003000
atggagagaa actgcagggc cccatgcaac atccagatgg aagaccccac cttcaaggag atggagagaa actgcagggc cccatgcaac atccagatgg aagaccccac cttcaaggag
30603060
aactaccggt tccacgccat caacggctac atcatggata ccctgcctgg cctggtgatg aactaccggt tccacgccat caacggctac atcatggata ccctgcctgg cctggtgatg
31203120
gcccaggatc agagaatcag gtggtacctg ctgagcatgg gctccaacga gaacatccac gcccaggatc agagaatcag gtggtacctg ctgagcatgg gctccaacga gaacatccac
31803180
agcatccact tctccggcca cgtgttcacc gtgaggaaaa aggaggagta caagatggcc agcatccact tctccggcca cgtgttcacc gtgaggaaaa aggaggagta caagatggcc
32403240
ctgtacaacc tgtaccccgg cgtgtttgag accgtggaga tgctgccatc taaggccggc ctgtacaacc tgtaccccgg cgtgtttgag accgtggaga tgctgccatc taaggccggc
33003300
atttggagag tggagtgcct gatcggcgag cacctgcacg ccggaatgtc taccctgttc atttggagag tggagtgcct gatcggcgag cacctgcacg ccggaatgtc taccctgttc
33603360
ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg ccagcggaca catcagagac ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg ccagcggaca catcagagac
34203420
ttccagatca ccgccagcgg ccagtacgga cagtgggctc ctaaactggc ccgcctgcac ttccagatca ccgccagcgg ccagtacgga cagtgggctc ctaaactggc ccgcctgcac
34803480
tatagcggca gcattaacgc ctggtccacc aaggagccat tcagctggat caaggtggat tatagcggca gcattaacgc ctggtccacc aaggagccat tcagctggat caaggtggat
35403540
ctgctggccc ccatgatcat ccacggcatc aaaacacagg gcgccagaca gaagttctcc ctgctggccc ccatgatcat ccacggcatc aaaacacagg gcgccagaca gaagttctcc
36003600
agcctgtaca tctcccagtt catcatcatg tactccctgg acggcaagaa gtggcagacc agcctgtaca tctcccagtt catcatcatg tactccctgg acggcaagaa gtggcagacc
36603660
tacagaggca actccaccgg cacactgatg gtgttcttcg gcaacgtgga cagcagcggc tacagaggca actccaccgg cacactgatg gtgttcttcg gcaacgtgga cagcagcggc
37203720
atcaagcaca acatcttcaa cccccccatc atcgcccggt acatcagact gcacccaacc atcaagcaca acatcttcaa ccccccatc atcgcccggt acatcagact gcacccaacc
37803780
cactactcca tcaggtccac cctgaggatg gagctgatgg gctgcgatct gaattcctgc cactactcca tcaggtccac cctgaggatg gagctgatgg gctgcgatct gaattcctgc
38403840
agcatgcccc tgggcatgga gtccaaagcc atctctgacg cccagatcac cgccagctcc agcatgcccc tgggcatgga gtccaaagcc atctctgacg cccagatcac cgccagctcc
39003900
tacttcacca acatgttcgc cacttggagc cccagcaagg ccagactgca cctgcagggc tacttcacca acatgttcgc cacttggagc cccagcaagg ccagactgca cctgcagggc
39603960
agaagcaatg cctggagacc ccaggtgaac aacccaaagg agtggctgca ggtggacttc agaagcaatg cctggagacc ccaggtgaac aacccaaagg agtggctgca ggtggacttc
40204020
cagaagacca tgaaggtgac cggcgtgacc acacagggcg tgaaaagcct gctgaccagc cagaagacca tgaaggtgac cggcgtgacc acacagggcg tgaaaagcct gctgaccagc
40804080
atgtacgtga aggagttcct gatcagctcc agccaggatg ggcaccagtg gaccctgttc atgtacgtga aggagttcct gatcagctcc agccaggatg ggcaccagtg gaccctgttc
41404140
tttcagaacg gcaaggtgaa ggtgttccag ggcaatcagg actcattcac ccctgtggtg tttcagaacg gcaaggtgaa ggtgttccag ggcaatcagg actcattcac ccctgtggtg
42004200
aactctctgg acccccccct gctgacccgg tacctgagaa tccacccaca gtcttgggtg aactctctgg acccccccct gctgacccgg tacctgagaa tccacccaca gtcttgggtg
42604260
caccagatcg ccctgaggat ggaagtgctg ggctgcgagg ctcaggatct gtac caccagatcg ccctgaggat ggaagtgctg ggctgcgagg ctcaggatct gtac
43144314
<210> 6<210> 6
<211> 4371<211> 4371
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Нуклеиновая кислота, кодирующая белок FVIII-BDD с сигнальным<223> Nucleic acid encoding the FVIII-BDD protein with a signal
пептидом (дикого типа) peptide (wild type)
<400> 6<400> 6
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc
60 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc
120 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac
180 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc
240 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat
300 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt
360 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg
420 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg
480 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat
540 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa
600 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta
660 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat
720 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct gctgcatctg ctcggggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct
780 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc
840 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat
900 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg
960 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa
10201020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa
10801080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat
11401140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact
12001200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc
12601260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg
13201320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct
13801380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg
14401440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact
15001500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt gatgtccgtc ctttgtattc aaggatta ccaaaaggtg taaaacattt gaaggatttt
15601560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca
16201620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga
16801680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa
17401740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag
18001800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg
18601860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt
19201920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc
19801980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa
20402040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg
21002100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc
21602160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac
22202220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc
22802280
ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt
23402340
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa
24002400
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca
24602460
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca
25202520
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc
25802580
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat
26402640
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc
27002700
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat
27602760
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac
28202820
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg
28802880
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt
29402940
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa
30003000
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg
30603060
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat
31203120
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct
31803180
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct
32403240
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg
33003300
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt
33603360
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg
34203420
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt
34803480
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat
35403540
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg
36003600
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc
36603660
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat
37203720
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata
37803780
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat
38403840
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc
39003900
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac
39603960
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg
40204020
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag agtaatgcct ggagaacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag
40804080
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg
41404140
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt
42004200
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac
42604260
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac
43204320
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c
43714371
<210> 7<210> 7
<211> 4371<211> 4371
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Кодон-оптимизированная нуклеотидная последовательность,<223> Codon-optimized nucleotide sequence,
кодирующая белок FVIII-BDD с сигнальным пептидом (вариант encoding the FVIII-BDD protein with a signal peptide (variant
FVIII-BDDco-v1) FVIII-BDDco-v1)
<400> 7<400> 7
atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttcagcgcc atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttcagcgcc
60 60
accagaaggt actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg accagaaggt actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg
120 120
ggcgagctgc ctgtggacgc cagattcccc cccagagtgc ctaagagctt ccccttcaac ggcgagctgc ctgtggacgc cagattcccc cccagagtgc ctaagagctt ccccttcaac
180 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc
240 240
gccaagccca gacccccctg gatgggcctg ctgggcccta ccatccaggc cgaggtgtac gccaagccca gacccccctg gatgggcctg ctgggcccta ccatccaggc cgaggtgtac
300 300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg
360 360
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagaga ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagaga
420 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg
480 480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac
540 540
gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgcagagag gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgcagagag
600 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg
660 660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagagac ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggacagagac
720 720
gccgccagcg ccagagcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc gccgccagcg ccagagcctg gcccaagatg cacaccgtga acggctacgt gaacaggagc
780 780
ctgcccggcc tgatcggctg ccacagaaag agcgtgtact ggcacgtgat cggcatgggc ctgcccggcc tgatcggctg ccacagaaag agcgtgtact ggcacgtgat cggcatgggc
840 840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gaggaaccac
900 900
agacaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg agacaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg
960 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag
10201020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgagaatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgag gagccccagc tgagaatgaa gaacaacgag
10801080
gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gagattcgac gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gagattcgac
11401140
gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc
12001200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc
12601260
cccgacgaca gaagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcaga cccgacgaca gaagctacaa gagccagtac ctgaacaacg gcccccagag gatcggcaga
13201320
aagtacaaga aggtgcggtt catggcctac accgacgaga ccttcaagac cagggaggcc aagtacaaga aggtgcggtt catggcctac accgacgaga ccttcaagac cagggaggcc
13801380
atccagcacg agagcggcat cctgggccct ctgctgtacg gcgaggtggg cgacaccctg atccagcacg agagcggcat cctgggccct ctgctgtacg gcgaggtggg cgacaccctg
14401440
ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccccca cggcatcacc ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccccca cggcatcacc
15001500
gacgtgagac ccctgtacag cagaagactg cccaagggcg tgaagcacct gaaggacttc gacgtgagac ccctgtacag cagaagactg cccaagggcg tgaagcacct gaaggacttc
15601560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc
16201620
accaagagcg accccagatg cctgaccaga tactacagca gcttcgtgaa catggagcgg accaagagcg accccagatg cctgaccaga tactacagca gcttcgtgaa catggagcgg
16801680
gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag gacctggcca gcggcctgat cggccccctg ctgatctgct acaagggagag cgtggaccag
17401740
agaggcaacc agatcatgag cgacaagcgg aacgtgatcc tgttcagcgt gttcgacgag agaggcaacc agatcatgag cgacaagcgg aacgtgatcc tgttcagcgt gttcgacgag
18001800
aaccggagct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg aaccggagct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc cgccggcgtg
18601860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg
19201920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc
19801980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag
20402040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc
21002100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag aaacagaggc atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttcag aaacagaggc
21602160
atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac
22202220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggagc agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggagc
22802280
ttcagccaga acccccccgt gctgaagaga caccagagag agatcaccag gaccaccctg ttcagccaga acccccccgt gctgaagaga caccagagag agatcaccag gaccaccctg
23402340
cagagcgacc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag cagagcgacc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag
24002400
gacttcgaca tctacgacga ggacgagaac cagagcccca gaagcttcca gaagaagacc gacttcgaca tctacgacga ggacgagaac cagagcccca gaagcttcca gaagaagacc
24602460
aggcactact tcatcgccgc cgtggagaga ctgtgggact acggcatgag cagcagcccc aggcactact tcatcgccgc cgtggagaga ctgtgggact acggcatgag cagcagcccc
25202520
cacgtgctga gaaacagagc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc cacgtgctga gaaacagagc cccagcggc agcgtgcccc agttcaagaa ggtggtgttc
25802580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggcgagct gaacgagcac caggagttca ccgacggcag cttcacccag cccctgtaca gaggcgagct gaacgagcac
26402640
ctgggcctgc tgggccccta catcagagcc gaggtggagg acaacatcat ggtgaccttc ctgggcctgc tgggccccta catcagagcc gaggtggagg acaacatcat ggtgaccttc
27002700
cggaaccagg ccagcagacc ctacagcttc tacagcagcc tgatcagcta cgaggaggac cggaaccagg ccagcagacc ctacagcttc tacagcagcc tgatcagcta cgaggaggac
27602760
cagaggcagg gcgccgagcc cagaaagaac ttcgtgaagc ccaacgagac caagacctac cagaggcagg gcgccgagcc cagaaagaac ttcgtgaagc ccaacgagac caagacctac
28202820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg
28802880
gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg
29402940
ctggtgtgcc acaccaacac cctgaacccc gcccacggca gacaggtgac cgtgcaggag ctggtgtgcc acaccaacac cctgaacccc gcccacggca gacaggtgac cgtgcaggag
30003000
ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg
30603060
gagcggaact gcagagcccc ctgcaacatc cagatggagg accccacctt caaggagaac gagcggaact gcagagcccc ctgcaacatc cagatggagg accccacctt caaggagaac
31203120
tacaggttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc tacaggttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc
31803180
caggaccaga gaatcagatg gtacctgctg agcatgggca gcaacgagaa catccacagc caggaccaga gaatcagatg gtacctgctg agcatgggca gcaacgagaa catccacagc
32403240
atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg
33003300
tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc
33603360
tggagagtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg tggagagtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg
34203420
gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat cagagacttc gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat cagagacttc
34803480
cagatcaccg ccagcggcca gtacggccag tgggccccca agctggccag actgcactac cagatcaccg ccagcggcca gtacggccag tgggccccca agctggccag actgcactac
35403540
agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg
36003600
ctggccccca tgatcatcca cggcatcaag acccagggcg ccagacagaa gttcagcagc ctggccccca tgatcatcca cggcatcaag acccagggcg cgacagaa gttcagcagc
36603660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac
37203720
agaggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc agaggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc
37803780
aagcacaaca tcttcaaccc ccccatcatc gcccggtaca tcaggctgca ccccacccac aagcacaaca tcttcaaccc ccccatcatc gcccggtaca tcaggctgca ccccacccac
38403840
tacagcatca ggagcaccct gagaatggag ctgatgggct gcgacctgaa cagctgcagc tacagcatca ggagcaccct gagaatggag ctgatgggct gcgacctgaa cagctgcagc
39003900
atgcccctgg gcatggagag caaggccatc agcgacgccc agatcaccgc cagcagctac atgcccctgg gcatggagag caaggccatc agcgacgccc agatcaccgc cagcagctac
39603960
ttcaccaaca tgttcgccac ctggagcccc agcaaggcca gactgcacct gcagggcaga ttcaccaaca tgttcgccac ctggagcccc agcaaggcca gactgcacct gcagggcaga
40204020
agcaacgcct ggagacccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag agcaacgcct ggagacccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag
40804080
aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg
41404140
tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc
42004200
cagaacggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac cagaacggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac
42604260
agcctggacc cccccctgct gaccagatac ctgagaatcc acccccagag ctgggtgcac agcctggacc cccccctgct gaccagatac ctgagaatcc acccccagag ctgggtgcac
43204320
cagatcgccc tgagaatgga ggtgctgggc tgcgaggccc aggacctgta c cagatcgccc tgagaatgga ggtgctgggc tgcgaggccc aggacctgta c
43714371
<210> 8<210> 8
<211> 4371<211> 4371
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Кодон-оптимизированная нуклеотидная последовательность,<223> Codon-optimized nucleotide sequence,
кодирующая белок FVIII-BDD с сигнальным пептидом (вариант encoding the FVIII-BDD protein with a signal peptide (variant
FVIII-BDDco-v2) FVIII-BDDco-v2)
<400> 8<400> 8
atgcagatcg agctgagcac ctgttttttt ctgtgcctgc tgaggttctg cttctccgcc atgcagatcg agctgagcac ctgttttttt ctgtgcctgc tgaggttctg cttctccgcc
60 60
acaagaagat actatctggg cgccgtggag ctgagctggg attatatgca gtccgacctg acaagaagat actatctggg cgccgtggag ctgagctggg attatatgca gtccgacctg
120 120
ggcgagctgc cagtggatgc tagattccct cctagagtgc ctaagagctt tccattcaat ggcgagctgc cagtggatgc tagattccct cctagagtgc ctaagagctt tccattcaat
180 180
acctccgtgg tgtacaagaa gaccctgttc gtggagttta ccgaccacct gttcaacatc acctccgtgg tgtacaagaa gaccctgttc gtggagttta ccgaccacct gttcaacatc
240 240
gccaaaccta gaccaccttg gatgggactg ctgggcccaa ctattcaggc cgaagtgtac gccaaaccta gaccaccttg gatgggactg ctgggcccaa ctattcaggc cgaagtgtac
300 300
gataccgtgg tgatcactct gaagaatatg gcctcccacc ctgtgagcct gcatgcagtt gataccgtgg tgatcactct gaagaatatg gcctcccacc ctgtgagcct gcatgcagtt
360 360
ggcgtgagct attggaaggc cagcgaggga gccgaatacg atgaccagac cagccagagg ggcgtgagct attggaaggc cagcgaggga gccgaatacg atgaccagac cagccagagg
420 420
gagaaggaag acgacaaggt gtttcccgga ggaagccaca cctatgtgtg gcaggtgctg gagaaggaag acgacaaggt gtttcccgga ggaagccaca cctatgtgtg gcaggtgctg
480 480
aaggagaatg gacctatggc cagcgatcca ctgtgcctga cctactctta tctgagccac aaggagaatg gacctatggc cagcgatcca ctgtgcctga cctactctta tctgagccac
540 540
gtggacctgg tgaaggacct gaatagcggc ctgattggcg cactgctggt gtgtagagag gtggacctgg tgaaggacct gaatagcggc ctgattggcg cactgctggt gtgtagagag
600 600
ggatctctgg ccaaagagaa gacccagacc ctgcacaagt ttatcctgct gtttgccgtg ggatctctgg ccaaagagaa gacccagacc ctgcacaagt ttatcctgct gtttgccgtg
660 660
tttgacgagg gcaaatcttg gcacagcgag accaaaaaca gcctgatgca ggatagagac tttgacgagg gcaaatcttg gcacagcgag accaaaaaca gcctgatgca ggatagac
720 720
gcagcctctg ctagagcttg gcctaagatg cacaccgtga atggctacgt gaacagatcc gcagcctctg ctagagcttg gcctaagatg cacaccgtga atggctacgt gaacagatcc
780 780
ctgcccggcc tgattggatg tcacagaaag agcgtgtact ggcacgtgat cggaatggga ctgcccggcc tgattggatg tcacagaaag agcgtgtact ggcacgtgat cggaatggga
840 840
actaccccag aagtgcacag catctttctg gagggacaca cctttctggt gcggaatcat actaccccag aagtgcacag catctttctg gagggacaca cctttctggt gcggaatcat
900 900
agacaggcca gcctggaaat cagccctatt acctttctga ccgcccagac actgctgatg agacaggcca gcctggaaat cagccctatt acctttctga ccgcccagac actgctgatg
960 960
gatctgggac agtttctgct gttctgccac atcagctctc accagcatga cggaatggaa gatctgggac agtttctgct gttctgccac atcagctctc accagcatga cggaatggaa
10201020
gcctacgtga aggtggacag ctgccctgag gaaccacagc tgaggatgaa gaataacgag gcctacgtga aggtggacag ctgccctgag gaaccacagc tgaggatgaa gaataacgag
10801080
gaggccgagg attacgacga tgacctgacc gattctgaga tggacgtggt gagattcgac gaggccgagg attacgacga tgacctgacc gattctgaga tggacgtggt gagattcgac
11401140
gacgataact ctccctcctt catccagatc agatccgtgg ccaaaaagca ccctaaaacc gacgataact ctccctcctt catccagatc agatccgtgg ccaaaaagca ccctaaaacc
12001200
tgggtgcact atatcgccgc agaggaagaa gactgggatt acgcacctct ggtgctggcc tgggtgcact atatcgccgc agaggaagaa gactgggatt acgcacctct ggtgctggcc
12601260
cctgatgaca gatcttataa gtctcagtac ctgaacaacg gccctcagag aatcggcagg cctgatgaca gatcttataa gtctcagtac ctgaacaacg gccctcagag aatcggcagg
13201320
aagtacaaga aggtgagatt catggcctac acagacgaga cattcaagac cagagaggcc aagtacaaga aggtgagatt catggcctac agacgaga cattcaagac cagagaggcc
13801380
attcagcacg agtccggcat tctgggacca ctgctgtacg gagaggtggg cgatacactg attcagcacg agtccggcat tctgggacca ctgctgtacg gagaggtggg cgatacactg
14401440
ctgatcatct tcaaaaatca ggccagcagg ccctacaaca tctacccaca tggcatcaca ctgatcatct tcaaaaatca ggccagcagg ccctacaaca tctacccaca tggcatcaca
15001500
gacgtgaggc ctctgtacag cagaagactg cctaaaggcg tgaagcacct gaaggacttc gacgtgaggc ctctgtacag cagaagactg cctaaaggcg tgaagcacct gaaggacttc
15601560
cccattctgc caggcgagat tttcaagtac aagtggacag tgaccgtgga ggatggaccc cccattctgc caggcgagat tttcaagtac aagtggacag tgaccgtgga ggatggaccc
16201620
acaaagtctg accctagatg cctgaccagg tactatagct ccttcgtgaa catggaaagg acaaagtctg accctagatg cctgaccagg tactatagct ccttcgtgaa catggaaagg
16801680
gatctggcct ctggactgat tggcccactg ctgatctgct acaaggaatc cgtggaccag gatctggcct ctggactgat tggcccactg ctgatctgct acaaggaatc cgtggaccag
17401740
agaggaaacc agatcatgag cgataagagg aatgtgatcc tgttcagcgt gttcgatgag agaggaaacc agatcatgag cgataagagg aatgtgatcc tgttcagcgt gttcgatgag
18001800
aacaggagct ggtatctgac cgagaacatc cagagattcc tgccaaatcc agccggcgtg aacaggagct ggtatctgac cgagaacatc cagagattcc tgccaaatcc agccggcgtg
18601860
cagctggaag atcctgaatt tcaggcctcc aatatcatgc actccatcaa tggctacgtg cagctggaag atcctgaatt tcaggcctcc aatatcatgc actccatcaa tggctacgtg
19201920
tttgacagcc tgcagctgtc tgtgtgtctg cacgaagtgg cctactggta catcctgagc tttgacagcc tgcagctgtc tgtgtgtctg cacgaagtgg cctactggta catcctgagc
19801980
attggagccc agaccgactt tctgagcgtg tttttctctg gctacacctt caagcacaag attggagccc agaccgactt tctgagcgtg tttttctctg gctacacctt caagcacaag
20402040
atggtgtacg aggacaccct gacactgttc ccattctcag gcgaaaccgt gtttatgagc atggtgtacg aggacaccct gacactgttc ccattctcag gcgaaaccgt gtttatgagc
21002100
atggagaacc caggactgtg gattctgggc tgccacaact ccgacttcag gaatagagga atggagaacc caggactgtg gattctgggc tgccacaact ccgacttcag gaatagagga
21602160
atgaccgccc tgctgaaagt gagcagctgc gataagaaca ccggcgatta ttacgaggac atgaccgccc tgctgaaagt gagcagctgc gataagaaca ccggcgatta ttacgaggac
22202220
tcctacgagg atatcagcgc ctacctgctg tccaaaaaca atgccatcga gcccaggagc tcctacgagg atatcagcgc ctacctgctg tccaaaaaca atgccatcga gcccaggagc
22802280
ttctcccaga atccacctgt gctgaaaaga caccagaggg agatcaccag aaccacactg ttctcccaga atccacctgt gctgaaaaga caccagaggg agatcaccag aaccacactg
23402340
cagtctgatc aggaggagat cgactatgac gacaccatca gcgtggagat gaagaaggag cagtctgatc aggaggagat cgactatgac gacaccatca gcgtggagat gaagaaggag
24002400
gactttgata tctacgacga ggatgagaac cagagcccca ggagctttca gaagaagacc gactttgata tctacgacga ggatgagaac cagagcccca ggagctttca gaagaagacc
24602460
aggcactact tcatcgccgc agtggagaga ctgtgggact acggaatgtc ttcctcccct aggcactact tcatcgccgc agtggagaga ctgtgggact acggaatgtc ttcctcccct
25202520
cacgtgctga gaaatagagc ccagtctgga agcgtgccac agtttaagaa ggtggtgttc cacgtgctga gaaatagagc ccagtctgga agcgtgccac agtttaagaa ggtggtgttc
25802580
caggagttta ccgacggctc tttcacccag ccactgtata gaggcgaact gaacgaacac caggagttta ccgacggctc tttcacccag ccactgtata gaggcgaact gaacgaacac
26402640
ctgggcctgc tgggacctta tatcagagcc gaagtggagg acaacatcat ggtgaccttc ctgggcctgc tgggacctta tatcagagcc gaagtggagg acaacatcat ggtgaccttc
27002700
agaaaccagg ccagcagacc ttacagcttc tactccagcc tgatcagcta cgaagaggat agaaaccagg ccagcagacc ttacagcttc tactccagcc tgatcagcta cgaagaggat
27602760
cagagacagg gcgccgaacc taggaaaaat tttgtgaagc caaacgagac caagacctac cagagacagg gcgccgaacc taggaaaaat tttgtgaagc caaacgagac caagacctac
28202820
ttttggaagg tgcagcatca catggccccc accaaggatg agttcgattg taaagcctgg ttttggaagg tgcagcatca catggccccc accaaggatg agttcgattg taaagcctgg
28802880
gcctacttct ccgatgtgga cctggaaaag gatgtgcaca gcggactgat cggaccactg gcctacttct ccgatgtgga cctggaaaag gatgtgcaca gcggactgat cggaccactg
29402940
ctggtgtgcc acacaaatac cctgaaccct gcccacggaa gacaggtgac agtgcaggaa ctggtgtgcc acacaaatac cctgaaccct gcccacggaa gacaggtgac agtgcaggaa
30003000
tttgccctgt tcttcaccat ctttgacgag accaagtcct ggtacttcac cgagaacatg tttgccctgt tcttcaccat ctttgacgag accaagtcct ggtacttcac cgagaacatg
30603060
gagagaaact gcagagcccc ttgcaacatt cagatggagg acccaacatt caaggagaac gagagaaact gcagagcccc ttgcaacatt cagatggagg acccaacatt caaggagaac
31203120
tacaggttcc acgccatcaa tggctacatc atggatacac tgcctggcct ggtgatggcc tacaggttcc acgccatcaa tggctacatc atggatacac tgcctggcct ggtgatggcc
31803180
caggatcaga gaattaggtg gtacctgctg tctatgggct ccaatgagaa tatccactcc caggatcaga gaattaggtg gtacctgctg tctatgggct ccaatgagaa tatccactcc
32403240
atccacttca gcggccacgt gttcaccgtg agaaagaaag aggagtacaa gatggccctg atccacttca gcggccacgt gttcaccgtg agaaagaaag aggagtacaa gatggccctg
33003300
tacaacctgt acccaggcgt gtttgagacc gtggagatgc tgccttctaa agctggcatc tacaacctgt acccaggcgt gtttgagacc gtggagatgc tgccttctaa agctggcatc
33603360
tggagagtgg agtgcctgat cggcgagcat ctgcatgctg gaatgtctac cctgtttctg tggagagtgg agtgcctgat cggcgagcat ctgcatgctg gaatgtctac cctgtttctg
34203420
gtgtactcca acaagtgcca gacacctctg ggcatggctt ctggacatat cagagacttt gtgtactcca acaagtgcca gacacctctg ggcatggctt ctggacatat cagagacttt
34803480
cagatcaccg cctccggcca gtacggacaa tgggctccaa agctggccag actgcattac cagatcaccg cctccggcca gtacggacaa tgggctccaa agctggccag actgcattac
35403540
tctggctcta ttaatgcctg gagcaccaag gagccctttt cctggatcaa ggtggatctg tctggctcta ttaatgcctg gagcaccaag gagccctttt cctggatcaa ggtggatctg
36003600
ctggccccca tgattatcca cggcatcaaa acccagggcg ccaggcagaa gttttcttcc ctggccccca tgattatcca cggcatcaaa acccagggcg ccaggcagaa gttttcttcc
36603660
ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac
37203720
agaggcaata gcaccggaac cctgatggtg tttttcggca acgtggactc ctccggcatt agaggcaata gcaccggaac cctgatggtg tttttcggca acgtggactc ctccggcatt
37803780
aagcacaata tcttcaaccc acctatcatc gccaggtaca tcagactgca ccccacccac aagcacaata tcttcaaccc acctatcatc gccaggtaca tcagactgca ccccacccac
38403840
tactctatca gaagcaccct gaggatggaa ctgatgggct gtgacctgaa ttcctgtagc tactctatca gaagcaccct gaggatggaa ctgatgggct gtgacctgaa ttcctgtagc
39003900
atgcctctgg gaatggagtc taaagccatc agtgacgccc agattaccgc cagcagctac atgcctctgg gaatggagtc taaagccatc agtgacgccc agattaccgc cagcagctac
39603960
tttaccaaca tgtttgctac atggtccccc tctaaggcca gactgcacct gcagggaaga tttaccaaca tgtttgctac atggtccccc tctaaggcca gactgcacct gcagggaaga
40204020
tctaacgcct ggagaccaca ggtgaacaac cccaaagaat ggctgcaggt ggattttcag tctaacgcct ggagaccaca ggtgaacaac cccaaagaat ggctgcaggt ggattttcag
40804080
aagaccatga aagtgaccgg cgtgacaaca cagggcgtga aatctctgct gacctctatg aagaccatga aagtgaccgg cgtgacaaca cagggcgtga aatctctgct gacctctatg
41404140
tacgtgaagg agtttctgat cagcagcagc caggacggcc atcagtggac cctgtttttt tacgtgaagg agtttctgat cagcagcagc caggacggcc atcagtggac cctgtttttt
42004200
cagaatggca aggtgaaggt gttccagggc aatcaggact cattcactcc agtggtgaac cagaatggca aggtgaaggt gttccagggc aatcaggact cattcactcc agtggtgaac
42604260
agcctggacc cacctctgct gaccagatac ctgagaattc acccacagtc ctgggtgcat agcctggacc cacctctgct gaccagatac ctgagaattc acccacagtc ctgggtgcat
43204320
cagatcgccc tgagaatgga agtgctggga tgtgaggcac aggacctgta c cagatcgccc tgagaatgga agtgctgga tgtgaggcac aggacctgta c
43714371
<210> 9<210> 9
<211> 4371<211> 4371
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Кодон-оптимизированная нуклеотидная последовательность,<223> Codon-optimized nucleotide sequence,
кодирующая белок FVIII-BDD с сигнальным пептидом (вариант encoding the FVIII-BDD protein with a signal peptide (variant
FVIII-BDDco-v3) FVIII-BDDco-v3)
<400> 9<400> 9
atgcagatcg agctgagcac ctgtttcttc ctgtgcctgc tgaggttctg tttcagcgcc atgcagatcg agctgagcac ctgtttcttc ctgtgcctgc tgaggttctg tttcagcgcc
60 60
acaaggaggt actatctggg cgccgtggaa ctgagctggg actatatgca gagcgacctg acaaggaggt actatctggg cgccgtggaa ctgagctggg actatatgca gagcgacctg
120 120
ggagagctgc ctgtggatgc cagatttcca cctagggtgc ccaagagctt ccccttcaat ggagagctgc ctgtggatgc cagatttcca cctagggtgc ccaagagctt ccccttcaat
180 180
acaagcgtgg tgtacaagaa gaccctgttc gtggagttta ccgaccacct gttcaacatc acaagcgtgg tgtacaagaa gaccctgttc gtggagttta ccgaccacct gttcaacatc
240 240
gccaagccta gacctccttg gatgggactg ctgggcccta ccattcaggc cgaagtgtac gccaagccta gacctccttg gatgggactg ctgggcccta ccattcaggc cgaagtgtac
300 300
gacacagtgg tgatcaccct gaagaatatg gccagccatc cagtgtccct gcacgcagtg gacacagtgg tgatcaccct gaagaatatg gccagccatc cagtgtccct gcacgcagtg
360 360
ggagtgtctt attggaaggc ctctgagggc gccgagtacg atgatcagac cagccagaga ggagtgtctt attggaaggc ctctgagggc gccgagtacg atgatcagac cagccagaga
420 420
gagaaggagg acgacaaggt gttccccgga ggaagccaca cctacgtgtg gcaggtgctg gagaaggagg acgacaaggt gttccccgga ggaagccaca cctacgtgtg gcaggtgctg
480 480
aaagagaatg gcccaatggc ctccgacccc ctgtgtctga catacagcta cctgagccac aaagagaatg gcccaatggc ctccgacccc ctgtgtctga catacagcta cctgagccac
540 540
gtggacctgg tgaaggacct gaactctggc ctgatcggag ctctgctggt gtgtagagaa gtggacctgg tgaaggacct gaactctggc ctgatcggag ctctgctggt gtgtagagaa
600 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgccgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgccgtg
660 660
ttcgatgagg gcaaaagctg gcattccgag accaagaatt ccctgatgca ggatagggac ttcgatgagg gcaaaagctg gcattccgag accaagaatt ccctgatgca ggatagggac
720 720
gctgccagcg ctagagcctg gcctaagatg cacactgtga atggctacgt gaaccggagc gctgccagcg ctagagcctg gcctaagatg cacactgtga atggctacgt gaaccggagc
780 780
ctgccaggcc tgatcggctg tcacagaaag agcgtgtact ggcacgtgat cggcatgggc ctgccaggcc tgatcggctg tcacagaaag agcgtgtact ggcacgtgat cggcatgggc
840 840
accactcctg aggtgcactc tatctttctg gaaggccaca cctttctggt gcggaaccat accactcctg aggtgcactc tatctttctg gaaggccaca cctttctggt gcggaaccat
900 900
agacaggcct ccctggaaat cagccccatc acctttctga ccgcccagac cctgctgatg agacaggcct ccctggaaat cagccccatc acctttctga ccgcccagac cctgctgatg
960 960
gatctgggac agttcctgct gttttgccac atctcctctc accagcacga cggaatggag gatctgggac agttcctgct gttttgccac atctcctctc accagcacga cggaatggag
10201020
gcctacgtga aagtggacag ctgtcctgaa gaacctcagc tgcggatgaa gaataacgag gcctacgtga aagtggacag ctgtcctgaa gaacctcagc tgcggatgaa gaataacgag
10801080
gaggccgagg actacgacga tgacctgacc gatagcgaga tggacgtggt gagattcgac gaggccgagg actacgacga tgacctgacc gatagcgaga tggacgtggt gagattcgac
11401140
gacgataaca gccccagctt catccagatc agatccgtgg ccaagaagca ccccaagaca gacgataaca gccccagctt catccagatc agatccgtgg ccaagaagca ccccaagaca
12001200
tgggtgcact atatcgccgc agaggaggag gattgggact acgcacctct ggtgctggct tgggtgcact atatcgccgc agaggaggag gattgggact acgcacctct ggtgctggct
12601260
cctgacgata gatcctacaa gtcccagtac ctgaacaacg gcccccagag aatcggcaga cctgacgata gatcctacaa gtcccagtac ctgaacaacg gcccccagag aatcggcaga
13201320
aagtacaaga aggtgagatt catggcctac accgacgaga cctttaagac cagagaggcc aagtacaaga aggtgagatt catggcctac accgacgaga cctttaagac cagagaggcc
13801380
atccagcacg agagcggcat tctgggacca ctgctgtatg gagaggtggg cgatacactg atccagcacg agagcggcat tctgggacca ctgctgtatg gagaggtggg cgatacactg
14401440
ctgatcatct tcaagaatca ggcctcccgg ccatacaaca tctatccaca cggcatcacc ctgatcatct tcaagaatca ggcctcccgg ccatacaaca tctatccaca cggcatcacc
15001500
gacgtgagac cactgtactc caggagactg cccaagggcg tgaagcacct gaaggacttc gacgtgagac cactgtactc caggagactg cccaagggcg tgaagcacct gaaggacttc
15601560
cctattctgc caggcgagat cttcaagtac aagtggacag tgaccgtgga agacggacct cctattctgc caggcgagat cttcaagtac aagtggacag tgaccgtgga agacggacct
16201620
accaaaagcg accccagatg cctgacccgg tactactcca gcttcgtgaa catggagaga accaaaagcg accccagatg cctgacccgg tactactcca gcttcgtgaa catggagaga
16801680
gatctggcca gcggactgat tggacctctg ctgatttgtt acaaggagag cgtggaccag gatctggcca gcggactgat tggacctctg ctgatttgtt acaagggagag cgtggaccag
17401740
aggggcaacc agattatgag cgacaagcgg aatgtgatcc tgttctccgt gttcgacgag aggggcaacc agattatgag cgacaagcgg aatgtgatcc tgttctccgt gttcgacgag
18001800
aaccgcagct ggtatctgac cgagaatatc cagaggttcc tgccaaaccc cgccggcgtt aaccgcagct ggtatctgac cgagaatatc cagaggttcc tgccaaaccc cgccggcgtt
18601860
cagctggaag atccagagtt tcaggcctcc aacatcatgc acagcatcaa tggctacgtg cagctggaag atccagagtt tcaggcctcc aacatcatgc acagcatcaa tggctacgtg
19201920
ttcgacagcc tgcagctgtc cgtgtgtctg catgaagtgg cctactggta tatcctgagc ttcgacagcc tgcagctgtc cgtgtgtctg catgaagtgg cctactggta tatcctgagc
19801980
atcggcgccc agaccgattt tctgtccgtg tttttctccg gctacacctt caagcacaag atcggcgccc agaccgattt tctgtccgtg tttttctccg gctacacctt caagcacaag
20402040
atggtgtacg aggacaccct gaccctgttt ccttttagcg gcgaaaccgt gttcatgagc atggtgtacg aggacaccct gaccctgttt ccttttagcg gcgaaaccgt gttcatgagc
21002100
atggagaacc caggactgtg gattctgggc tgtcacaaca gcgacttcag aaatcggggc atggagaacc caggactgtg gattctgggc tgtcacaaca gcgacttcag aaatcggggc
21602160
atgaccgctc tgctgaaggt gagctcttgt gacaaaaata ccggcgacta ctacgaggac atgaccgctc tgctgaaggt gagctcttgt gacaaaaata ccggcgacta ctacgaggac
22202220
agctacgagg atatcagcgc ctacctgctg agcaagaaca acgccatcga gccaagaagc agctacgagg atatcagcgc ctacctgctg agcaagaaca acgccatcga gccaagaagc
22802280
ttcagccaga atccccccgt gctgaagaga catcagaggg agatcaccag aaccaccctg ttcagccaga atccccccgt gctgaagaga catcagaggg agatcaccag aaccaccctg
23402340
cagagcgacc aggaggagat cgattacgac gacaccatca gcgtggagat gaagaaggag cagagcgacc aggaggagat cgattacgac gacaccatca gcgtggagat gaagaaggag
24002400
gatttcgaca tctacgacga ggacgagaat cagagcccaa ggagctttca gaagaagacc gatttcgaca tctacgacga ggacgagaat cagagcccaa ggagctttca gaagaagacc
24602460
cggcactact tcatcgctgc cgtggagaga ctgtgggatt atggcatgag ctccagccct cggcactact tcatcgctgc cgtggagaga ctgtgggatt atggcatgag ctccagccct
25202520
cacgtgctga gaaatagagc ccagtctggc tccgtgcccc agttcaagaa agtggtgttc cacgtgctga gaaatagagc ccagtctggc tccgtgcccc agttcaagaa agtggtgttc
25802580
caggaattca ccgacggcag ctttacccag cccctgtata gaggcgaact gaatgaacac caggaattca ccgacggcag ctttacccag cccctgtata gaggcgaact gaatgaacac
26402640
ctgggcctgc tgggacctta catcagagcc gaagtggagg acaacatcat ggtgaccttt ctgggcctgc tgggacctta catcagagcc gaagtggagg acaacatcat ggtgaccttt
27002700
aggaatcagg ccagcagacc ctacagcttc tatagctccc tgatctccta cgaggaggac aggaatcagg ccagcagacc ctacagcttc tatagctccc tgatctccta cgaggaggac
27602760
cagagacagg gcgctgagcc aagaaagaat ttcgtgaagc ccaacgagac caagacctac cagagacagg gcgctgagcc aagaaagaat ttcgtgaagc ccaacgagac caagacctac
28202820
ttctggaaag tgcagcacca catggcccct accaaggatg agttcgactg taaagcctgg ttctggaaag tgcagcacca catggcccct accaaggatg agttcgactg taaagcctgg
28802880
gcctacttca gcgacgtgga cctggagaag gacgtgcact ccggactgat cggaccactg gcctacttca gcgacgtgga cctggagaag gacgtgcact ccggactgat cggaccactg
29402940
ctggtgtgcc acacaaacac cctgaaccct gcccatggaa gacaggtgac tgtgcaggaa ctggtgtgcc acacaaacac cctgaaccct gcccatggaa gacaggtgac tgtgcaggaa
30003000
ttcgccctgt tctttaccat cttcgacgag accaagtcct ggtacttcac cgagaatatg ttcgccctgt tctttaccat cttcgacgag accaagtcct ggtacttcac cgagaatatg
30603060
gagaggaatt gcagagcccc ctgtaacatc cagatggagg accccacctt taaggagaat gagaggaatt gcagagcccc ctgtaacatc cagatggagg accccacctt taaggagaat
31203120
tacaggtttc acgccatcaa cggctacatc atggacacac tgccaggcct ggtgatggca tacaggtttc acgccatcaa cggctacatc atggacacac tgccaggcct ggtgatggca
31803180
caggatcaga ggatcagatg gtatctgctg agcatgggct ccaacgagaa catccactcc caggatcaga ggatcagatg gtatctgctg agcatgggct ccaacgagaa catccactcc
32403240
atccacttca gcggccacgt gtttaccgtg agaaagaagg aggagtacaa gatggccctg atccacttca gcggccacgt gtttaccgtg agaaagaagg aggagtacaa gatggccctg
33003300
tacaacctgt atcccggcgt gttcgaaacc gtggagatgc tgccttccaa agccggaatc tacaacctgt atcccggcgt gttcgaaacc gtggagatgc tgccttccaa agccggaatc
33603360
tggagagtgg agtgcctgat tggcgagcac ctgcacgctg gaatgtccac cctgttcctg tggagagtgg agtgcctgat tggcgagcac ctgcacgctg gaatgtccac cctgttcctg
34203420
gtgtatagca acaagtgcca gacccccctg ggcatggcta gcggacacat tagagacttt gtgtatagca acaagtgcca gacccccctg ggcatggcta gcggacacat tagagacttt
34803480
cagatcaccg cctccggcca gtacggacag tgggccccaa aactggctag gctgcattac cagatcaccg cctccggcca gtacggacag tgggccccaa aactggctag gctgcattac
35403540
agcggctcca tcaatgcctg gtccaccaag gagccattca gctggatcaa agtggatctg agcggctcca tcaatgcctg gtccaccaag gagccattca gctggatcaa agtggatctg
36003600
ctggccccca tgatcatcca cggcattaag acacagggcg ccaggcagaa gttcagctct ctggccccca tgatcatcca cggcattaag acacagggcg ccaggcagaa gttcagctct
36603660
ctgtacatct cccagttcat catcatgtac tccctggacg gcaagaagtg gcagacctac ctgtacatct cccagttcat catcatgtac tccctggacg gcaagaagtg gcagacctac
37203720
aggggcaata gcaccggcac actgatggtg tttttcggca acgtggactc ttccggcatc aggggcaata gcaccggcac actgatggtg tttttcggca acgtggactc ttccggcatc
37803780
aagcacaaca tctttaaccc ccctatcatc gccaggtaca tcaggctgca ccccactcac aagcacaaca tctttaaccc ccctatcatc gccaggtaca tcaggctgca ccccactcac
38403840
tacagcatca gatccaccct gagaatggag ctgatgggat gcgacctgaa cagctgcagc tacagcatca gatccaccct gagaatggag ctgatgggat gcgacctgaa cagctgcagc
39003900
atgcccctgg gcatggagag caaggccatt tctgacgccc agatcaccgc cagcagctat atgcccctgg gcatggagag caaggccatt tctgacgccc agatcaccgc cagcagctat
39603960
ttcaccaata tgttcgctac ctggagcccc agcaaggcca gactgcatct gcagggcaga ttcaccaata tgttcgctac ctggagcccc agcaaggcca gactgcatct gcagggcaga
40204020
agcaacgcct ggagaccaca ggtgaacaat cctaaagagt ggctgcaggt ggacttccag agcaacgcct ggagaccaca ggtgaacaat cctaaagagt ggctgcaggt ggacttccag
40804080
aagaccatga aggtgaccgg cgtgacaacc cagggcgtga aatctctgct gacctccatg aagaccatga aggtgaccgg cgtgacaacc cagggcgtga aatctctgct gacctccatg
41404140
tacgtgaagg agttcctgat ctcctccagc caggatggcc atcagtggac cctgttcttc tacgtgaagg agttcctgat ctcctccagc caggatggcc atcagtggac cctgttcttc
42004200
cagaacggca aggtgaaagt gttccagggc aaccaggaca gctttacccc tgtggtgaac cagaacggca aggtgaaagt gttccagggc aaccaggaca gctttacccc tgtggtgaac
42604260
tctctggatc cccccctgct gaccaggtac ctgagaattc acccccagag ctgggtgcac tctctggatc cccccctgct gaccaggtac ctgagaattc acccccagag ctgggtgcac
43204320
cagatcgccc tgagaatgga agtgctggga tgcgaggcac aggacctgta c cagatcgccc tgagaatgga agtgctgga tgcgaggcac aggacctgta c
43714371
<210> 10<210> 10
<211> 4371<211> 4371
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Кодон-оптимизированная нуклеотидная последовательность,<223> Codon-optimized nucleotide sequence,
кодирующая белок FVIII-BDD с сигнальным пептидом (вариант encoding the FVIII-BDD protein with a signal peptide (variant
FVIII-BDDco-v4) FVIII-BDDco-v4)
<400> 10<400> 10
atgcagatcg agctgtccac ctgcttcttc ctgtgcctgc tgcgcttctg tttctctgct atgcagatcg agctgtccac ctgcttcttc ctgtgcctgc tgcgcttctg tttctctgct
60 60
acccggaggt actacctggg cgctgtggag ctgagctggg actacatgca gagcgatctg acccggaggt actacctggg cgctgtggag ctgagctggg actacatgca gagcgatctg
120 120
ggcgagctgc ccgtggatgc cagatttccc ccaagagtgc ctaagtcctt ccccttcaac ggcgagctgc ccgtggatgc cagatttccc ccaagagtgc ctaagtcctt ccccttcaac
180 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc
240 240
gccaagccaa ggcccccctg gatgggactg ctgggaccta caattcaggc cgaggtgtac gccaagccaa ggcccccctg gatgggactg ctgggaccta caattcaggc cgaggtgtac
300 300
gataccgtgg tgatcaccct gaagaacatg gcctcccacc cagtgtccct gcatgccgtg gataccgtgg tgatcaccct gaagaacatg gcctcccacc cagtgtccct gcatgccgtg
360 360
ggcgtgagct actggaaggc ttctgaaggc gccgagtacg acgaccagac cagccagagg ggcgtgagct actggaaggc ttctgaaggc gccgagtacg acgaccagac cagccagagg
420 420
gagaaggagg acgacaaggt gttcccaggc ggatctcaca cctacgtgtg gcaggtgctg gagaaggagg acgacaaggt gttcccaggc ggatctcaca cctacgtgtg gcaggtgctg
480 480
aaggagaatg gcccaatggc cagcgaccca ctgtgtctga cctacagcta cctgtcccac aaggagaatg gcccaatggc cagcgaccca ctgtgtctga cctacagcta cctgtcccac
540 540
gtggacctgg tgaaggacct gaactccggc ctgatcggcg ccctgctggt gtgtagagaa gtggacctgg tgaaggacct gaactccggc ctgatcggcg ccctgctggt gtgtagagaa
600 600
ggatctctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg ggatctctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg
660 660
tttgacgagg gcaagagctg gcattccgag accaagaaca gcctgatgca ggacagagac tttgacgagg gcaagagctg gcattccgag accaagaaca gcctgatgca ggacagagac
720 720
gcagccagcg ctagagcctg gcccaagatg cacaccgtga atggctacgt gaaccggtcc gcagccagcg ctagagcctg gcccaagatg cacaccgtga atggctacgt gaaccggtcc
780 780
ctgccaggcc tgatcggctg tcacagaaaa agcgtgtact ggcacgtgat cggcatgggc ctgccaggcc tgatcggctg tcacagaaaa agcgtgtact ggcacgtgat cggcatgggc
840 840
accacacccg aggtgcacag catctttctg gagggccaca ccttcctggt gagaaaccac accacacccg aggtgcacag catctttctg gagggccaca ccttcctggt gagaaaccac
900 900
aggcaggcct ccctggagat ctcccccatc acctttctga ccgcccagac cctgctgatg aggcaggcct ccctggagat ctcccccatc acctttctga ccgcccagac cctgctgatg
960 960
gatctgggcc agttcctgct gttctgccac atcagctccc accagcacga cggaatggag gatctgggcc agttcctgct gttctgccac atcagctccc accagcacga cggaatggag
10201020
gcctacgtga aggtggatag ctgccccgag gagccccagc tgagaatgaa gaacaacgag gcctacgtga aggtggatag ctgccccgag gagccccagc tgagaatgaa gaacaacgag
10801080
gaggccgagg actacgacga tgacctgacc gattccgaga tggacgtggt gcgcttcgac gaggccgagg actacgacga tgacctgacc gattccgaga tggacgtggt gcgcttcgac
11401140
gacgataata gccccagctt catccagatc agatccgtgg ccaagaagca cccaaagacc gacgataata gccccagctt catccagatc agatccgtgg ccaagaagca cccaaagacc
12001200
tgggtgcact acatcgctgc cgaggaggag gactgggatt acgccccact ggtgctggcc tgggtgcact acatcgctgc cgaggaggag gactgggatt acgccccact ggtgctggcc
12601260
cctgatgaca gatcctacaa gagccagtac ctgaacaacg gcccccagag aatcggccgg cctgatgaca gatcctacaa gagccagtac ctgaacaacg gcccccagag aatcggccgg
13201320
aagtacaaga aggtgagatt catggcctac accgacgaga ccttcaagac cagggaagcc aagtacaaga aggtgagatt catggcctac accgacgaga ccttcaagac cagggaagcc
13801380
atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg cgataccctg atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg cgataccctg
14401440
ctgatcatct tcaagaacca ggcctcccgg ccctacaaca tctaccccca cggcatcacc ctgatcatct tcaagaacca ggcctcccgg ccctacaaca tctaccccca cggcatcacc
15001500
gacgtgaggc cactgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc gacgtgaggc cactgtacag caggaggctg cccaagggcg tgaagcacct gaaggacttc
15601560
cccatcctgc ccggcgagat ctttaagtac aagtggaccg tgaccgtgga ggacggccca cccatcctgc ccggcgagat ctttaagtac aagtggaccg tgaccgtgga ggacggccca
16201620
accaagagcg acccaagatg cctgaccagg tactactcct ccttcgtgaa catggagcgg accaagagcg acccaagatg cctgaccagg tactactcct ccttcgtgaa catggagcgg
16801680
gatctggcca gcggactgat tggccctctg ctgatctgct acaaggagag cgtggaccag gatctggcca gcggactgat tggccctctg ctgatctgct acaaggagag cgtggaccag
17401740
cgcggcaatc agatcatgag cgacaagaga aacgtgatcc tgttcagcgt gttcgacgag cgcggcaatc agatcatgag cgacaagaga aacgtgatcc tgttcagcgt gttcgacgag
18001800
aatcgcagct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc agccggcgtg aatcgcagct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc agccggcgtg
18601860
cagctggaag atcctgaatt tcaggccagc aacatcatgc actccatcaa cggctacgtg cagctggaag atcctgaatt tcaggccagc aacatcatgc actccatcaa cggctacgtg
19201920
ttcgactccc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgagc ttcgactccc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgagc
19801980
atcggcgccc agaccgactt cctgtccgtg ttcttttccg gctacacctt caagcacaag atcggcgccc agaccgactt cctgtccgtg ttcttttccg gctacacctt caagcacaag
20402040
atggtgtacg aggacaccct gaccctgttc ccctttagcg gcgagaccgt gttcatgagc atggtgtacg aggacaccct gaccctgttc ccctttagcg gcgagaccgt gttcatgagc
21002100
atggagaacc caggcctgtg gattctgggc tgccacaaca gcgacttccg caataggggc atggagaacc caggcctgtg gattctgggc tgccacaaca gcgacttccg caataggggc
21602160
atgaccgccc tgctgaaagt gtccagctgc gataagaaca ccggcgacta ctacgaggac atgaccgccc tgctgaaagt gtccagctgc gataagaaca ccggcgacta ctacgaggac
22202220
agctacgagg acatctccgc ctacctgctg agcaagaaca acgccatcga gcccagatcc agctacgagg acatctccgc ctacctgctg agcaagaaca acgccatcga gccgatcc
22802280
ttcagccaga accctccagt gctgaagagg caccagcgcg agatcaccag aaccaccctg ttcagccaga accctccagt gctgaagagg caccagcgcg agatcaccag aaccaccctg
23402340
cagtctgatc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag cagtctgatc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag
24002400
gacttcgaca tctacgacga ggacgagaac cagagcccta ggtccttcca gaagaagacc gacttcgaca tctacgacga ggacgagaac cagagcccta ggtccttcca gaagaagacc
24602460
cggcactact tcatcgccgc agtggagagg ctgtgggatt acggcatgag cagctcccca cggcactact tcatcgccgc agtggagagg ctgtgggatt acggcatgag cagctcccca
25202520
cacgtgctga gaaatagggc ccagagcggc agcgtgcccc agttcaaaaa ggtggtgttc cacgtgctga gaaatagggc cccagcggc agcgtgcccc agttcaaaaa ggtggtgttc
25802580
caggagttca ccgacggctc cttcacccag cccctgtaca gaggcgagct gaatgagcac caggagttca ccgacggctc cttcacccag cccctgtaca gaggcgagct gaatgagcac
26402640
ctgggcctgc tgggacccta catcagagca gaggtggagg acaacatcat ggtgaccttc ctgggcctgc tgggacccta catcagagca gaggtggagg acaacatcat ggtgaccttc
27002700
aggaaccagg ccagcagacc ctacagcttc tacagcagcc tgatcagcta cgaggaggac aggaaccagg ccagcagacc ctacagcttc tacagcagcc tgatcagcta cgaggaggac
27602760
cagagacagg gagccgagcc acgcaagaac ttcgtgaagc ccaacgagac caagacctac cagagacagg gagccgagcc acgcaagaac ttcgtgaagc ccaacgagac caagacctac
28202820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgattg taaagcctgg ttctggaagg tgcagcacca catggccccc accaaggacg agttcgattg taaagcctgg
28802880
gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggacctctg gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggacctctg
29402940
ctggtgtgtc ataccaacac cctgaacccc gcccacggca gacaggtgac tgtgcaggag ctggtgtgtc ataccaacac cctgaacccc gcccacggca gacaggtgac tgtgcaggag
30003000
tttgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg tttgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg
30603060
gagagaaact gcagggcccc atgcaacatc cagatggaag accccacctt caaggagaac gagagaaact gcagggcccc atgcaacatc cagatggaag accccacctt caaggagaac
31203120
taccggttcc acgccatcaa cggctacatc atggataccc tgcctggcct ggtgatggcc taccggttcc acgccatcaa cggctacatc atggataccc tgcctggcct ggtgatggcc
31803180
caggatcaga gaatcaggtg gtacctgctg agcatgggct ccaacgagaa catccacagc caggatcaga gaatcaggtg gtacctgctg agcatgggct ccaacgagaa catccacagc
32403240
atccacttct ccggccacgt gttcaccgtg aggaaaaagg aggagtacaa gatggccctg atccacttct ccggccacgt gttcaccgtg aggaaaaagg aggagtacaa gatggccctg
33003300
tacaacctgt accccggcgt gtttgagacc gtggagatgc tgccatctaa ggccggcatt tacaacctgt accccggcgt gtttgagacc gtggagatgc tgccatctaa ggccggcatt
33603360
tggagagtgg agtgcctgat cggcgagcac ctgcacgccg gaatgtctac cctgttcctg tggagagtgg agtgcctgat cggcgagcac ctgcacgccg gaatgtctac cctgttcctg
34203420
gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggacacat cagagacttc gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggacacat cagagacttc
34803480
cagatcaccg ccagcggcca gtacggacag tgggctccta aactggcccg cctgcactat cagatcaccg ccagcggcca gtacggacag tgggctccta aactggcccg cctgcactat
35403540
agcggcagca ttaacgcctg gtccaccaag gagccattca gctggatcaa ggtggatctg agcggcagca ttaacgcctg gtccaccaag gagccattca gctggatcaa ggtggatctg
36003600
ctggccccca tgatcatcca cggcatcaaa acacagggcg ccagacagaa gttctccagc ctggccccca tgatcatcca cggcatcaaa acacagggcg cgacagaa gttctccagc
36603660
ctgtacatct cccagttcat catcatgtac tccctggacg gcaagaagtg gcagacctac ctgtacatct cccagttcat catcatgtac tccctggacg gcaagaagtg gcagacctac
37203720
agaggcaact ccaccggcac actgatggtg ttcttcggca acgtggacag cagcggcatc agaggcaact ccaccggcac actgatggtg ttcttcggca acgtggacag cagcggcatc
37803780
aagcacaaca tcttcaaccc ccccatcatc gcccggtaca tcagactgca cccaacccac aagcacaaca tcttcaaccc ccccatcatc gcccggtaca tcagactgca cccaacccac
38403840
tactccatca ggtccaccct gaggatggag ctgatgggct gcgatctgaa ttcctgcagc tactccatca ggtccaccct gaggatggag ctgatgggct gcgatctgaa ttcctgcagc
39003900
atgcccctgg gcatggagtc caaagccatc tctgacgccc agatcaccgc cagctcctac atgcccctgg gcatggagtc caaagccatc tctgacgccc agatcaccgc cagctcctac
39603960
ttcaccaaca tgttcgccac ttggagcccc agcaaggcca gactgcacct gcagggcaga ttcaccaaca tgttcgccac ttggagcccc agcaaggcca gactgcacct gcagggcaga
40204020
agcaatgcct ggagacccca ggtgaacaac ccaaaggagt ggctgcaggt ggacttccag agcaatgcct ggagacccca ggtgaacaac ccaaaggagt ggctgcaggt ggacttccag
40804080
aagaccatga aggtgaccgg cgtgaccaca cagggcgtga aaagcctgct gaccagcatg aagaccatga aggtgaccgg cgtgaccaca cagggcgtga aaagcctgct gaccagcatg
41404140
tacgtgaagg agttcctgat cagctccagc caggatgggc accagtggac cctgttcttt tacgtgaagg agttcctgat cagctccagc caggatgggc accagtggac cctgttcttt
42004200
cagaacggca aggtgaaggt gttccagggc aatcaggact cattcacccc tgtggtgaac cagaacggca aggtgaaggt gttccagggc aatcaggact cattcacccc tgtggtgaac
42604260
tctctggacc cccccctgct gacccggtac ctgagaatcc acccacagtc ttgggtgcac tctctggacc cccccctgct gacccggtac ctgagaatcc acccacagtc ttgggtgcac
43204320
cagatcgccc tgaggatgga agtgctgggc tgcgaggctc aggatctgta c cagatcgccc tgaggatgga agtgctgggc tgcgaggctc aggatctgta c
43714371
<210> 11<210> 11
<211> 1438<211> 1438
<212> PRT<212>PRT
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> белок FVIII-BDD (фактор свёртывания крови VIII c делетированным <223> FVIII-BDD protein (blood clotting factor VIII with deleted
BB
доменом) domain)
<400> 11<400> 11
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp TyrAla Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 151 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro ProMet Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30 20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys LysArg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45 35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys ProThr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60 50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu ValArg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 8065 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro ValTyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95 85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly AlaSer Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110 100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys ValGlu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125 115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu AsnPhe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140 130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu SerGly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala LeuHis Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175 165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr LeuLeu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190 180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser TrpHis Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205 195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala SerHis Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220 210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn ArgAla Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp HisSer Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255 245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu GluVal Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270 260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu IleGly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285 275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu GlySer Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300 290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly MetGln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu ArgGlu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335 325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr AspMet Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350 340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser PheSer Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365 355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val HisIle Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380 370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val LeuTyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly ProAla Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415 405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr ThrGln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430 420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly IleAsp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445 435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile IleLeu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460 450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly IlePhe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val LysThr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495 485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr LysHis Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510 500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg CysTrp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525 515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu AlaLeu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540 530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val AspSer Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu PheGln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575 565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile GlnSer Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590 580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu PheArg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605 595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp SerGln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620 610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile LeuLeu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly TyrSer Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655 645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe ProThr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670 660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu TrpPhe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685 675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr AlaIle Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700 690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr GluLeu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn AlaAsp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735 725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg HisIle Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750 740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu IleGln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765 755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe AspAsp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780 770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys LysIle Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr GlyThr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815 805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly SerMet Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830 820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly SerVal Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845 835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly LeuPhe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860 850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val ThrLeu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu IlePhe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895 885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn PheSer Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910 900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His HisVal Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925 915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr PheMet Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940 930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly ProSer Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg GlnLeu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975 965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu ThrVal Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990 980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala ProLys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005 995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg PheCys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe
1010 1015 1020 1010 1015 1020
His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val MetHis Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met
1025 1030 1035 10401025 1030 1035 1040
Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser AsnAla Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn
1045 1050 1055 1045 1050 1055
Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val ArgGlu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg
1060 1065 1070 1060 1065 1070
Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly ValLys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val
1075 1080 1085 1075 1080 1085
Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg ValPhe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1090 1095 1100 1090 1095 1100
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu PheGlu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe
1105 1110 1115 11201105 1110 1115 1120
Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser GlyLeu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly
1125 1130 1135 1125 1130 1135
His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln TrpHis Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp
1140 1145 1150 1140 1145 1150
Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala TrpAla Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp
1155 1160 1165 1155 1160 1165
Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala ProSer Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro
1170 1175 1180 1170 1175 1180
Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe SerMet Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser
1185 1190 1195 12001185 1190 1195 1200
Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly LysSer Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys
1205 1210 1215 1205 1210 1215
Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val PheLys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe
1220 1225 1230 1220 1225 1230
Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn ProPhe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245 1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser IlePro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile
1250 1255 1260 1250 1255 1260
Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser CysArg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys
1265 1270 1275 12801265 1270 1275 1280
Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln IleSer Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile
1285 1290 1295 1285 1290 1295
Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro SerThr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser
1300 1305 1310 1300 1305 1310
Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro GlnLys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln
1315 1320 1325 1315 1320 1325
Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr MetVal Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
1330 1335 1340 1330 1335 1340
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr SerLys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser
1345 1350 1355 13601345 1350 1355 1360
Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His GlnMet Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln
1365 1370 1375 1365 1370 1375
Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly AsnTrp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn
1380 1385 1390 1380 1385 1390
Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu LeuGln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu
1395 1400 1405 1395 1400 1405
Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile AlaThr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala
1410 1415 1420 1410 1415 1420
Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu TyrLeu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1425 1430 14351425 1430 1435
<210> 12<210> 12
<211> 1457<211> 1457
<212> PRT<212>PRT
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> белок FVIII-BDD с сигнальным пептидом<223> FVIII-BDD protein with signal peptide
<400> 12<400> 12
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg PheMet Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 151 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu SerCys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30 20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala ArgTrp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45 35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val ValPhe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60 50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn IleTyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 8065 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile GlnAla Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95 85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala SerAla Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110 100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala SerHis Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125 115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu AspGlu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140 130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val LeuAsp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr SerLys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175 165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu IleTyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190 180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys ThrGly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205 195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu GlyGln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220 210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg AspLys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly TyrAla Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255 245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser ValVal Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270 260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser IleTyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285 275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala SerPhe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300 290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu MetLeu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln HisAsp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335 325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu ProAsp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350 340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp AspGln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365 355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn SerLeu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380 370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys ThrPro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala ProTrp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415 405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu AsnLeu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430 420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe MetAsn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445 435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His GluAla Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460 450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr LeuSer Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr ProLeu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495 485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro LysHis Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510 500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile PheGly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525 515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser AspLys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540 530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu ArgPro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys GluAsp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575 565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn ValSer Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590 580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr GluIle Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605 595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu AspAsn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620 610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr ValPro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr TrpPhe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655 645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe PheTyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670 660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu ThrSer Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685 675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn ProLeu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700 690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg GlyGly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly AspMet Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735 725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser LysTyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750 740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val LeuAsn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu
755 760 765 755 760 765
Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp GlnLys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln
770 775 780 770 775 780
Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys GluGlu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu
785 790 795 800785 790 795 800
Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser PheAsp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe
805 810 815 805 810 815
Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu TrpGln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp
820 825 830 820 825 830
Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala GlnAsp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln
835 840 845 835 840 845
Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe ThrSer Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
850 855 860 850 855 860
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu HisAsp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His
865 870 875 880865 870 875 880
Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn IleLeu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile
885 890 895 885 890 895
Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr SerMet Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser
900 905 910 900 905 910
Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro ArgSer Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
915 920 925 915 920 925
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys ValLys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val
930 935 940 930 935 940
Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala TrpGln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp
945 950 955 960945 950 955 960
Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly LeuAla Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu
965 970 975 965 970 975
Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala HisIle Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His
980 985 990 980 985 990
Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile PheGly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
995 1000 1005 995 1000 1005
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn CysAsp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys
1010 1015 1020 1010 1015 1020
Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu AsnArg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn
1025 1030 1035 10401025 1030 1035 1040
Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro GlyTyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly
1045 1050 1055 1045 1050 1055
Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser MetLeu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1060 1065 1070 1060 1065 1070
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val PheGly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe
1075 1080 1085 1075 1080 1085
Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu TyrThr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr
1090 1095 1100 1090 1095 1100
Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly IlePro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile
1105 1110 1115 11201105 1110 1115 1120
Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met SerTrp Arg Val Glu Cys Leu Ile Gly Gly His Leu His Ala Gly Met Ser
1125 1130 1135 1125 1130 1135
Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly MetThr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met
1140 1145 1150 1140 1145 1150
Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln TyrAla Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
1155 1160 1165 1155 1160 1165
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser IleGly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile
1170 1175 1180 1170 1175 1180
Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp LeuAsn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu
1185 1190 1195 12001185 1190 1195 1200
Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg GlnLeu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln
1205 1210 1215 1205 1210 1215
Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser LeuLys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu
1220 1225 1230 1220 1225 1230
Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr LeuAsp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu
1235 1240 1245 1235 1240 1245
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn IleMet Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile
1250 1255 1260 1250 1255 1260
Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr HisPhe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His
1265 1270 1275 12801265 1270 1275 1280
Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp LeuTyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu
1285 1290 1295 1285 1290 1295
Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser AspAsn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1300 1305 1310 1300 1305 1310
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr TrpAla Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp
1315 1320 1325 1315 1320 1325
Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala TrpSer Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp
1330 1335 1340 1330 1335 1340
Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe GlnArg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln
1345 1350 1355 13601345 1350 1355 1360
Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser LeuLys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu
1365 1370 1375 1365 1370 1375
Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln AspLeu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp
1380 1385 1390 1380 1385 1390
Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val PheGly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
1395 1400 1405 1395 1400 1405
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp ProGln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro
1410 1415 1420 1410 1415 1420
Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val HisPro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His
1425 1430 1435 14401425 1430 1435 1440
Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp LeuGln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu
1445 1450 1455 1445 1450 1455
TyrTyr
<210> 13<210> 13
<211> 130<211> 130
<212> DNA<212> DNA
<213> Природная последовательность<213> Natural sequence
<220><220>
<223> Левый (первый) ITR (инвертированные концевые повторы)<223> Left (first) ITR (inverted terminal repeats)
<400> 13<400> 13
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt
6060
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact
120120
aggggttcct aggggttcct
130130
<210> 14<210> 14
<211> 252<211> 252
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Промотор HLP<223> HLP promoter
<400> 14<400> 14
tgtttgctgc ttgcaatgtt tgcccatttt agggtggaca caggacgctg tggtttctga tgtttgctgc ttgcaatgtt tgcccatttt agggtggaca caggacgctg tggtttctga
6060
gccagggggc gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac gccaggggggc gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac
120120
tggggtgacc ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg tggggtgacc ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg
180180
cttaaatacg gacgaggaca gggccctgtc tcctcagctt caggcaccac cactgacctg cttaaatacg gacgaggaca gggccctgtc tcctcagctt caggcaccac cactgacctg
240240
ggacagtgaa tc ggacagtgaa tc
252252
<210> 15<210> 15
<211> 60<211> 60
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Сигнал полиаденилирования<223> Polyadenylation signal
<400> 15<400> 15
cgcgaataaa agatctttat tttcattaga tctgtgtgtt ggttttttgt gtgatgcagc cgcgaataaa agatctttat tttcattaga tctgtgtgtt ggttttttgt gtgatgcagc
6060
<210> 16<210> 16
<211> 141<211> 141
<212> DNA<212> DNA
<213> Природная последовательность<213> Natural sequence
<220><220>
<223> Правый ITR<223> Right ITR
<400> 16<400> 16
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
6060
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc
120120
gagcgcgcag ctgcctgcag g gagcgcgcag ctgcctgcag g
141141
<210> 17<210> 17
<211> 57<211> 57
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Нуклеиновая кислота, кодирующую сигнальный пептид<223> Nucleic acid encoding a signal peptide
<400> 17<400> 17
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagt atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagt
5757
<210> 18<210> 18
<211> 57<211> 57
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Нуклеиновая кислота, кодирующую сигнальный пептид<223> Nucleic acid encoding a signal peptide
<400> 18<400> 18
atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttcagc atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttcagc
5757
<210> 19<210> 19
<211> 57<211> 57
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Нуклеиновая кислота, кодирующую сигнальный пептид<223> Nucleic acid encoding a signal peptide
<400> 19<400> 19
atgcagatcg agctgagcac ctgttttttt ctgtgcctgc tgaggttctg cttctcc atgcagatcg agctgagcac ctgttttttt ctgtgcctgc tgaggttctg cttctcc
5757
<210> 20<210> 20
<211> 57<211> 57
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Нуклеиновая кислота, кодирующую сигнальный пептид<223> Nucleic acid encoding a signal peptide
<400> 20<400> 20
atgcagatcg agctgagcac ctgtttcttc ctgtgcctgc tgaggttctg tttcagc atgcagatcg agctgagcac ctgtttcttc ctgtgcctgc tgaggttctg tttcagc
5757
<210> 21<210> 21
<211> 57<211> 57
<212> DNA<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Нуклеиновая кислота, кодирующую сигнальный пептид<223> Nucleic acid encoding a signal peptide
<400> 21<400> 21
atgcagatcg agctgtccac ctgcttcttc ctgtgcctgc tgcgcttctg tttctct atgcagatcg agctgtccac ctgcttcttc ctgtgcctgc tgcgcttctg tttctct
5757
<210> 22<210> 22
<211> 19<211> 19
<212> PRT<212>PRT
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> сигнальный пептид<223> signal peptide
<400> 22<400> 22
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg PheMet Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 151 5 10 15
Cys Phe SerCys Phe Ser
<---<---
Claims (15)
Priority Applications (17)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| MA68586A MA68586A1 (en) | 2022-04-28 | 2023-04-18 | CODON-OPTIMIZED NUCLEIC ACID ENCODING FVIII-BDD |
| CR20240524A CR20240524A (en) | 2022-04-28 | 2023-04-18 | Codon-optimized nucleic acid encoding the fviii-bdd |
| US18/859,760 US20250282847A1 (en) | 2022-04-28 | 2023-04-18 | Codon-optimized nucleic acid encoding the fviii-bdd |
| PCT/RU2023/050094 WO2023211316A1 (en) | 2022-04-28 | 2023-04-18 | Codon-optimized nucleic acid encoding the fviii-bdd |
| AU2023261338A AU2023261338A1 (en) | 2022-04-28 | 2023-04-18 | Codon-optimized nucleic acid encoding the fviii-bdd |
| JP2024563594A JP2025514313A (en) | 2022-04-28 | 2023-04-18 | Codon-optimized nucleic acid encoding FVIII-BDD |
| EP23796916.7A EP4514836A1 (en) | 2022-04-28 | 2023-04-18 | Codon-optimized nucleic acid encoding the fviii-bdd |
| IL316584A IL316584A (en) | 2022-04-28 | 2023-04-18 | Codon-optimized nucleic acid encoding the fviii-bdd |
| KR1020247039728A KR20250007615A (en) | 2022-04-28 | 2023-04-18 | Codon-optimized nucleic acid encoding FVIII-BDD |
| CA3250665A CA3250665A1 (en) | 2022-04-28 | 2023-04-18 | Codon-optimized nucleic acid encoding the fviii-bdd |
| PE2024002342A PE20251838A1 (en) | 2022-04-28 | 2023-04-18 | Codon-optimized nucleic acid encoding the B-domain-deleted coagulation factor VIII protein, and its use |
| TW112114534A TW202346601A (en) | 2022-04-28 | 2023-04-19 | Codon-optimized nucleic acid that encodes b-domain deleted coagulation factor viii protein, and use thereof |
| ARP230101022A AR129163A1 (en) | 2022-04-28 | 2023-04-27 | CODON-OPTIMIZED NUCLEIC ACID ENCODING B-DOMAIN DELETED COAGULATION FACTOR VIII PROTEIN AND ITS USE |
| CN202310468975.6A CN116970629A (en) | 2022-04-28 | 2023-04-27 | Codon-optimized nucleic acid encoding coagulation factor VIII protein with deleted B-domain and its use |
| CONC2024/0014690A CO2024014690A2 (en) | 2022-04-28 | 2024-10-28 | Codon-optimized nucleic acid encoding the b-domain-deleted coagulation factor VIII protein, and its use |
| CL2024003296A CL2024003296A1 (en) | 2022-04-28 | 2024-10-28 | Codon-optimized nucleic acid encoding factor VIII protein with a deleted b-domain coagulation factor VIII protein |
| MX2024013280A MX2024013280A (en) | 2022-04-28 | 2024-10-28 | Codon-optimized nucleic acid encoding the fviii-bdd |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2022111734A RU2022111734A (en) | 2023-10-30 |
| RU2808564C2 true RU2808564C2 (en) | 2023-11-29 |
Family
ID=
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020041773A1 (en) * | 2018-08-24 | 2020-02-27 | Spark Therapeutics, Inc. | Optimized promoter sequences, intron-free expression constructs and methods of use |
| RU2745506C2 (en) * | 2015-10-30 | 2021-03-25 | Спарк Терапьютикс, Инк. | Cpg reduced factor viii variants, compositions and methods and use for treatment of hemostasis disorders |
| RU2020108209A (en) * | 2017-08-01 | 2021-09-02 | Спарк Терапьютикс, Инк. | METHODS OF GENOTHERAPY USING FACTOR VIII (FVIII) GENE |
| RU2762257C2 (en) * | 2016-04-15 | 2021-12-17 | Зе Трастис Оф Зе Юниверсити Оф Пенсильвания | Gene therapy for the treatment of hemophilia a |
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2745506C2 (en) * | 2015-10-30 | 2021-03-25 | Спарк Терапьютикс, Инк. | Cpg reduced factor viii variants, compositions and methods and use for treatment of hemostasis disorders |
| RU2762257C2 (en) * | 2016-04-15 | 2021-12-17 | Зе Трастис Оф Зе Юниверсити Оф Пенсильвания | Gene therapy for the treatment of hemophilia a |
| RU2020108209A (en) * | 2017-08-01 | 2021-09-02 | Спарк Терапьютикс, Инк. | METHODS OF GENOTHERAPY USING FACTOR VIII (FVIII) GENE |
| WO2020041773A1 (en) * | 2018-08-24 | 2020-02-27 | Spark Therapeutics, Inc. | Optimized promoter sequences, intron-free expression constructs and methods of use |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR20230057487A (en) | Methods and compositions for genomic manipulation | |
| AU2008205445A1 (en) | Method for producing gamma-carboxlated proteins | |
| CN114929735A (en) | Factor VIII constructs | |
| CN112575034B (en) | Product for treating hemophilia A and application thereof | |
| CN113025659B (en) | Gene editing system for treating hemophilia A and application thereof | |
| Tuteja et al. | Transcription efficiency of human apolipoprotein AI promoter varies with naturally occurring A to G transition | |
| KR20240004276A (en) | Adenosine deaminase variants and uses thereof | |
| AU614497B2 (en) | Factor viii-c analogs | |
| RS61305B1 (en) | Mutant factor viii compositions and methods | |
| CA2462966A1 (en) | Factor viii c2 domain variants | |
| RU2808564C2 (en) | Codon-optimized nucleic acid that encodes b-domain-deleted factor viii protein and its use | |
| RU2818229C2 (en) | Recovered nucleic acid which codes fviii-bdd-based fusion protein and heterologous signal peptide, and use thereof | |
| CN114032239B (en) | Tissue specific promoter and application thereof | |
| JP2025515356A (en) | Isolated nucleic acid encoding a fusion protein based on FVIII-BDD and a heterologous signal peptide | |
| JPH05213998A (en) | New polypeptide and medicinal composition containing the same as active ingredient | |
| EP4326753A2 (en) | Genome editing by directed non-homologous dna insertion using a retroviral integrase-cas fusion protein and methods of treatment | |
| US20250282847A1 (en) | Codon-optimized nucleic acid encoding the fviii-bdd | |
| EA050470B1 (en) | A codon-optimized nucleic acid that encodes the factor VIII protein with a deleted B domain | |
| CA3117536A1 (en) | Modified factor ix polypeptides | |
| MXPA04011944A (en) | Control sequences of the human corin gene. | |
| WO2014041500A2 (en) | Double mutant coagulation factor viii and methods thereof | |
| CA3277009A1 (en) | Guide rnas that target trac gene and methods of use |