CN112739818A - 编码因子ix的核苷酸 - Google Patents
编码因子ix的核苷酸 Download PDFInfo
- Publication number
- CN112739818A CN112739818A CN201980062207.2A CN201980062207A CN112739818A CN 112739818 A CN112739818 A CN 112739818A CN 201980062207 A CN201980062207 A CN 201980062207A CN 112739818 A CN112739818 A CN 112739818A
- Authority
- CN
- China
- Prior art keywords
- factor
- codons encoding
- sequence
- codon
- polynucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102100022641 Coagulation factor IX Human genes 0.000 title claims abstract description 645
- 108010076282 Factor IX Proteins 0.000 title claims abstract description 595
- 229960004222 factor ix Drugs 0.000 title claims abstract description 552
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 403
- 239000002773 nucleotide Substances 0.000 title claims abstract description 401
- 239000002157 polynucleotide Substances 0.000 claims abstract description 335
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 335
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 335
- 230000003612 virological effect Effects 0.000 claims abstract description 202
- 239000002245 particle Substances 0.000 claims abstract description 199
- 108091026890 Coding region Proteins 0.000 claims abstract description 172
- 239000012634 fragment Substances 0.000 claims abstract description 130
- 239000000203 mixture Substances 0.000 claims abstract description 113
- 238000000034 method Methods 0.000 claims abstract description 38
- 108020004705 Codon Proteins 0.000 claims description 682
- 230000000694 effects Effects 0.000 claims description 158
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 113
- 229920001184 polypeptide Polymers 0.000 claims description 111
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 111
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 74
- 239000013598 vector Substances 0.000 claims description 71
- 150000001413 amino acids Chemical class 0.000 claims description 64
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 53
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 53
- 210000004027 cell Anatomy 0.000 claims description 53
- 235000001014 amino acid Nutrition 0.000 claims description 52
- 229940024606 amino acid Drugs 0.000 claims description 50
- 230000001105 regulatory effect Effects 0.000 claims description 43
- 238000013518 transcription Methods 0.000 claims description 43
- 230000035897 transcription Effects 0.000 claims description 43
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 40
- 235000004279 alanine Nutrition 0.000 claims description 40
- 208000009429 hemophilia B Diseases 0.000 claims description 38
- 239000004475 Arginine Substances 0.000 claims description 37
- 239000004471 Glycine Substances 0.000 claims description 37
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 37
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 36
- 239000004473 Threonine Substances 0.000 claims description 36
- 229960000310 isoleucine Drugs 0.000 claims description 36
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 35
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 34
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 34
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 34
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 34
- 238000011282 treatment Methods 0.000 claims description 34
- 239000004474 valine Substances 0.000 claims description 34
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 32
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 32
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 32
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 32
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 32
- 235000009582 asparagine Nutrition 0.000 claims description 32
- 229960001230 asparagine Drugs 0.000 claims description 32
- 235000003704 aspartic acid Nutrition 0.000 claims description 32
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 32
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 32
- 235000018417 cysteine Nutrition 0.000 claims description 32
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 32
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 32
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 30
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 claims description 30
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 30
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 29
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 29
- 239000004472 Lysine Substances 0.000 claims description 29
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 29
- 238000010361 transduction Methods 0.000 claims description 29
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 claims description 28
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 claims description 28
- 230000026683 transduction Effects 0.000 claims description 28
- 239000003623 enhancer Substances 0.000 claims description 24
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 23
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 23
- 210000004185 liver Anatomy 0.000 claims description 23
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 22
- 108700019146 Transgenes Proteins 0.000 claims description 22
- 238000003556 assay Methods 0.000 claims description 19
- 229930195712 glutamate Natural products 0.000 claims description 17
- 210000003494 hepatocyte Anatomy 0.000 claims description 17
- 239000008280 blood Substances 0.000 claims description 16
- 210000004369 blood Anatomy 0.000 claims description 16
- 108010023321 Factor VII Proteins 0.000 claims description 15
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 12
- 229920002683 Glycosaminoglycan Polymers 0.000 claims description 12
- 235000013922 glutamic acid Nutrition 0.000 claims description 12
- 239000004220 glutamic acid Substances 0.000 claims description 12
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 11
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 claims description 11
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 claims description 11
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 claims description 11
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 claims description 11
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 claims description 11
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 claims description 11
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims description 11
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 11
- 208000031220 Hemophilia Diseases 0.000 claims description 10
- 208000009292 Hemophilia A Diseases 0.000 claims description 10
- 238000007820 coagulation assay Methods 0.000 claims description 10
- 150000003431 steroids Chemical class 0.000 claims description 10
- 206010053567 Coagulopathies Diseases 0.000 claims description 9
- 108700039691 Genetic Promoter Regions Proteins 0.000 claims description 9
- 239000013603 viral vector Substances 0.000 claims description 8
- 230000035602 clotting Effects 0.000 claims description 7
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 6
- 210000004962 mammalian cell Anatomy 0.000 claims description 5
- 229960005205 prednisolone Drugs 0.000 claims description 5
- OIGNJSKKLXVSLS-VWUMJDOOSA-N prednisolone Chemical compound O=C1C=C[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 OIGNJSKKLXVSLS-VWUMJDOOSA-N 0.000 claims description 5
- 230000002829 reductive effect Effects 0.000 claims description 5
- 241000702421 Dependoparvovirus Species 0.000 claims description 4
- 241000238631 Hexapoda Species 0.000 claims description 4
- 230000010076 replication Effects 0.000 claims description 4
- 238000011260 co-administration Methods 0.000 claims description 3
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 claims description 3
- 241000701447 unidentified baculovirus Species 0.000 claims description 3
- 239000003112 inhibitor Substances 0.000 claims description 2
- 238000011529 RT qPCR Methods 0.000 claims 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 30
- 241000699670 Mus sp. Species 0.000 description 28
- 201000010099 disease Diseases 0.000 description 28
- 230000035772 mutation Effects 0.000 description 27
- 210000000234 capsid Anatomy 0.000 description 20
- 101100017570 Mycoplasma gallisepticum (strain R(low / passage 15 / clone 2)) hlp2 gene Proteins 0.000 description 19
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 17
- 238000002474 experimental method Methods 0.000 description 17
- 108091028043 Nucleic acid sequence Proteins 0.000 description 14
- CTMZLDSMFCVUNX-VMIOUTBZSA-N cytidylyl-(3'->5')-guanosine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=C(C(N=C(N)N3)=O)N=C2)O)[C@@H](CO)O1 CTMZLDSMFCVUNX-VMIOUTBZSA-N 0.000 description 14
- 108090000623 proteins and genes Proteins 0.000 description 14
- 102100033391 ATP-dependent RNA helicase DDX3X Human genes 0.000 description 13
- 101000870662 Homo sapiens ATP-dependent RNA helicase DDX3X Proteins 0.000 description 13
- 101000838883 Homo sapiens Hippocalcin-like protein 1 Proteins 0.000 description 13
- 102000004169 proteins and genes Human genes 0.000 description 13
- 238000001415 gene therapy Methods 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 11
- 235000018102 proteins Nutrition 0.000 description 11
- 238000003753 real-time PCR Methods 0.000 description 11
- 150000007523 nucleic acids Chemical class 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 9
- 230000002209 hydrophobic effect Effects 0.000 description 9
- 208000015181 infectious disease Diseases 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 108010074860 Factor Xa Proteins 0.000 description 8
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 description 8
- 108010076504 Protein Sorting Signals Proteins 0.000 description 8
- 208000036142 Viral infection Diseases 0.000 description 8
- 239000000427 antigen Substances 0.000 description 8
- 108091007433 antigens Proteins 0.000 description 8
- 102000036639 antigens Human genes 0.000 description 8
- 239000006228 supernatant Substances 0.000 description 8
- 230000009385 viral infection Effects 0.000 description 8
- 239000013607 AAV vector Substances 0.000 description 7
- 102100022712 Alpha-1-antitrypsin Human genes 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 7
- 108091092195 Intron Proteins 0.000 description 6
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 6
- 230000015271 coagulation Effects 0.000 description 6
- 238000005345 coagulation Methods 0.000 description 6
- 239000013644 scAAV2 vector Substances 0.000 description 6
- 108010048049 Factor IXa Proteins 0.000 description 5
- 241000125945 Protoparvovirus Species 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 239000003593 chromogenic compound Substances 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 150000003904 phospholipids Chemical class 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 description 4
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 description 4
- 238000011740 C57BL/6 mouse Methods 0.000 description 4
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 4
- 238000002965 ELISA Methods 0.000 description 4
- 238000008157 ELISA kit Methods 0.000 description 4
- 108010080805 Factor XIa Proteins 0.000 description 4
- NWIBSHFKIJFRCO-WUDYKRTCSA-N Mytomycin Chemical compound C1N2C(C(C(C)=C(N)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 NWIBSHFKIJFRCO-WUDYKRTCSA-N 0.000 description 4
- 108090000190 Thrombin Proteins 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 229940067631 phospholipid Drugs 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 229960004072 thrombin Drugs 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- 108010062466 Enzyme Precursors Proteins 0.000 description 3
- 102000010911 Enzyme Precursors Human genes 0.000 description 3
- 108010014173 Factor X Proteins 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- 101100506223 Homo sapiens HAP1 gene Proteins 0.000 description 3
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 3
- 102100039384 Huntingtin-associated protein 1 Human genes 0.000 description 3
- 101100017567 Mycoplasma gallisepticum (strain R(low / passage 15 / clone 2)) hlp1 gene Proteins 0.000 description 3
- 238000000692 Student's t-test Methods 0.000 description 3
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- 229910052791 calcium Inorganic materials 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000000432 density-gradient centrifugation Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- NBQNWMBBSKPBAY-UHFFFAOYSA-N iodixanol Chemical compound IC=1C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C(I)C=1N(C(=O)C)CC(O)CN(C(C)=O)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NBQNWMBBSKPBAY-UHFFFAOYSA-N 0.000 description 3
- 229960004359 iodixanol Drugs 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000000069 prophylactic effect Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 102100033416 60S acidic ribosomal protein P1 Human genes 0.000 description 2
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 2
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 2
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 238000012286 ELISA Assay Methods 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 208000032843 Hemorrhage Diseases 0.000 description 2
- 101000712357 Homo sapiens 60S acidic ribosomal protein P1 Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000740 bleeding effect Effects 0.000 description 2
- 230000023555 blood coagulation Effects 0.000 description 2
- 230000037396 body weight Effects 0.000 description 2
- 238000012754 cardiac puncture Methods 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 238000010253 intravenous injection Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229960004857 mitomycin Drugs 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000001543 one-way ANOVA Methods 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 2
- 230000002463 transducing effect Effects 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- PGOHTUIFYSHAQG-LJSDBVFPSA-N (2S)-6-amino-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-4-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S,3R)-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S,3R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-1-[(2S,3R)-2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-1-[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylsulfanylbutanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-5-carbamimidamidopentanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]acetyl]amino]-3-hydroxypropanoyl]amino]-4-methylpentanoyl]amino]-3-sulfanylpropanoyl]amino]-4-methylsulfanylbutanoyl]amino]-5-carbamimidamidopentanoyl]amino]-3-hydroxybutanoyl]pyrrolidine-2-carbonyl]amino]-5-oxopentanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-(1H-imidazol-5-yl)propanoyl]amino]-4-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-5-carbamimidamidopentanoyl]amino]-5-oxopentanoyl]amino]-3-hydroxybutanoyl]amino]-3-hydroxypropanoyl]amino]-3-carboxypropanoyl]amino]-3-hydroxypropanoyl]amino]-5-oxopentanoyl]amino]-5-oxopentanoyl]amino]-3-phenylpropanoyl]amino]-5-carbamimidamidopentanoyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoyl]amino]-4-oxobutanoyl]amino]-5-carbamimidamidopentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-4-carboxybutanoyl]amino]-5-oxopentanoyl]amino]hexanoic acid Chemical compound CSCC[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O PGOHTUIFYSHAQG-LJSDBVFPSA-N 0.000 description 1
- UAIUNKRWKOVEES-UHFFFAOYSA-N 3,3',5,5'-tetramethylbenzidine Chemical compound CC1=C(N)C(C)=CC(C=2C=C(C)C(N)=C(C)C=2)=C1 UAIUNKRWKOVEES-UHFFFAOYSA-N 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 101710095339 Apolipoprotein E Proteins 0.000 description 1
- 102100029470 Apolipoprotein E Human genes 0.000 description 1
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 1
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 1
- -1 CTX Chemical compound 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010061932 Factor VIIIa Proteins 0.000 description 1
- 101000771674 Homo sapiens Apolipoprotein E Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- FQISKWAFAHGMGT-SGJOWKDISA-M Methylprednisolone sodium succinate Chemical compound [Na+].C([C@@]12C)=CC(=O)C=C1[C@@H](C)C[C@@H]1[C@@H]2[C@@H](O)C[C@]2(C)[C@@](O)(C(=O)COC(=O)CCC([O-])=O)CC[C@H]21 FQISKWAFAHGMGT-SGJOWKDISA-M 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- 102000002262 Thromboplastin Human genes 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 206010053476 Traumatic haemorrhage Diseases 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000001668 ameliorated effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 150000001483 arginine derivatives Chemical class 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229960002537 betamethasone Drugs 0.000 description 1
- UREBDLICKHMUKA-DVTGEIKXSA-N betamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-DVTGEIKXSA-N 0.000 description 1
- 208000015294 blood coagulation disease Diseases 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229960005069 calcium Drugs 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 229960003957 dexamethasone Drugs 0.000 description 1
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 208000031169 hemorrhagic disease Diseases 0.000 description 1
- 230000023597 hemostasis Effects 0.000 description 1
- 102000053020 human ApoE Human genes 0.000 description 1
- 102000051631 human SERPINA1 Human genes 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 229960004584 methylprednisolone Drugs 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 229960004618 prednisone Drugs 0.000 description 1
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical class CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 229960005294 triamcinolone Drugs 0.000 description 1
- GFNANZIMVAIWHM-OBYCQNJPSA-N triamcinolone Chemical compound O=C1C=C[C@]2(C)[C@@]3(F)[C@@H](O)C[C@](C)([C@@]([C@H](O)C4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 GFNANZIMVAIWHM-OBYCQNJPSA-N 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 230000001810 trypsinlike Effects 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/64—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
- C12N9/6421—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
- C12N9/6424—Serine endopeptidases (3.4.21)
- C12N9/644—Coagulation factor IXa (3.4.21.22)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/48—Hydrolases (3) acting on peptide bonds (3.4)
- A61K38/482—Serine endopeptidases (3.4.21)
- A61K38/4846—Factor VII (3.4.21.21); Factor IX (3.4.21.22); Factor Xa (3.4.21.6); Factor XI (3.4.21.27); Factor XII (3.4.21.38)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/04—Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/21—Serine endopeptidases (3.4.21)
- C12Y304/21022—Coagulation factor IXa (3.4.21.22)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/007—Vector systems having a special element relevant for transcription cell cycle specific enhancer/promoter combination
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Microbiology (AREA)
- Epidemiology (AREA)
- Hematology (AREA)
- Diabetes (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
本发明涉及包含因子IX核苷酸序列的多核苷酸,其中因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列,并且其中编码序列的一部分不是野生型的。本发明还涉及包含含有本发明的多核苷酸的重组基因组的病毒颗粒,包含所述多核苷酸或病毒颗粒的组合物,以及所述多核苷酸、病毒颗粒或组合物的方法和用途。
Description
发明领域
本发明涉及包含编码因子IX的核苷酸序列的多核苷酸,包含该多核苷酸的病毒颗粒以及利用该多核苷酸的治疗。
发明背景
B型血友病(一种X连锁的威胁生命的出血性疾病)影响1:30,000的男性。目前的治疗涉及频繁静脉注射(每周2-3次)因子IX(FIX)蛋白。这种治疗在止血方面非常有效,但其不是治愈性的,而且非常昂贵(每位患者每年150,000英镑),因此使得其是世界上大多数B型血友病患者所无法承受的。B型血友病的基因疗法通过在将因子IX基因的功能拷贝转移到患病患者后因子IX的持续的内源性产生而提供了治愈的潜力。
本申请涉及用于治疗B型血友病的基因治疗方法,其涉及施用包含编码因子IX的多核苷酸的载体。这样的基因治疗方法可避免频繁静脉注射因子IX的需要。但是,提供有效的基因治疗载体(即允许高水平的因子IX表达和高活性的因子IX的表达的载体)是困难的。
发明概述
本申请证明了对包含因子IX核苷酸序列的多核苷酸的各种修饰能够帮助改善表达的因子IX多肽的表达水平和活性。例如,本申请证明了以下能够改善包含因子IX核苷酸序列的多核苷酸治疗B型血友病的功效:
·使用经密码子优化的序列;
·保留因子IX多肽的未经密码子优化的一部分;
·包括内含子或内含子片段;
·`提供在内含子或内含子片段侧翼的未经密码子优化的序列;
·使用功能获得突变;
·使用特定的启动子;和/或
·保持单链形式的包含所述核苷酸的AAV基因组。
这些修饰提供了这样的因子IX序列,其是高表达的并且其编码高活性的因子IX多肽或其片段。如实施例所证明的,本发明的多核苷酸以比其他编码因子IX的多核苷酸(例如WO16/075473中公开的那些)更高水平的表达和提供总体因子IX活性。
因此,在本发明的第一方面,提供了包含因子IX核苷酸序列的多核苷酸,其中因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列,并且其中编码序列的一部分不是野生型的。
在本发明的第二方面,提供了包含因子IX核苷酸序列的多核苷酸,其中所述因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列,并且所述编码序列包含:(i)与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;(ii)与SEQ ID NO:15至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
在本发明的第三方面,提供了包含因子IX核苷酸序列的多核苷酸,其中所述因子IX核苷酸序列编码因子IX蛋白或其片段,并与SEQ ID NO:5具有至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%的同一性。
在本发明的第四方面,提供了包含重组基因组的病毒颗粒,所述重组基因组包含本发明的多核苷酸。
在本发明的第五方面,提供了包含本发明的多核苷酸或病毒颗粒和药学上可接受的赋形剂的组合物。
在本发明的第六方面,提供了一种治疗方法,其包括向患者施用有效量的本发明的多核苷酸或病毒颗粒。
在本发明的第七方面,提供了本发明的多核苷酸、病毒颗粒或组合物在制备用于治疗方法的药物中的用途。
在第八方面,本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽,从而治疗疾病。
在第九方面,本发明的多核苷酸、病毒颗粒或组合物通过以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病。
在第十方面,提供了一种以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ IDNO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的方法,包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。
在第十一方面,提供了一种通过以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的方法,包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。
在第十二方面,提供了本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的用途,从而治疗疾病。
在第十三方面,提供了本发明的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的用途。
在第十四方面,本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽,从而治疗疾病。
在第十五方面,本发明的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQ IDNO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病。
在第十六方面,提供了一种以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ IDNO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的方法,包括将本发明的多核苷酸、病毒颗粒或组合物施用至患者。
在第十七方面,提供了一种通过以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的方法,包括将本发明的多核苷酸、病毒颗粒或组合物施用至患者。
在第十八方面,提供了本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的用途,从而治疗疾病。
在第十九方面,提供了本发明的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的用途。
在第二十方面,本发明的多核苷酸、病毒颗粒或组合物用于通过表达具有比由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的病毒颗粒和/或包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病。
在第二十一方面,提供了一种通过表达具有比由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的病毒颗粒和/或包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病的方法,包括向患者施用有效量的本发明的多核苷酸、病毒颗粒或组合物。
在第二十二方面,提供了本发明的多核苷酸、病毒颗粒或组合物用于通过表达具有比由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的病毒颗粒和/或包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病的用途。
在第二十三方面,本发明的多核苷酸、病毒颗粒或组合物用于在患有B型血友病的患者中获得至少20%的稳定的因子IX活性水平。
在第二十四方面,提供了一种在患有B型血友病的患者中实现至少20%的稳定的因子IX活性水平的方法,包括将有效量的本发明的多核苷酸、病毒颗粒或组合物施用至患者。
在第二十五方面,提供了本发明的多核苷酸、病毒颗粒或组合物用于在患有B型血友病的患者中获得至少20%的稳定的因子IX活性水平的用途。
在第二十六方面,提供了用于治疗B型血友病的本发明的多核苷酸、病毒颗粒或组合物,包括以在患者中有效实现至少20%的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。
在第二十七方面,提供了一种治疗B型血友病的方法,包括以在患者中有效实现至少20%的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。
在第二十八方面,提供了本发明的多核苷酸、病毒颗粒或组合物在治疗B型血友病中的用途,包括以在患者中有效实现至少20%的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。
附图说明
图1—FIX转基因盒ssLP1.FIXco、ssHLP2.TI-codop-FIX-GoF(HTFG)和ssHLP2.TI-ACNP-FIX-GoF(HTAG)的示意图。ITR=反向末端重复序列;HLP2和LP1分别是SEQ ID NO:6和7的转录调节元件;E=外显子;T1=截短的内含子1A;WT=野生型;CO=密码子优化的;ACNP=本发明的经密码子优化的序列。
图2—用AAV2/Mut C载体进行HUH7转导的结果-实验1;(A)显示上清液中FIX抗原的水平;(B)显示使用细胞裂解物中存在的载体基因组数目标准化后的FIX抗原水平;误差棒代表n=2的平均值±SD。1e3=1×103;5e3=5×103;1e4=1×104;MOI=感染复数。
图3—用AAV2/Mut C载体进行HUH7转导的结果-实验2,显示上清液中FIX抗原的水平。误差棒代表n=3的平均值±SD。1e3=1×103;5e3=5×103;1e4=1×104,MOI=感染复数。
图4—用AAV2/Mut C载体进行HUH7转导的结果-实验2;A)显示上清液中FIX抗原的水平;(B)显示使用细胞裂解物中存在的载体基因组数目标准化后的FIX抗原水平。误差棒代表n=3的平均值±SD。1e3=1×103;5e3=5×103;1e4=1×104;MOI=感染复数。
图5—MOI 5×103的HUA7细胞AAV2/Mut C转导的组合数据(来自实验1和2)。误差棒代表n=12的平均值±SD。通过学生T检验,P=0.001。5e3=5×103;MOI=感染复数。
图6—在用AAV2/Mut C载体进行HUH7转导后,显示了MOI 1×103、5×103和1×104的FIX的活性(实验1)。误差棒代表n=2个重复孔的平均值±SD。1e3=1×103;5e3=5×103;1e4=1×104;MOI=感染复数。
图7—在用AAV2/Mut C载体进行HUH7转导后,显示了FIX的活性(实验2)。误差棒代表n=3的平均值±SD。1e3=1×103;5e3=5×103;1e4=1×104;MOI=感染复数。
图8—在使用AAV2/Mut C载体进行HUH7转导后,显示了FIX的活性(实验3)。误差棒代表n=3的平均值±SD。1e3=1×103;5e3=5×103;1e4=1×104;MOI=感染复数。
图9—在使用AAV2/Mut C载体进行HUH7转导后显示的显示MOI 5×103的FIX的活性的组合数据(来自实验1和2;图6和7)。误差棒代表n=12的平均值±SD。5e3=5×103;MOI=感染复数。使用学生T检验确定统计显著性(p=0.0195)。
图10—施用AAV2/8.LP1.FIXco和AAV2/8.HLP2.HTFG后,鼠血浆中人FIX的标准化水平(实验3)。将FIX:Ag水平标准化至载体拷贝数/细胞。误差棒代表n=4只小鼠的平均值±SD。P值<0.05(学生T检验)
图11—C57BL/6小鼠中FIX的替代密码子优化的比较(实验4)。给小鼠注射含有ssHLP2.HTFG、ssHLP2.HTAG或scLP1.FIXco的AAV2/8载体(对照)。注射后3周评估FIX抗原(A)的水平(ssHLP2.HTAG和sc.LP1.FIXco之间的P=0.0007,ssHLP2.HTAG和ssHLP2.HTFG之间的p=0.0198)。将抗原水平标准化至载体基因组(B)(ssHLP2.HTAG和sc.LP1.FIXco之间的p=0.0009,ssHLP2.HTAG和ssHLP2.HTFG之间的p=0.0039)。n=4只小鼠。使用单向ANOVA(多重比较)确定P值。
图12—C57BL/6小鼠中FIX的替代密码子优化的比较(实验4)。给小鼠注射含有ssHLP2.HTFG、ssHLP2.HTAG或scLP1.FIXco的AAV2/8载体(对照)。注射后3周评估FIX活性水平。n=4只小鼠。ssHLP2.HTAG和scLP1.FIXco之间的P=0.0008,ssHLP2.HTAG和ssHLP2.HTFG之间的p=0.01。使用单向ANOVA(多重比较)确定p值。
图13—因子IX结构的示意图。示意图上方的数字代表完整的因子IX多肽中的氨基酸位置,包括信号肽和前肽区(由SEQ ID NO:9编码)。示意图下方的代表成熟因子IX中的等同氨基酸位置(对应于SEQ ID NO:19中的编码序列的部分)。
图14—序列表。
图15—两名接受包含ssHLP2.HTAG的AAV2/Mut C载体的B型血友病患者中的平均因子IX活性。两名血友病患者施用4.5×1011vg/kg的包含ssHLP2.HTAG的AAV2/Mut C载体。在施用后0-55周期间定期评估因子IX活性水平。如通过使用SynthASilTM试剂盒的一阶段凝血测定法评估的,患者在52周时实现了40.5+/-4.5%的稳定的平均因子IX活性水平。在载体施用(输注)后第6-12周还向患者施用预防性泼尼松龙。“FIX:C(%)”描述了FIX活动水平;参见左y轴。“ALT(IU/L)”描述了丙氨酸转氨酶水平;参见右y轴。
详细描述
一般定义
除非另有定义,否则本文使用的技术和科学术语具有与本发明所属领域的技术人员通常理解的含义相同的含义。
通常,术语“包含”旨在意指包含但不限于。例如,短语“包含因子IX核苷酸序列的多核苷酸”应被解释为意指该多核苷酸具有因子IX核苷酸序列,但是该多核苷酸可以包含另外的核苷酸。
在本发明的一些实施方案中,单词“包含”被替换为短语“由……组成”。术语“由……组成”旨在是限制性的。例如,短语“由因子IX核苷酸序列组成的多核苷酸”应被理解为意指该多核苷酸具有因子IX核苷酸序列而没有另外的核苷酸。
术语“蛋白质”和“多肽”在本文可互换使用,并且是指任何长度的氨基酸的聚合物链。
为了本发明的目的,为了确定两个序列(例如两个多核苷酸或两个多肽序列)的同一性百分比,将这些序列进行比对以用于最佳比较目的(例如,可以在第一序列中引入缺口以用于与第二序列的最佳比对)。然后比较核苷酸位置上的核苷酸残基。当第一序列中的位置被与第二序列中相应位置相同的核苷酸残基占据时,则核苷酸在该位置是相同的。两个序列之间的同一性百分比是所述序列共有的相同位置的数量的函数(即,同一性%=相同位置的数量/参考序列中的总位置数量×100)。
通常,序列比较是在参考序列的长度上进行的。例如,如果用户希望确定给定(“测试”)序列是否与SEQ ID NO:5是95%相同的,则SEQ ID NO:5是参考序列。例如,为了评估序列是否与SEQ ID NO:5(参考序列的实例)至少80%相同,本领域技术人员将在SEQ ID NO:5的长度上进行比对,并鉴定测试序列中有多少位置与SEQ ID NO:5的位置相同。如果至少80%的位置相同,则测试序列与SEQ ID NO:5至少80%相同。如果序列比SEQ ID NO:5短,则缺口或缺失位置应视为不相同的位置。
本领域技术人员知道可用于确定两个序列之间的同源性或同一性的不同计算机程序。例如,可以使用数学算法来完成序列的比较和两个序列之间的同一性百分比的确定。在一个实施方案中,使用Needleman和Wunsch(1970)算法确定两个氨基酸或核酸序列之间的同一性百分比,该算法已被并入Accelrys GCG软件包的GAP程序中(可在http://www.accelrys.com/products/gcg/获得),使用Blosum 62矩阵或PAM250矩阵,以及16、14、12、10、8、6或4的缺口权重和1、2、3、4、5或6的长度权重。
为了本发明的目的,术语“片段”是指序列的连续部分。例如,50个核苷酸的SEQ IDNO:5的片段是指SEQ ID NO:5的50个连续核苷酸。
多核苷酸
一方面,本发明提供了包含因子IX核苷酸序列的多核苷酸,其中因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列,并且其中因子IX核苷酸序列的一部分不是野生型的。
多核苷酸可还包含一种或多种以下特征。多核苷酸可以包含未经密码子优化的部分。多核苷酸可以包含内含子或内含子片段。多核苷酸可在对应于野生型因子IX的密码子384的密码子中包含突变。
术语“多核苷酸”是指任意长度的核苷酸、脱氧核糖核苷酸、核糖核苷酸或其类似物的聚合形式。例如,多核苷酸可以包含DNA(脱氧核糖核苷酸)或RNA(核糖核苷酸)。多核苷酸可以由DNA组成。多核苷酸可以是mRNA。由于多核苷酸可以包含RNA或DNA,因此所有对T(胸腺嘧啶)核苷酸的引用都可以用U(尿嘧啶)取代。
因子IX核苷酸序列
多核苷酸包含因子IX核苷酸序列。因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列。
“编码序列”是编码多核苷酸并且排除非编码区如内含子的序列。编码序列可以被非编码核苷酸(例如内含子)中断,但是只有编码多肽的核苷酸应被认为是编码序列的一部分。例如,编码因子IX蛋白的编码序列将包含编码形成由该编码序列表达的因子IX蛋白的一部分的氨基酸的任何密码子,而与那些密码子在序列上是连续的还是被一个或多个非编码核苷酸分隔开无关。换句话说,包含被非编码核苷酸区段中断的编码核苷酸区段的多核苷酸将被视为包含由紧接并列的非连续编码区段组成(即减去非编码区段)的“编码序列”。然而,在本文中,终止密码子将被认为是全长编码序列的一部分。
术语“编码……的序列”是指包含编码所编码的多肽的密码子的核苷酸序列。例如,编码因子IX蛋白或其片段的核苷酸序列包含编码因子IX蛋白或其片段的氨基酸序列的密码子。SEQ ID NO:5中提供了合适的核苷酸序列。
下表描述了编码每个氨基酸的密码子:
相应的RNA密码子将包含U来取代上表中的T。
本发明的一方面提供了包含因子IX核苷酸序列的多核苷酸,其中因子IX核苷酸序列编码因子IX蛋白或其片段,并且与SEQ ID NO:5具有至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%的同一性。任选地,因子IX核苷酸序列包含编码序列,并且该编码序列的一部分是经密码子优化的。
通常,因子IX核苷酸序列可以与SEQ ID NO:5的至少1200、至少1350或至少1650个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。因子IX核苷酸序列可以与SEQ ID NO:5的至少1200、至少1350或至少1650个核苷酸的连续片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。因子IX核苷酸序列可以与SEQ ID NO:5至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。例如,因子IX核苷酸序列可以与SEQ ID NO:5至少98%相同。
因子IX蛋白或其片段
多核苷酸包含因子IX核苷酸序列,所述因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列。
野生型因子IX是一种丝氨酸蛋白酶,其形成凝血级联的一部分。缺乏或突变的因子IX可导致减少的血液凝结和B型血友病疾病。典型的野生型因子IX多肽由SEQ ID NO:9(有时称为因子IXB)或SEQ ID NO:19编码。替代的野生型因子IX多肽在密码子194处不同于由SEQ ID NO:9编码的多肽,例如密码子194可以编码苏氨酸(“Malmo A”)而不是丙氨酸。
最初表达为前体“未成熟”形式的因子IX(例如SEQ ID NO:16的因子IX)包含疏水性信号肽(SEQ ID NO:16的氨基酸1-28)、前肽区(SEQ ID NO:16的氨基酸29-46)和成熟的多肽区域,如图13所示。因子IX的成熟(酶原)形式缺少疏水性信号肽和前肽区。术语“成熟因子IX”是指不包含疏水性信号肽或前肽区的因子IX多肽,例如SEQ ID NO:8。
在凝结过程中,单链酶原形式被因子XIa或因子VI Ia裂解,以产生活性的双链形式(因子IXa),其中两条链通过二硫桥相连。活化的形式可以催化因子X中的精氨酸-异亮氨酸键的水解以形成因子Xa。野生型因子IX被凝血酶抑制。野生型因子IX蛋白具有四个蛋白结构域,即Gla结构域、EGF结构域的两个串联拷贝以及负责催化裂解的C端胰蛋白酶样肽酶结构域。
术语“因子IX蛋白”是指因子IX的单链酶原形式、活化的双链形式及其变体,并且可以指成熟的因子IX多肽或包含前肽区和/或信号肽区域的因子IX多肽。
优选地,因子IX片段的长度为至少200、至少250、至少300、200至461、250至461或300至461个氨基酸。在一个实施方案中,因子IX蛋白或其片段包含:
a)与SEQ ID NO:8至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;或者
b)与SEQ ID NO:8的至少200、至少250、至少300、200至415、250至415或300至415个氨基酸的片段至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
在一个实施方案中,因子IX蛋白或其片段与SEQ ID NO:16至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同;或与SEQ ID NO:16的长度为至少200、至少250、至少300、200至461、250至461或300至461个氨基酸的片段至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,因子IX蛋白或其片段与SEQ ID NO:16至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同;或与SEQ ID NO:16的长度为至少300或300至461个氨基酸的片段至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。因子IX蛋白或其片段可以具有SEQ ID NO:16或SEQ ID NO:8的序列。
优选地,因子IX蛋白或其片段是功能性的。功能性因子IX蛋白或片段是对因子X中的精氨酸-异亮氨酸键进行水解以形成因子Xa的蛋白或片段。
确定由因子IX核苷酸序列编码的因子IX蛋白或片段是否是功能性的在本领域技术人员的能力范围内。本领域技术人员仅需要表达因子IX核苷酸序列,并测试表达的蛋白质是否有活性。例如,本领域技术人员可以制备包含与可操作的启动子连接的因子IX核苷酸序列的本发明的病毒颗粒,并在适合于表达因子IX蛋白或其片段的条件下用病毒颗粒转导细胞。可以使用生色测定法(例如实施例3中描述的活性测定法)分析表达的因子IX蛋白或其片段的活性。
例如,合适的生色测定法如下所述。因子IX与凝血酶、磷脂、钙、凝血酶活化的因子VIII和因子XIa混合。在这些条件下,因子XIa激活因子IX以形成因子IXa,并且因子IXa的活性可以催化生色底物(SXa-11)的裂解,以产生pNA。可以通过确定在405nm处的吸光度来测量生成的pNA的水平,并且这与样品中因子IX的活性成比例。
通过使用标准ELISA测定法(例如实施例4中所述的测定法)测量样品中的因子IX的浓度,然后将活性除以因子IX浓度,可以将活性标准化以补偿样品中不同浓度的因子IX。例如,与因子IX结合的抗体可以与平板结合。可以将包含未知浓度的因子IX的样品通过平板。可以将与因子IX结合的第二种检测抗体施加至平板,并洗掉任何多余的物质。保留(即未洗掉的)的检测抗体将与因子IX结合。检测抗体可以与酶例如辣根过氧化物酶连接。可以通过测量检测抗体的量来测量与平板上的因子IX结合的检测抗体的水平。例如,如果检测抗体与辣根过氧化物酶连接,则辣根过氧化物酶可以催化从底物(例如TMB(3,3',5,5'-四甲基联苯胺))生成蓝色反应产物,并可以通过在450nm处的吸光度检测蓝色产物的水平。蓝色产物的水平与洗涤步骤后保留的检测抗体的量(其与样品中因子IX的量成比例)成比例。
任选地,因子IX蛋白或其片段的活性高于由SEQ ID NO:9、SEQ ID NO:19或SEQ IDNO:12编码的因子IX多肽的活性。任选地,使用对因子IX具有特异性的生色底物(即可以被因子IXa改变以提供生色信号的底物)来测量活性。合适的生色底物是SXa-11。
在一个实施方案中,因子IX蛋白或其片段在对应于野生型因子IX的位置384的位置处包含突变。例如,野生型因子IX的位置384(从信号肽的起始处(即对应于SEQ ID NO:16的氨基酸384的位置)开始编号)是精氨酸残基(R384),但是这可以被不同的残基取代。在一个实施方案中,R384被小的疏水氨基酸取代。例如,小的疏水氨基酸可以是丙氨酸、异亮氨酸、亮氨酸、缬氨酸或甘氨酸。优选地,因子IX蛋白或其片段在对应于野生型因子IX的位置384的位置处包含亮氨酸,如SEQ ID NO:16所示。
与野生型序列的位置384相对应的位置处的突变可能导致功能获得(GoF)突变,导致功能亢进的因子IX。表达在位置384处包含突变的因子IX蛋白的优点是蛋白质量的相对较小增加导致整体蛋白质活性的较大增加。
确定给定的多肽是否在对应于位置384的位置处具有突变在本领域技术人员的能力范围内。本领域技术人员仅需要将多肽序列的序列与野生型(前体,未成熟)因子IX多肽的序列进行比对,并确定与后者的第384个残基对齐的前者的残基是否为精氨酸。如果不是,则该多肽在对应于野生型因子IX的位置384的位置处具有突变。可以使用诸如上述的Needleman和Wunsch算法的任何合适的算法来执行比对。
编码序列的一部分不是野生型的
编码序列的一部分可以不是野生型的。编码野生型因子IX的核苷酸序列由SEQ IDNO:9表示,并且包含与SEQ ID NO:9不同的部分的编码序列包含非野生型的部分(条件是这样的部分也与也被认为是野生型的其他因子IX编码序列(例如前述的Malmo A变体)不同)。
在一个实施方案中,编码序列的非野生型的部分是经密码子优化的。为了鉴定编码序列是否包含经密码子优化的部分,可以将编码序列与SEQ ID NO:9进行比对。如果序列的任何部分与SEQ ID NO:9不相同,则用户然后应该确定它们是否经密码子优化,即,它们是否包含至少一个已经被偏好的密码子(即TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG之一)取代的密码子。如果非野生型的部分包含至少一个已经被偏好的密码子取代的密码子,则其是经密码子优化的。优选地,编码序列的连续部分是经密码子优化的。然而,在一些实施方案中,经密码子优化的编码序列的部分可以分离在编码序列的2、3、4或5个区域上。任选地,未经密码子优化的编码序列的部分分离在编码序列的少于3或少于2个区域上。可以通过用在特定器官或特定生物体中偏好(即反映密码子偏好)的其他密码子(所谓的偏好的密码子)取代密码子来对核苷酸序列进行密码子优化。这样的密码子优化改善了特定器官或特定生物体中核苷酸序列的表达。例如,如果核苷酸序列是针对人肝脏进行密码子优化的,则对该核苷酸序列进行修饰以增加人肝脏中所偏好的密码子的数量。本领域技术人员将理解,密码子优化序列可不需要改变每个密码子,因为在某些位置可能已经存在“偏好的密码子”。
这样的密码子优化可能受到其他因素的影响。例如,可以看出CpG的存在对表达有不利影响,因此,如果在某些位置使用偏好的密码子将CpG引入序列中,则用户可以决定不使用偏好的密码子;这仍然将被认为是经密码子优化的。在一个实施方案中,以C核苷酸结尾的偏好的密码子将不包括在经密码子优化的编码序列的部分中,其中序列中的下一个密码子以G开头。例如,密码子CTC编码亮氨酸。在序列中的下一个密码子以G开头,例如为密码子GTT时,则CTC不应当用于编码亮氨酸。
本申请公开了某些密码子对于在人肝脏中的表达是偏好的,并且降低编码序列的CpG含量同时保持这些偏好的密码子的高比例改善编码序列的表达。偏好的密码子是TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。
在一个实施方案中,经密码子优化的编码序列的部分是针对在肝脏(任选地,人肝脏)中的表达进行密码子优化的。针对在肝脏中的表达进行密码子优化的编码序列的部分可能包含较高比例的在肝脏中偏好的密码子,例如偏好的密码子TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。
在一个实施方案中,以下密码子在编码序列的非野生型或经密码子优化的部分中集体过度呈现:TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。“集体过度呈现”是指编码序列中经密码子优化的或非野生型的部分中偏好密码子的总数高于野生型因子IX核苷酸序列(例如SEQ ID NO:9或SEQ ID NO:19)的相应部分中偏好密码子的总数。
在一个优选的实施方案中,与野生型因子IX核苷酸序列(例如SEQ ID NO:9的序列)的相应部分相比,在经密码子优化的编码序列的部分中,以下密码子的频率更高:TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。任选地,以下密码子在经密码子优化的编码序列的部分中集体过度呈现,除非它们的存在导致CpG:TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。任选地,经密码子优化的编码序列的部分包含至少40%、至少45%、至少50%、至少55%、至少60%或至少65%、至少70%或至少73%的选自以下的密码子:TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。
在下表中将本发明的多核苷酸(HLP2.T1-ACNP-FIX-GoF)的经密码子优化的部分中的密码子使用与野生型因子IX核苷酸序列(SEQ ID NO:9)的相应区段中的密码子使用进行比较。
表1
在该区域中SEQ ID NO:9中的偏好的密码子的总数是120(序列的30%)。另一方面,HTAG的经密码子优化的部分中的偏好的密码子的总数为293(密码子的73%)。
确定多核苷酸的给定部分是否包含偏好的密码子是简单的。为了确定在核苷酸序列的一部分中使用的每个密码子的频率,本领域技术人员仅需要将该部分的序列输入到查看密码子使用并审查结果的一种容易获得的算法中。或者,用户可以简单地对它们进行计数。
下表列出了与SEQ ID NO:9的相应区域相比在HTAG的经密码子优化的部分中被取代的密码子。
表2
在一个实施方案中,在编码序列的经密码子优化的部分中:
a)与参考野生型因子IX序列相比,至少1、至少2、至少4或至少5个编码苯丙氨酸的密码子被TTC取代;
b)至少60%、至少65%或至少70%的编码苯丙氨酸的密码子是TTC;
c)至少60%、至少65%或至少70%的编码苯丙氨酸的密码子是TTC,其余是TTT;和/或
d)编码苯丙氨酸的密码子是TTC,除非下一个密码子以G开头。
例如,当提及至少1个密码子A被至少1个密码子B取代时,这是指与野生型序列(例如SEQ ID NO:9)相比,在至少1个位置处密码子A被密码子B取代。为了确定是否发生了这样的取代,只需要将测试序列与野生型因子IX序列进行比对,并查看哪些密码子是不同的。如果对应于野生型因子IX的密码子A的测试序列中的至少一个密码子是测试序列中的密码子B,则至少一个密码子A已被密码子B取代。例如,如果测试序列中的第一个密码子是TTT和野生型因子IX序列中的第一个密码子是TTC,该测试序列包含至少1个被TTT取代的密码子TTC。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少10、至少15或至少16个编码亮氨酸的密码子被CTG取代;
b)至少90%或至少94%的编码亮氨酸的密码子是CTG;和/或
c)至少90%或至少94%的编码亮氨酸的密码子是CTG,其余是CTC。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少10、至少11或至少12个编码异亮氨酸的密码子被ATC取代;
b)与参考野生型因子IX序列相比,至少一个ATC密码子被ATT取代,其中下一个密码子以G开头;
c)至少60%、至少70%或至少75%的编码异亮氨酸的密码子是ATC;
d)至少60%、至少70%或至少75%的编码异亮氨酸的密码子是ATC,其余是ATT;和/或
e)编码异亮氨酸的密码子是ATC,除非下一个密码子以G开头。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少10、至少15、至少20或至少25个编码缬氨酸的密码子被GTG取代;
b)与参考野生型因子IX序列相比,至少1个编码缬氨酸的密码子被GTC取代;
c)至少80%、至少90%或至少95%的编码缬氨酸的密码子是GTG;和/或
d)至少80%、至少90%或至少95%的编码缬氨酸的密码子是GTG,其余是GTC。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少10、至少12或至少13个编码丝氨酸的密码子被AGC取代;
b)与参考野生型因子IX序列相比,至少1、至少2或至少4个编码丝氨酸的密码子被TCT取代,其中下一个密码子以G开头;
c)至少60%、至少65%或至少70%的编码丝氨酸的密码子是AGC;和/或
d)至少60%、至少65%或至少70%的编码丝氨酸的密码子是AGC,其余是TCT或TCC。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1、至少2或至少5个编码脯氨酸的密码子被CCC取代;
b)与参考野生型因子IX序列相比,至少1个编码脯氨酸的密码子被CCT取代,其中下一个密码子以G开头;
c)至少50%、至少55%或至少60%的编码脯氨酸的密码子是CCC;
d)50%、至少55%或至少60%的编码脯氨酸的密码子为CCC,其余是CCA或CCT;和/或
e)编码脯氨酸的密码子是CCC,除非下一个密码子以G开头。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少6、至少7、至少8或至少10个编码苏氨酸的密码子被ACC取代;
b)与参考野生型因子IX序列相比,至少1或至少2个编码苏氨酸的密码子被ACT取代,其中下一个密码子以G开头;
c)至少45%、至少50%或至少55%的编码苏氨酸的密码子是ACC;
d)至少45%、至少50%或至少55%的编码苏氨酸的密码子是ACC,其余是ACT;和/或
e)编码苏氨酸的密码子是ACC,除非下一个密码子以G开头。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1、至少2、至少3或至少4个编码丙氨酸的密码子被GCC取代;
b)与参考野生型因子IX序列相比,至少1、至少2或至少3个编码丙氨酸的密码子被GCT取代,其中下一个密码子以G开头;
c)至少35%、至少40%或至少43%的编码丙氨酸的密码子是GCC;
d)至少35%、至少40%或至少45%的编码丙氨酸的密码子是GCC,其余是GCT;和/或
e)编码丙氨酸的密码子是GCC,除非下一个密码子以G开头。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1或至少2个编码酪氨酸的密码子被TAC取代;
b)与参考野生型因子IX序列相比,至少1个TAC密码子被TAT取代,其中下一个密码子以G开头;
c)至少40%、至少45%或至少48%的编码酪氨酸的密码子是TAC;
d)至少40%、至少45%或至少48%的编码酪氨酸的密码子是TAC,其余是TAT;和/或
e)编码酪氨酸的密码子是TAC,除非下一个密码子以G开头。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1个编码组氨酸的密码子被CAC取代;
b)至少50%、至少60%或至少65%的编码组氨酸的密码子是CAC;
c)至少50%、至少60%或至少65%的编码组氨酸的密码子是CAC,其余是CAT;和/或
d)编码组氨酸的密码子是CAC,除非下一个密码子以G开头。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1、至少2、至少4或至少5个编码谷氨酰胺的密码子被CAG取代;
b)与参考野生型因子IX序列相比,至少1个CAG密码子被CAA取代;
c)至少80%、至少85%或至少90%的编码谷氨酰胺的密码子是CAG;和/或
d)至少80%、至少85%或至少90%的编码谷氨酰胺的密码子是CAG,其余是CAA。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1、至少2、至少4或至少5个编码天冬酰胺的密码子被AAC取代;
b)至少60%、至少65%或至少70%的编码天冬酰胺的密码子是AAC;
c)至少60%、至少65%或至少70%的编码天冬酰胺的密码子是AAC,其余是AAT;和/或
d)编码天冬酰胺的密码子是AAC,除非下一个密码子以G开头。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少7、至少8或至少9个编码赖氨酸的密码子被AAG取代;
b)与参考野生型因子IX序列相比,至少1个AAG密码子被AAA取代。
c)至少80%、至少90%或至少95%的编码赖氨酸的密码子是AAG;和/或
d)至少80%、至少90%或至少95%的编码赖氨酸的密码子是AAG,其余的是AAA。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1、至少2、至少3或至少4个编码天冬氨酸的密码子被GAC取代;
b)与参考野生型因子IX序列相比,其中至少1个GAC密码子被GAT取代,其中下一个密码子以G开头;
c)至少45%、至少50%或至少60%的编码天冬氨酸的密码子是GAC;
d)至少45%、至少50%或至少60%的编码天冬氨酸的密码子是GAC,其余是GAT;和/或
e)编码天冬氨酸的密码子是GAC,除非下一个密码子以G开头。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少15、至少20、至少25或至少26个编码谷氨酸的密码子被GAG取代;
b)至少80%、至少90%或至少95%的编码谷氨酸的密码子是GAG;和/或
c)至少80%、至少90%或至少95%的编码谷氨酸的密码子是GAG和其余的是GAA。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少6、至少7或至少8个编码半胱氨酸的密码子被TGC取代;
b)与参考野生型因子IX序列相比,至少1个TGC密码子被TGT取代,其中下一个密码子以G开头;
c)至少40%、至少50%或至少55%的编码半胱氨酸的密码子是TGC;
d)至少40%、至少50%或至少55%的编码半胱氨酸的密码子是TGC,其余是TGT;和/或
e)编码半胱氨酸的密码子是TGC,除非下一个密码子以G开头。
在一个实施方案中,在经密码子优化的编码序列的部分中,在经密码子优化的编码序列的部分中,编码色氨酸的密码子是TGG。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少8、至少10或至少11个编码精氨酸的密码子被AGG取代;
b)与参考野生型因子IX序列相比,至少1个编码精氨酸的密码子被AGA取代;
c)至少60%、至少70%或至少75%的编码精氨酸的密码子是AGG;和/或
d)至少60%、至少70%或至少75%的编码精氨酸的密码子是AGG,其余是AGA。
优选地,至少60%、至少70%或至少75%的编码精氨酸的密码子是AGG。
在一个实施方案中,在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少10、至少12或至少13个编码甘氨酸的密码子被GGC取代;
b)与参考野生型因子IX序列相比,至少5、至少6、至少7或至少8个编码甘氨酸的密码子被GGG取代,其中下一个密码子以G开头。
c)至少50%、至少55%或至少60%的编码甘氨酸的密码子是GGC;
d)至少50%、至少55%或至少60%的编码甘氨酸的密码子是GGC,其余的是GGG;和/或
e)编码甘氨酸的密码子是GGC,除非下一个密码子以G开头。
在一个实施方案中,经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子。
在一个实施方案中,经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子,并且在密码子优化的部分中:
a)与参考野生型因子IX序列相比,至少5个编码苯丙氨酸的密码子被TTC取代;
b)与参考野生型因子IX序列相比,至少16个编码亮氨酸的密码子被CTG取代;
c)与参考野生型因子IX序列相比,至少12个编码异亮氨酸的密码子被ATC取代;
d)与参考野生型因子IX序列相比,至少25个编码缬氨酸的密码子被GTG取代;
e)与参考野生型因子IX序列相比,至少13个编码丝氨酸的密码子被AGC取代;
f)与参考野生型因子IX序列相比,至少5个编码脯氨酸的密码子被CCC取代;
g)与参考野生型因子IX序列相比,至少10个编码苏氨酸的密码子被ACC取代;
h)与参考野生型因子IX序列相比,至少4个编码丙氨酸的密码子被GCC取代;
i)与参考野生型因子IX序列相比,至少2个编码酪氨酸的密码子被TAC取代;
j)与参考野生型因子IX序列相比,至少1个编码组氨酸的密码子被CAC取代;
k)与参考野生型因子IX序列相比,至少5个编码谷氨酰胺的密码子被CAG取代;
l)与参考野生型因子IX序列相比,至少5个编码天冬酰胺的密码子被AAC取代;
m)与参考野生型因子IX序列相比,至少9个编码赖氨酸的密码子被AAG取代;
n)与参考野生型因子IX序列相比,至少4个编码天冬氨酸的密码子被GAC取代;
o)与参考野生型因子IX序列相比,至少26个编码谷氨酸的密码子被GAG取代;
p)与参考野生型因子IX序列相比,至少8个编码半胱氨酸的密码子被TGC取代;
q)编码色氨酸的密码子是TGG;
r)与参考野生型因子IX序列相比,至少11个编码精氨酸的密码子被AGG取代;和
s)与参考野生型因子IX序列相比,至少13个编码甘氨酸的密码子被GGC取代。
在一个实施方案中,经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子,并且在密码子优化的部分中:
a)至少70%的编码苯丙氨酸的密码子是TTC;
b)至少94%的编码亮氨酸的密码子是CTG;
c)至少75%的编码异亮氨酸的密码子是ATC;
d)至少95%的编码缬氨酸的密码子是GTG;
e)至少70%的编码丝氨酸的密码子是AGC;
f)至少60%的编码脯氨酸的密码子是CCC;
g)至少55%的编码苏氨酸的密码子是ACC;
h)至少43%的编码丙氨酸的密码子是GCC;
i)至少48%的编码酪氨酸的密码子是TAC;
j)至少65%的编码组氨酸的密码子是CAC;
k)至少90%的编码谷氨酰胺的密码子是CAG;
l)至少70%的编码天冬酰胺的密码子是AAC;
m)至少95%的编码赖氨酸的密码子是AAG;
n)至少60%的编码天冬氨酸的密码子是GAC;
o)至少95%的编码谷氨酸的密码子是GAG;
p)至少55%的编码半胱氨酸的密码子是TGC;
q)编码色氨酸的密码子是TGG;
r)至少75%的编码精氨酸的密码子是AGG;和
s)至少60%的编码甘氨酸的密码子是GGC。
在一个实施方案中,经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子,并且在密码子优化的部分中:
a)至少70%的编码苯丙氨酸的密码子是TTC,其余是TTT;
b)至少94%的编码亮氨酸的密码子是CTG,其余是CTC;
c)至少75%的编码异亮氨酸的密码子是ATC,其余是ATT;
d)至少95%的编码缬氨酸的密码子是GTG;
e)至少70%的编码丝氨酸的密码子是AGC;
f)至少60%的编码脯氨酸的密码子是CCC,其余是CCA或CCT;
g)至少55%的编码苏氨酸的密码子是ACC,其余是ACT;
h)至少43%的编码丙氨酸的密码子是GCC,其余是GCT;
i)至少48%的编码酪氨酸的密码子是TAC,其余是TAT;
j)至少65%的编码组氨酸的密码子是CAC,其余的是CAT;
k)至少90%的编码谷氨酰胺的密码子是CAG,其余的是CAA;
l)至少70%的编码天冬酰胺的密码子是AAC,其余的是AAT;
m)至少95%的编码赖氨酸的密码子是AAG,其余的是AAA;
n)至少60%的编码天冬氨酸的密码子是GAC,其余是GAT;
o)至少95%的编码谷氨酸的密码子是GAG,其余的是GAA;
p)至少55%的编码半胱氨酸的密码子是TGC,其余的是TGT;
q)编码色氨酸的密码子是TGG;
r)至少75%的编码精氨酸的密码子是AGG,其余是AGA;和
s)至少60%的编码甘氨酸的密码子是GGC,其余是GGG。
参考野生型因子IX序列是SEQ ID NO:9或SEQ ID NO:19。
经密码子优化的部分可以对应于编码部分或全部因子IX蛋白的序列。例如,因子IX蛋白可以是全长编码序列(诸如编码SEQ ID NO:8或SEQ ID NO:16的序列)或其变体,并且整个编码序列可以是经密码子优化的。因此,本文中提及“编码序列的一部分是经密码子优化的”应理解为是指“编码序列的至少一部分是经密码子优化的”。然而,在一些实施方案中,编码序列的一部分未经密码子优化,例如,编码序列的一部分未经密码子优化以用于在肝脏中表达。在一些实施方案中,经密码子优化的编码序列的部分的长度为至少800、至少900、至少1100、少于1500、少于1300、少于1200、800至1500、900至1300、1100至1200或约1191个核苷酸。
在一个实施方案中,经密码子优化的编码序列的部分包含外显子3或外显子3的至少10、至少15、至少20、少于25、10至25、15至25或20至25个核苷酸的部分。在另一个实施方案中,经密码子优化的编码序列的部分包含外显子4或外显子4的至少80、至少90、至少100、少于114、80至114、90至114或100至114个核苷酸的部分。在另一个实施方案中,经密码子优化的编码序列的部分包含外显子5或外显子5的至少90、至少100、至少110、少于129、90至129、100至129或110至129个核苷酸的部分。在另一个实施方案中,经密码子优化的编码序列的部分包含外显子6或外显子6的至少150、至少180、至少200、少于203、150至203、180至203或200至203个核苷酸的部分。在另一个实施方案中,经密码子优化的编码序列的部分包含外显子7或外显子7的至少70、至少80、至少90、至少100、少于115、70至115、80至115、90至115或100至115个核苷酸的部分。在另一个实施方案中,经密码子优化的编码序列的部分包含外显子8或外显子8的至少400、至少450、至少500、少于548、400至548、450至548或500至548个核苷酸的部分。
外显子3包含野生型因子IX(例如SEQ ID NO:9的因子IX)的核苷酸253-277或非野生型因子IX核苷酸序列中的相应序列。外显子4包含野生型因子IX(例如SEQ ID NO:9的因子IX)的核苷酸278-391或非野生型因子IX核苷酸序列中的相应序列。外显子5包含野生型因子IX(例如SEQ ID NO:9的因子IX)的核苷酸392-520或非野生型因子IX核苷酸序列中的相应序列。外显子6包含野生型因子IX(例如SEQ ID NO:9的因子IX)的核苷酸521-723或非野生型因子IX核苷酸序列中的相应序列。外显子7包含野生型因子IX(例如SEQ ID NO:9的因子IX)的核苷酸724-838或非野生型因子IX核苷酸序列中的相应序列。外显子8包含野生型因子IX(例如SEQ ID NO:9的因子IX)的核苷酸839-1386或非野生型因子IX核苷酸序列中的相应序列。
优选地,外显子3的至少20个核苷酸的部分、外显子4的至少100个核苷酸的部分、外显子5的至少110个核苷酸的部分、外显子6的至少180个核苷酸的部分、外显子7的100个核苷酸的部分和外显子8的至少500个核苷酸的部分是经密码子优化的。经密码子优化的编码序列的部分可以包含外显子3、外显子4、外显子5、外显子6、外显子7和外显子8。在一个实施方案中,经密码子优化的编码序列的部分包含外显子3、外显子4、外显子5、外显子6、外显子7和外显子8。
在一个实施方案中,经密码子优化的编码序列的部分包含外显子2的一部分,并且外显子2的该部分的长度为少于160、少于150、少于100、少于75、少于60、至少20、至少30、至少40、至少50、20至160、30至150、30至100、40至75或约56个核苷酸。外显子2包含野生型因子IX(例如SEQ ID NO:9的因子IX)的核苷酸89-252或非野生型因子IX核苷酸序列中的相应序列。在优选的实施方案中,经密码子优化的编码序列的部分包含长度为30至100个核苷酸的外显子2的一部分。
确定编码因子IX蛋白或其片段的序列的一部分是否对应于例如野生型因子IX的外显子8在本领域技术人员的能力范围内。本领域技术人员仅需要使用合适的比对算法(例如上文所述的Needleman和Wunsch的算法)将编码因子IX蛋白或其片段的序列与外显子8进行序列比对,并确定是否至少部分的核苷酸序列与SEQ ID NO:9的外显子8(如上文所述,SEQ ID NO:9的外显子8由SEQ ID NO:9的核苷酸839-1386组成)具有大于90%、大于95%或大于98%的同一性。
如上文所讨论的,提供包含部分或全部经密码子优化的编码序列的多核苷酸序列可以确保编码的多肽以高水平表达。在一个实施方案中,与参考野生型因子IX序列相比,由因子IX核苷酸序列编码的多肽在人肝细胞中以更高的水平表达。参考野生型因子IX序列可以是SEQ ID NO:9。在一个实施方案中,与由包含SEQ ID NO:12的因子IX核苷酸序列和SEQID NO:7的转录调节元件的核苷酸序列编码的多肽相比,由因子IX核苷酸序列编码的多肽在人肝细胞中以更高的水平表达。在一个实施方案中,由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽相比,由因子IX核苷酸序列编码的多肽在人肝细胞中以更高的水平表达。
在一个实施方案中,由因子IX核苷酸序列编码的多肽在人肝细胞中以由包含SEQID NO:12或SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:7或SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少1.5倍、至少2倍、至少2.5倍或至少3倍的水平表达。任选地,由因子IX核苷酸序列编码的多肽在人肝细胞中以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少1.5倍、至少2倍、至少2.5倍或至少3倍的水平表达。任选地,由因子IX核苷酸序列编码的多肽在人肝细胞中以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少1.5倍、至少2倍、至少2.5倍或至少3倍的水平表达。
在一个方面,本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽,从而治疗疾病。在一个方面,本发明的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病。在一个方面,提供了一种以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的方法,包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。在一个方面,提供了一种通过以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的方法,包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。在一个方面,提供了本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的用途,从而治疗疾病。在一个方面,提供了用于通过以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的用途。在一个实施方案中,表达由因子IX核苷酸序列编码的多肽包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。
在一个方面,本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽,从而治疗疾病。在一个方面,本发明的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病。在一个方面,提供了一种以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的方法,包括将本发明的多核苷酸、病毒颗粒或组合物施用至患者。在一个方面,提供了一种通过以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的方法,包括将本发明的多核苷酸、病毒颗粒或组合物施用至患者。在一个方面,提供了本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的用途,从而治疗疾病。在一个方面,提供了本发明的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的用途。在一个实施方案中,表达由因子IX核苷酸序列编码的多肽包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。任选地,该疾病是血友病,例如B型血友病。
本领域技术人员可以通过用包含因子IX核苷酸序列的病毒颗粒转导宿主细胞,以及用包含参考序列的载体转导一些细胞,来确定因子IX核苷酸序列是否以比参考序列更高的水平表达。可以在适于表达由因子IX核苷酸序列编码的因子IX蛋白或其片段的条件下培养细胞,并且可以比较表达的因子IX蛋白的水平。可以使用诸如标题为“因子IX蛋白或其片段”的章节中描述的ELISA来评估表达的因子IX蛋白的水平。合适的宿主细胞包括培养的人肝细胞,例如Huh 7细胞。
如上文所讨论的,CpG(即CG二核苷酸)的存在可能降低表达效率。这是因为CpG可能被甲基化,并且它们的甲基化可能导致基因沉默,从而降低表达。因此,与参考野生型因子IX序列的相应部分相比,经密码子优化的编码序列的部分优选包含减少数量的CpG。在一个优选的实施方案中,经密码子优化的编码序列的部分包含少于40、少于20、少于10、少于5或少于1个CpG。优选地,经密码子优化的编码序列的部分不含CpG,即不包含(包含0个)CG二核苷酸。
在一个实施方案中,经密码子优化的编码序列的部分与SEQ ID NO:1的至少800、至少900、至少1100、少于1191、少于1100、少于1000、800至1191、900至1191或约1191个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,经密码子优化的编码序列的部分与SEQ ID NO:1至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,经密码子优化的编码序列的部分与SEQ ID NO:1的900至1191个核苷酸的片段至少95%相同。在一个实施方案中,经密码子优化的编码序列的部分与SEQ ID NO:1至少95%或至少98%相同。
本发明提供了包含因子IX核苷酸序列的多核苷酸,其中所述因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列,并且所述编码序列包含与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列和与SEQ ID NO:15至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%或至少99.8%相同的序列是经密码子优化的。
未经密码子优化的编码序列的部分
在一个实施方案中,因子IX核苷酸序列包含未经密码子优化的部分。未经密码子优化的部分可以是连续的部分。包括未经密码子优化的部分可以改善编码序列的表达,因为未经密码子优化的部分可以与编码序列的其他部分例如内含子或内含子片段有益地相互作用。例如,因子IX核苷酸序列可以包含内含子或内含子片段,并且在这样的情况下,用野生型因子IX序列侧接内含子或内含子片段可以帮助确保正确的剪接。
与野生型序列相比,未经密码子优化的部分未被修饰以包括更多数量的偏好的密码子。例如,未经密码子优化的部分可以包括与野生型序列相似数量的偏好密码子。未经密码子优化的部分可包含少于50%的密码子TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。任选地,未经密码子优化的部分包含少于50%、少于45%或少于40%的选自以下的密码子:TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。
任选地,未经密码子优化的部分未经密码子优化以用于在人肝细胞中表达。在一个实施方案中,未经密码子优化的部分包含与SEQ ID NO:9的相应部分基本上相同数量的偏好密码子。例如,未经密码子优化的部分可以包含作为SEQ ID NO:9的相应部分的偏好密码子的数量的至少90%。
任选地,未经密码子优化的部分的长度为至少100、至少150、至少170、至少190、少于250、少于225、少于200或约195个核苷酸。
如下文更详细讨论的,因子IX核苷酸序列可包含内含子或内含子片段。在这样的情况下,内含子或内含子片段的侧翼可以是未经密码子优化的部分,即未经密码子优化的部分的一些可以与内含子或内含子片段的3'末端相邻,和未经密码子优化的部分的一些可以与内含子或内含子片段的5'末端相邻。内含子或内含子片段可以在外显子1和外显子2之间。在这样的情况下,包括未经密码子优化的部分是有利的,该部分包含外显子1的一部分和外显子2的一部分。
任选地,未经密码子优化的部分包含外显子1或外显子1的至少60、至少70、至少80、60至88、70至88或80至88个连续核苷酸的部分。外显子1包含野生型因子IX(例如SEQ IDNO:9的因子IX)的核苷酸1-88或非野生型因子IX核苷酸序列中的相应序列。外显子1的一部分可以编码信号肽区和前肽区。任选地,未经密码子优化的部分包含或不包含信号肽和/或前肽区。外显子1还可以在5'端包含29个核苷酸的附加非编码片段。如果因子IX核苷酸序列包含内含子或内含子片段,则优选的是,未经密码子优化的部分包括与内含子或内含子片段相邻的外显子1的一部分。例如,如果内含子或内含子片段在外显子1和外显子2之间,则优选的是,未经密码子优化的部分包含对应于SEQ ID NO:9的核苷酸80-88、70-88、60-88、40-88或20-88的外显子1的部分。
任选地,未经密码子优化的部分包括外显子2的至少50、至少75、至少80、至少90、至少100、少于140、少于120、50至140、75至120或约107个核苷酸的部分。例如,如果内含子或内含子片段位于外显子1和外显子2之间,则优选的是,未经密码子优化的部分包含对应于SEQ ID NO:9的核苷酸89-100、89-120、89-140、89-160、89-180或89-196的外显子2的一部分。
未经密码子优化的部分可包含CpG。例如,未经密码子优化的部分可包含与SEQ IDNO:9的相应部分相同数目的CpG。未经密码子优化的部分每100个核苷酸可包含至少1、至少1.5或至少2个CpG。未经密码子优化的部分可以包含至少1、至少2、至少3、1至5、2至5或约5个CpG。
未经密码子优化的部分可以与SEQ ID NO:15或SEQ ID NO:2的至少100、至少150、至少175、少于195、少于190或少于180的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。未经密码子优化的部分可以与SEQ ID NO:15或SEQ ID NO:2至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。例如,未经密码子优化的部分可以与SEQ IDNO:15或SEQ ID NO:2至少98%相同。
未经密码子优化的部分可以是野生型的。SEQ ID NO:9是野生型因子IX核苷酸编码序列的实例。因此,未经密码子优化的部分可以与SEQ ID NO:9的相应部分至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
因子IX核苷酸序列可包含内含子或内含子片段
因子IX核苷酸序列可包含中断编码序列的内含子或内含子片段。内含子是在表达过程中被切除的核苷酸序列,并且不构成编码序列的一部分。
基因组野生型因子IX核苷酸序列包含内含子,所述内含子中断因子IX编码序列。内含子的存在可以帮助保持野生型因子IX的高水平表达。因此,在本发明的因子IX核苷酸序列中包含内含子或内含子的至少一个片段可能是有利的。例如,因子IX核苷酸序列可以包含与野生型因子IX中的内含子1相对应的内含子或内含子片段。适当地,内含子是野生型因子IX的内含子1A的片段,例如SEQ ID NO:3。已经发现,截短内含子1的序列导致因子IX核苷酸序列的表达增加。认为内含子1的截短以形成内含子1A可以缺失内含子中的抑制子元件。内含子1序列的截短还导致因子IX核苷酸序列更短,这允许在基因治疗实施方案中将因子IX核苷酸序列更有效地包装到病毒递送系统中。
内含子片段可以少于500、少于400、少于350、少于300、至少100、至少200、至少250、至少290、100至500、200至400、250至350或约299个核苷酸。内含子片段可以与SEQ IDNO:3的至少100、至少200、至少250或至少290个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。内含子或内含子片段可以与SEQ ID NO:3至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。例如,内含子或内含子片段可以与SEQ ID NO:3至少95%或至少98%相同。
优选地,内含子或内含子片段中断因子IX核苷酸序列中未经密码子优化的部分,即内含子在未经密码子优化的部分的5'和在未经密码子优化的部分的3'。如果紧接在内含子的3'和5'或靠近内含子的3'和5'区段的核苷酸是未经密码子优化的,则该内含子由未经密码子优化的序列“侧接”。“靠近内含子”是指在内含子的1、2、3、4、5、6、7、8、9或10个核苷酸以内。如上文所讨论的,用未经密码子优化的核苷酸序列侧接内含子或内含子片段可以帮助确保正确的剪接。任选地,内含子或内含子片段侧接未经密码子优化的至少60、至少70、至少80、至少90或至少100个核苷酸。例如,如果紧接在内含子的3'端的40个核苷酸和紧接在内含子的5'端的20个核苷酸是未经密码子优化的,或者如果紧接在内含子的3'端的30个核苷酸和紧接在内含子的5'端的30个核苷酸是未经密码子优化的,则该内含子侧接未经密码子优化的60个核苷酸。任选地,内含子或内含子片段在5'端侧接未经密码子优化的110至120个核苷酸(例如紧接在内含子的5'端),和在3'端侧接未经密码子优化的100至110个核苷酸(例如紧接在内含子的3'端)。
内含子或内含子片段可以位于与因子IX核苷酸序列的外显子1和外显子2相对应的编码序列的部分之间。如果内含子或内含子片段对应于野生型因子IX中的内含子1的片段,则优选的是,内含子或内含子片段在对应于因子IX核苷酸序列的外显子1和外显子2的编码序列的部分之间。
多核苷酸还可以包含转录调节元件
多核苷酸可以包含转录调节元件。
在一个实施方案中,转录调节元件与SEQ ID NO:6至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,多核苷酸包含与SEQ ID NO:6至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。任选地,多核苷酸包含SEQ ID NO:6的转录调节元件。
可以使用任何适当的转录调节元件,例如HLP2、HLP1、LP1、HCR-hAAT、ApoE-hAAT和LSP,它们都是肝脏特异性的转录调节元件。在以下参考文献中更详细地描述了这些转录调节元件:HLP1:McIntosh J.等人,Blood 2013Apr 25,121(17):3335-44;LP1:Nathwani等人,Blood.2006April1,107(7):2653–2661;HCR-hAAT:Miao等人,Mol Ther.2000;1:522-532;ApoE-hAAT:Okuyama等人,Human Gene Therapy,7,637-645(1996);和LSP:Wang等人,Proc Natl Acad Sci U S A.1999March 30,96(7):3906–3910。HLP2转录调节元件具有SEQID NO:6的序列。
转录调节元件可包含启动子和/或增强子,例如来自HLP2、HLP1、LP1、HCR-hAAT、ApoE-hAAT和LSP的启动子元件和/或增强子元件。这些转录调节元件中的每一个都包含启动子、增强子和任选地其他核苷酸。
在一个实施方案中,转录调节元件包含增强子,其是人载脂蛋白E(ApoE)肝基因座控制区(HCR;Miao等人(2000),Molecular Therapy1(6):522)或其片段。在一个实施方案中,转录调节元件包含HCR增强子的片段,该片段是长度为至少80、至少90、至少100、少于192、80至192、90至192、100至250或117至192个核苷酸的片段。任选地,HCR增强子的片段的长度为100至250个核苷酸。
合适的HCR增强子片段描述于SEQ ID NO:13中。任选地,转录调节元件包含长度为至少80、至少90、至少100、少于192、80至192、90至192、100至250、117至192个核苷酸的增强子,并且该增强子包含与SEQ ID NO:13至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的多核苷酸序列。任选地,转录调节元件包含长度为117至192个核苷酸的增强子,并且该增强子包含与SEQ ID NO:13至少98%、至少99%、至少99.5%、至少99.8%或100%相同的多核苷酸序列。
任选地,转录调节元件包含与SEQ ID NO:13的至少90、至少100或至少110个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。任选地,多核苷酸包含与SEQ ID NO:13至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。任选地,多核苷酸包含与SEQ ID NO:13至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。任选地,多核苷酸包含SEQ ID NO:13的增强子。
在一个实施方案中,转录调节元件包含启动子,其是人α-1抗胰蛋白酶启动子(A1AT;Miao等人(2000),Molecular Therapy1(6):522)或其片段。任选地,A1AT启动子的片段的长度是至少100、至少120、至少150、至少180、少于255、100至255、150至225、150至300、180至255个核苷酸。任选地,A1AT启动子的片段的长度为150至300个核苷酸。
合适的A1AT启动子片段在SEQ ID NO:14中描述。任选地,转录调节元件包含长度为至少100、至少120、至少150、至少180、少于255、100至255、150 300或180 255个核苷酸的启动子,并且该启动子包含与SEQ ID NO:14至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的多核苷酸序列。任选地,转录调节元件包含长度为180至255个核苷酸的启动子,并且该启动子包含与SEQ ID NO:14至少98%、至少99%、至少99.5%、至少99.8%或100%相同的多核苷酸序列。任选地,多核苷酸包含与SEQ ID NO:14的至少100、至少120或至少150个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子。任选地,多核苷酸包含与SEQ ID NO:14至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子。任选地,多核苷酸包含与SEQ ID NO:14至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子。任选地,多核苷酸包含SEQ ID NO:14的启动子。
如果多核苷酸打算在肝脏中表达,则启动子可以是肝脏特异性启动子。任选地,启动子是人肝脏特异性启动子。一般而言,“肝脏特异性启动子”是在肝细胞中提供更高水平表达的启动子。例如,本领域技术人员可以通过比较肝细胞(例如Huh 7细胞)中多核苷酸的表达与来自其他组织的细胞中多核苷酸的表达来确定启动子是否是肝脏特异性启动子。如果与来自其他组织的细胞相比,肝细胞中的表达水平更高,则该启动子是肝脏特异性启动子。
功能获得突变
因子IX蛋白或其片段可包含功能获得突变。功能获得突变是增加因子IX蛋白或其片段的活性的突变。例如,功能获得突变可以产生具有与野生型因子IX(例如由SEQ ID NO:9或SEQ ID NO:19编码的因子IX)相比至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少4倍、至少5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍或至少8倍或更高活性的因子IX蛋白或其片段。
因子IX蛋白或其片段可在对应于野生型因子IX的位置384(对应于SEQ ID NO:9的密码子384或由SEQ ID NO:9编码的未成熟多肽的氨基酸384)的位置处包含突变。在对应于野生型因子IX的位置384的位置处的突变可以是功能获得突变。例如,用亮氨酸取代精氨酸384可以导致活性的显著增加。
因子IX蛋白是否在对应于因子IX中的位置384的位置处包含突变,可以通过使用合适的算法(例如上文所述的Needleman和Wunsch的算法)将因子IX蛋白与SEQ ID NO:16进行比对,并确定与氨基酸384(其为SEQ ID NO:16中的亮氨酸)对齐的氨基酸是否为精氨酸残基来确定。如果与SEQ ID NO:16的氨基酸384对齐的氨基酸不是精氨酸残基,则因子IX蛋白在对应于野生型因子IX的位置384的位置处具有突变。
可以通过比较包含突变的因子IX蛋白的活性与除了假定的功能获得突变之外相同的参考因子IX蛋白的活性来确定突变是否是功能获得突变。这两种蛋白质的相对活性可以使用生色测定法(例如在“因子IX蛋白质或其片段”标题下讨论的那些)来确定。如果包含突变的因子IX蛋白的活性高于参考蛋白的活性,则该突变是功能获得突变。
因此,因子IX核苷酸序列可以包含在对应于因子IX中的位置384的位置处编码突变的密码子。例如,因子IX核苷酸序列可包含在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子,该氨基酸是小的疏水性氨基酸。小的疏水性氨基酸可以是丙氨酸、亮氨酸、异亮氨酸、甘氨酸或缬氨酸。例如,小的疏水性氨基酸可以是丙氨酸或亮氨酸。优选地,小的疏水性氨基酸是亮氨酸。
在对应于野生型因子IX的位置384的位置处编码突变的密码子可以是编码亮氨酸的密码子例如CTX,其中X是任何核苷酸。优选地,X是C或G。在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子可以是CTC,例如在SEQ ID NO:4中。在替代实施方案中,在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子是TTG或CTG,例如在SEQID NO:11或SEQ ID NO:26中。例如,本文中对SEQ ID NO:1的引用可以由对SEQ ID NO:26或11的相应部分的引用取代。换句话说,SEQ ID NO:1可以在核苷酸957(C)处用G取代,或在核苷酸955(C)和957(C)处分别用T和G取代。
多核苷酸可包含与SEQ ID NO:5的至少1200、至少1350或至少1650个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的因子IX序列。例如,因子IX核苷酸序列可以与SEQ ID NO:5至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
适当地,
(i)因子IX核苷酸序列包含与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;和(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子,其中在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子编码亮氨酸。
适当地,
(i)因子IX核苷酸序列包含与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的编码序列;
(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子,其中在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子编码亮氨酸;和
(iii)多核苷酸包含与SEQ ID NO:13至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。
适当地,
(i)因子IX核苷酸序列包含与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的编码序列;
(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子,其中在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子编码亮氨酸;和
(iii)多核苷酸包含与SEQ ID NO:14至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子元件。
适当地,
(i)因子IX核苷酸序列包含与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;
(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子,其中在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子编码亮氨酸;和
(iii)多核苷酸包含与SEQ ID NO:6至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
适当地,
(i)因子IX核苷酸序列包含与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;
(ii)因子IX核苷酸序列包含与SEQ ID NO:2至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;和
(iii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子,其中在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子编码亮氨酸。
适当地,因子IX核苷酸序列包含内含子或内含子片段,并且内含子片段与SEQ IDNO:3至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
包含多核苷酸的病毒颗粒
本发明还提供了包含重组基因组的病毒颗粒,所述重组基因组包含本发明的多核苷酸。为了本发明的目的,术语“病毒颗粒”是指病毒体的全部或部分。例如,病毒颗粒包含重组基因组,并且还可以包含衣壳。病毒颗粒可以是基因治疗载体。在本文中,术语“病毒颗粒”和“载体”可互换使用。为了本申请的目的,“基因治疗”载体是可用于基因治疗的病毒颗粒,即包含在施用后在宿主细胞中表达转基因(例如因子IX核苷酸序列)所需的所有功能元件的病毒颗粒。
合适的病毒颗粒包括细小病毒、逆转录病毒、慢病毒或单纯疱疹病毒。细小病毒可以是腺相关病毒(AAV)。病毒颗粒优选是重组腺相关病毒(AAV)载体或慢病毒载体。更优选地,病毒颗粒是AAV病毒颗粒。术语AAV和rAAV在本文可互换使用。
所有已知的AAV血清型的基因组组织非常相似。AAV的基因组是线性的单链DNA分子,其长度少于约5,000个核苷酸。反向末端重复序列(ITR)位于非结构复制(Rep)蛋白和结构(VP)蛋白的独特编码核苷酸序列的侧翼。VP蛋白(VP1、VP2和VP3)形成衣壳。末端145nt是自互补的并且被组织成使得可以形成T形发夹的能量稳定的分子内双链体得以形成。这些发夹结构用作病毒DNA复制的起点,用作细胞DNA聚合酶复合物的引物。在哺乳动物细胞中野生型(wt)AAV感染后,分别从P5启动子和P19启动子表达Rep基因(即编码Rep78和Rep52蛋白),并且两种Rep蛋白在病毒基因组的复制中均具有功能。Rep ORF中的剪接事件导致实际上四种Rep蛋白(即Rep78、Rep68、Rep52和Rep40)的表达。然而,已经显示,哺乳动物细胞中编码Rep78和Rep52蛋白的未剪接的mRNA足以用于产生AAV载体。在昆虫细胞中,Rep78和Rep52蛋白也足以用于产生AAV载体。
本发明的重组病毒基因组可以包含ITR。本发明的AAV载体仅使用一个ITR发挥作用是可能的。因此,病毒基因组包含至少一个ITR,但更通常地,包含两个ITR(通常在病毒基因组的任一端,即一个在5'端和一个在3'端)。在多核苷酸和ITR的一个或多个之间可能存在插入序列。可将本发明的多核苷酸掺入位于两个规则的ITR之间或位于用两个D区改造的ITR的任一侧的病毒颗粒中。
可在本发明中用于产生AAV载体的AAV序列可以衍生自任何AAV血清型的基因组。通常,AAV血清型在氨基酸和核酸水平上具有显著同源性的基因组序列,提供遗传功能的相同集合,产生基本上在物理和功能上等同的病毒体,并通过实际上相同的机制复制和组装。对于各种AAV血清型的基因组序列和基因组相似性的概述,参见例如GenBank登录号U89790;GenBank登录号J01901;GenBank登录号AF043303;GenBank登录号AF085716;Chiorini等人,1997;Srivastava等人,1983;Chiorini等人,1999;Rutledge等人,1998;和Wu等人,2000。AAV血清型1、2、3、3B、4、5、6、7、8、9、10、11或12可用于本发明。当用于产生基因治疗载体时,来自AAV血清型的序列可以被突变或工程化。
任选地,AAV载体包含衍生自AAV1、AAV2、AAV4和/或AAV6的ITR序列。优选地,ITR序列是AAV2 ITR序列。在本文中,术语AAVx/y是指包含来自AAVx(其中x是AAV血清型的编号)的一些组分和来自AAVy(其中y是相同或不同血清型的编号)的一些组分的病毒颗粒。例如,AAV2/8载体可以包含病毒基因组的一部分,包括来自AAV2株的ITR,和来自AAV8株的衣壳。
在一个实施方案中,病毒颗粒是包含衣壳的AAV病毒颗粒。AAV衣壳通常由三种蛋白VP1、VP2和VP3形成。VP1的氨基酸序列包括VP2的序列。VP1的不形成VP2的一部分的部分被称为VP1unique或VP1U。VP2的氨基酸序列包括VP3的序列。VP2的不形成VP3的一部分的部分被称为VP2unique或VP2U。优选地,衣壳是AAV5衣壳或Mut C衣壳。Mut C衣壳可以与SEQID NO:10具有至少96%、至少98%、至少99%、至少99.5%、至少99.8%或100%的同一性。AAV衣壳可以与SEQ ID NO:17具有至少96%、至少98%、至少99%,99.5%、至少99.8%或100%的同一性。在替代实施方案中,衣壳具有SEQ ID NO:17的VP2U和/或VP3和与SEQ IDNO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:25具有至少96%、至少98%、至少99%、至少99.5%、至少99.8%或100%的同一性的VP1U。
本发明的病毒颗粒可以是“杂合”颗粒,其中病毒ITR和病毒衣壳来自不同的细小病毒,例如不同的AAV血清型。优选地,病毒ITR和衣壳来自AAV的不同血清型,在这样的情况下,这样的病毒颗粒被称为跨衣壳的或假型的。类似地,细小病毒可具有“嵌合”衣壳(例如,包含来自不同细小病毒(优选不同AAV血清型)的序列)或“靶向”衣壳(例如,定向嗜性)。
在一些实施方案中,重组AAV基因组包含完整的ITR,其包含功能性末端分辨位点(TRS)。这样的AAV基因组可以包含一个或两个可分辨的ITR,即包含功能性TRS的ITR,在其上可发生位点特异性切刻以生成游离的3'羟基,其可用作DNA聚合酶解旋和复制ITR的底物。优选地,重组基因组是单链的(即,它以单链形式包装到病毒颗粒中)。任选地,重组基因组不以自身互补的构型包装,即,基因组不包含具有在病毒颗粒中退火的基本上自身互补部分的单个共价连接的多核苷酸链。替代地,重组基因组可以以“单体双链体”形式包装。WO2011/122950中描述了“单体双链体”。基因组可以包装为在病毒颗粒中退火的两个基本上互补但非共价连接的多核苷酸。
病毒颗粒还可以包含多聚A序列。多聚A序列可以位于编码功能性因子IX蛋白的核苷酸序列的下游。多聚A序列可以是牛生长激素多聚A序列(bGHpA)。多聚A序列的长度可以为250至270个核苷酸。
本发明的病毒颗粒任选地在宿主细胞中高表达。例如,在Huh7细胞中转导后,病毒颗粒表达具有比由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的病毒颗粒和/或包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的病毒颗粒表达的因子IX蛋白的活性更高的因子IX活性的因子IX蛋白或其片段。
任选地,在转导到Huh7细胞群体中之后,病毒颗粒表达具有比由转导到可比较的Huh7细胞群体中的包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的可比较的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段。任选地,在转导到Huh7细胞群体中之后,病毒颗粒表达具有比由转导到可比较的Huh7细胞群体中的包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的可比较的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段。
一方面,本发明的多核苷酸、病毒颗粒或组合物用于通过表达具有比由包含SEQID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的病毒颗粒和/或包含SEQID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病。在一个方面,提供了一种通过表达具有比由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的病毒颗粒和/或包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病的方法,包括向患者施用有效量的本发明的多核苷酸、病毒颗粒或组合物。在一个方面,提供了本发明的多核苷酸、病毒颗粒或组合物用于通过表达具有比由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的病毒颗粒和/或包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病的用途。任选地,包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的病毒颗粒和/或包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的病毒颗粒是可比较的病毒颗粒。任选地,表达因子IX蛋白或其片段包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。任选地,疾病是血友病,例如B型血友病。
在这样的实施方案中,术语“可比较的病毒颗粒”是指与本发明的AAV病毒颗粒相同的病毒颗粒,除了可比较的病毒颗粒包含不同的因子IX核苷酸序列和不同的转录调节元件(SEQ ID NO:12和SEQ ID NO:7或SEQ ID NO:18和SEQ ID NO:6)。任选地,使用生色测定法例如上述的生色测定法评估活性。但是,在这样的情况下,该活性未针对因子IX浓度进行标准化,因此该活性是表达水平以及因子IX蛋白的固有活性的函数。
组合物、方法和用途
在本发明的另一方面,提供了一种组合物,其包含本发明的多核苷酸或载体/病毒颗粒和药学上可接受的赋形剂。
药学上可接受的赋形剂可以包含载体、稀释剂和/或其他药物、药剂或佐剂等。任选地,药学上可接受的赋形剂包括盐溶液。任选地,药学上可接受的赋形剂包括人血清白蛋白。
本发明还提供了用于治疗方法的本发明的多核苷酸、载体/病毒颗粒或组合物。任选地,治疗方法包括向患者施用有效量的本发明的多核苷酸或载体/病毒颗粒。
本发明还提供了一种治疗方法,该方法包括向患者施用有效量的本发明的多核苷酸或载体/病毒颗粒。
本发明还提供了本发明的多核苷酸、载体/病毒颗粒或组合物在制备用于治疗方法的药物中的用途。任选地,治疗方法包括向患者施用有效量的本发明的多核苷酸或载体/病毒颗粒。任选地,治疗方法是基因疗法。“基因疗法”涉及施用本发明的载体/病毒颗粒,其能够在施用其的宿主中表达转基因(例如因子IX核苷酸序列)。
任选地,治疗方法是治疗凝血病诸如血友病(例如,A或B型血友病)或VanWillebrands病的方法。优选地,凝血病的特征在于增加的出血和/或减少的凝血。任选地,治疗方法是治疗血友病例如B型血友病的方法。在一些实施方案中,患者是患有B型血友病的患者。任选地,患者具有针对因子IX的抗体或抑制剂。任选地,多核苷酸和/或载体/病毒颗粒是静脉内施用的。任选地,多核苷酸和/或载体/病毒颗粒用于仅施用至患者一次(即单剂量)。
当在上文所述的方法中“治疗”B型血友病时,这意味着血友病的一种或多种症状得到改善。这并不意味着血友病的症状得到完全治疗,从而使血友病症状不再存在于患者中,尽管在某些方法中可能是这样的情况。治疗方法可能导致B型血友病的一种或多种症状不如治疗前严重。任选地,相对于预先施用的情况,该治疗方法导致患者血液中循环因子IX的量/浓度和/或给定体积的患者血液内可检测到的因子IX活性的总体水平和/或患者血液中因子IX的比活性(活性/因子IX蛋白质的量)的增加。
“治疗有效量”是指在所需的剂量和时间段内有效实现所需治疗结果(例如提高受试者中功能性因子IX的水平(以导致功能性因子IX以足以缓解B型血友病的症状的水平的产生))的量。
任选地,以少于1×1011、少于1×1012、少于5×1012、少于2×1012、少于1.5×1012、少于3×1012、少于1×1013,少于2×1013或少于3×1013的载体基因组/千克患者体重的剂量施用载体/病毒颗粒。任选地,以至少4.5×1011或4.5×1011至1×1012的载体基因组/千克患者体重(vg/kg)的剂量施用多核苷酸、病毒颗粒或组合物。任选地,以少于5×1011vg/kg的剂量施用多核苷酸、病毒颗粒或组合物。任选地,以4.5×1011vg/kg至5×1011vg/kg或4.5×1011vg/kg至4.9×1011vg/kg的剂量施用多核苷酸、病毒颗粒或组合物。任选地,所施用的多核苷酸或病毒颗粒是由哺乳动物细胞产生的,和/或具有由于使用哺乳动物病毒载体生产细胞而产生的特征,并与昆虫病毒载体生产细胞(例如杆状病毒系统)中产生的载体区分开。
任选地,使用定量PCR滴定载体基因组实现给定剂量的载体/病毒颗粒(在载体基因组的数量方面定量的)的施用。原则上,可以将qPCR引物设计为结合对于野生型基因组不常见的重组载体基因组的任何部分,但是建议不使用非常靠近ITR的引物模板序列,因为这样做可导致夸大的载体基因组滴度测量。任选地,利用针对启动子区域例如转基因盒(有时也称为转基因表达盒)的启动子区域的引物,通过定量聚合酶链反应(qPCR)对载体基因组进行定量。
进行qPCR的方法是本领域技术人员已知的。使用实时PCR循环仪和SYBR Green(ThermoFisher Scientific)等DNA结合染料,可以实时检测新生双链扩增子的扩增。然后可以将已知数量的qPCR模板遗传物质(例如启动子区域)进行连续稀释以创建标准曲线,并从标准曲线内插样品载体基因组滴度。
任选地,选择所施用的载体/病毒颗粒的剂量,使得受试者以非血友病健康受试者的因子IX活性的10%-90%、20%-80%、30%-70%、25%-50%、20%-150%、30%-140%、40%-130%、50%-120%、60%-110%或70%-100%的活性表达因子IX。任选地,以在患有B型血友病的患者中有效实现至少20%的稳定的因子IX活性水平的剂量施用多核苷酸、病毒颗粒或组合物。任选地,以在患有B型血友病的患者中有效实现至少25%的稳定的因子IX活性水平的剂量施用多核苷酸、病毒颗粒或组合物。任选地,以在患有B型血友病的患者中有效实现至少30%的稳定的因子IX活性水平的剂量施用多核苷酸、病毒颗粒或组合物。任选地,以在患有B型血友病的患者中有效实现至少35%的稳定的因子IX活性水平的剂量施用多核苷酸、病毒颗粒或组合物。任选地,以在患有B型血友病的患者中有效实现至少或约40%的稳定的因子IX活性水平的剂量施用多核苷酸、病毒颗粒或组合物。
在一个方面,本发明的多核苷酸、病毒颗粒或组合物用于在患有B型血友病的患者中实现至少20%的稳定的因子IX活性水平。在一个方面,提供了一种在患有B型血友病的患者中实现至少20%的稳定的因子IX活性水平的方法,包括将有效量的本发明的多核苷酸、病毒颗粒或组合物施用至患者。在另一方面,提供了本发明的多核苷酸、病毒颗粒或组合物用于在患有B型血友病的患者中获得至少20%的稳定的因子IX活性水平的用途。在另一方面,提供了用于治疗B型血友病的本发明的多核苷酸、病毒颗粒或组合物,包括以在患者中有效实现至少20%的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。在另一方面,提供了一种治疗B型血友病的方法,包括以在患者中有效实现至少20%的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。在另一方面,提供了本发明的多核苷酸、病毒颗粒或组合物在治疗B型血友病中的用途,包括以在患者中有效实现至少20%的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。任选地,治疗B型血友病或实现稳定的因子IX的活性水平包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。任选地,为了实现稳定的因子IX活性水平,例如至少20%、至少30%或至少40%的稳定的因子IX活性水平,以少于5×1011vg/kg或4.5×1011vg/kg至4.9×1011vg/kg的剂量施用多核苷酸、病毒颗粒或组合物。任选地,所施用的多核苷酸或病毒颗粒是由哺乳动物细胞产生的和/或具有因使用哺乳动物病毒载体生产细胞而产生的特征,并与昆虫病毒载体生产细胞(例如杆状病毒系统)中产生的载体区分开。
至少X%(例如至少20%)的因子IX活性水平是指正常因子IX水平范围的至少X%(例如20%)的因子IX活性水平。本领域技术人员将容易理解提及正常因子IX活性水平的百分比(其是在常规临床实践中参考国际标准确定的)的含义。合并的正常(健康)人血浆具有约5μg/ml的因子IX浓度。
术语“稳定的因子IX活性水平”是指在至少5周的连续时间内保持在或高于一定水平的因子IX活性水平。在一些实施方案中,因子IX活性水平在至少10、至少15、至少20、至少30、至少40或至少50周的连续时间内保持在或高于某一水平。例如,如果活性水平在至少5周的连续时间内保持在至少20%,则患者具有至少20%的稳定的因子IX活动水平。在这样的例子中,因子IX活性水平在至少5周后可以继续为至少20%,因此在至少10、至少15、至少20、至少30或至少40或至少50周的累积连续期间内保持至少20%。任选地,如果因子IX活性水平在至少20周的连续时间内保持在或高于某一水平,则患者具有稳定的因子IX活性水平。任选地,用多核苷酸、病毒颗粒或组合物施用的患者可以具有至少20%、至少25%、至少30%或至少35%的稳定的因子IX活性水平。任选地,用多核苷酸、病毒颗粒或组合物施用的患者可以具有至少或约40%的稳定的因子IX活性水平。
任选地,从多核苷酸、病毒颗粒或组合物施用的至少10周、至少15周、至少20周、至少30周、至少40周或至少50周后,因子IX活性水平是稳定的。例如,当从用多核苷酸、病毒颗粒或组合物施用至患者的至少10周后,患者具有至少20%的稳定的因子IX活性水平时,则存在在开始施用至少10周后连续至少5周、至少10周、至少15周、至少20周、至少30周或至少40周或至少50周的持续时间内保持至少20%的至少20%的因子IX活性水平。任选地,患者在从多核苷酸、病毒颗粒或组合物施用的至少10周后具有稳定的因子IX活性水平,并且因子IX活性水平在至少20周或至少40周(在从施用的最初至少10周后)的连续时间内保持在或高于一定水平。任选地,施用的至少10周、至少15周、至少20周、至少30周或至少40周后,稳定的因子IX活性水平可以为至少20%、至少25%、至少30%或至少35%。任选地,施用的至少10周、至少15周、至少20周、至少30周或至少40周后,稳定的因子IX活性水平可以为至少或约40%。在一些实施方案中,在多核苷酸、病毒颗粒或组合物的施用的至少10周后患者具有至少20%的稳定的因子IX活性水平,并且因子IX活性水平在至少20周或至少40周(在从施用的最初至少10周后)的连续时间内保持在至少20%。在一些实施方案中,在多核苷酸、病毒颗粒或组合物的施用的至少10周后患者具有至少40%的稳定的因子IX活性水平,并且因子IX活性水平在至少20周或至少40周(在从施用的最初至少10周后)的连续时间内保持在至少40%。
任选地,在多核苷酸、病毒颗粒或组合物的施用后至少10、至少20、至少30、至少40或至少50周的时间点,因子IX活性水平在或高于某个水平(例如20%,25%,30%,35%或40%)。例如,在多核苷酸、病毒颗粒或组合物的施用后约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51或52周的时间点,因子IX的活性水平在或高于某个水平(例如20%、25%、30%、35%或40%)。任选地,在施用多核苷酸、病毒颗粒或组合物后约10周的时间点,因子IX活性水平为至少20%。任选地,在施用多核苷酸、病毒颗粒或组合物后约10周的时间点,因子IX活性水平为至少25%。任选地,在施用多核苷酸、病毒颗粒或组合物后约10周的时间点,因子IX活性水平为至少40%。任选地,在施用多核苷酸、病毒颗粒或组合物后约20周的时间点,因子IX活性水平为至少20%。任选地,在施用多核苷酸、病毒颗粒或组合物后约20周的时间点,因子IX活性水平为至少25%。任选地,在施用多核苷酸、病毒颗粒或组合物后约20周的时间点,因子IX活性水平为至少或约40%。任选地,在施用多核苷酸、病毒颗粒或组合物后约52周的时间点,因子IX活性水平为至少20%。任选地,在施用多核苷酸、病毒颗粒或组合物后约52周的时间点,因子IX活性水平为至少25%。任选地,在施用多核苷酸、病毒颗粒或组合物后约52周的时间点,因子IX活性水平为至少或约40%。
当因子IX活性水平在施用多核苷酸、病毒颗粒或组合物后至少10、至少20、至少30、至少40或至少50周的时间点在或高于某个水平(例如20%、25%、30%、35%或40%)时,因子IX活性水平也可以是稳定的。在其中因子IX活性水平也是稳定的此类实施方案中,至少5周(或至少10、至少15、至少20、至少30或至少40或至少50周)的连续时间可以紧接在多核苷酸、病毒颗粒或组合物的施用后至少10、至少20、至少30、至少40或至少50周的时间点之前、包含在其中或紧接在之后。任选地,在施用多核苷酸、病毒颗粒或组合物后约10周的时间点,因子IX活性水平为至少20%,并且因子IX活性水平在紧接该时间点之后的至少40周的连续时间内保持至少20%。任选地,在施用多核苷酸、病毒颗粒或组合物后约10周的时间点,因子IX活性水平为至少25%,并且因子IX活性水平在紧接该时间点之后的至少40周的连续时间内保持至少25%。任选地,在施用多核苷酸、病毒颗粒或组合物后约10周的时间点,因子IX活性水平为至少40%,并且因子IX活性水平在紧接该时间点之后的至少40周的连续时间内保持至少40%。任选地,在施用多核苷酸、病毒颗粒或组合物后约52周的时间点,因子IX活性水平为至少20%,并且因子IX活性水平在紧接该时间点之后的至少40周的连续时间内保持至少20%。任选地,在施用多核苷酸、病毒颗粒或组合物后约52周的时间点,因子IX活性水平为至少25%,并且因子IX活性水平在紧接该时间点之后的至少40周的连续时间内保持至少25%。任选地,在施用多核苷酸、病毒颗粒或组合物后约52周的时间点,因子IX活性水平为至少40%,并且因子IX活性水平在紧接该时间点之后的至少40周的连续时间内保持至少40%。
在诸如人患者的患者中,因子IX活性可以通过从患者采集血液样品或通过对从患者采集的血液样品执行测定法来进行测量。
任选地,可以使用凝血测定法来测量因子IX活性水平。任选地,凝血结测定法是一阶段凝血测定法。任选地,凝血测定法(例如一阶段凝血分析)使用SynthASilTM试剂盒。在一个实例中,合适的凝血测定法(一阶段凝血测定法)如下文所述。
由于因子IX是凝血级联的一部分,因此具有增强的活性的因子IX多肽将比具有较低活性的因子IX多肽更快地催化血液凝结。将因子IX多肽与贫血小板血浆混合,并在37℃下孵育。然后添加磷脂和接触活化途径活化剂,例如SynthASilTM APTT(活化的部分促凝血酶原激酶时间)试剂。然后添加钙,并且用户测量发生凝结所花费的时间。凝结形成可以使用分光光度法或电磁钢球法进行评估。例如,当混合物的光密度超过一定阈值或当混合物已经充分凝结以改变磁球的运动(这由传感器检测)时,可以认为已经发生凝结形成。
任选地,使用SynthASilTM一阶段凝血测定试剂盒测量因子IX活性,以确定血液样品中的因子IX活性。
任选地,患者是使用具有比由包含(i)SEQ ID NO:4或5的因子IX核苷酸序列和(ii)SEQ ID NO:6的转录调节元件的病毒颗粒表达的因子IX的活性更低的活性的因子IX难治的患者。任选地,患者是使用以比由包含(i)SEQ ID NO:4或5的因子IX核苷酸序列和(ii)SEQ ID NO:6的转录调节元件的核苷酸序列编码的水平更低的水平表达的因子IX多肽难治的患者。如实施例中所示,包含(i)SEQ ID NO:4或5的因子IX核苷酸序列和(ii)SEQ ID NO:6的转录调节元件的病毒颗粒以更高的水平表达因子IX多肽,并且与从其他因子IX核苷酸序列表达的多肽相比,所述多肽具有更高的活性。因此,包含(i)SEQ ID NO:4或5的因子IX核苷酸序列和(ii)SEQ ID NO:6的转录调节元件的病毒颗粒可用于治疗需要较高水平的因子IX、较低剂量的病毒颗粒或难以从包含替代因子IX核苷酸序列的病毒颗粒表达因子IX的患者,例如失去部分肝脏因此从肝细胞表达高水平的因子IX核苷酸序列的能力较弱的患者。
任选地,该方法或用途包括类固醇的预防性共同施用,即向患者施用适当剂量的类固醇。共同施用可以是伴随的,即患者在接受一定剂量的本发明的多核苷酸、载体或组合物的同时接受一定剂量的类固醇。或者,可在将本发明的多核苷酸、载体或组合物施用至患者之前或之后施用类固醇。任选地,在向患者施用本发明的多核苷酸、载体或组合物后6至12周施用类固醇。
任选地,类固醇选自泼尼松、贝他米松、泼尼松龙、曲安西龙、甲基泼尼松龙和地塞米松。任选地,类固醇是泼尼松龙。
序列表
表3
实施例
在以下实施例中,用携带FIX转基因盒ssLP1、FIXco(本文的FIXco)、ssHLP2.TI-codop-FIX-GoF(本文的HTFG)和ssHLP2.TI-ACNP-FIX-GoF(本文的HTAG)的重组AAV进行实验。SsHLP2.TI-codop-FIX-GoF是WO2016/075473中公开的ssHLP2.TI-codop-FIX构建体的被修改为在编码的FIX多肽的位置384处编码亮氨酸(L)而不是精氨酸(R)的形式。这些盒在图1中示出。ssLP1.FIXco包含经完全密码子优化的FIX编码序列(SEQ ID NO:12),其5'之前是SV40内含子,其表达由LP1启动子(SEQ ID NO:7)驱动。ssHLP2.TI-codop-FIX-GoF和ssHLP2.TI-ACNP-FIX-GoF共有在FIX编码序列的5'具有较短的HLP2转录调节元件(SEQ IDNO:6)的结构,该编码序列被天然内含子1A的截短形式中断,并且其中外显子1和外显子2核苷酸序列的一部分为野生型(未经密码子优化),其余编码序列是经密码子优化的(对于HTFG为SEQ ID NO:18,和对于HTAG为SEQ ID NO:5)。经密码子优化的部分的核苷酸序列在各自的两个构建体之间不同。与ssLP1.FIXco编码的野生型FIX蛋白不同,ssHLP2.TI-codop-FIX-GoF和ssHLP2.TI-ACNP-FIX-GoF编码在FIX多肽的位置384处具有精氨酸(R)至亮氨酸(L)的取代的过度活性FIX。
实施例1-方法
AAV载体产生和定量
1.AAV载体原液是通过人胚胎肾脏(HEK293)细胞与由载体基因组质粒、腺病毒辅助质粒和包含AAV Rep和Cap(AAV8或AAVMut C)功能的包装质粒组成的质粒的组合的标准三重质粒转染制备的。由于重组AAV颗粒包含基于AAV2的基因组,以及来自血清型8的衣壳或包含来自两种血清型的部分的合成衣壳(“Mut C”;SEQ ID NO:10),因此将它们称为“假型”。
2.通过使用碘克沙醇的密度梯度离心纯化载体。
3.通过使用针对启动子区域的引物的qPCR滴定载体基因组。
体外转导和FIX表达的检测
1.将HUH7细胞以每孔5×105个细胞接种在12孔板中。
2.然后用丝裂霉素C刺激细胞1小时,然后用携带编码FIX的转基因盒的AAV颗粒转导。
3.转导后五天,收集上清液,并使用市售ELISA试剂盒(Stago Asserachrom IX:Ag试剂盒Ref#00943)分析FIX的水平。使用来自Quadratech的市售生色试剂盒(Biophen FIX(6)试剂盒Ref#221806)分析FIX的活性。
4.根据制造商的说明,使用Qiagen DNeasy血液和组织试剂盒(Ref#69506)提取载体基因组DNA,并通过qPCR进行定量。
体内FIX检测
1.通过尾静脉向成年C57BL/6小鼠注射5×1010个携带编码FIX的转基因盒的AAV颗粒的载体基因组(vg)(每组n=4)。
2.注射后两周麻醉小鼠,并通过心脏穿刺收集血液,将其添加到柠檬酸钠(1/10稀释)中,并在4℃下以3000xg离心15分钟以收集血浆,将其冷冻在-80℃以用于分析。
3.收获肝脏并在液氮中速冻,然后保存在-80℃下用于DNA提取(Qiagen DNeasy血液和组织试剂盒,Ref#69506)以用于载体基因组分析。
4.使用FIX ELISA试剂盒(Stago Asserachrom IX:Ag试剂盒REF 00943)测定鼠血浆中存在的FIX的水平。使用来自Quadratech的市售生色试剂盒(Biophen FIX(6)试剂盒Ref#221806)测定人FIX的活性。
实施例2-使用ELISA分析体外FIX转基因表达
在标准细胞培养条件下培养HUH7(人肝细胞)细胞。FIX转基因通过用丝裂霉素C处理HUH7细胞1小时,然后用假型ssAAV2/Mut C转导来表达。首先通过除AAV辅助和包装质粒以外还用重组载体基因组质粒转染HEK293细胞并再培养48小时来产生AAV颗粒。通过密度梯度离心和碘克沙醇从HEK293细胞纯化ssAAV2/Mut C载体。使用针对转基因表达盒的启动子区域的引物通过qPCR对载体基因组进行滴定。通过测量转导后5天的FIX水平,比较FIX表达盒以确定它们在体外表达FIX转基因的相对能力。被评估的载体是ssAAV2/MutC.HLP2.TI-codop-FIX-GoF和ssAAV2/Mut C.HLP2.TI-ACNP-FIX-GoF。通过使用市售的ELISA试剂盒(Stago Asserachrom IX:Ag试剂盒Ref#00943)分析培养上清液中的FIX水平。在两个单独的实验中(参见图2B和4B),使用Qiagen DNeasy血液和组织试剂盒(Ref#69506)收获HUH7细胞DNA后,将FIX表达水平(如使用HUH7培养细胞的上清液的ELISA测定得出的)针对每个细胞的载体基因组拷贝数进行标准化。
用1×103个载体基因组(vg)的MOI的ssAAV2/Mut C.HLP2.TI-codop-FIX-GoF和ssAAV2/Mut C.HLP2.TI-ACNP-FIX-GoF转导后5天,FIX水平在ssAAV2/Mut C.HLP2.TI-ACNP-FIX-GoF转导的HUH7细胞中比在ssAAV2/Mut C.HLP2.TI-codop-FIX-GoF转导的HUH7细胞中更高(n=2;图2A、3和4A)。类似地,当在MOI增加(5×103和1×104)的HUH7细胞中进行相同的FIX表达测定时,FIX水平在ssAAV2/Mut C.HLP2.TI-ACNP-FIX-GoF转导的细胞中比在ssAAV2/Mut C.HLP2.TI-codop-FIX-GoF转导的细胞中更高(n=2;图2A、3和4A)。当针对每个细胞的病毒载体基因组拷贝数对FIX表达水平进行标准化时,在测试的三个MOI(1×103、5×103和1×104)的每个中,相对于ssAAV2/MutC.HLP2.TI-codop-FIX-GoF,ssAAV2/MutC.HLP2.TI-ACNP-FIX-GoF转导的HUH7细胞中的FIX水平始终较高(n=2;图2B和4B)。当将来自图2、3和4的实验的5×103转导数据组合时,相对于ssAAV2/Mut C.HLP2.TI-codop-FIX-GoF,显示了来自ssAAV2/Mut C.HLP2.TI-ACNP-FIX-GoF的明显优异表达(图5)。
实施例3-体外FIX转基因活性的分析
通过收获HUH7细胞上清液并使用BIOPHEN Factor IX试剂盒(Quadratech#221806、#222101、#223201)来评估FIX活性。在体外比较部分密码子优化的FIX转基因(HLP2.TI-codop-FIX-GoF和HLP2.TI-ACNP-FIX-GoF),以确定(MOI为1×103、5×103和1×104)的HUH7细胞的ssAAV2/Mut C转导后的相对FIX活性。转导后5天从HUH7细胞分离上清液,并使用BIOPHEN Factor IX试剂盒测定FIX活性。无论MOI如何,在由ssAAV2/MutC.HLP2.TI-ACNP-FIX-GoF转导的细胞衍生的上清液中观察到更高的平均FIX活性(图6-8)。当将来自图6和7的实验的5×103转导数据组合时,相对于ssAAV2/MutC.HLP2.TI-codop-FIX-GoF,显示了来自ssAAV2/Mut C.HLP2.TI-ACNP-FIX-GoF的明显优异表达(图9)。
实施例4-使用ELISA分析体内FIX转基因表达
在使用5×1010个假型ssAAV2/8载体的载体基因组(vg)通过尾静脉注射进行转导后,FIX转基因在C57Bl/6小鼠中表达。首先通过除AAV辅助和包装质粒以外还用重组载体基因组质粒转染HEK293细胞并再培养48小时来产生AAV颗粒。通过密度梯度离心和碘克沙醇从HEK293细胞纯化ssAAV2/8载体。使用针对转基因表达盒的启动子区域的引物通过qPCR对载体基因组进行滴定。比较FIX表达盒LP1.FIXco、HLP2.TI-codop-FIX-GoF和HLP2.TI-ACNP-FIX-GoF,以确定它们表达FIX转基因的相对能力。
在涉及ssAAV2/8.HLP2.TI-codop-FIX-GoF和ssAAV2/8.LP1.FIXco的第一个实验中,给药后2周,通过心脏穿刺从经麻醉的小鼠收集血液。随后,通过添加柠檬酸钠(1/10稀释)分离血浆,并在4℃以3000×g离心15分钟。使用FIX ELISA试剂盒(Stago AsserachromIX:Ag试剂盒Ref#00943)测定FIX的循环水平。
在收获小鼠肝脏后,将FIX表达水平针对每个细胞的载体基因组拷贝数进行标准化。相对于ssAAV2/8.LP1.FIXco,使用ssAAV2/8.HLP2.TI-codop-FIX-GoF转导后,标准化的FIX表达水平被确定为显著更高(p<0.05)(n=4只小鼠;图10)。
在进一步的实验中,在体内比较部分密码子优化的FIX转基因(HLP2.TI-codop-FIX-GoF和HLP2.TI-ACNP-FIX-GoF),以确定使用ssAAV2/8的C57Bl/6小鼠转导后的相对FIX表达。同时,在用scAAV2/8.LP1.FIXco载体转导C57Bl/6小鼠后确定FIX表达。给药后3周从小鼠分离血浆,并使用ELISA测定法测定FIX抗原水平。在用scAAV2/8.LP1.FIXco转导的小鼠中平均FIX表达水平最低,而在用ssAAV2/8.HLP2.TI-codop-FIX-GoF转导的小鼠中水平更高(n=4只小鼠;图11A)。用ssAAV2/8.HLP2.TI-ACNP-FIX-GoF转导的小鼠比用ssAAV2/8.HLP2.TI-codop-FIX-GoF转导的小鼠具有显著更高的FIX表达(n=4只小鼠;图11A)。当针对每个细胞的病毒载体基因组拷贝数对FIX表达水平进行标准化时,FIX表达的趋势得以保持,从而ssAAV2/8.HLP2.TI-ACNP-FIX-GoF产生的FIX比ssAAV2/8.HLP2.TI-codop-FIX-GoF和scAAV2/8.LP1.FIXco明显更多(n=4;图11B)。此外,ssAAV2/8.HLP2.TI-codop-FIX-GoF比scAAV2/8.LP1.FIXco表现出更高的FIX表达(n=4只小鼠;图11B)。
实施例5-体内FIX转基因活性的分析
BIOPHEN因子IX试剂盒(Quadratech#221806,#222101,#223201)是用于使用手动生色法测量人柠檬酸血浆或IX浓缩物中的因子IX活性的生色测定法。
在存在凝血酶、磷脂和钙的情况下,在测定中以恒定浓度和过量提供的第一因子XIa将存在于测试样品中的FIX活化为FIXa,其与也以恒定浓度和过量提供的凝血酶活化的因子VIII:C、磷脂(PLP)和钙形成酶复合物,其将测定系统中存在的X因子活化为Xa因子。该活性与因子IX的量(其是限制因素)直接相关。然后,通过其在因子Xa生色底物(SXa-11)上的比活性来精确测量生成的因子Xa。因子Xa裂解底物并释放pNA。产生的pNA的量与因子IXa活性直接成比例。最后,在测定的样品中的因子IX的量与所产生的因子Xa活性之间存在直接关系,该活性通过释放的pNA的量来测量,该释放的pNA的量通过405nm处的显色测定。
在体内比较部分密码子优化的FIX转基因(HLP2.TI-codop-FIX-GoF和HLP2.TI-ACNP-FIX-GoF),以确定在用ssAAV2/8进行C57Bl/6小鼠转导后的相对FIX活性。同时,用scAAV2/8.LP1.FIXco转导C57Bl/6小鼠后测定FIX活性。给药后3周从小鼠分离血浆,并使用BIOPHEN Factor IX试剂盒测定FIX活性。在用scAAV2/8.LP1.FIXco转导的小鼠中,平均FIX活性最低,而在用ssAAV2/8.HLP2.TI-codop-FIX-GoF转导的小鼠中,活性更高(n=4只小鼠;图12)。用ssAAV2/8.HLP2.TI-ACNP-FIX-GoF转导的小鼠比用ssAAV2/8.HLP2.TI-codop-FIX-GoF转导的小鼠具有明显更高的FIX活性(n=4只小鼠;图12)。
实施例6
两名B型血友病患者用4.5×1011vg/kg的含有ssHLP2.HTAG的AAV2/Mut C载体治疗。两名患者均已知在筛查时患有严重的B型血友病,其中内源性FIX活性<1%。患者1在基线接受预防治疗,并在研究的前四天持续这样。接受含有ssHLP2.HTAG的AAV2/Mut C载体的单次输注的4周内,两名患者实现>30%的FIX活性水平。如通过使用SynthASilTM试剂盒的一阶段凝血测定法评估的,患者在52周时实现了40.5+/-4.5%的稳定的因子IX活性水平。在第6至12周期间施用预防性类固醇(泼尼松龙)。
两名患者均未经历过自发性或长期出血事件。患者1在治疗后第10周因右手指割伤而具有外伤性出血。重要的是,患者不需要任何外源性凝血因子,并且事件在同一天解决。事件发生时患者的FIX活性被测量为38%。
本文所述的发明还涉及以下方面:
1.一种包含因子IX核苷酸序列的多核苷酸,其中所述因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列,并且其中所述编码序列的一部分不是野生型的。
2.方面1的多核苷酸,其中所述编码序列的非野生型部分是经密码子优化的。
3.一种包含因子IX核苷酸序列的多核苷酸,其中所述因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列,并且所述编码序列包括:
(i)与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;和
(ii)与SEQ ID NO:15至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
4.方面3的多核苷酸,其中与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%或至少99.8%相同的序列是经密码子优化的。
5.一种包含因子IX核苷酸序列的多核苷酸,其中所述因子IX核苷酸序列编码因子IX蛋白或其片段,并且与SEQ ID NO:5具有至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%的同一性。
6.方面5的多核苷酸,其中所述因子IX核苷酸序列包含编码序列,并且所述编码序列的一部分是经密码子优化的。
7.前述方面中任一项的多核苷酸,其中所述多核苷酸包含DNA或RNA。
8.方面2、4、6或7中任一项的多核苷酸,其中经密码子优化的编码序列的部分是连续部分。
9.方面2、4、6、7或8的多核苷酸,其中经密码子优化的编码序列的部分是针对在人肝中的表达而进行密码子优化的。
10.前述方面中任一项的多核苷酸,其中由因子IX核苷酸序列编码的多肽在人肝细胞中以比参考野生型因子IX核苷酸序列更高的水平表达。
11.方面2、4、6或7中任一项的多核苷酸,其中经密码子优化的编码序列的部分的长度为至少800、至少900、至少1100、少于1500、少于1300、少于1200、800至1500、900至1300、1100至1200或约1191个核苷酸。
12.方面2、4或6-11中任一项的多核苷酸,其中经密码子优化的编码序列的部分包含以下的1、2、3、4、5种或全部:
a)外显子3或外显子3的至少10、至少15、至少20、少于25、10至25、15至25或20至25个核苷酸的部分;
b)外显子4或外显子4的至少80、至少90、至少100、少于114、80至114、90至114、100至114的核苷酸的部分;
c)外显子5或外显子5的至少90、至少100、至少110、少于129、90至129、100至129或110至129个核苷酸的部分;
d)外显子6或外显子6的至少150、至少180、至少200、少于203、150至203、180至203或200至203个核苷酸的部分;
e)外显子7或外显子7的至少70、至少80、至少90、至少100、少于115、70至115、80至115、90至115或100至115个核苷酸的部分;和/或
f)外显子8或外显子8的至少400、至少450、至少500、少于548、400至548、450至548或500至548个核苷酸的部分。
13.方面12的多核苷酸,其中经密码子优化的编码序列的部分包含a)、b)、c)、d)、e)和f)。
14.方面12或方面13的多核苷酸,其中经密码子优化的编码序列的部分包含外显子3的至少20个核苷酸的部分、外显子4的至少100个核苷酸的部分、外显子5的至少110个核苷酸的部分、外显子6的至少180个核苷酸、外显子7的至少100个核苷酸的部分和外显子8的至少500个核苷酸的部分。
15.方面12-14中任一项的多核苷酸,其中经密码子优化的编码序列的部分包含外显子3、外显子4、外显子5、外显子6、外显子7和外显子8。
16.方面2、4或6-15中任一项的多核苷酸,其中经密码子优化的编码序列的部分包含外显子2的一部分,外显子2的该部分的长度为少于160、少于150、少于100、少于75、少于60、至少20、至少30、至少40、至少50、20至160、30至150、30至100、40至75或约56个核苷酸。
17.方面2、4或6-16中任一项的多核苷酸,其中经密码子优化的编码序列的部分包含长度为30至100个核苷酸的外显子2的一部分。
18.方面2、4或6-17中任一项的多核苷酸,其中与参考野生型因子IX序列的相应部分相比,经密码子优化的编码序列的部分包含减少数量的CpG。
19.方面18的多核苷酸,其中经密码子优化的编码序列的部分包含少于40、少于20、少于18、少于10、少于5或少于1个CpG。
20.方面18或19的多核苷酸,其中经密码子优化的编码序列的部分不含CpG。
21.方面2、4或6-20中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中,至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%或至少73%的密码子选自:
a)TTC;
b)CTG;
c)ATC;
d)GTG;
e)GTC;
f)AGC;
g)CCC;
h)ACC;
i)GCC;
j)TAC;
k)CAC;
l)CAG;
m)AAC;
n)AAA;
o)AAG;
p)GAC;
q)TGC;
r)AGG;
s)GGC;和
t)GAG。
22.方面2、4或6-21中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1、至少2、至少4或至少5个编码苯丙氨酸的密码子被TTC取代;
b)至少60%、至少65%或至少70%的编码苯丙氨酸的密码子是TTC;
c)至少60%、至少65%或至少70%的编码苯丙氨酸的密码子是TTC,其余是TTT;和/或
d)编码苯丙氨酸的密码子是TTC,除非下一个密码子以G开头。
23.方面2、4或6-22中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少10、至少15或至少16个编码亮氨酸的密码子被CTG取代;
b)至少90%或至少94%的编码亮氨酸的密码子是CTG;和/或
c)至少90%或至少94%的编码亮氨酸的密码子是CTG,其余是CTC。
24.方面2、4、6-23中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少10、至少11或至少12个编码异亮氨酸的密码子被ATC取代;
b)与参考野生型因子IX序列相比,至少一个ATC密码子被ATT取代,其中下一个密码子以G开头;
c)至少60%、至少70%或至少75%的编码异亮氨酸的密码子是ATC;
d)至少60%、至少70%或至少75%的编码异亮氨酸的密码子是ATC,其余是ATT;和/或
e)编码异亮氨酸的密码子是ATC,除非下一个密码子以G开头。
25.方面2、4或6-24中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少10、至少15、至少20或至少25个编码缬氨酸的密码子被GTG取代;
b)与参考野生型因子IX序列相比,至少1个编码缬氨酸的密码子被GTC取代;
c)至少80%、至少90%或至少95%的编码缬氨酸的密码子是GTG;和/或
d)至少80%、至少90%或至少95%的编码缬氨酸的密码子是GTG,其余是GTC。
26.方面2、4或6-25中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少10、至少12或至少13个编码丝氨酸的密码子被AGC取代;
b)与参考野生型因子IX序列相比,至少1、至少2或至少4个编码丝氨酸的密码子被TCT取代,其中下一个密码子以G开头;
c)至少60%、至少65%或至少70%的编码丝氨酸的密码子是AGC;和/或
d)至少60%、至少65%或至少70%的编码丝氨酸的密码子是AGC,其余是TCT或TCC。
27.方面2、4或6-26中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1、至少2或至少5个编码脯氨酸的密码子被CCC取代;
b)与参考野生型因子IX序列相比,至少1个编码脯氨酸的密码子被CCT取代,其中下一个密码子以G开头;
c)至少50%、至少55%或至少60%的编码脯氨酸的密码子是CCC;
d)50%、至少55%或至少60%的编码脯氨酸的密码子为CCC,其余是CCA或CCT;和/或
e)编码脯氨酸的密码子是CCC,除非下一个密码子以G开头。
28.方面2、4或6-27中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少6、至少7、至少8或至少10个编码苏氨酸的密码子被ACC取代;
b)与参考野生型因子IX序列相比,至少1或至少2个编码苏氨酸的密码子被ACT取代,其中下一个密码子以G开头;
c)至少45%、至少50%或至少55%的编码苏氨酸的密码子是ACC;
d)至少45%、至少50%或至少55%的编码苏氨酸的密码子是ACC,其余是ACT;和/或
e)编码苏氨酸的密码子是ACC,除非下一个密码子以G开头。
29.方面2、4或6-28中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1、至少2、至少3或至少4个编码丙氨酸的密码子被GCC取代;
b)与参考野生型因子IX序列相比,至少1、至少2或至少3个编码丙氨酸的密码子被GCT取代,其中下一个密码子以G开头;
c)至少35%、至少40%或至少43%的编码丙氨酸的密码子是GCC;
d)至少35%、至少40%或至少45%的编码丙氨酸的密码子是GCC,其余是GCT;和/或
e)编码丙氨酸的密码子是GCC,除非下一个密码子以G开头。
30.方面2、4或6-29中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1或至少2个编码酪氨酸的密码子被TAC取代;
b)与参考野生型因子IX序列相比,至少1个TAC密码子被TAT取代,其中下一个密码子以G开头;
c)至少40%、至少45%或至少48%的编码酪氨酸的密码子是TAC;
d)至少40%、至少45%或至少48%的编码酪氨酸的密码子是TAC,其余是TAT;和/或
e)编码酪氨酸的密码子是TAC,除非下一个密码子以G开头。
31.方面2、4或6-30中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1个编码组氨酸的密码子被CAC取代;
b)至少50%、至少60%或至少65%的编码组氨酸的密码子是CAC;
c)至少50%、至少60%或至少65%的编码组氨酸的密码子是CAC,其余是CAT;和/或
d)编码组氨酸的密码子是CAC,除非下一个密码子以G开头。
32.方面2、4或6-31中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1、至少2、至少4或至少5个编码谷氨酰胺的密码子被CAG取代;
b)与参考野生型因子IX序列相比,至少1个CAG密码子被CAA取代;
c)至少80%、至少85%或至少90%的编码谷氨酰胺的密码子是CAG;和/或
d)至少80%、至少85%或至少90%的编码谷氨酰胺的密码子是CAG,其余是CAA。
33.方面2、4或6-32中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1、至少2、至少4或至少5个编码天冬酰胺的密码子被AAC取代;
b)至少60%、至少65%或至少70%的编码天冬酰胺的密码子是AAC;
c)至少60%、至少65%或至少70%的编码天冬酰胺的密码子是AAC,其余是AAT;和/或
d)编码天冬酰胺的密码子是AAC,除非下一个密码子以G开头。
34.方面2、4或6-33中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少7、至少8或至少9个编码赖氨酸的密码子被AAG取代;
b)与参考野生型因子IX序列相比,至少1个AAG密码子被AAA取代。
c)至少80%、至少90%或至少95%的编码赖氨酸的密码子是AAG;和/或
d)至少80%、至少90%或至少95%的编码赖氨酸的密码子是AAG,其余的是AAA。
35.方面2、4或6-34中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少1、至少2、至少3或至少4个编码天冬氨酸的密码子被GAC取代;
b)与参考野生型因子IX序列相比,其中至少1个GAC密码子被GAT取代,其中下一个密码子以G开头;
c)至少45%、至少50%或至少60%的编码天冬氨酸的密码子是GAC;
d)至少45%、至少50%或至少60%的编码天冬氨酸的密码子是GAC,其余是GAT;和/或
e)编码天冬氨酸的密码子是GAC,除非下一个密码子以G开头。
36.方面2、4或6-35中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少15、至少20、至少25或至少26个编码谷氨酸的密码子被GAG取代;
b)至少80%、至少90%或至少95%的编码谷氨酸的密码子是GAG;和/或
c)至少80%、至少90%或至少95%的编码谷氨酸的密码子是GAG和其余的是GAA。
37.方面2、4或6-36中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少6、至少7或至少8个编码半胱氨酸的密码子被TGC取代;
b)与参考野生型因子IX序列相比,至少1个TGC密码子被TGT取代,其中下一个密码子以G开头;
c)至少40%、至少50%或至少55%的编码半胱氨酸的密码子是TGC;
d)至少40%、至少50%或至少55%的编码半胱氨酸的密码子是TGC,其余是TGT;和/或
e)编码半胱氨酸的密码子是TGC,除非下一个密码子以G开头。
38.方面2、4或6-37中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中,编码色氨酸的密码子是TGG。
39.方面2、4或6-38中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少8、至少10或至少11个编码精氨酸的密码子被AGG取代;
b)与参考野生型因子IX序列相比,至少1个编码精氨酸的密码子被AGA取代;
c)至少60%、至少70%或至少75%的编码精氨酸的密码子是AGG;和/或
d)至少60%、至少70%或至少75%的编码精氨酸的密码子是AGG,其余是AGA。
40.方面2、4或6-39中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
a)与参考野生型因子IX序列相比,至少5、至少10、至少12或至少13个编码甘氨酸的密码子被GGC取代;
b)与参考野生型因子IX序列相比,至少5、至少6、至少7或至少8个编码甘氨酸的密码子被GGG取代,其中下一个密码子以G开头。
c)至少50%、至少55%或至少60%的编码甘氨酸的密码子是GGC;
d)至少50%、至少55%或至少60%的编码甘氨酸的密码子是GGC,其余的是GGG;和/或
e)编码甘氨酸的密码子是GGC,除非下一个密码子以G开头。
41.方面2、4或6-40中任一项的多核苷酸,其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子。
42.方面2、4或6-41中任一项的多核苷酸,其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子,并且在密码子优化的部分中:
a)与参考野生型因子IX序列相比,至少5个编码苯丙氨酸的密码子被TTC取代;
b)与参考野生型因子IX序列相比,至少16个编码亮氨酸的密码子被CTG取代;
c)与参考野生型因子IX序列相比,至少12个编码异亮氨酸的密码子被ATC取代;
d)与参考野生型因子IX序列相比,至少25个编码缬氨酸的密码子被GTG取代;
e)与参考野生型因子IX序列相比,至少13个编码丝氨酸的密码子被AGC取代;
f)与参考野生型因子IX序列相比,至少5个编码脯氨酸的密码子被CCC取代;
g)与参考野生型因子IX序列相比,至少10个编码苏氨酸的密码子被ACC取代;
h)与参考野生型因子IX序列相比,至少4个编码丙氨酸的密码子被GCC取代;
i)与参考野生型因子IX序列相比,至少2个编码酪氨酸的密码子被TAC取代;
j)与参考野生型因子IX序列相比,至少1个编码组氨酸的密码子被CAC取代;
k)与参考野生型因子IX序列相比,至少5个编码谷氨酰胺的密码子被CAG取代;
l)与参考野生型因子IX序列相比,至少5个编码天冬酰胺的密码子被AAC取代;
m)与参考野生型因子IX序列相比,至少9个编码赖氨酸的密码子被AAG取代;
n)与参考野生型因子IX序列相比,至少4个编码天冬氨酸的密码子被GAC取代;
o)与参考野生型因子IX序列相比,至少26个编码谷氨酸的密码子被GAG取代;
p)与参考野生型因子IX序列相比,至少8个编码半胱氨酸的密码子被TGC取代;
q)编码色氨酸的密码子是TGG;
r)与参考野生型因子IX序列相比,至少11个编码精氨酸的密码子被AGG取代;和
s)与参考野生型因子IX序列相比,至少13个编码甘氨酸的密码子被GGC取代。
43.方面2、4或6-42中任一项的多核苷酸,其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子,并且在密码子优化的部分中:
a)至少70%的编码苯丙氨酸的密码子是TTC;
b)至少94%的编码亮氨酸的密码子是CTG;
c)至少75%的编码异亮氨酸的密码子是ATC;
d)至少95%的编码缬氨酸的密码子是GTG;
e)至少70%的编码丝氨酸的密码子是AGC;
f)至少60%的编码脯氨酸的密码子是CCC;
g)至少55%的编码苏氨酸的密码子是ACC;
h)至少43%的编码丙氨酸的密码子是GCC;
i)至少48%的编码酪氨酸的密码子是TAC;
j)至少65%的编码组氨酸的密码子是CAC;
k)至少90%的编码谷氨酰胺的密码子是CAG;
l)至少70%的编码天冬酰胺的密码子是AAC;
m)至少95%的编码赖氨酸的密码子是AAG;
n)至少60%的编码天冬氨酸的密码子是GAC;
o)至少95%的编码谷氨酸的密码子是GAG;
p)至少55%的编码半胱氨酸的密码子是TGC;
q)编码色氨酸的密码子是TGG;
r)至少75%的编码精氨酸的密码子是AGG;和
s)至少60%的编码甘氨酸的密码子是GGC。
44.方面2、4或6-43中任一项的多核苷酸,其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子,并且在密码子优化的部分中:
a)至少70%的编码苯丙氨酸的密码子是TTC,其余是TTT;
b)至少94%的编码亮氨酸的密码子是CTG,其余是CTC;
c)至少75%的编码异亮氨酸的密码子是ATC,其余是ATT;
d)至少95%的编码缬氨酸的密码子是GTG;
e)至少70%的编码丝氨酸的密码子是AGC;
f)至少60%的编码脯氨酸的密码子是CCC,其余是CCA或CCT;
g)至少55%的编码苏氨酸的密码子是ACC,其余是ACT;
h)至少43%的编码丙氨酸的密码子是GCC,其余是GCT;
i)至少48%的编码酪氨酸的密码子是TAC,其余是TAT;
j)至少65%的编码组氨酸的密码子是CAC,其余的是CAT;
k)至少90%的编码谷氨酰胺的密码子是CAG,其余的是CAA;
l)至少70%的编码天冬酰胺的密码子是AAC,其余的是AAT;
m)至少95%的编码赖氨酸的密码子是AAG,其余的是AAA;
n)至少60%的编码天冬氨酸的密码子是GAC,其余是GAT;
o)至少95%的编码谷氨酸的密码子是GAG,其余的是GAA;
p)至少55%的编码半胱氨酸的密码子是TGC,其余的是TGT;
q)编码色氨酸的密码子是TGG;
r)至少75%的编码精氨酸的密码子是AGG,其余是AGA;和
s)至少60%的编码甘氨酸的密码子是GGC,其余是GGG。
45.方面10-44中任一项的多核苷酸,其中所述参考野生型因子IX序列是SEQ IDNO:9或SEQ ID NO:19。
46.方面2、4或6-45中任一项的多核苷酸,其中经密码子优化的编码序列的部分与SEQ ID NO:1的至少800、至少900、至少1100、少于1191、少于1100、少于1000、800至1191、900至1191或约1191个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
47.方面46的多核苷酸,其中经密码子优化的编码序列的部分与SEQ ID NO:1至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
48.方面46或47的多核苷酸,其中经密码子优化的编码序列的部分与SEQ ID NO:1的900至1191个核苷酸的片段至少95%相同。
49.方面46-48中任一项的多核苷酸,其中经密码子优化的编码序列的部分与SEQID NO:1至少95%或至少98%相同。
50.前述方面中任一项的多核苷酸,其中所述编码序列包含未经密码子优化的部分。
51.方面50的多核苷酸,其中所述未经密码子优化的部分是至少100、至少150、至少170、至少190、少于250、少于225、少于200或约195个核苷酸。
52.方面50或51中任一项的多核苷酸,其中未经密码子优化的部分包含外显子1或外显子1的至少60、至少70、至少80、60至88、70至88或80至88个核苷酸。
53.方面50-52中任一项的多核苷酸,其中所述未经密码子优化的部分包含外显子2的至少50、至少75、至少80、至少90、至少100、少于140、少于120、50至140、75至120或约107个核苷酸的部分。
54.方面50-53中任一项的多核苷酸,其中所述未经密码子优化的部分包含CpG。
55.方面54的多核苷酸,其中未经密码子优化的部分每100个核苷酸包含至少1或至少2个CpG。
56.方面50-55中任一项的多核苷酸,其中未经密码子优化的部分包含选自以下的少于50%、少于45%、少于40%或少于35%的密码子:
a)TTC;
b)CTG;
c)ATC;
d)GTG;
e)GTC;
f)AGC;
g)CCC;
h)ACC;
i)GCC;
j)TAC;
k)CAC;
l)CAG;
m)AAC;
n)AAA;
o)AAG;
p)GAC;
q)TGC;
r)AGG;
s)GGC;和
t)GAG。
57.方面50-56中任一项的多核苷酸,其中所述未经密码子优化的部分与SEQ IDNO:15的至少100、至少150、至少175、少于195、少于190或少于180个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
58.方面57的多核苷酸,其中所述未经密码子优化的部分与SEQ ID NO:15至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
59.方面50-58中任一项的多核苷酸,其中未经密码子优化的部分是野生型。
60.方面50-59中任一项的多核苷酸,其中所述未经密码子优化的部分与SEQ IDNO:15至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
61.前述方面中任一项的多核苷酸,其中所述多核苷酸还包含中断编码序列的内含子或内含子片段。
62.方面61的多核苷酸,其中所述内含子或内含子片段是野生型因子IX内含子的一部分。
63.方面61或62的多核苷酸,其中所述内含子片段是少于500、少于400、少于350、少于300、至少100、至少200、至少250、至少290、100至500、200至400、250至350或约299个核苷酸。
64.方面61-63中任一项的多核苷酸,其中内含子片段与SEQ ID NO:3的至少100、至少200、至少250或至少290个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
65.方面61-64中任一项的多核苷酸,其中所述内含子或内含子片段与SEQ ID NO:3至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
66.方面65的多核苷酸,其中所述内含子或内含子片段与SEQ ID NO:3至少95%或至少98%相同。
67.方面61-66中任一项的多核苷酸,其中所述内含子或内含子片段中断未经密码子优化的部分。
68.方面67的多核苷酸,其中所述内含子或内含子片段侧接未经密码子优化的至少60、至少70、至少80、至少90或至少100个核苷酸。
69.方面68的多核苷酸,其中所述内含子或内含子片段侧接在5'端的未经密码子优化的110至120个核苷酸和在3'端的未经密码子优化的100至110个核苷酸。
70.方面61-69中任一项的多核苷酸,其中所述内含子或内含子片段位于外显子1和外显子2之间。
71.方面61-70中任一项的多核苷酸,其中所述内含子或所述内含子片段是天然内含子1的片段(内含子1a)。
72.前述方面中任一项的多核苷酸,其中所述多核苷酸还包含转录调节元件。
73.方面72的多核苷酸,其中所述转录调节元件包含肝脏特异性启动子。
74.方面72或方面73的多核苷酸,其中所述转录调节元件包含A1AT启动子或A1AT启动子的片段。
75.方面74的多核苷酸,其中A1AT启动子的片段的长度为至少100、至少120、至少150、至少180、少于255、100至255、150至225、150至300或180至255个核苷酸。
76.方面75的多核苷酸,其中A1AT启动子的片段的长度为150至300个核苷酸。
77.方面72-76中任一项的多核苷酸,其中所述转录调节元件包含增强子。
78.方面77的多核苷酸,其中所述增强子是HCR增强子或HCR增强子的片段。
79.方面78的多核苷酸,其中所述HCR增强子的片段的长度为至少80、至少90、至少100、少于192、80至192、90至192、100至250或117至192个核苷酸。
80.方面79的多核苷酸,其中所述HCR增强子的片段的长度为100至250个核苷酸。
81.方面72-80中任一项的多核苷酸,其中所述转录调节元件与SEQ ID NO:6至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
82.方面81的多核苷酸,其中所述转录调节元件具有SEQ ID NO:6的序列。
83.前述方面中任一项的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:13至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。
84.前述方面中任一项的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:13至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。
85.前述方面中任一项的多核苷酸,其中所述多核苷酸包含SEQ ID NO:13的增强子。
86.前述方面中任一项的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:14至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。
87.前述方面中任一项的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:14至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子。
88.前述方面中任一项的多核苷酸,其中所述多核苷酸包含SEQ ID NO:14的启动子。
89.前述方面中任一项的多核苷酸,其中所述因子IX核苷酸序列在对应于野生型因子IX的密码子384的位置处包含编码氨基酸的密码子,并且其中对应于野生型因子IX的密码子384的位置处的编码氨基酸的密码子编码丙氨酸或亮氨酸。
90.方面89的多核苷酸,其中在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子是CTX,其中X是任何核苷酸。
91.前述方面中任一项的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:5的至少1200、至少1350或至少1650个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的因子IX核苷酸序列。
92.前述方面中任一项的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:5至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的因子IX核苷酸序列。
93.前述方面中任一项的多核苷酸,其中:
(i)因子IX核苷酸序列包含与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;和(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子,其中在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子编码亮氨酸。
94.前述方面中任一项的多核苷酸,其中:
(i)因子IX核苷酸序列包含与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的编码序列;
(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子,其中在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子编码亮氨酸;和
(iii)多核苷酸包含与SEQ ID NO:14至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子元件和/或与SEQ ID NO:13至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。
95.前述方面中任一项的多核苷酸,其中:
(i)因子IX核苷酸序列包含与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;
(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子,其中在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子编码亮氨酸;和
(iii)多核苷酸包含与SEQ ID NO:6至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
96.前述方面中任一项的多核苷酸,其中:
(i)因子IX核苷酸序列包含与SEQ ID NO:1至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;
(ii)因子IX核苷酸序列包含与SEQ ID NO:2的相应部分至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;和(iii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子,其中在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子编码亮氨酸。
97.方面95或96中任一项的多核苷酸,其中所述因子IX核苷酸序列包含内含子或内含子片段,并且所述内含子片段与SEQ ID NO:3至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
98.前述方面中任一项的多核苷酸,其中:
(i)因子IX核苷酸序列包含编码序列,并且该编码序列的一部分未经密码子优化;和
(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子,其中在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子编码亮氨酸。
99.前述方面中任一项的多核苷酸,其中由因子IX核苷酸序列编码的多肽在人肝细胞中以与由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽相比更高的水平表达。
100.前述方面中任一项的多核苷酸,其中由因子IX核苷酸序列编码的多肽在人肝细胞中以与由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽相比更高的水平表达。
101.前述方面中任一项的多核苷酸,其中由因子IX核苷酸序列编码的多肽在人肝细胞中以由包含SEQ ID NO:12或SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:7或SEQID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达。
102.一种病毒颗粒,其包含重组基因组,所述重组基因组包含前述方面中任一项的多核苷酸。
103.方面102的病毒颗粒,其是AAV、腺病毒或慢病毒颗粒。
104.方面103的病毒颗粒,其是AAV病毒颗粒。
105.方面102-104中任一项的病毒颗粒,其中所述重组基因组还包含:
a)AAV2 ITR;
b)多聚A序列;
c)复制起点;和/或
d)两个可分辨的ITR。
106.方面105的病毒颗粒,其中所述重组基因组是单链的和/或包含两个可分辨的ITR。
107.方面102-106中任一项的病毒颗粒,其中所述病毒颗粒包含选自以下的衣壳:
(i)与SEQ ID NO:10具有至少96%、至少98%、至少99%、至少99.5%、至少99.8%同一性或100%同一性的衣壳;
(ii)与SEQ ID NO:17具有至少96%、至少98%、至少99%、99.5%、至少99.8%或100%同一性的衣壳;
(iii)AAVMutC;和
(iv)AAV5。
108.方面102-107中任一项的病毒颗粒,其中在转导到Huh7细胞中后,所述病毒颗粒表达具有比由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的病毒颗粒和/或包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段。
109.方面108的病毒颗粒,其中所述活性是使用对因子Xa具有特异性的生色底物测量的。
110.前述方面中任一项的多核苷酸或病毒颗粒,其中因子IX蛋白片段的长度为至少200、至少250、至少300、200至415、250至415或300至415个氨基酸。
111.前述方面中任一项的多核苷酸或病毒颗粒,其中因子IX蛋白或其片段包含:
a)与SEQ ID NO:8至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;或
b)与长度为至少200、至少250、至少300、200至415、250至415或300至415个氨基酸的SEQ ID NO:8的片段至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
112.一种组合物,其包含前述方面中任一项的多核苷酸或病毒颗粒和药学上可接受的赋形剂。
113.用于治疗方法的前述方面中任一项的多核苷酸、病毒颗粒或组合物。
114.方面113使用的多核苷酸、病毒颗粒或组合物,其中治疗方法包括向患者施用有效量的方面1-112中任一项的多核苷酸、组合物或病毒颗粒。
115.一种治疗方法,包括向患者施用有效量的方面1-112中任一项的多核苷酸、组合物或病毒颗粒。
116.方面1-112中任一项的多核苷酸、病毒颗粒或组合物在制备用于治疗方法的药物中的用途。
117.方面116的用途,其中所述治疗方法包括向患者施用有效量的方面1-112中任一项的多核苷酸、组合物或病毒颗粒。
118.方面113-117中任一项的多核苷酸、病毒颗粒、组合物、用途或方法,其中所述治疗方法是治疗血友病的方法。
119.方面118的多核苷酸、病毒颗粒、组合物、用途或方法,其中所述血友病是B型血友病。
120.方面119的多核苷酸、病毒颗粒、组合物、用途或方法,其中所述患者具有针对因子IX的抗体或抑制剂。
121.方面1-112中任一项的多核苷酸、病毒颗粒或组合物,其用于以由包含SEQ IDNO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽,从而治疗疾病。
122.方面1-112中任一项的多核苷酸、病毒颗粒或组合物,其用于通过以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病。
123.一种以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的方法,包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。
124.一种通过以由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的方法,包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。
125.方面1-112中任一项的多核苷酸、病毒颗粒或组合物用于以由包含SEQ IDNO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的用途,从而治疗疾病。
126.方面1-112中任一项的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的用途。
127.方面1-112中任一项的多核苷酸、病毒颗粒或组合物,其用于以由包含SEQ IDNO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽,从而治疗疾病。
128.方面1-112中任一项的多核苷酸、病毒颗粒或组合物,其用于通过以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病。
129.一种以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的方法,包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。
130.一种通过以由包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的方法,包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。
131.方面1-112中任一项的多核苷酸、病毒颗粒或组合物用于以由包含SEQ IDNO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的用途,从而治疗疾病。
132.方面1-112中任一项的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的用途。
133.方面121-122、125-128或131-132中任一项的多核苷酸、病毒颗粒或组合物或用途,其中表达由因子IX核苷酸序列编码的多肽包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。
134.方面1-112中任一项的多核苷酸、病毒颗粒或组合物,其用于通过表达具有比由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的病毒颗粒和/或包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病。
135.一种通过表达具有比由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ IDNO:7的转录调节元件的病毒颗粒和/或包含SEQ ID NO:18的因子IX核苷酸序列和SEQ IDNO:6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病的方法,包括向患者施用有效量的方面1-112中任一项的多核苷酸、病毒颗粒或组合物。
136.方面1-112中任一项的多核苷酸、病毒颗粒或组合物用于通过表达具有比由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的病毒颗粒和/或包含SEQ ID NO:18的因子IX核苷酸序列和SEQ ID NO:6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病的用途。
137.方面134或136中任一项的多核苷酸、病毒颗粒或组合物或用途,其中表达因子IX蛋白或其片段包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。
138.方面121-122、124-128、130-137中任一项的多核苷酸、病毒颗粒或组合物、治疗方法或用途,其中所述疾病是血友病。
139.方面138的多核苷酸、病毒颗粒或组合物、治疗方法或用途,其中所述疾病是b型血友病。
140.方面1-112中任一项的多核苷酸、病毒颗粒或组合物,其用于在患有B型血友病的患者中获得至少20%的稳定的因子IX活性水平。
141.一种在患有B型血友病的患者中实现至少20%的稳定的因子IX活性水平的方法,其包括向患者施用有效量的方面1-112中任一项的多核苷酸、病毒颗粒或组合物。
142.方面1-112中任一项的多核苷酸、病毒颗粒或组合物在患有B型血友病的患者中获得至少20%的稳定的因子IX活性水平的用途。
143.方面1-112中任一项的多核苷酸、病毒颗粒或组合物,其用于治疗B型血友病,包括以在患者中有效地获得至少20%的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。
144.一种治疗B型血友病的方法,其包括以在患者中有效地获得至少20%的稳定的因子IX活性水平的剂量向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。
145.方面1-112中任一项的多核苷酸、病毒颗粒或组合物在治疗B型血友病中的用途,包括以在患者中有效地获得至少20%的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。
146.方面140、142、143或145的多核苷酸、病毒颗粒或组合物或用途,其中治疗B型血友病或实现稳定的因子IX活性水平包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。
147.方面141、144、146-148中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中所述因子IX活性水平在施用多核苷酸、病毒颗粒或组合物的至少10周、至少15周、至少20周、至少30周、至少40周或至少50周后是稳定的。
148.方面123、124、129、130、133、135、137-147中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中所述患者是使用具有比由包含(i)SEQ ID NO:4或5的因子IX核苷酸序列和(ii)SEQ ID NO:6的转录调节元件的病毒颗粒表达的因子IX的活性更低的活性的因子IX难治的患者。
149.方面123、124、129、130、133、135、137-148中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中所述患者是使用以比由包含(i)SEQ ID NO:4或5的因子IX核苷酸序列和(ii)SEQ ID NO:6的转录调节元件的核苷酸序列编码的水平更低的水平表达的因子IX多肽难治的患者。
150.方面121-149中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中以在患有B型血友病的患者中有效实现至少20%的稳定的因子IX活性水平的剂量施用所述多核苷酸、病毒颗粒或组合物。
151.方面121-150中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中以至少4.5×1011vg/kg的剂量,或少于5×1011vg/kg的剂量,或4.5×1011至1×1012vg/kg的剂量,或4.5×1011vg/kg至4.9×1011vg/kg的剂量施用所述多核苷酸、病毒颗粒或组合物。
152.方面151的多核苷酸、病毒颗粒或组合物、方法或用途,其中所述剂量通过使用qPCR定量载体基因组的数量来确定,任选地,其中qPCR使用结合启动子区域的引物,任选地,其中所述启动子区域是转基因盒的启动子区域。
153.方面121-152中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中所施用的多核苷酸或病毒颗粒是由哺乳动物细胞产生的和/或具有因使用哺乳动物病毒载体生产细胞而产生并与昆虫病毒载体生产细胞(例如杆状病毒系统)中产生的载体区分开的特征。
154.方面140-153中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中稳定的因子IX活性水平是至少25%或至少30%的稳定的因子IX活性水平。
155.方面140-154中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中稳定的因子IX活性水平是至少35%的稳定的因子IX活性水平。
156.方面140-155中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中稳定的因子IX活性水平为至少或约40%。
157.方面140-156中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中在施用所述多核苷酸、病毒颗粒或组合物后至少50周或约52周的时间点,因子IX活性水平为至少20%。
158.方面157的多核苷酸、病毒颗粒或组合物、方法或用途,其中因子IX活性水平在紧接所述时间点之前至少40周的连续时间保持至少20%。
159.方面140-156中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中在施用所述多核苷酸、病毒颗粒或组合物后至少50周或约52周的时间点,因子IX活性水平为至少25%。
160.方面159的多核苷酸、病毒颗粒或组合物、方法或用途,其中因子IX活性水平在紧接所述时间点之前至少40周的连续时间保持至少25%。
161.方面140-156中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中在施用所述多核苷酸、病毒颗粒或组合物后至少50周或约52周的时间点,因子IX活性为至少或约40%。
162.方面161的多核苷酸、病毒颗粒或组合物、方法或用途,其中因子IX活性水平在紧接所述时间点之前至少40周的连续时间保持至少40%。
163.方面140-162中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中使用凝血测定法测量因子IX活性以确定来自患者的血液样品中的因子IX活性,任选地,其中所述凝血测定法使用SynthASilTM试剂盒。
164.方面140-162中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中通过从患者采集血液样品并使用凝血测定法测量因子IX活性以确定血液样品中的因子IX活性,任选地,其中所述凝血测定法使用SynthASilTM试剂盒。
165.方面163或164的多核苷酸、病毒颗粒或组合物、方法或用途,其中所述凝血测定法是一阶段凝血测定法,任选地,其中一阶段凝血测定法使用SynthASilTM试剂盒。
166.方面113-165中任一项的多核苷酸、病毒颗粒或组合物、方法或用途,其中所述方法或用途包括类固醇的共同施用。
167.方面166的多核苷酸、病毒颗粒或组合物、方法或用途,其中所述类固醇是泼尼松龙。
序列表
<110> UCL商业有限责任公司
<120> 编码因子IX的核苷酸
<130> N411562WO
<150> GB1813528.5
<151> 2018-08-20
<150> US16/105,583
<151> 2018-08-20
<160> 26
<170> PatentIn version 3.5
<210> 1
<211> 1191
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 1
gaggagaagt gcagctttga ggaggccagg gaggtgtttg agaacactga gaggaccact 60
gagttctgga agcagtatgt ggatggggac cagtgtgaga gcaacccctg cctgaatggg 120
ggcagctgca aggatgacat caacagctat gagtgctggt gcccctttgg ctttgagggc 180
aagaactgtg agctggatgt gacctgcaac atcaagaatg gcagatgtga gcagttctgc 240
aagaactctg ctgacaacaa ggtggtgtgc agctgcactg agggctacag gctggctgag 300
aaccagaaga gctgtgagcc tgctgtgcca ttcccatgtg gcagagtgtc tgtgagccag 360
accagcaagc tgaccagggc tgaggctgtg ttccctgatg tggactatgt gaacagcact 420
gaggctgaaa ccatcctgga caacatcacc cagagcaccc agagcttcaa tgacttcacc 480
agggtggtgg ggggggagga tgccaagcct ggccagttcc cctggcaagt ggtgctgaat 540
ggcaaggtgg atgccttctg tgggggcagc attgtgaatg agaagtggat tgtgactgct 600
gcccactgtg tggagactgg ggtgaagatc actgtggtgg ctggggagca caacattgag 660
gagactgagc acactgagca gaagaggaat gtgatcagga tcatccccca ccacaactac 720
aatgctgcca tcaacaagta caaccatgac attgccctgc tggagctgga tgagcccctg 780
gtgctgaaca gctatgtgac ccccatctgc attgctgaca aggagtacac caacatcttc 840
ctgaagtttg gctctggcta tgtgtctggc tggggcaggg tgttccacaa gggcaggtct 900
gccctggtgc tgcagtacct gagggtgccc ctggtggaca gggccacctg cctgctcagc 960
accaagttca ccatctacaa caacatgttc tgtgctggct tccatgaggg gggcagggac 1020
agctgccagg gggactctgg gggcccccat gtgactgagg tggagggcac cagcttcctg 1080
actggcatca tcagctgggg ggaggagtgt gccatgaagg gcaagtatgg catctacacc 1140
aaagtctcca gatatgtgaa ctggatcaag gagaagacca agctgacctg a 1191
<210> 2
<211> 494
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 2
atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60
ggatatctac tcagtgctga atgtacaggt ttgtttcctt ttttaaaata cattgagtat 120
gcttgccttt tagatataga aatatctgat gctgtcttct tcactaaatt ttgattacat 180
gatttgacag caatattgaa gagtctaaca gccagcacgc aggttggtaa gtactgtggg 240
aacatcacag attttggctc catgccctaa agagaaattg gctttcagat tatttggatt 300
aaaaacaaag actttcttaa gagatgtaaa attttcatga tgttttcttt tttgctaaaa 360
ctaaagaatt attcttttac atttcagttt ttcttgatca tgaaaacgcc aacaaaattc 420
tgaatcggcc aaagaggtat aattcaggta aattggaaga gtttgttcaa gggaaccttg 480
agagagaatg tatg 494
<210> 3
<211> 299
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 3
gtttgtttcc ttttttaaaa tacattgagt atgcttgcct tttagatata gaaatatctg 60
atgctgtctt cttcactaaa ttttgattac atgatttgac agcaatattg aagagtctaa 120
cagccagcac gcaggttggt aagtactgtg ggaacatcac agattttggc tccatgccct 180
aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 240
aaattttcat gatgttttct tttttgctaa aactaaagaa ttattctttt acatttcag 299
<210> 4
<211> 1386
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 4
atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60
ggatatctac tcagtgctga atgtacagtt tttcttgatc atgaaaacgc caacaaaatt 120
ctgaatcggc caaagaggta taattcaggt aaattggaag agtttgttca agggaacctt 180
gagagagaat gtatggagga gaagtgcagc tttgaggagg ccagggaggt gtttgagaac 240
actgagagga ccactgagtt ctggaagcag tatgtggatg gggaccagtg tgagagcaac 300
ccctgcctga atgggggcag ctgcaaggat gacatcaaca gctatgagtg ctggtgcccc 360
tttggctttg agggcaagaa ctgtgagctg gatgtgacct gcaacatcaa gaatggcaga 420
tgtgagcagt tctgcaagaa ctctgctgac aacaaggtgg tgtgcagctg cactgagggc 480
tacaggctgg ctgagaacca gaagagctgt gagcctgctg tgccattccc atgtggcaga 540
gtgtctgtga gccagaccag caagctgacc agggctgagg ctgtgttccc tgatgtggac 600
tatgtgaaca gcactgaggc tgaaaccatc ctggacaaca tcacccagag cacccagagc 660
ttcaatgact tcaccagggt ggtggggggg gaggatgcca agcctggcca gttcccctgg 720
caagtggtgc tgaatggcaa ggtggatgcc ttctgtgggg gcagcattgt gaatgagaag 780
tggattgtga ctgctgccca ctgtgtggag actggggtga agatcactgt ggtggctggg 840
gagcacaaca ttgaggagac tgagcacact gagcagaaga ggaatgtgat caggatcatc 900
ccccaccaca actacaatgc tgccatcaac aagtacaacc atgacattgc cctgctggag 960
ctggatgagc ccctggtgct gaacagctat gtgaccccca tctgcattgc tgacaaggag 1020
tacaccaaca tcttcctgaa gtttggctct ggctatgtgt ctggctgggg cagggtgttc 1080
cacaagggca ggtctgccct ggtgctgcag tacctgaggg tgcccctggt ggacagggcc 1140
acctgcctgc tcagcaccaa gttcaccatc tacaacaaca tgttctgtgc tggcttccat 1200
gaggggggca gggacagctg ccagggggac tctgggggcc cccatgtgac tgaggtggag 1260
ggcaccagct tcctgactgg catcatcagc tggggggagg agtgtgccat gaagggcaag 1320
tatggcatct acaccaaagt ctccagatat gtgaactgga tcaaggagaa gaccaagctg 1380
acctga 1386
<210> 5
<211> 1685
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 5
atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60
ggatatctac tcagtgctga atgtacaggt ttgtttcctt ttttaaaata cattgagtat 120
gcttgccttt tagatataga aatatctgat gctgtcttct tcactaaatt ttgattacat 180
gatttgacag caatattgaa gagtctaaca gccagcacgc aggttggtaa gtactgtggg 240
aacatcacag attttggctc catgccctaa agagaaattg gctttcagat tatttggatt 300
aaaaacaaag actttcttaa gagatgtaaa attttcatga tgttttcttt tttgctaaaa 360
ctaaagaatt attcttttac atttcagttt ttcttgatca tgaaaacgcc aacaaaattc 420
tgaatcggcc aaagaggtat aattcaggta aattggaaga gtttgttcaa gggaaccttg 480
agagagaatg tatggaggag aagtgcagct ttgaggaggc cagggaggtg tttgagaaca 540
ctgagaggac cactgagttc tggaagcagt atgtggatgg ggaccagtgt gagagcaacc 600
cctgcctgaa tgggggcagc tgcaaggatg acatcaacag ctatgagtgc tggtgcccct 660
ttggctttga gggcaagaac tgtgagctgg atgtgacctg caacatcaag aatggcagat 720
gtgagcagtt ctgcaagaac tctgctgaca acaaggtggt gtgcagctgc actgagggct 780
acaggctggc tgagaaccag aagagctgtg agcctgctgt gccattccca tgtggcagag 840
tgtctgtgag ccagaccagc aagctgacca gggctgaggc tgtgttccct gatgtggact 900
atgtgaacag cactgaggct gaaaccatcc tggacaacat cacccagagc acccagagct 960
tcaatgactt caccagggtg gtgggggggg aggatgccaa gcctggccag ttcccctggc 1020
aagtggtgct gaatggcaag gtggatgcct tctgtggggg cagcattgtg aatgagaagt 1080
ggattgtgac tgctgcccac tgtgtggaga ctggggtgaa gatcactgtg gtggctgggg 1140
agcacaacat tgaggagact gagcacactg agcagaagag gaatgtgatc aggatcatcc 1200
cccaccacaa ctacaatgct gccatcaaca agtacaacca tgacattgcc ctgctggagc 1260
tggatgagcc cctggtgctg aacagctatg tgacccccat ctgcattgct gacaaggagt 1320
acaccaacat cttcctgaag tttggctctg gctatgtgtc tggctggggc agggtgttcc 1380
acaagggcag gtctgccctg gtgctgcagt acctgagggt gcccctggtg gacagggcca 1440
cctgcctgct cagcaccaag ttcaccatct acaacaacat gttctgtgct ggcttccatg 1500
aggggggcag ggacagctgc cagggggact ctgggggccc ccatgtgact gaggtggagg 1560
gcaccagctt cctgactggc atcatcagct ggggggagga gtgtgccatg aagggcaagt 1620
atggcatcta caccaaagtc tccagatatg tgaactggat caaggagaag accaagctga 1680
cctga 1685
<210> 6
<211> 334
<212> DNA
<213> 人工序列
<220>
<223> 合成调节元件
<400> 6
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaactgg 120
acacaggacg ctgtggtttc tgagccaggg ggcgactcag atcccagcca gtggacttag 180
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 240
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 300
cttcaggcac caccactgac ctgggacagt gaat 334
<210> 7
<211> 447
<212> DNA
<213> 人工序列
<220>
<223> 合成调节元件
<400> 7
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaat 447
<210> 8
<211> 415
<212> PRT
<213> 智人
<400> 8
Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg
1 5 10 15
Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe
20 25 30
Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly
35 40 45
Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp
50 55 60
Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys
65 70 75 80
Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu
85 90 95
Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr
100 105 110
Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val
115 120 125
Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr
130 135 140
Arg Ala Glu Ala Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu
145 150 155 160
Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn
165 170 175
Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe
180 185 190
Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly
195 200 205
Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu
210 215 220
Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu
225 230 235 240
Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His
245 250 255
His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu
260 265 270
Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile
275 280 285
Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser
290 295 300
Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala
305 310 315 320
Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys
325 330 335
Leu Leu Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly
340 345 350
Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro
355 360 365
His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser
370 375 380
Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys
385 390 395 400
Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr
405 410 415
<210> 9
<211> 1386
<212> DNA
<213> 智人
<400> 9
atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60
ggatatctac tcagtgctga atgtacagtt tttcttgatc atgaaaacgc caacaaaatt 120
ctgaatcggc caaagaggta taattcaggt aaattggaag agtttgttca agggaacctt 180
gagagagaat gtatggaaga aaagtgtagt tttgaagaag cacgagaagt ttttgaaaac 240
actgaaagaa caactgaatt ttggaagcag tatgttgatg gagatcagtg tgagtccaat 300
ccatgtttaa atggcggcag ttgcaaggat gacattaatt cctatgaatg ttggtgtccc 360
tttggatttg aaggaaagaa ctgtgaatta gatgtaacat gtaacattaa gaatggcaga 420
tgcgagcagt tttgtaaaaa tagtgctgat aacaaggtgg tttgctcctg tactgaggga 480
tatcgacttg cagaaaacca gaagtcctgt gaaccagcag tgccatttcc atgtggaaga 540
gtttctgttt cacaaacttc taagctcacc cgtgctgagg ctgtttttcc tgatgtggac 600
tatgtaaatt ctactgaagc tgaaaccatt ttggataaca tcactcaaag cacccaatca 660
tttaatgact tcactcgggt tgttggtgga gaagatgcca aaccaggtca attcccttgg 720
caggttgttt tgaatggtaa agttgatgca ttctgtggag gctctatcgt taatgaaaaa 780
tggattgtaa ctgctgccca ctgtgttgaa actggtgtta aaattacagt tgtcgcaggt 840
gaacataata ttgaggagac agaacataca gagcaaaagc gaaatgtgat tcgaattatt 900
cctcaccaca actacaatgc agctattaat aagtacaacc atgacattgc ccttctggaa 960
ctggacgaac ccttagtgct aaacagctac gttacaccta tttgcattgc tgacaaggaa 1020
tacacgaaca tcttcctcaa atttggatct ggctatgtaa gtggctgggg aagagtcttc 1080
cacaaaggga gatcagcttt agttcttcag taccttagag ttccacttgt tgaccgagcc 1140
acatgtcttc gatctacaaa gttcaccatc tataacaaca tgttctgtgc tggcttccat 1200
gaaggaggta gagattcatg tcaaggagat agtgggggac cccatgttac tgaagtggaa 1260
gggaccagtt tcttaactgg aattattagc tggggtgaag agtgtgcaat gaaaggcaaa 1320
tatggaatat ataccaaggt atcccggtat gtcaactgga ttaaggaaaa aacaaagctc 1380
acttaa 1386
<210> 10
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 11
<211> 1386
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 11
atgcagaggg tgaacatgat catggctgag agccctggcc tgatcaccat ctgcctgctg 60
ggctacctgc tgtctgctga gtgcactgtg ttcctggacc atgagaatgc caacaagatc 120
ctgaacaggc ccaagagata caactctggc aagctggagg agtttgtgca gggcaacctg 180
gagagggagt gcatggagga gaagtgcagc tttgaggagg ccagggaggt gtttgagaac 240
actgagagga ccactgagtt ctggaagcag tatgtggatg gggaccagtg tgagagcaac 300
ccctgcctga atgggggcag ctgcaaggat gacatcaaca gctatgagtg ctggtgcccc 360
tttggctttg agggcaagaa ctgtgagctg gatgtgacct gcaacatcaa gaatggcaga 420
tgtgagcagt tctgcaagaa ctctgctgac aacaaggtgg tgtgcagctg cactgagggc 480
tacaggctgg ctgagaacca gaagagctgt gagcctgctg tgccattccc atgtggcaga 540
gtgtctgtga gccagaccag caagctgacc agggctgagg ctgtgttccc tgatgtggac 600
tatgtgaaca gcactgaggc tgaaaccatc ctggacaaca tcacccagag cacccagagc 660
ttcaatgact tcaccagggt ggtggggggg gaggatgcca agcctggcca gttcccctgg 720
caagtggtgc tgaatggcaa ggtggatgcc ttctgtgggg gcagcattgt gaatgagaag 780
tggattgtga ctgctgccca ctgtgtggag actggggtga agatcactgt ggtggctggg 840
gagcacaaca ttgaggagac tgagcacact gagcagaaga ggaatgtgat caggatcatc 900
ccccaccaca actacaatgc tgccatcaac aagtacaacc atgacattgc cctgctggag 960
ctggatgagc ccctggtgct gaacagctat gtgaccccca tctgcattgc tgacaaggag 1020
tacaccaaca tcttcctgaa gtttggctct ggctatgtgt ctggctgggg cagggtgttc 1080
cacaagggca ggtctgccct ggtgctgcag tacctgaggg tgcccctggt ggacagggcc 1140
acctgcctgt tgagcaccaa gttcaccatc tacaacaaca tgttctgtgc tggcttccat 1200
gaggggggca gggacagctg ccagggggac tctgggggcc cccatgtgac tgaggtggag 1260
ggcaccagct tcctgactgg catcatcagc tggggggagg agtgtgccat gaagggcaag 1320
tatggcatct acaccaaagt ctccagatat gtgaactgga tcaaggagaa gaccaagctg 1380
acctga 1386
<210> 12
<211> 1386
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 12
atgcagaggg tgaacatgat catggctgag agccctggcc tgatcaccat ctgcctgctg 60
ggctacctgc tgtctgctga gtgcactgtg ttcctggacc atgagaatgc caacaagatc 120
ctgaacaggc ccaagagata caactctggc aagctggagg agtttgtgca gggcaacctg 180
gagagggagt gcatggagga gaagtgcagc tttgaggagg ccagggaggt gtttgagaac 240
actgagagga ccactgagtt ctggaagcag tatgtggatg gggaccagtg tgagagcaac 300
ccctgcctga atgggggcag ctgcaaggat gacatcaaca gctatgagtg ctggtgcccc 360
tttggctttg agggcaagaa ctgtgagctg gatgtgacct gcaacatcaa gaatggcaga 420
tgtgagcagt tctgcaagaa ctctgctgac aacaaggtgg tgtgcagctg cactgagggc 480
tacaggctgg ctgagaacca gaagagctgt gagcctgctg tgccattccc atgtggcaga 540
gtgtctgtga gccagaccag caagctgacc agggctgagg ctgtgttccc tgatgtggac 600
tatgtgaaca gcactgaggc tgaaaccatc ctggacaaca tcacccagag cacccagagc 660
ttcaatgact tcaccagggt ggtggggggg gaggatgcca agcctggcca gttcccctgg 720
caagtggtgc tgaatggcaa ggtggatgcc ttctgtgggg gcagcattgt gaatgagaag 780
tggattgtga ctgctgccca ctgtgtggag actggggtga agatcactgt ggtggctggg 840
gagcacaaca ttgaggagac tgagcacact gagcagaaga ggaatgtgat caggatcatc 900
ccccaccaca actacaatgc tgccatcaac aagtacaacc atgacattgc cctgctggag 960
ctggatgagc ccctggtgct gaacagctat gtgaccccca tctgcattgc tgacaaggag 1020
tacaccaaca tcttcctgaa gtttggctct ggctatgtgt ctggctgggg cagggtgttc 1080
cacaagggca ggtctgccct ggtgctgcag tacctgaggg tgcccctggt ggacagggcc 1140
acctgcctga ggagcaccaa gttcaccatc tacaacaaca tgttctgtgc tggcttccat 1200
gaggggggca gggacagctg ccagggggac tctgggggcc cccatgtgac tgaggtggag 1260
ggcaccagct tcctgactgg catcatcagc tggggggagg agtgtgccat gaagggcaag 1320
tatggcatct acaccaaagt ctccagatat gtgaactgga tcaaggagaa gaccaagctg 1380
acctga 1386
<210> 13
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 合成增强子元件
<400> 13
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaac 117
<210> 14
<211> 185
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子元件
<400> 14
gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 60
gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 120
tacggacgag gacagggccc tgtctcctca gcttcaggca ccaccactga cctgggacag 180
tgaat 185
<210> 15
<211> 195
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 15
atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60
ggatatctac tcagtgctga atgtacagtt tttcttgatc atgaaaacgc caacaaaatt 120
ctgaatcggc caaagaggta taattcaggt aaattggaag agtttgttca agggaacctt 180
gagagagaat gtatg 195
<210> 16
<211> 461
<212> PRT
<213> 智人
<400> 16
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Ala Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Leu
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr
450 455 460
<210> 17
<211> 724
<212> PRT
<213> 腺相关病毒5
<400> 17
Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro Leu
<210> 18
<211> 1685
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 18
atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60
ggatatctac tcagtgctga atgtacaggt ttgtttcctt ttttaaaata cattgagtat 120
gcttgccttt tagatataga aatatctgat gctgtcttct tcactaaatt ttgattacat 180
gatttgacag caatattgaa gagtctaaca gccagcacgc aggttggtaa gtactgtggg 240
aacatcacag attttggctc catgccctaa agagaaattg gctttcagat tatttggatt 300
aaaaacaaag actttcttaa gagatgtaaa attttcatga tgttttcttt tttgctaaaa 360
ctaaagaatt attcttttac atttcagttt ttcttgatca tgaaaacgcc aacaaaattc 420
tgaatcggcc aaagaggtat aattcaggta aattggaaga gtttgttcaa gggaaccttg 480
agagagaatg tatggaggag aagtgttctt tcgaggaggc gagagaggtt ttcgagaata 540
ctgagcgaac aaccgaattc tggaaacaat atgtggatgg cgaccaatgt gaatctaatc 600
cctgcctcaa cggtggctca tgcaaagacg atatcaacag ctacgagtgt tggtgcccct 660
ttggtttcga gggaaagaat tgcgagcttg atgtaacctg taacattaag aatgggcgct 720
gcgaacagtt ttgcaagaac agcgccgaca ataaggtcgt ctgcagttgt accgaaggct 780
ataggcttgc agagaatcag aagagttgcg agcctgctgt gccgttccca tgtggcagag 840
tcagtgtgtc ccaaactagc aagctgacaa gagcagaagc cgttttcccc gatgtggact 900
acgtgaattc cactgaagcc gaaacgatcc tggacaatat cacacagagc actcagtctt 960
tcaacgactt cacacgggtt gtgggaggag aggacgccaa acccggccag tttccttggc 1020
aagtcgttct taacggcaag gtcgacgcct tttgtggagg gagtattgtg aacgagaaat 1080
ggattgtcac cgctgctcat tgtgttgaaa ctggggtgaa aatcactgtt gtcgcaggag 1140
agcacaatat cgaagagaca gaacacaccg agcagaaacg caacgttatt cggatcattc 1200
cacatcacaa ctacaatgct gccatcaaca agtacaacca cgacattgcg ctgctggagt 1260
tggatgaacc tctcgtgctc aactcctatg tgaccccaat ctgcatagca gataaggagt 1320
ataccaacat cttcctgaag tttgggtcag gttatgtgtc aggctgggga cgagtgtttc 1380
ataaagggag atcagcactg gtgttgcagt atctgcgcgt accactggtg gatcgggcta 1440
cttgcctgct aagcacaaaa ttcaccatct acaacaacat gttttgtgcc ggttttcacg 1500
aaggcggcag ggacagctgt cagggagatt ccggagggcc tcatgtcaca gaggtcgagg 1560
gcacctcctt tctcactggg attataagct ggggagaaga atgcgccatg aaagggaagt 1620
acggcatata cacgaaagtg tctagatacg tgaattggat taaggaaaag accaaactga 1680
cgtga 1685
<210> 19
<211> 1248
<212> DNA
<213> 智人
<400> 19
tataattcag gtaaattgga agagtttgtt caagggaacc ttgagagaga atgtatggaa 60
gaaaagtgta gttttgaaga agcacgagaa gtttttgaaa acactgaaag aacaactgaa 120
ttttggaagc agtatgttga tggagatcag tgtgagtcca atccatgttt aaatggcggc 180
agttgcaagg atgacattaa ttcctatgaa tgttggtgtc cctttggatt tgaaggaaag 240
aactgtgaat tagatgtaac atgtaacatt aagaatggca gatgcgagca gttttgtaaa 300
aatagtgctg ataacaaggt ggtttgctcc tgtactgagg gatatcgact tgcagaaaac 360
cagaagtcct gtgaaccagc agtgccattt ccatgtggaa gagtttctgt ttcacaaact 420
tctaagctca cccgtgctga ggctgttttt cctgatgtgg actatgtaaa ttctactgaa 480
gctgaaacca ttttggataa catcactcaa agcacccaat catttaatga cttcactcgg 540
gttgttggtg gagaagatgc caaaccaggt caattccctt ggcaggttgt tttgaatggt 600
aaagttgatg cattctgtgg aggctctatc gttaatgaaa aatggattgt aactgctgcc 660
cactgtgttg aaactggtgt taaaattaca gttgtcgcag gtgaacataa tattgaggag 720
acagaacata cagagcaaaa gcgaaatgtg attcgaatta ttcctcacca caactacaat 780
gcagctatta ataagtacaa ccatgacatt gcccttctgg aactggacga acccttagtg 840
ctaaacagct acgttacacc tatttgcatt gctgacaagg aatacacgaa catcttcctc 900
aaatttggat ctggctatgt aagtggctgg ggaagagtct tccacaaagg gagatcagct 960
ttagttcttc agtaccttag agttccactt gttgaccgag ccacatgtct tcgatctaca 1020
aagttcacca tctataacaa catgttctgt gctggcttcc atgaaggagg tagagattca 1080
tgtcaaggag atagtggggg accccatgtt actgaagtgg aagggaccag tttcttaact 1140
ggaattatta gctggggtga agagtgtgca atgaaaggca aatatggaat atataccaag 1200
gtatcccggt atgtcaactg gattaaggaa aaaacaaagc tcacttaa 1248
<210> 20
<211> 724
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 20
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro Leu
<210> 21
<211> 725
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 21
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro
50 55 60
Val Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn
65 70 75 80
Glu Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg
130 135 140
Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp
145 150 155 160
Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser
165 170 175
Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp
180 185 190
Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly
195 200 205
Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr
210 215 220
Trp Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu
225 230 235 240
Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val
245 250 255
Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly
260 265 270
Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp
275 280 285
Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg
290 295 300
Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser
305 310 315 320
Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr
325 330 335
Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly
340 345 350
Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly
355 360 365
Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser
370 375 380
Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser
405 410 415
Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val
420 425 430
Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val
435 440 445
Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn
450 455 460
Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser
465 470 475 480
Gly Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met
485 490 495
Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met
500 505 510
Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met
515 520 525
Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu
530 535 540
Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn
545 550 555 560
Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser
565 570 575
Ser Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val
580 585 590
Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile
595 600 605
Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala
610 615 620
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys
625 630 635 640
Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val
645 650 655
Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met
660 665 670
Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
675 680 685
Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro
690 695 700
Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr
705 710 715 720
Leu Thr Arg Pro Leu
725
<210> 22
<211> 725
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 22
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn
65 70 75 80
Glu Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg
130 135 140
Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp
145 150 155 160
Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser
165 170 175
Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp
180 185 190
Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly
195 200 205
Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr
210 215 220
Trp Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu
225 230 235 240
Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val
245 250 255
Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly
260 265 270
Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp
275 280 285
Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg
290 295 300
Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser
305 310 315 320
Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr
325 330 335
Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly
340 345 350
Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly
355 360 365
Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser
370 375 380
Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser
405 410 415
Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val
420 425 430
Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val
435 440 445
Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn
450 455 460
Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser
465 470 475 480
Gly Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met
485 490 495
Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met
500 505 510
Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met
515 520 525
Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu
530 535 540
Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn
545 550 555 560
Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser
565 570 575
Ser Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val
580 585 590
Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile
595 600 605
Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala
610 615 620
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys
625 630 635 640
Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val
645 650 655
Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met
660 665 670
Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
675 680 685
Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro
690 695 700
Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr
705 710 715 720
Leu Thr Arg Pro Leu
725
<210> 23
<211> 725
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 23
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg
130 135 140
Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp
145 150 155 160
Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser
165 170 175
Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp
180 185 190
Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly
195 200 205
Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr
210 215 220
Trp Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu
225 230 235 240
Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val
245 250 255
Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly
260 265 270
Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp
275 280 285
Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg
290 295 300
Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser
305 310 315 320
Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr
325 330 335
Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly
340 345 350
Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly
355 360 365
Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser
370 375 380
Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser
405 410 415
Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val
420 425 430
Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val
435 440 445
Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn
450 455 460
Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser
465 470 475 480
Gly Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met
485 490 495
Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met
500 505 510
Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met
515 520 525
Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu
530 535 540
Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn
545 550 555 560
Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser
565 570 575
Ser Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val
580 585 590
Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile
595 600 605
Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala
610 615 620
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys
625 630 635 640
Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val
645 650 655
Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met
660 665 670
Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
675 680 685
Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro
690 695 700
Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr
705 710 715 720
Leu Thr Arg Pro Leu
725
<210> 24
<211> 725
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 24
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg
130 135 140
Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp
145 150 155 160
Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser
165 170 175
Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp
180 185 190
Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly
195 200 205
Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr
210 215 220
Trp Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu
225 230 235 240
Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val
245 250 255
Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly
260 265 270
Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp
275 280 285
Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg
290 295 300
Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser
305 310 315 320
Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr
325 330 335
Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly
340 345 350
Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly
355 360 365
Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser
370 375 380
Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser
405 410 415
Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val
420 425 430
Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val
435 440 445
Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn
450 455 460
Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser
465 470 475 480
Gly Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met
485 490 495
Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met
500 505 510
Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met
515 520 525
Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu
530 535 540
Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn
545 550 555 560
Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser
565 570 575
Ser Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val
580 585 590
Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile
595 600 605
Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala
610 615 620
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys
625 630 635 640
Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val
645 650 655
Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met
660 665 670
Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
675 680 685
Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro
690 695 700
Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr
705 710 715 720
Leu Thr Arg Pro Leu
725
<210> 25
<211> 725
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 25
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Thr Gly Lys Arg
130 135 140
Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp
145 150 155 160
Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser
165 170 175
Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp
180 185 190
Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly
195 200 205
Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr
210 215 220
Trp Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu
225 230 235 240
Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val
245 250 255
Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly
260 265 270
Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp
275 280 285
Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg
290 295 300
Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser
305 310 315 320
Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr
325 330 335
Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly
340 345 350
Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly
355 360 365
Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser
370 375 380
Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser
405 410 415
Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val
420 425 430
Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val
435 440 445
Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn
450 455 460
Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser
465 470 475 480
Gly Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met
485 490 495
Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met
500 505 510
Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met
515 520 525
Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu
530 535 540
Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn
545 550 555 560
Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser
565 570 575
Ser Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val
580 585 590
Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile
595 600 605
Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala
610 615 620
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys
625 630 635 640
Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val
645 650 655
Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met
660 665 670
Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
675 680 685
Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro
690 695 700
Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr
705 710 715 720
Leu Thr Arg Pro Leu
725
<210> 26
<211> 1386
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 26
atgcagaggg tgaacatgat catggctgag agccctggcc tgatcaccat ctgcctgctg 60
ggctacctgc tgtctgctga gtgcactgtg ttcctggacc atgagaatgc caacaagatc 120
ctgaacaggc ccaagagata caactctggc aagctggagg agtttgtgca gggcaacctg 180
gagagggagt gcatggagga gaagtgcagc tttgaggagg ccagggaggt gtttgagaac 240
actgagagga ccactgagtt ctggaagcag tatgtggatg gggaccagtg tgagagcaac 300
ccctgcctga atgggggcag ctgcaaggat gacatcaaca gctatgagtg ctggtgcccc 360
tttggctttg agggcaagaa ctgtgagctg gatgtgacct gcaacatcaa gaatggcaga 420
tgtgagcagt tctgcaagaa ctctgctgac aacaaggtgg tgtgcagctg cactgagggc 480
tacaggctgg ctgagaacca gaagagctgt gagcctgctg tgccattccc atgtggcaga 540
gtgtctgtga gccagaccag caagctgacc agggctgagg ctgtgttccc tgatgtggac 600
tatgtgaaca gcactgaggc tgaaaccatc ctggacaaca tcacccagag cacccagagc 660
ttcaatgact tcaccagggt ggtggggggg gaggatgcca agcctggcca gttcccctgg 720
caagtggtgc tgaatggcaa ggtggatgcc ttctgtgggg gcagcattgt gaatgagaag 780
tggattgtga ctgctgccca ctgtgtggag actggggtga agatcactgt ggtggctggg 840
gagcacaaca ttgaggagac tgagcacact gagcagaaga ggaatgtgat caggatcatc 900
ccccaccaca actacaatgc tgccatcaac aagtacaacc atgacattgc cctgctggag 960
ctggatgagc ccctggtgct gaacagctat gtgaccccca tctgcattgc tgacaaggag 1020
tacaccaaca tcttcctgaa gtttggctct ggctatgtgt ctggctgggg cagggtgttc 1080
cacaagggca ggtctgccct ggtgctgcag tacctgaggg tgcccctggt ggacagggcc 1140
acctgcctgc tgagcaccaa gttcaccatc tacaacaaca tgttctgtgc tggcttccat 1200
gaggggggca gggacagctg ccagggggac tctgggggcc cccatgtgac tgaggtggag 1260
ggcaccagct tcctgactgg catcatcagc tggggggagg agtgtgccat gaagggcaag 1320
tatggcatct acaccaaagt ctccagatat gtgaactgga tcaaggagaa gaccaagctg 1380
acctga 1386
Claims (27)
1.一种包含因子IX核苷酸序列的多核苷酸,其中:
(i)因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列;
(ii)编码序列的一部分是经密码子优化的;
(iii)经密码子优化的编码序列的部分的长度为至少1100个核苷酸;
(iv)在经密码子优化的部分中,至少60%的密码子选自TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG;
(v)与SEQ ID NO:9的相应部分相比,经密码子优化的部分包含减少数量的CpG;
(vi)所述多核苷酸还包含转录调节元件,所述转录调节元件包含:
(a)A1AT启动子或A1AT启动子的片段;和/或
(b)HCR增强子或HCR增强子的片段;和
(vii)因子IX核苷酸序列在对应于野生型因子IX的位置384的位置处包含编码亮氨酸的密码子。
2.前述权利要求的多核苷酸,其中经密码子优化的编码序列的部分是经密码子优化以用于在人肝中表达。
3.前述权利要求中任一项的多核苷酸,其中:
(i)由因子IX核苷酸序列编码的多肽在人肝细胞中以与参考野生型因子IX核苷酸序列相比更高的水平表达;和/或
(ii)经密码子优化的编码序列的部分的长度为至少800、至少900、至少1100、少于1500、少于1300、少于1200、800至1500、900至1300、1100至1200或约1191个核苷酸;和/或
(iii)经密码子优化的编码序列的部分包含以下的1、2、3、4、5种或全部:
a)外显子3或外显子3的至少10、至少15、至少20、少于25、10至25、15至25或20至25个核苷酸的部分;
b)外显子4或外显子4的至少80、至少90、至少100、少于114、80至114、90至114或100至114的核苷酸的部分;
c)外显子5或外显子5的至少90、至少100、至少110、少于129、90至129、100至129或110至129个核苷酸的部分;
d)外显子6或外显子6的至少150、至少180、至少200、少于203、150至203、180至203或200至203个核苷酸的部分;
e)外显子7或外显子7的至少70、至少80、至少90、至少100、少于115、70至115、80至115、90至115或100至115个核苷酸的部分;和/或
f)外显子8或外显子8的至少400、至少450、至少500、少于548、400至548、450至548或500至548个核苷酸的部分;和/或
(iv)经密码子优化的编码序列的部分包含外显子3的至少20个核苷酸的部分、外显子4的至少100个核苷酸的部分、外显子5的至少110个核苷酸的部分、外显子6的至少180个核苷酸、外显子7的至少100个核苷酸的部分和外显子8的至少500个核苷酸的部分;和/或
(v)经密码子优化的编码序列的部分包含外显子3、外显子4、外显子5、外显子6、外显子7和外显子8;和/或
(vi)经密码子优化的编码序列的部分包含外显子2的一部分,外显子2的该部分的长度为少于160、少于150、少于100、少于75、少于60、至少20、至少30、至少40、至少50、20至160、30至150、30至100、40至75或约56个核苷酸;和/或
(vii)经密码子优化的编码序列的部分包含长度为30至100个核苷酸的外显子2的一部分。
4.前述权利要求中任一项的多核苷酸,其中:
(i)经密码子优化的编码序列的部分包含少于40、少于20、少于18、少于10、少于5或少于1个CpG;和/或
(ii)经密码子优化的编码序列的部分不含CpG。
5.前述权利要求中任一项的多核苷酸,其中在经密码子优化的编码序列的部分中:
(i)a)与参考野生型因子IX序列相比,至少1、至少2、至少4或至少5个编码苯丙氨酸的密码子被TTC取代;
b)至少60%、至少65%或至少70%的编码苯丙氨酸的密码子是TTC;
c)至少60%、至少65%或至少70%的编码苯丙氨酸的密码子是TTC,其余是TTT;和/或
d)编码苯丙氨酸的密码子是TTC,除非下一个密码子以G开头;和/或
(ii)a)与参考野生型因子IX序列相比,至少5、至少10、至少15或至少16个编码亮氨酸的密码子被CTG取代;
b)至少90%或至少94%的编码亮氨酸的密码子是CTG;和/或
c)至少90%或至少94%的编码亮氨酸的密码子是CTG,其余是CTC;和/或
(iii)a)与参考野生型因子IX序列相比,至少5、至少10、至少11或至少12个编码异亮氨酸的密码子被ATC取代;
b)与参考野生型因子IX序列相比,至少一个ATC密码子被ATT取代,其中下一个密码子以G开头;
c)至少60%、至少70%或至少75%的编码异亮氨酸的密码子是ATC;
d)至少60%、至少70%或至少75%的编码异亮氨酸的密码子是ATC,其余是ATT;和/或
e)编码异亮氨酸的密码子是ATC,除非下一个密码子以G开头;和/或
(iv)a)与参考野生型因子IX序列相比,至少10、至少15、至少20或至少25个编码缬氨酸的密码子被GTG取代;
b)与参考野生型因子IX序列相比,至少1个编码缬氨酸的密码子被GTC取代;
c)至少80%、至少90%或至少95%的编码缬氨酸的密码子是GTG;和/或
d)至少80%、至少90%或至少95%的编码缬氨酸的密码子是GTG,其余是GTC;和/或
(v)a)与参考野生型因子IX序列相比,至少5、至少10、至少12或至少13个编码丝氨酸的密码子被AGC取代;
b)与参考野生型因子IX序列相比,至少1、至少2或至少4个编码丝氨酸的密码子被TCT取代,其中下一个密码子以G开头;
c)至少60%、至少65%或至少70%的编码丝氨酸的密码子是AGC;和/或
d)至少60%、至少65%或至少70%的编码丝氨酸的密码子是AGC,其余是TCT或TCC;和/或
(vi)a)与参考野生型因子IX序列相比,至少1、至少2或至少5个编码脯氨酸的密码子被CCC取代;
b)与参考野生型因子IX序列相比,至少1个编码脯氨酸的密码子被CCT取代,其中下一个密码子以G开头;
c)至少50%、至少55%或至少60%的编码脯氨酸的密码子是CCC;
d)50%、至少55%或至少60%的编码脯氨酸的密码子为CCC,其余是CCA或CCT;和/或
e)编码脯氨酸的密码子是CCC,除非下一个密码子以G开头;和/或
(vii)a)与参考野生型因子IX序列相比,至少6、至少7、至少8或至少10个编码苏氨酸的密码子被ACC取代;
b)与参考野生型因子IX序列相比,至少1或至少2个编码苏氨酸的密码子被ACT取代,其中下一个密码子以G开头;
c)至少45%、至少50%或至少55%的编码苏氨酸的密码子是ACC;
d)至少45%、至少50%或至少55%的编码苏氨酸的密码子是ACC,其余是ACT;和/或
e)编码苏氨酸的密码子是ACC,除非下一个密码子以G开头;和/或
(viii)a)与参考野生型因子IX序列相比,至少1、至少2、至少3或至少4个编码丙氨酸的密码子被GCC取代;
b)与参考野生型因子IX序列相比,至少1、至少2或至少3个编码丙氨酸的密码子被GCT取代,其中下一个密码子以G开头;
c)至少35%、至少40%或至少43%的编码丙氨酸的密码子是GCC;
d)至少35%、至少40%或至少45%的编码丙氨酸的密码子是GCC,其余是GCT;和/或
e)编码丙氨酸的密码子是GCC,除非下一个密码子以G开头;和/或
(ix)a)与参考野生型因子IX序列相比,至少1或至少2个编码酪氨酸的密码子被TAC取代;
b)与参考野生型因子IX序列相比,至少1个TAC密码子被TAT取代,其中下一个密码子以G开头;
c)至少40%、至少45%或至少48%的编码酪氨酸的密码子是TAC;
d)至少40%、至少45%或至少48%的编码酪氨酸的密码子是TAC,其余是TAT;和/或
e)编码酪氨酸的密码子是TAC,除非下一个密码子以G开头;和/或
(x)a)与参考野生型因子IX序列相比,至少1个编码组氨酸的密码子被CAC取代;
b)至少50%、至少60%或至少65%的编码组氨酸的密码子是CAC;
c)至少50%、至少60%或至少65%的编码组氨酸的密码子是CAC,其余是CAT;和/或
d)编码组氨酸的密码子是CAC,除非下一个密码子以G开头;和/或
(xi)a)与参考野生型因子IX序列相比,至少1、至少2、至少4或至少5个编码谷氨酰胺的密码子被CAG取代;
b)与参考野生型因子IX序列相比,至少1个CAG密码子被CAA取代;
c)至少80%、至少85%或至少90%的编码谷氨酰胺的密码子是CAG;和/或
d)至少80%、至少85%或至少90%的编码谷氨酰胺的密码子是CAG,其余是CAA;和/或
(xii)a)与参考野生型因子IX序列相比,至少1、至少2、至少4或至少5个编码天冬酰胺的密码子被AAC取代;
b)至少60%、至少65%或至少70%的编码天冬酰胺的密码子是AAC;
c)至少60%、至少65%或至少70%的编码天冬酰胺的密码子是AAC,其余是AAT;和/或
e)编码天冬酰胺的密码子是AAC,除非下一个密码子以G开头;和/或
(xiii)a)与参考野生型因子IX序列相比,至少5、至少7、至少8或至少9个编码赖氨酸的密码子被AAG取代;
b)与参考野生型因子IX序列相比,至少1个AAG密码子被AAA取代;
c)至少80%、至少90%或至少95%的编码赖氨酸的密码子是AAG;和/或
d)至少80%、至少90%或至少95%的编码赖氨酸的密码子是AAG,其余的是AAA;和/或
(xiv)a)与参考野生型因子IX序列相比,至少1、至少2、至少3或至少4个编码天冬氨酸的密码子被GAC取代;
b)与参考野生型因子IX序列相比,其中至少1个GAC密码子被GAT取代,其中下一个密码子以G开头;
c)至少45%、至少50%或至少60%的编码天冬氨酸的密码子是GAC;
d)至少45%、至少50%或至少60%的编码天冬氨酸的密码子是GAC,其余是GAT;和/或
e)编码天冬氨酸的密码子是GAC,除非下一个密码子以G开头;和/或
(xv)a)与参考野生型因子IX序列相比,至少15、至少20、至少25或至少26个编码谷氨酸的密码子被GAG取代;
b)至少80%、至少90%或至少95%的编码谷氨酸的密码子是GAG;和/或
c)至少80%、至少90%或至少95%的编码谷氨酸的密码子是GAG和其余的是GAA;和/或
(xvi)a)与参考野生型因子IX序列相比,至少5、至少6、至少7或至少8个编码半胱氨酸的密码子被TGC取代;
b)与参考野生型因子IX序列相比,至少1个TGC密码子被TGT取代,其中下一个密码子以G开头;
c)至少40%、至少50%或至少55%的编码半胱氨酸的密码子是TGC;
d)至少40%、至少50%或至少55%的编码半胱氨酸的密码子是TGC,其余是TGT;和/或
e)编码半胱氨酸的密码子是TGC,除非下一个密码子以G开头;和/或
(xvii)编码色氨酸的密码子是TGG;和/或
(xviii)a)与参考野生型因子IX序列相比,至少5、至少8、至少10或至少11个编码精氨酸的密码子被AGG取代;
b)与参考野生型因子IX序列相比,至少1个编码精氨酸的密码子被AGA取代;
c)至少60%、至少70%或至少75%的编码精氨酸的密码子是AGG;和/或
d)至少60%、至少70%或至少75%的编码精氨酸的密码子是AGG,其余是AGA;和/或
(xix)a)与参考野生型因子IX序列相比,至少5、至少10、至少12或至少13个编码甘氨酸的密码子被GGC取代;
b)与参考野生型因子IX序列相比,至少5、至少6、至少7或至少8个编码甘氨酸的密码子被GGG取代,其中下一个密码子以G开头;
c)至少50%、至少55%或至少60%的编码甘氨酸的密码子是GGC;
d)至少50%、至少55%或至少60%的编码甘氨酸的密码子是GGC,其余的是GGG;和/或
e)编码甘氨酸的密码子是GGC,除非下一个密码子以G开头。
6.前述权利要求中任一项的多核苷酸,其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子,并且在密码子优化的部分中:
a)与参考野生型因子IX序列相比,至少5个编码苯丙氨酸的密码子被TTC取代;
b)与参考野生型因子IX序列相比,至少16个编码亮氨酸的密码子被CTG取代;
c)与参考野生型因子IX序列相比,至少12个编码异亮氨酸的密码子被ATC取代;
d)与参考野生型因子IX序列相比,至少25个编码缬氨酸的密码子被GTG取代;
e)与参考野生型因子IX序列相比,至少13个编码丝氨酸的密码子被AGC取代;
f)与参考野生型因子IX序列相比,至少5个编码脯氨酸的密码子被CCC取代;
g)与参考野生型因子IX序列相比,至少10个编码苏氨酸的密码子被ACC取代;
h)与参考野生型因子IX序列相比,至少4个编码丙氨酸的密码子被GCC取代;
i)与参考野生型因子IX序列相比,至少2个编码酪氨酸的密码子被TAC取代;
j)与参考野生型因子IX序列相比,至少1个编码组氨酸的密码子被CAC取代;
k)与参考野生型因子IX序列相比,至少5个编码谷氨酰胺的密码子被CAG取代;
l)与参考野生型因子IX序列相比,至少5个编码天冬酰胺的密码子被AAC取代;
m)与参考野生型因子IX序列相比,至少9个编码赖氨酸的密码子被AAG取代;
n)与参考野生型因子IX序列相比,至少4个编码天冬氨酸的密码子被GAC取代;
o)与参考野生型因子IX序列相比,至少26个编码谷氨酸的密码子被GAG取代;
p)与参考野生型因子IX序列相比,至少8个编码半胱氨酸的密码子被TGC取代;
q)编码色氨酸的密码子是TGG;
r)与参考野生型因子IX序列相比,至少11个编码精氨酸的密码子被AGG取代;和
s)与参考野生型因子IX序列相比,至少13个编码甘氨酸的密码子被GGC取代。
7.前述权利要求中任一项的多核苷酸,其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子,并且在密码子优化的部分中:
a)至少70%的编码苯丙氨酸的密码子是TTC;
b)至少94%的编码亮氨酸的密码子是CTG;
c)至少75%的编码异亮氨酸的密码子是ATC;
d)至少95%的编码缬氨酸的密码子是GTG;
e)至少70%的编码丝氨酸的密码子是AGC;
f)至少60%的编码脯氨酸的密码子是CCC;
g)至少55%的编码苏氨酸的密码子是ACC;
h)至少43%的编码丙氨酸的密码子是GCC;
i)至少48%的编码酪氨酸的密码子是TAC;
j)至少65%的编码组氨酸的密码子是CAC;
k)至少90%的编码谷氨酰胺的密码子是CAG;
l)至少70%的编码天冬酰胺的密码子是AAC;
m)至少95%的编码赖氨酸的密码子是AAG;
n)至少60%的编码天冬氨酸的密码子是GAC;
o)至少95%的编码谷氨酸的密码子是GAG;
p)至少55%的编码半胱氨酸的密码子是TGC;
q)编码色氨酸的密码子是TGG;
r)至少75%的编码精氨酸的密码子是AGG;和
s)至少60%的编码甘氨酸的密码子是GGC。
8.前述权利要求中任一项的多核苷酸,其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子,并且在密码子优化的部分中:
a)至少70%的编码苯丙氨酸的密码子是TTC,其余是TTT;
b)至少94%的编码亮氨酸的密码子是CTG,其余是CTC;
c)至少75%的编码异亮氨酸的密码子是ATC,其余是ATT;
d)至少95%的编码缬氨酸的密码子是GTG;
e)至少70%的编码丝氨酸的密码子是AGC;
f)至少60%的编码脯氨酸的密码子是CCC,其余是CCA或CCT;
g)至少55%的编码苏氨酸的密码子是ACC,其余是ACT;
h)至少43%的编码丙氨酸的密码子是GCC,其余是GCT;
i)至少48%的编码酪氨酸的密码子是TAC,其余是TAT;
j)至少65%的编码组氨酸的密码子是CAC,其余的是CAT;
k)至少90%的编码谷氨酰胺的密码子是CAG,其余的是CAA;
l)至少70%的编码天冬酰胺的密码子是AAC,其余的是AAT;
m)至少95%的编码赖氨酸的密码子是AAG,其余的是AAA;
n)至少60%的编码天冬氨酸的密码子是GAC,其余是GAT;
o)至少95%的编码谷氨酸的密码子是GAG,其余的是GAA;
p)至少55%的编码半胱氨酸的密码子是TGC,其余的是TGT;
q)编码色氨酸的密码子是TGG;
r)至少75%的编码精氨酸的密码子是AGG,其余是AGA;和
s)至少60%的编码甘氨酸的密码子是GGC,其余是GGG。
9.权利要求4-8中任一项的多核苷酸,其中所述参考野生型因子IX序列是SEQ ID NO:9或SEQ ID NO:19。
10.前述权利要求中任一项的多核苷酸,其中所述转录调节元件包含肝脏特异性启动子。
11.前述权利要求中任一项的多核苷酸,其中A1AT启动子的片段是:
(i)至少100、至少120、至少150、至少180、少于255、100至255、150至225、150至300或180至255个核苷酸的长度;和/或
(ii)150至300个核苷酸的长度。
12.前述权利要求中任一项的多核苷酸,其中HCR增强子的片段是:
(i)至少80、至少90、至少100、少于192、80至192、90至192、100至250或117至192个核苷酸的长度;和/或
(ii)100至250个核苷酸的长度。
13.前述权利要求中任一项的多核苷酸,其中:
(i)转录调节元件与SEQ ID NO:6至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同;和/或
(ii)转录调节元件具有SEQ ID NO:6的序列。
14.前述权利要求中任一项的多核苷酸,其中:
(i)多核苷酸包含与SEQ ID NO:13至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子;和/或
(ii)多核苷酸包含与SEQ ID NO:13至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子;和/或
(iii)多核苷酸包含SEQ ID NO:13的增强子;和/或
(iv)多核苷酸包含与SEQ ID NO:14至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子;和/或
(v)多核苷酸包含与SEQ ID NO:14至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子;和/或
(vi)多核苷酸包含SEQ ID NO:14的启动子。
15.前述权利要求中任一项的多核苷酸,其中在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子是CTX,其中X是任何核苷酸,任选地,其中X是C或G。
16.一种包含因子IX核苷酸序列的多核苷酸,其中所述因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列,并且其中所述编码序列的一部分不是野生型的。
17.一种病毒颗粒,其包含重组基因组,所述重组基因组包含前述权利要求中任一项的多核苷酸。
18.权利要求17的病毒颗粒:
(i)其是AAV、腺病毒或慢病毒病毒颗粒;和/或
(ii)其是AAV病毒颗粒;和/或
(iii)其中所述重组基因组还包含:
a)AAV2 ITR;
b)多聚A序列;
c)复制起点;和/或
d)两个可分辨的ITR;和/或
(iv)其中所述重组基因组是单链的。
19.权利要求17或18的病毒颗粒,其中在转导到Huh7细胞中后,所述病毒颗粒表达具有比由包含SEQ ID NO:12的因子IX核苷酸序列和SEQ ID NO:7的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段。
20.前述权利要求中任一项的多核苷酸或病毒颗粒,其中所述因子IX片段的长度为至少200、至少250、至少300、200至415、250至415或300至415个氨基酸。
21.一种组合物,其包含前述权利要求中任一项的多核苷酸或病毒颗粒和药学上可接受的赋形剂。
22.前述权利要求中任一项的多核苷酸、病毒颗粒或组合物,其用于治疗方法。
23.根据权利要求22使用的多核苷酸、病毒颗粒或组合物,其中所述治疗方法包括向患者施用有效量的权利要求1-21中任一项的多核苷酸、病毒颗粒或组合物。
24.权利要求22或23的多核苷酸、病毒颗粒或组合物,其中:
(i)所述治疗方法是治疗血友病的方法;和/或
(ii)所述治疗方法是治疗B型血友病的方法;和/或
(iii)所述患者具有针对因子IX的抗体或抑制剂。
25.权利要求1-21中任一项的多核苷酸、病毒颗粒或组合物,其用于在患有B型血友病的患者中实现至少20%的稳定的因子IX活性水平,任选地,其中实现稳定的因子IX活性水平包括向患者施用权利要求1-21中任一项的多核苷酸、病毒颗粒或组合物。
26.权利要求1-21中任一项的多核苷酸、病毒颗粒或组合物,其用于治疗B型血友病,包括以在患者中有效地获得至少20%的稳定的因子IX活性水平的剂量向患者施用所述多核苷酸、病毒颗粒或组合物。
27.根据权利要求25或26使用的多核苷酸、病毒颗粒或组合物,其中:
(a)所述因子IX活性水平在所述多核苷酸、病毒颗粒或组合物施用的至少10周、至少15周、至少20周、至少30周、至少40周或至少50周后是稳定的;
(b)所述患者是使用具有比由包含(i)SEQ ID NO:4或5的因子IX核苷酸序列和(ii)SEQID NO:6的转录调节元件的病毒颗粒表达的因子IX的活性更低的活性的因子IX难治的患者;
(c)所述患者是使用以比由包含(i)SEQ ID NO:4或5的因子IX核苷酸序列和(ii)SEQID NO:6的转录调节元件的核苷酸序列编码的水平更低的水平表达的因子IX多肽难治的患者;
(d)以在患有B型血友病的患者中有效实现至少20%的稳定的因子IX活性水平的剂量施用所述多核苷酸、病毒颗粒或组合物;
(e)以至少4.5×1011vg/kg的剂量,或少于5×1011vg/kg的剂量,或4.5×1011至1×1012vg/kg的剂量,或4.5×1011vg/kg至4.9×1011vg/kg的剂量施用所述多核苷酸、病毒颗粒或组合物,任选地,其中所述剂量是通过使用qPCR定量载体基因组的数量来确定的,任选地,其中qPCR使用结合启动子区域的引物,任选地,其中所述启动子区域是转基因盒的启动子区域;
(f)所施用的多核苷酸或病毒颗粒是由哺乳动物细胞产生的和/或具有因使用哺乳动物病毒载体生产细胞而产生并与昆虫病毒载体生产细胞(例如杆状病毒系统)中产生的载体区分开的特征;
(g)稳定的因子IX活性水平是至少25%或至少30%的稳定的因子IX活性水平,任选地,其中稳定的因子IX活性水平是至少35%的稳定的因子IX活性水平,任选地,其中稳定的因子IX活性水平是至少或约40%;
(h)在施用所述多核苷酸、病毒颗粒或组合物后至少50周或约52周的时间点,因子IX活性水平为至少20%,任选地,其中因子IX活性水平在紧接所述时间点之前至少40周的连续时间保持至少20%;
(i)在施用所述多核苷酸、病毒颗粒或组合物后至少50周或约52周的时间点,因子IX活性水平为至少25%,任选地,其中因子IX活性水平在紧接所述时间点之前至少40周的连续时间保持至少25%;
(j)在施用所述多核苷酸、病毒颗粒或组合物后至少50周或约52周的时间点,因子IX活性为至少或约40%,任选地,其中因子IX活性水平在紧接所述时间点之前至少40周的连续时间保持至少40%;
(k)使用凝血测定法测量因子IX活性以确定来自患者的血液样品中的因子IX活性,任选地,其中所述凝血测定法使用SynthASilTM试剂盒;
(l)通过从患者采集血液样品并使用凝血测定法测量因子IX活性以确定血液样品中的因子IX活性,任选地,其中所述凝血测定法使用SynthASilTM试剂盒;
(m)所述凝血测定法是一阶段凝血测定法,任选地,其中一阶段凝血测定法使用SynthASilTM试剂盒;和/或
(n)所述用途包括类固醇的共同施用,任选地,其中所述类固醇是泼尼松龙。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1813528.5 | 2018-08-20 | ||
US16/105,583 US10842885B2 (en) | 2018-08-20 | 2018-08-20 | Factor IX encoding nucleotides |
US16/105,583 | 2018-08-20 | ||
GBGB1813528.5A GB201813528D0 (en) | 2018-08-20 | 2018-08-20 | Factor IX encoding nucleotides |
PCT/GB2019/052339 WO2020039183A1 (en) | 2018-08-20 | 2019-08-20 | Factor ix encoding nucleotides |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112739818A true CN112739818A (zh) | 2021-04-30 |
Family
ID=67810978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980062207.2A Pending CN112739818A (zh) | 2018-08-20 | 2019-08-20 | 编码因子ix的核苷酸 |
Country Status (11)
Country | Link |
---|---|
EP (1) | EP3810770A1 (zh) |
JP (1) | JP2021533799A (zh) |
KR (1) | KR20210049129A (zh) |
CN (1) | CN112739818A (zh) |
AU (1) | AU2019323747A1 (zh) |
BR (1) | BR112021002998A2 (zh) |
CA (1) | CA3109579A1 (zh) |
IL (1) | IL280973A (zh) |
MX (1) | MX2021001901A (zh) |
SG (1) | SG11202101560QA (zh) |
WO (1) | WO2020039183A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022268110A1 (zh) * | 2021-06-23 | 2022-12-29 | 英斯培瑞有限公司 | 用于治疗b型血友病的组合物和方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10842885B2 (en) | 2018-08-20 | 2020-11-24 | Ucl Business Ltd | Factor IX encoding nucleotides |
CA3232470A1 (en) * | 2021-10-27 | 2023-05-04 | Leah SABIN | Compositions and methods for expressing factor ix for hemophilia b therapy |
WO2024170976A1 (en) * | 2023-02-18 | 2024-08-22 | Intas Pharmaceuticals Ltd. | Codon optimized polynucleotide encoding human factor ix |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104245937A (zh) * | 2012-04-17 | 2014-12-24 | 弗·哈夫曼-拉罗切有限公司 | 使用修饰的核酸表达多肽的方法 |
US20170355973A1 (en) * | 2008-09-15 | 2017-12-14 | Paolo Simioni | Factor ix polypeptide mutant, its uses and method for its production |
CN107980063A (zh) * | 2015-05-11 | 2018-05-01 | Ucl商业有限公司 | 法布里病基因治疗 |
CN108138159A (zh) * | 2015-06-23 | 2018-06-08 | 费城儿童医院 | 经修饰的因子ix、以及用于基因转移到细胞、器官和组织的组合物、方法和用途 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE549037T1 (de) * | 2004-09-22 | 2012-03-15 | St Jude Childrens Res Hospital | Verbesserte expression von faktor-ix in gentherapie-vektoren |
WO2011122950A1 (en) | 2010-04-01 | 2011-10-06 | Amsterdam Molecular Therapeutics (Amt) Ip B.V. | Monomeric duplex aav vectors |
CN103667346B (zh) * | 2013-12-17 | 2016-01-20 | 扬州大学 | 一种pRBE-HCR-hAAT-hFIXml质粒及其构建和应用 |
WO2016004113A1 (en) * | 2014-06-30 | 2016-01-07 | Biogen Ma Inc. | Optimized factor ix gene |
GB201420139D0 (en) | 2014-11-12 | 2014-12-24 | Ucl Business Plc | Factor IX gene therapy |
CN116732066A (zh) * | 2016-10-14 | 2023-09-12 | 四川至善唯新生物科技有限公司 | 一种高活性凝血因子ix突变体、重组蛋白与融合蛋白的制备与应用 |
-
2019
- 2019-08-20 EP EP19762195.6A patent/EP3810770A1/en active Pending
- 2019-08-20 JP JP2021509867A patent/JP2021533799A/ja active Pending
- 2019-08-20 WO PCT/GB2019/052339 patent/WO2020039183A1/en unknown
- 2019-08-20 AU AU2019323747A patent/AU2019323747A1/en not_active Abandoned
- 2019-08-20 CN CN201980062207.2A patent/CN112739818A/zh active Pending
- 2019-08-20 KR KR1020217008345A patent/KR20210049129A/ko not_active Application Discontinuation
- 2019-08-20 SG SG11202101560QA patent/SG11202101560QA/en unknown
- 2019-08-20 CA CA3109579A patent/CA3109579A1/en active Pending
- 2019-08-20 MX MX2021001901A patent/MX2021001901A/es unknown
- 2019-08-20 BR BR112021002998-2A patent/BR112021002998A2/pt not_active IP Right Cessation
-
2021
- 2021-02-18 IL IL280973A patent/IL280973A/en unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170355973A1 (en) * | 2008-09-15 | 2017-12-14 | Paolo Simioni | Factor ix polypeptide mutant, its uses and method for its production |
CN104245937A (zh) * | 2012-04-17 | 2014-12-24 | 弗·哈夫曼-拉罗切有限公司 | 使用修饰的核酸表达多肽的方法 |
CN107980063A (zh) * | 2015-05-11 | 2018-05-01 | Ucl商业有限公司 | 法布里病基因治疗 |
CN108138159A (zh) * | 2015-06-23 | 2018-06-08 | 费城儿童医院 | 经修饰的因子ix、以及用于基因转移到细胞、器官和组织的组合物、方法和用途 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022268110A1 (zh) * | 2021-06-23 | 2022-12-29 | 英斯培瑞有限公司 | 用于治疗b型血友病的组合物和方法 |
Also Published As
Publication number | Publication date |
---|---|
CA3109579A1 (en) | 2020-02-27 |
KR20210049129A (ko) | 2021-05-04 |
BR112021002998A2 (pt) | 2021-05-11 |
AU2019323747A1 (en) | 2021-03-04 |
IL280973A (en) | 2021-04-29 |
EP3810770A1 (en) | 2021-04-28 |
WO2020039183A1 (en) | 2020-02-27 |
JP2021533799A (ja) | 2021-12-09 |
MX2021001901A (es) | 2021-05-27 |
SG11202101560QA (en) | 2021-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210008179A1 (en) | Modified factor ix, and compositions, methods and uses for gene transfer to cells, organs, and tissues | |
US11344608B2 (en) | Factor IX gene therapy | |
CN112739818A (zh) | 编码因子ix的核苷酸 | |
US20220396611A1 (en) | Factor viii construct | |
KR20240025507A (ko) | 미성숙 종결 코돈-매개 장애를 치료하기 위한 방법 및 조성물 | |
US11596671B2 (en) | Gene therapy of hemophilia B using viral vectors encoding recombinant fix variants with increased expression | |
JP2020519272A (ja) | 凝固因子変異体及びその使用 | |
US11517631B2 (en) | Factor IX encoding nucleotides | |
US20210309985A1 (en) | Factor ix encoding nucleotides | |
GB2576508A (en) | Factor IX encoding nucleotides | |
KR20230154067A (ko) | Fix 단백질을 인코딩하는 코돈 최적화된 핵산 | |
US20210395714A1 (en) | Modified factor ix polypeptides | |
OA21369A (en) | Codon-optimized nucleic acid encoding the fix protein. | |
EP4355768A1 (en) | Gene therapy of hemophilia a using viral vectors encoding recombinant fviii variants with increased expression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |