TW202346581A - IgA蛋白酶截短體、包含IgA蛋白酶截短體的融合蛋白及其用途 - Google Patents
IgA蛋白酶截短體、包含IgA蛋白酶截短體的融合蛋白及其用途 Download PDFInfo
- Publication number
- TW202346581A TW202346581A TW112103015A TW112103015A TW202346581A TW 202346581 A TW202346581 A TW 202346581A TW 112103015 A TW112103015 A TW 112103015A TW 112103015 A TW112103015 A TW 112103015A TW 202346581 A TW202346581 A TW 202346581A
- Authority
- TW
- Taiwan
- Prior art keywords
- seq
- fusion protein
- iga
- amino acid
- iga protease
- Prior art date
Links
- 108010002231 IgA-specific serine endopeptidase Proteins 0.000 title claims abstract description 134
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 87
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 87
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 31
- 201000010099 disease Diseases 0.000 claims abstract description 30
- 230000008021 deposition Effects 0.000 claims abstract description 16
- 208000010159 IgA glomerulonephritis Diseases 0.000 claims abstract description 10
- 206010021263 IgA nephropathy Diseases 0.000 claims abstract description 10
- 150000001413 amino acids Chemical class 0.000 claims description 93
- 235000001014 amino acid Nutrition 0.000 claims description 81
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 77
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 64
- 229920001184 polypeptide Polymers 0.000 claims description 62
- 239000012634 fragment Substances 0.000 claims description 53
- 150000007523 nucleic acids Chemical class 0.000 claims description 44
- 210000004027 cell Anatomy 0.000 claims description 30
- 241000186588 Erysipelatoclostridium ramosum Species 0.000 claims description 27
- 230000035772 mutation Effects 0.000 claims description 26
- 102000039446 nucleic acids Human genes 0.000 claims description 23
- 108020004707 nucleic acids Proteins 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 21
- 238000003776 cleavage reaction Methods 0.000 claims description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 18
- 239000002773 nucleotide Substances 0.000 claims description 18
- 125000003729 nucleotide group Chemical group 0.000 claims description 18
- 238000006467 substitution reaction Methods 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 16
- 239000008194 pharmaceutical composition Substances 0.000 claims description 13
- 230000002255 enzymatic effect Effects 0.000 claims description 12
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 11
- 208000031814 IgA Vasculitis Diseases 0.000 claims description 11
- 208000015446 immunoglobulin a vasculitis Diseases 0.000 claims description 11
- 238000002360 preparation method Methods 0.000 claims description 10
- 241000588724 Escherichia coli Species 0.000 claims description 8
- 230000037430 deletion Effects 0.000 claims description 8
- 238000012217 deletion Methods 0.000 claims description 8
- 108010088751 Albumins Proteins 0.000 claims description 7
- 102000009027 Albumins Human genes 0.000 claims description 7
- 210000004899 c-terminal region Anatomy 0.000 claims description 7
- 210000004962 mammalian cell Anatomy 0.000 claims description 6
- 239000004471 Glycine Substances 0.000 claims description 5
- 208000011200 Kawasaki disease Diseases 0.000 claims description 5
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 5
- 208000001725 mucocutaneous lymph node syndrome Diseases 0.000 claims description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 4
- 102000008100 Human Serum Albumin Human genes 0.000 claims description 4
- 108091006905 Human Serum Albumin Proteins 0.000 claims description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 4
- 239000003937 drug carrier Substances 0.000 claims description 4
- 235000014304 histidine Nutrition 0.000 claims description 4
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 4
- 206010012468 Dermatitis herpetiformis Diseases 0.000 claims description 3
- 208000024869 Goodpasture syndrome Diseases 0.000 claims description 3
- 201000004331 Henoch-Schoenlein purpura Diseases 0.000 claims description 3
- 206010019617 Henoch-Schonlein purpura Diseases 0.000 claims description 3
- 206010037549 Purpura Diseases 0.000 claims description 3
- 241001672981 Purpura Species 0.000 claims description 3
- 230000006378 damage Effects 0.000 claims description 3
- 229940079593 drug Drugs 0.000 claims description 3
- 239000003814 drug Substances 0.000 claims description 3
- 201000008383 nephritis Diseases 0.000 claims description 3
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 claims description 2
- 241000699802 Cricetulus griseus Species 0.000 claims description 2
- 101710135898 Myc proto-oncogene protein Proteins 0.000 claims description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 claims description 2
- 101710150448 Transcriptional regulator Myc Proteins 0.000 claims description 2
- 230000017531 blood circulation Effects 0.000 claims description 2
- 150000002411 histidines Chemical class 0.000 claims description 2
- 210000005260 human cell Anatomy 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 210000001672 ovary Anatomy 0.000 claims description 2
- 230000002265 prevention Effects 0.000 claims description 2
- 238000000746 purification Methods 0.000 claims description 2
- 206010039073 rheumatoid arthritis Diseases 0.000 claims description 2
- 239000002253 acid Substances 0.000 claims 3
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 claims 1
- 125000003277 amino group Chemical group 0.000 claims 1
- 238000012258 culturing Methods 0.000 claims 1
- 238000005520 cutting process Methods 0.000 claims 1
- 210000003292 kidney cell Anatomy 0.000 claims 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 74
- 229940024606 amino acid Drugs 0.000 description 69
- 230000000694 effects Effects 0.000 description 15
- 125000000539 amino acid group Chemical group 0.000 description 13
- 239000003550 marker Substances 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 108090000623 proteins and genes Proteins 0.000 description 11
- 239000000126 substance Substances 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 9
- 239000002904 solvent Substances 0.000 description 9
- 108020004414 DNA Proteins 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 8
- 235000018102 proteins Nutrition 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 8
- 239000000872 buffer Substances 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 108091005804 Peptidases Proteins 0.000 description 6
- 239000004365 Protease Substances 0.000 description 6
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 6
- 239000003963 antioxidant agent Substances 0.000 description 6
- 235000006708 antioxidants Nutrition 0.000 description 6
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 5
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 239000008103 glucose Substances 0.000 description 5
- 229940090044 injection Drugs 0.000 description 5
- 239000007924 injection Substances 0.000 description 5
- 238000002347 injection Methods 0.000 description 5
- 239000008176 lyophilized powder Substances 0.000 description 5
- 229930182817 methionine Natural products 0.000 description 5
- 239000000725 suspension Substances 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- 239000000969 carrier Substances 0.000 description 4
- 239000000839 emulsion Substances 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 239000000546 pharmaceutical excipient Substances 0.000 description 4
- 239000000843 powder Substances 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- 241001138401 Kluyveromyces lactis Species 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 3
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 239000003995 emulsifying agent Substances 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 229920002477 rna polymer Polymers 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 238000011740 C57BL/6 mouse Methods 0.000 description 2
- 241000193403 Clostridium Species 0.000 description 2
- 229920000858 Cyclodextrin Polymers 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 241000701959 Escherichia virus Lambda Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 244000285963 Kluyveromyces fragilis Species 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241000282577 Pan troglodytes Species 0.000 description 2
- ZTHYODDOHIVTJV-UHFFFAOYSA-N Propyl gallate Chemical compound CCCOC(=O)C1=CC(O)=C(O)C(O)=C1 ZTHYODDOHIVTJV-UHFFFAOYSA-N 0.000 description 2
- 239000008156 Ringer's lactate solution Substances 0.000 description 2
- 241000607720 Serratia Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 230000003698 anagen phase Effects 0.000 description 2
- 239000012736 aqueous medium Substances 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- -1 butylmethyl hydroxyanisole Chemical compound 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 239000002738 chelating agent Substances 0.000 description 2
- OSASVXMJTNOKOY-UHFFFAOYSA-N chlorobutanol Chemical compound CC(C)(O)C(Cl)(Cl)Cl OSASVXMJTNOKOY-UHFFFAOYSA-N 0.000 description 2
- 239000007979 citrate buffer Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 239000002270 dispersing agent Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 235000011187 glycerol Nutrition 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 230000003054 hormonal effect Effects 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 239000007972 injectable composition Substances 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 208000017169 kidney disease Diseases 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 210000002706 plastid Anatomy 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 2
- 229920000053 polysorbate 80 Polymers 0.000 description 2
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 2
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 2
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 230000003319 supportive effect Effects 0.000 description 2
- 239000000375 suspending agent Substances 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 239000003826 tablet Substances 0.000 description 2
- 238000011191 terminal modification Methods 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- CWERGRDVMFNCDR-UHFFFAOYSA-N thioglycolic acid Chemical compound OC(=O)CS CWERGRDVMFNCDR-UHFFFAOYSA-N 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- QUWIXWFOWIEFRQ-GASJEMHNSA-N (2R,3S,4R,5R)-1-sulfanylhexane-1,2,3,4,5,6-hexol Chemical compound SC(O)[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO QUWIXWFOWIEFRQ-GASJEMHNSA-N 0.000 description 1
- UYTSRQMXRROFPU-REOHCLBHSA-N (2r)-2-amino-3-fluoropropanoic acid Chemical compound FC[C@H](N)C(O)=O UYTSRQMXRROFPU-REOHCLBHSA-N 0.000 description 1
- POGSZHUEECCEAP-ZETCQYMHSA-N (2s)-2-amino-3-(3-amino-4-hydroxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(N)=C1 POGSZHUEECCEAP-ZETCQYMHSA-N 0.000 description 1
- FPJGLSZLQLNZIW-VIFPVBQESA-N (2s)-2-amino-3-(4-methyl-1h-indol-3-yl)propanoic acid Chemical compound CC1=CC=CC2=C1C(C[C@H](N)C(O)=O)=CN2 FPJGLSZLQLNZIW-VIFPVBQESA-N 0.000 description 1
- ICLYJLBTOGPLMC-KVVVOXFISA-N (z)-octadec-9-enoate;tris(2-hydroxyethyl)azanium Chemical compound OCCN(CCO)CCO.CCCCCCCC\C=C/CCCCCCCC(O)=O ICLYJLBTOGPLMC-KVVVOXFISA-N 0.000 description 1
- LUTLAXLNPLZCOF-UHFFFAOYSA-N 1-Methylhistidine Natural products OC(=O)C(N)(C)CC1=NC=CN1 LUTLAXLNPLZCOF-UHFFFAOYSA-N 0.000 description 1
- PBFKVYVGYHNCGT-UHFFFAOYSA-N 1-sulfanylpropane-1,2,3-triol Chemical compound OCC(O)C(O)S PBFKVYVGYHNCGT-UHFFFAOYSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical group C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- ARSWQPLPYROOBG-ZETCQYMHSA-N 2-methylleucine Chemical compound CC(C)C[C@](C)(N)C(O)=O ARSWQPLPYROOBG-ZETCQYMHSA-N 0.000 description 1
- RCCMXKJGURLWPB-UHFFFAOYSA-N 4-methyleneglutamic acid Chemical compound OC(=O)C(N)CC(=C)C(O)=O RCCMXKJGURLWPB-UHFFFAOYSA-N 0.000 description 1
- BDDLHHRCDSJVKV-UHFFFAOYSA-N 7028-40-2 Chemical compound CC(O)=O.CC(O)=O.CC(O)=O.CC(O)=O BDDLHHRCDSJVKV-UHFFFAOYSA-N 0.000 description 1
- XGWFJBFNAQHLEF-UHFFFAOYSA-N 9-anthroic acid Chemical compound C1=CC=C2C(C(=O)O)=C(C=CC=C3)C3=CC2=C1 XGWFJBFNAQHLEF-UHFFFAOYSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000351920 Aspergillus nidulans Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 239000004322 Butylated hydroxytoluene Substances 0.000 description 1
- NLZUEZXRPGMBCV-UHFFFAOYSA-N Butylhydroxytoluene Chemical compound CC1=CC(C(C)(C)C)=C(O)C(C(C)(C)C)=C1 NLZUEZXRPGMBCV-UHFFFAOYSA-N 0.000 description 1
- 101100244725 Caenorhabditis elegans pef-1 gene Proteins 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 102000016938 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 241000588914 Enterobacter Species 0.000 description 1
- 241000588921 Enterobacteriaceae Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241001524679 Escherichia virus M13 Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 241000282575 Gorilla Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000481961 Lachancea thermotolerans Species 0.000 description 1
- 241000235651 Lachancea waltii Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- BRMWTNUJHUMWMS-LURJTMIESA-N N(tele)-methyl-L-histidine Chemical compound CN1C=NC(C[C@H](N)C(O)=O)=C1 BRMWTNUJHUMWMS-LURJTMIESA-N 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 241001504519 Papio ursinus Species 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 241000282405 Pongo abelii Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- HCBIBCJNVBAKAB-UHFFFAOYSA-N Procaine hydrochloride Chemical compound Cl.CCN(CC)CCOC(=O)C1=CC=C(N)C=C1 HCBIBCJNVBAKAB-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 241000311088 Schwanniomyces Species 0.000 description 1
- 241001123650 Schwanniomyces occidentalis Species 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 206010047115 Vasculitis Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- TVXBFESIOXBWNM-UHFFFAOYSA-N Xylitol Natural products OCCC(O)C(O)C(O)CCO TVXBFESIOXBWNM-UHFFFAOYSA-N 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- LWZFANDGMFTDAV-BURFUSLBSA-N [(2r)-2-[(2r,3r,4s)-3,4-dihydroxyoxolan-2-yl]-2-hydroxyethyl] dodecanoate Chemical compound CCCCCCCCCCCC(=O)OC[C@@H](O)[C@H]1OC[C@H](O)[C@H]1O LWZFANDGMFTDAV-BURFUSLBSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000003708 ampul Substances 0.000 description 1
- 229940035674 anesthetics Drugs 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 239000008135 aqueous vehicle Substances 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000003385 bacteriostatic effect Effects 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 235000010354 butylated hydroxytoluene Nutrition 0.000 description 1
- 229940095259 butylated hydroxytoluene Drugs 0.000 description 1
- BPKIGYQJPYCAOW-FFJTTWKXSA-I calcium;potassium;disodium;(2s)-2-hydroxypropanoate;dichloride;dihydroxide;hydrate Chemical compound O.[OH-].[OH-].[Na+].[Na+].[Cl-].[Cl-].[K+].[Ca+2].C[C@H](O)C([O-])=O BPKIGYQJPYCAOW-FFJTTWKXSA-I 0.000 description 1
- BMLSTPRTEKLIPM-UHFFFAOYSA-I calcium;potassium;disodium;hydrogen carbonate;dichloride;dihydroxide;hydrate Chemical compound O.[OH-].[OH-].[Na+].[Na+].[Cl-].[Cl-].[K+].[Ca+2].OC([O-])=O BMLSTPRTEKLIPM-UHFFFAOYSA-I 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 230000009920 chelation Effects 0.000 description 1
- 229960004926 chlorobutanol Drugs 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 235000005687 corn oil Nutrition 0.000 description 1
- 239000002285 corn oil Substances 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 239000002385 cottonseed oil Substances 0.000 description 1
- 150000001896 cresols Chemical class 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 229940097362 cyclodextrins Drugs 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 239000007884 disintegrant Substances 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- DEFVIWRASFVYLL-UHFFFAOYSA-N ethylene glycol bis(2-aminoethyl)tetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)CCOCCOCCN(CC(O)=O)CC(O)=O DEFVIWRASFVYLL-UHFFFAOYSA-N 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000001408 fungistatic effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 239000003193 general anesthetic agent Substances 0.000 description 1
- 235000001727 glucose Nutrition 0.000 description 1
- 229940093181 glucose injection Drugs 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 238000001794 hormone therapy Methods 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 239000001866 hydroxypropyl methyl cellulose Substances 0.000 description 1
- 235000010979 hydroxypropyl methyl cellulose Nutrition 0.000 description 1
- 229920003088 hydroxypropyl methyl cellulose Polymers 0.000 description 1
- UFVKGYZPFZQRLF-UHFFFAOYSA-N hydroxypropyl methyl cellulose Chemical compound OC1C(O)C(OC)OC(CO)C1OC1C(O)C(O)C(OC2C(C(O)C(OC3C(C(O)C(O)C(CO)O3)O)C(CO)O2)O)C(CO)O1 UFVKGYZPFZQRLF-UHFFFAOYSA-N 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 239000003018 immunosuppressive agent Substances 0.000 description 1
- 238000002650 immunosuppressive therapy Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000001155 isoelectric focusing Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 230000003907 kidney function Effects 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000006193 liquid solution Substances 0.000 description 1
- 239000003589 local anesthetic agent Substances 0.000 description 1
- 229960005015 local anesthetics Drugs 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- VWHRYODZTDMVSS-QMMMGPOBSA-N m-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(F)=C1 VWHRYODZTDMVSS-QMMMGPOBSA-N 0.000 description 1
- ZLNQQNXFFQJAID-UHFFFAOYSA-L magnesium carbonate Chemical compound [Mg+2].[O-]C([O-])=O ZLNQQNXFFQJAID-UHFFFAOYSA-L 0.000 description 1
- 239000001095 magnesium carbonate Substances 0.000 description 1
- 229910000021 magnesium carbonate Inorganic materials 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 1
- 229910052753 mercury Inorganic materials 0.000 description 1
- FSKZQBYGDIRMEW-UHFFFAOYSA-N mercury;thiophene Chemical compound [Hg].C=1C=CSC=1 FSKZQBYGDIRMEW-UHFFFAOYSA-N 0.000 description 1
- HEBKCHPVOIAQTA-UHFFFAOYSA-N meso ribitol Natural products OCC(O)C(O)C(O)CO HEBKCHPVOIAQTA-UHFFFAOYSA-N 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 235000010270 methyl p-hydroxybenzoate Nutrition 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 239000002687 nonaqueous vehicle Substances 0.000 description 1
- 239000000346 nonvolatile oil Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000006174 pH buffer Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 230000006320 pegylation Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- WVDDGKGOMKODPV-ZQBYOMGUSA-N phenyl(114C)methanol Chemical compound O[14CH2]C1=CC=CC=C1 WVDDGKGOMKODPV-ZQBYOMGUSA-N 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 239000000244 polyoxyethylene sorbitan monooleate Substances 0.000 description 1
- 229940068968 polysorbate 80 Drugs 0.000 description 1
- 239000008057 potassium phosphate buffer Substances 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 208000022204 primary glomerular disease Diseases 0.000 description 1
- 229960001309 procaine hydrochloride Drugs 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000009465 prokaryotic expression Effects 0.000 description 1
- 239000000473 propyl gallate Substances 0.000 description 1
- 235000010388 propyl gallate Nutrition 0.000 description 1
- 229940075579 propyl gallate Drugs 0.000 description 1
- 235000010232 propyl p-hydroxybenzoate Nutrition 0.000 description 1
- 210000004777 protein coat Anatomy 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- CVHZOJJKTDOEJC-UHFFFAOYSA-N saccharin Chemical compound C1=CC=C2C(=O)NS(=O)(=O)C2=C1 CVHZOJJKTDOEJC-UHFFFAOYSA-N 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 229960004249 sodium acetate Drugs 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- WBHQBSYUUJJSRZ-UHFFFAOYSA-M sodium bisulfate Chemical compound [Na+].OS([O-])(=O)=O WBHQBSYUUJJSRZ-UHFFFAOYSA-M 0.000 description 1
- 229910000342 sodium bisulfate Inorganic materials 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000008354 sodium chloride injection Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- AKHNMLFCWUSKQB-UHFFFAOYSA-L sodium thiosulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=S AKHNMLFCWUSKQB-UHFFFAOYSA-L 0.000 description 1
- 235000019345 sodium thiosulphate Nutrition 0.000 description 1
- 239000002195 soluble material Substances 0.000 description 1
- 229950006451 sorbitan laurate Drugs 0.000 description 1
- 235000011067 sorbitan monolaureate Nutrition 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 229940117013 triethanolamine oleate Drugs 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000008215 water for injection Substances 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 239000000811 xylitol Substances 0.000 description 1
- 235000010447 xylitol Nutrition 0.000 description 1
- HEBKCHPVOIAQTA-SCDXWVJYSA-N xylitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)CO HEBKCHPVOIAQTA-SCDXWVJYSA-N 0.000 description 1
- 229960002675 xylitol Drugs 0.000 description 1
Landscapes
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本申請案係關於一種IgA蛋白酶截短體、包含IgA蛋白酶截短體的融合蛋白(例如,包含IgA蛋白酶截短體和Fc的融合蛋白)及其在治療IgA沉積疾病(例如,IgA腎病)中的用途。
Description
本申請案係關於生物醫藥領域,具體地,本申請案係關於一種IgA蛋白酶截短體、包含IgA蛋白酶截短體的融合蛋白、包含所述IgA蛋白酶截短體或所述融合蛋白的藥物組合物、編碼所述IgA蛋白酶截短體或所述融合蛋白的核酸、所述IgA蛋白酶截短體或所述融合蛋白的製備方法、以及IgA蛋白酶截短體或所述融合蛋白在製備用於治療IgA沉積相關疾病的藥物中的用途。
IgA腎病是目前世界上最常見的原發性腎小球疾病之一,給患者和社會帶來沉重的負擔。目前針對IgA腎病尚缺乏特異性的治療。臨床上多用RAS阻斷劑為基礎的支持治療,以減緩腎功能惡化。對於支持治療無效的患者予以聯合激素免疫抑制劑治療。但激素免疫抑制劑的使用長期療效不佳且給患者帶來嚴重的副作用。
亟需開發有效並且具有低副作用的治療藥物。
儘管本申請案將在以下揭露多個方面和實施方式,但是在不違背本申請案主題精神和範圍的前提下,本申請案所屬技術領域中具有通常知識者顯然可以對其進行各種等同改變和修改。本申請案揭露的多個方面和實施方式僅用於舉例說明,其並非旨在限制本申請案,本申請案的實際保護範圍以申請專利範圍為準。除非另外指出,本文中使用的所有技術和科學術語均具有與本申請案所屬領域中的通常知識者通常所理解的相同的含義。本申請案中引用的所有參考文獻、專利、專利申請均通過整體引用併入本文。
定義
本申請案中使用的術語「多枝梭菌」或「梭狀芽孢桿菌」均指的是
Clostridium ramosum菌,它是一種人體腸道共生菌,可以產生IgA蛋白酶。
本申請案中使用的術語「IgA蛋白酶」是指能夠特異性切割受試者(例如,人)IgA免疫球蛋白分子的酶。
本申請案中使用的術語「AK183」是指多枝梭菌(
Clostridium ramosum)的AK183株。
Clostridium ramosumAK183株產生的野生型IgA蛋白酶的胺基酸序列如SEQ ID NO: 1所示(其中,第1-30位胺基酸為訊息肽)。
本申請案中使用的術語「受試者」包括人類和非人類的動物。非人類的動物包括所有的脊椎動物,例如哺乳動物和非哺乳動物。「受試者」也可以是家畜動物,例如牛、豬、羊、家禽和馬;或齧齒類動物,例如大鼠、小鼠;或靈長類動物,例如猿(ape)、猴子、黑猩猩(chimpanzee)、大猩猩(gorilla)、猩猩(orangutan)、狒狒(baboon);或家養動物,例如狗和貓。「受試者」可以是雄性或者雌性,可以是老年、成年、青少年、兒童或者嬰兒。人類「受試者」可以是高加索人、非洲人、亞洲人、閃族人,或其他種族或所述種族背景的混合。
本申請案中使用的術語「蛋白」、「多肽」以及「肽」可以互換使用,是指胺基酸的聚合物。本申請案所述的蛋白、多肽或肽可以含有天然的胺基酸,也可以含有非天然的胺基酸,或胺基酸的類似物、模擬物。本申請案所述的蛋白、多肽或肽可以通過本領域習知的任何方法獲得,例如但不限於,通過天然分離、重組表現、化學合成等。
本申請案所用的術語「胺基酸」是指含有胺基(-NH
2)和羧基(-COOH)官能基以及每個胺基酸特有的側鏈的有機化合物。胺基酸名稱在本申請案中也以標準的單字母或三字母代碼表示,總結如下:
名稱 | 三字母代碼 | 單字母代碼 |
丙胺酸 | Ala | A |
精胺酸 | Arg | R |
天門冬醯胺 | Asn | N |
天門冬胺酸 | Asp | D |
半胱胺酸 | Cys | C |
麩胺酸 | Glu | E |
麩醯胺酸 | Gln | Q |
甘胺酸 | Gly | G |
組胺酸 | His | H |
異白胺酸 | Ile | I |
白胺酸 | Leu | L |
離胺酸 | Lys | K |
甲硫胺酸 | Met | M |
苯丙胺酸 | Phe | F |
脯胺酸 | Pro | P |
絲胺酸 | Ser | S |
蘇胺酸 | Thr | T |
色胺酸 | Trp | W |
酪胺酸 | Tyr | Y |
纈胺酸 | Val | V |
在本申請案中當「保守替換」用於胺基酸序列時,是指將一個胺基酸殘基用另一個具有相似理化性質的側鏈的胺基酸殘基替代。例如,可以在具有疏水側鏈的胺基酸殘基之間(例如Met、Ala、Val、Leu和Ile)、具有中性親水側鏈的胺基酸殘基之間(例如Cys、Ser、Thr、Asn和Gln)、具有酸性側鏈的胺基酸殘基之間(例如Asp、Glu)、具有鹼性側鏈的胺基酸殘基之間(例如His、Lys和Arg)或具有芳香側鏈的胺基酸殘基之間(例如Trp、Tyr和Phe)進行保守替換。本領域已知,保守替換通常不會引起蛋白構象結構的顯著變化,因此能夠保留蛋白質的生物活性。
本申請案所述的術語「同源的」指當最佳比對時核酸序列(或其互補鏈)或胺基酸序列與另一條序列具有至少60%(例如,至少65%、70%、75%、80%、85%、88%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)的序列同一性。
當「百分比(%)序列同一性」用於胺基酸序列(或核酸序列)時,是指在進行序列比對,並且必要時引入間隔使相同胺基酸(或核酸)數目達到最多後,在候選序列中,與參考序列相同的胺基酸(或核酸)殘基占所述候選序列的胺基酸(或核酸)殘基的百分比。換言之,可以通過用與其比較的參考序列相同的胺基酸殘基(或鹼基)數除以候選序列或參考序列(以較短者為準)中的胺基酸殘基(或鹼基)總數來計算胺基酸序列(或核酸序列)的百分比(%)序列同一性。所述胺基酸殘基的保守替換可以認為或可以不認為是相同殘基。可以通過本領域公開的工具,例如BLASTN、BLASTp(美國國家生物技術資訊中心網站(NCBI),也可參見Altschul S.F. et al.,J. Mol. Biol.,215:403–410(1990);Stephen F. et al.,Nucleic Acids Res.,25:3389–3402(1997))、ClustalW2(歐洲生物資訊研究所網站,可參見Higgins D.G. et al., Methods in Enzymology,266:383-402(1996);Larkin M.A. et al.,Bioinformatics(Oxford, England),23(21):2947-8(2007))和ALIGN或Megalign(DNASTAR)軟體,對序列進行比對以確定胺基酸(或核酸)序列的百分比序列同一性。本申請案所屬技術領域中具有通常知識者可以使用所述工具的預設參數或根據比對的需要適當調整參數,例如通過挑選合適的演算法。
「分離的」物質已經經人工由自然狀態改變。如果自然界中出現某種「分離的」組合物或物質,那麼其已經被改變或脫離其原始狀態,或二者均有發生。例如,某一活體動物體內天然存在的多核苷酸或多肽不是「分離的」,但如果這些多核苷酸或多肽與之在天然狀態下共存的物質足夠分離並以基本上純的狀態存在,則可以認為是「分離的」。「分離的核酸序列」是指分離的核酸分子的序列。在一些實施方式中,「分離的IgA蛋白酶截短體」是指純度為至少60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的IgA蛋白酶截短體,其中純度由電泳方法(例如,SDS-PAGE、等電聚焦、毛細管電泳),或層析法(例如,離子交換層析或反相HPLC)確定。
本申請案中的術語「載體」是指可將遺傳因子操作性地插入其中並使該遺傳因子獲得表現的一種運載工具,例如生產由該遺傳因子編碼的蛋白質、RNA或DNA,或者複製所述遺傳因子。載體可用於轉化、轉導或轉染宿主細胞,使其攜帶的遺傳因子在宿主細胞內得以表現。舉例來說,載體包括:質體、噬菌體、黏質體(cosmid)、人工染色體如酵母人工染色體(YAC)、細菌人工染色體(BAC)或P1衍生的人工染色體(PAC)、噬菌體如λ噬菌體或M13噬菌體,以及動物病毒等。載體可含有多種控制表現的元件,包括啟動子序列、轉錄起始序列、增強子序列、選擇元件及報告基因。另外,載體還可含有複製起始位點。載體還可包括協助其進入細胞的成分,包括但不限於,病毒顆粒、脂質體或蛋白外殼。載體可以是表現載體或選殖載體。本申請案提供的載體(例如表現載體)含有本申請案所述的編碼IgA蛋白酶截短體或融合蛋白的核酸序列、至少一個可操作地連接至所述核酸序列的啟動子(例如,SV40、CMV、EF-1α),以及至少一個選擇標記。
本申請案中使用的對某種疾病、病症或狀況的「治療」或「療法」包括預防或減輕某種疾病、病症或狀況,降低某種疾病、病症或狀況發生或發展的速度,降低發展出某種疾病、病症或狀況的風險,預防或延遲與某種疾病、病症或狀況相關的症狀發展,減少或終止與某種疾病、病症或狀況相關的症狀,產生某種疾病、病症或狀況的完全或部分的逆轉,治癒某種疾病、病症或狀況,或以上的組合。
術語「藥學上可接受的」表示指定的載體、媒介、稀釋劑、賦形劑和/或鹽通常在化學和/或物理上與組成該製劑的其他成分相容,並且在生理上與其受體相容。
術語「IgA沉積相關疾病」是指與IgA免疫球蛋白以聚集或非聚集形式在受試者的組織或器官中積累相關的疾病。例如,包括但不限於,IgA腎病、皰疹樣皮炎、類過敏性紫斑(又稱IgA血管炎)、川崎病、紫斑性腎炎、IgA血管炎腎損害、IgA類風濕因數陽性的類風濕性關節炎、IgA型抗GBM病或IgA型ANCA相關血管炎。
術語「IgA腎病」是指腎臟內以IgA沉積為特徵的腎臟疾病。
IgA
蛋白酶截短體
在另一方面,本申請案提供了一種分離的IgA蛋白酶截短體,其包含來自多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶的非天然截短片段,或者與所述非天然截短片段具有至少90%或至少95%的序列同一性(例如,具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性)。
本申請案中使用的術語「截短體」是指從野生型多肽的一端或兩端去除一個或多個胺基酸之後形成的肽。例如,「IgA蛋白酶截短體」是指從野生型的IgA蛋白酶的一端或者兩端去除一個或多個胺基酸之後形成的肽。因此,本申請案中的「截短體」並不包括其對應的野生型多肽的全長。
在某些實施方式中,截短體在其對應的野生型多肽的基礎上有一個或多個胺基酸突變或缺失。例如,在某些實施方式中,本申請案所述的IgA蛋白酶截短體包含來自多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶的非天然截短片段,其中所述非天然截短片段在所述多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶的基礎上有胺基酸突變或缺失,使得所述IgA蛋白酶截短體喪失或降低自酶切功能。
本申請案中使用的術語「非天然截短片段」是指與多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶在自然環境下自酶切之後形成的截短片段具有不同的胺基酸序列(例如,不同的胺基酸長度、不同的胺基酸類型等等)的片段。
在某些實施方式中,所述胺基酸突變或缺失發生在所述多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶的天然自酶切位點。在某些實施方式中,所述胺基酸突變或缺失發生在所述多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶的天然自酶切位點的上游5個位點以內(例如,在所述天然自酶切位點的上游1個位點、2個位點、3個位點、4個位點或5個位點)。在某些實施方式中,所述胺基酸突變或缺失發生在所述多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶的天然自酶切位點的下游5個位點以內(例如,在所述天然自酶切位點的下游1個位點、2個位點、3個位點、4個位點或5個位點)。在某些實施方式中,所述胺基酸突變或缺失發生在所述多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶的天然自酶切位點的上游5個位點以內和下游5個位點以內。
在某些實施方式中,所述非天然截短片段為來自多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶的N末端截短片段或C末端截短片段。
本申請案中使用的術語「N末端截短片段」是指包括多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶的胺基端的胺基酸序列的截短片段。
本申請案中使用的術語「C末端截短片段」是指包括多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶的羧基端的胺基酸序列的截短片段。
在某些實施方式中,所述多枝梭菌(
Clostridium ramosum)為
Clostridium ramosumAK183株。
在某些實施方式中,所述N末端截短片段包含來自多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶的N末端第31位起的至少760個連續胺基酸的多肽片段,或者與所述多肽片段具有至少90%或至少95%的序列同一性(例如,至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性)。在某些實施方式中,所述多枝梭菌(
Clostridium ramosum)的野生型IgA蛋白酶的胺基酸序列如SEQ ID NO: 1所示。
除特殊說明外,本申請案所提到的AK183 IgA蛋白酶胺基酸位點即為相對應的野生型AK183 IgA蛋白酶(其胺基酸序列如SEQ ID NO: 1所示)胺基酸位點。例如,本申請案所提到的AK183 IgA蛋白酶的第790位對應於SEQ ID NO: 1的第790個位點。除特殊說明外,本申請案所提到的AK183 IgA蛋白酶截短體的命名規則為AK183(對應於SEQ ID NO: 1的起始位點-對應於SEQ ID NO: 1的終止位點)。例如,AK183(31-790)指的是SEQ ID NO: 1的第31位至第790位胺基酸形成的IgA蛋白酶截短體。
在某些實施方式中,本申請案所述的IgA蛋白酶的天然自酶切位點在如SEQ ID NO: 1所示的胺基酸序列的第710位至830位之間、第720位至第820位之間、第730位至810位之間、第740位至800位之間、第750位至第790位之間、第791位至第780位之間或者第792位至第797位之間。在某些實施方式中,所述天然自酶切位點在如SEQ ID NO: 1所示的胺基酸序列的第790位、第791位、第792位、第793位、第794位、第795位、第796位、第797位、第798位、第799位或第800位。
在某些實施方式中,本申請案提供的IgA蛋白酶截短體包含如SEQ ID NO: 1所示的胺基酸序列的第31位起的至少760個連續胺基酸的多肽片段。例如,在某些實施方式中,本申請案提供的IgA蛋白酶截短體包含如SEQ ID NO: 1所示的胺基酸序列的第31位起的至少761個、至少762個、至少763個、至少764個、至少765個、至少766個、至少767個、至少768個、至少769個、至少770個、至少771個、至少772個、至少773個、至少774個、至少775個、至少776個、至少777個、至少778個、至少779個、至少780個、至少781個、至少782個、至少783個、至少784個、至少785個、至少786個、至少787個、至少788個、至少789個、至少790個、至少791個、至少792個、至少793個、至少794個、至少795個、至少796個、至少797個、至少798個、至少799個、至少800個、至少801個、至少802個、至少803個、至少804個、至少805個、至少806個、至少807個、至少808個、至少809個、至少810個、至少850個、至少860個、至少870個、至少880個、至少890個、至少900個、至少910個、至少920個、至少930個、至少940個、至少950個、至少960個、至少970個、至少980個、至少990個、至少1000個、至少1050個、至少1100個、至少1150個、至少1200個連續胺基酸的多肽片段。在某些實施方式中,本申請案提供的IgA蛋白酶截短體包含如SEQ ID NO: 1所示的胺基酸序列的第31位起的760個連續胺基酸的多肽片段。在某些實施方式中,本申請案提供的IgA蛋白酶截短體包含如SEQ ID NO: 1所示的胺基酸序列的第31位起的761個連續胺基酸的多肽片段。在某些實施方式中,本申請案提供的IgA蛋白酶截短體包含如SEQ ID NO: 1所示的胺基酸序列的第31位起的762個連續胺基酸的多肽片段。在某些實施方式中,本申請案提供的IgA蛋白酶截短體包含如SEQ ID NO: 1所示的胺基酸序列的第31位起的768個連續胺基酸的多肽片段。在某些實施方式中,本申請案提供的IgA蛋白酶截短體包含如SEQ ID NO: 1所示的胺基酸序列的第31位起的777個連續胺基酸的多肽片段。在某些實施方式中,本申請案提供的IgA蛋白酶截短體包含如SEQ ID NO: 1所示的胺基酸序列的第31位起的786個連續胺基酸的多肽片段。在某些實施方式中,本申請案提供的IgA蛋白酶截短體包含如SEQ ID NO: 1所示的胺基酸序列的第31位起的803個連續胺基酸的多肽片段。
在某些實施方式中,本申請案提供的IgA蛋白酶截短體包含選自下組的多肽片段:如SEQ ID NO: 1所示的胺基酸序列的第31位至第790位胺基酸、如SEQ ID NO: 1所示的胺基酸序列的第31位至第792位胺基酸、如SEQ ID NO: 1所示的胺基酸序列的第31位至第798位胺基酸、如SEQ ID NO: 1所示的胺基酸序列的第31位至第807位胺基酸、如SEQ ID NO: 1所示的胺基酸序列的第31位至第816位胺基酸、如SEQ ID NO: 1所示的胺基酸序列的第31位至第833位胺基酸以及與其具有至少90%或至少95%的序列同一性(例如,至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性)的多肽片段。
在某些實施方式中,本申請案提供了AK183(31-790)截短體,其胺基酸序列如SEQ ID NO: 14所示。
ASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQ(SEQ ID NO: 14)
在某些實施方式中,本申請案提供了AK183(31-791)截短體,其胺基酸序列如SEQ ID NO: 15所示。
ASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQV(SEQ ID NO: 15)
在某些實施方式中,本申請案提供了AK183(31-792)截短體,其胺基酸序列如SEQ ID NO: 16所示。
ASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVL(SEQ ID NO: 16)
在某些實施方式中,本申請案提供了AK183(31-798)截短體,其胺基酸序列如SEQ ID NO: 17所示。
ASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLDENGNV(SEQ ID NO: 17)
在某些實施方式中,本申請案提供了AK183(31-807)截短體,其胺基酸序列如SEQ ID NO: 18所示。
ASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLDENGNVLADDNTETQ(SEQ ID NO: 18)
在某些實施方式中,本申請案提供了AK183(31-816)截短體,其胺基酸序列如SEQ ID NO: 19所示。
ASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLDENGNVLADDNTETQRYTTVSIQY(SEQ ID NO: 19)
在某些實施方式中,本申請案提供了AK183(31-833)截短體,其胺基酸序列如SEQ ID NO: 20所示。
ASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLDENGNVLADDNTETQRYTTVSIQYKFEDGSEIPNTAGGTFT(SEQ ID NO: 20)
在某些實施方式中,本申請案提供的IgA蛋白酶截短體在上述多肽片段的胺基酸序列基礎上,在一個或多個位點(例如,在1個、2個、3個、4個、5個或更多個位點)具有胺基酸的保守替換。胺基酸殘基的保守替換是指性質相似的胺基酸之間的替換,例如極性胺基酸之間的替換(如麩醯胺酸和天門冬醯胺之間的替換),疏水性胺基酸之間的替換(如白胺酸、異白胺酸、甲硫胺酸和纈胺酸之間的替換),以及帶相同電荷的胺基酸之間的替換(如精胺酸、離胺酸和組胺酸之間的替換,或者麩胺酸和天門冬胺酸之間的替換)等。在某些實施方式中,本申請案所述的IgA蛋白酶截短體與SEQ ID NO: 14、SEQ ID NO: 15、SEQ ID NO: 16、SEQ ID NO: 17、SEQ ID NO: 18、SEQ ID NO: 19或SEQ ID NO: 20所示的胺基酸序列相比,在1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、15個、20個或更多個位點具有胺基酸的保守替換。
在不影響活性的前提下,本申請案提供的IgA蛋白酶截短體還可以含有非天然的胺基酸。非天然的胺基酸包括例如,β-氟代丙胺酸、1-甲基組胺酸、γ-亞甲基麩胺酸、α-甲基白胺酸、4,5-脫氫離胺酸、羥基脯胺酸、3-氟代苯基丙胺酸、3-胺基酪胺酸、4-甲基色胺酸等。
本申請案提供的IgA蛋白酶截短體也可以使用本領域習知的方法進行修飾。例如,但不限於,PEG化、醣基化、胺基端修飾、脂肪醯化、羧基端修飾、磷酸化、甲基化等。本申請案所屬技術領域中具有通常知識者可以理解,本申請案提供的IgA蛋白酶截短體使用本領域習知的方法進行修飾之後,仍然保留了與IgA蛋白酶截短體基本上相似的功能。
在某些實施方式中,本申請案提供的IgA蛋白酶截短體具有特異性切割人IgA的酶活性。在某些實施方式中,本申請案提供的IgA蛋白酶截短體具有特異性切割人IgA重鏈的酶活性。在某些實施方式中,本申請案提供的IgA蛋白酶截短體具有特異性切割人IgA重鏈CH1與鉸鏈區交匯處的酶活性。在某些實施方式中,本申請案提供的IgA蛋白酶截短體具有特異性切割人IgA1的酶活性。
在某些實施方式中,本申請案提供的IgA蛋白酶截短體在上述多肽片段的胺基酸序列基礎上,在一個或多個位點具有胺基酸的保守替換,但仍然具有切割人IgA(例如,IgA1)的酶活性。在某些實施方式中,本申請案提供的IgA蛋白酶截短體與上述多肽片段具有至少90%或至少95%的序列同一性(例如,至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性),並且仍然具有切割人IgA(例如,IgA1)的酶活性。
融合蛋白
在另一方面,本申請案提供了一種融合蛋白,其包含第一多肽和第二多肽,其中所述第一多肽包含本申請案所述的IgA蛋白酶截短體,所述第二多肽包含用於延長所述第一多肽在受試者體內半衰期的胺基酸序列。
在某些實施方式中,所述第一多肽和所述第二多肽之間通過連接子連接。在某些實施方式中,所述第一多肽和所述第二多肽之間直接連接(即,不通過連接子連接)。本申請案中使用的術語「連接子」或「接頭」是指具有1、2、3、4或5個胺基酸殘基,或長度介於5和15、20、30、50或更多個胺基酸殘基之間的人工胺基酸序列,通過肽鍵連接,並用於連接一個或多個多肽。連接子可能有也可能沒有二級結構。連接子序列在本領域是已知的,例如,參見Holliger
et al., Proc. Natl. Acad. Sci. USA90:6444-6448 (1993);Poljak
et al., Structure2:1121-1123 (1994)。
在某些實施方式中,所述連接子選自下組:可切割連接子、不可切割連接子、肽連接子、柔性連接子、剛性連接子、螺旋連接子和非螺旋連接子。可以使用本領域已知的任何合適的連接子。在某些實施方式中,所述連接子包含肽連接子。例如,本申請案中的有用連接子可能富含甘胺酸和絲胺酸殘基。示例包括具有包含蘇胺酸/絲胺酸和甘胺酸的單個或重複序列的連接子,例如GGGS(SEQ ID NO: 21)或GGGGS(SEQ ID NO: 22)或其串聯重複(例如,2、3、4、5、6、7、8、9、10或更多重複)。在某些實施方式中,本申請案中使用的連接子包括GGCGGCGGTGGATCC(SEQ ID NO: 23)。可選地,所述連接子可能是包含如GGCGGCGGTGGATCC(SEQ ID NO: 23)所示的胺基酸序列的一個或多個順序或串聯重複的長肽鏈。在某些實施方式中,所述第一連接子包括SEQ ID NO: 23的1、2、3、4、5、6、7、8、9、10或更多順序或串聯重複。在某些實施方式中,所述第一連接子包括選自下組的胺基酸序列或由選自下組的胺基酸序列組成:與SEQ ID NO: 21、22、23中的任何一個具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性的胺基酸序列。
在某些實施方式中,所述第二多肽選自Fc結構域和白蛋白。在某些實施方式中,所述Fc結構域包含鉸鏈區。在某些實施方式中,所述Fc結構域包含下游鉸鏈區(lower hinge)。在某些實施方式中,所述Fc結構域包含核心鉸鏈區(core hinge region)和下游鉸鏈區(lower hinge)。在某些實施方式中,所述Fc結構域包含上游鉸鏈區(upper hinge region)、核心鉸鏈區(core hinge region)和下游鉸鏈區(lower hinge)。在某些實施方式中,所述Fc結構域不包含鉸鏈區。在某些實施方式中,所述Fc結構域來源於人IgG Fc結構域。在某些實施方式中,所述Fc結構域來源於人IgG1 Fc結構域、人IgG2 Fc結構域、人IgG3 Fc結構域或人IgG4 Fc結構域。
在某些實施方式中,所述Fc結構域包括如SEQ ID NO: 24所示的胺基酸序列。在某些實施方式中,所述Fc結構域由如SEQ ID NO: 24所示的胺基酸序列組成。在某些實施方式中,所述Fc結構域的胺基酸序列與如SEQ ID NO: 24所示的胺基酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的序列同一性。
EPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK(SEQ ID NO: 24)
在某些實施方式中,所述Fc結構域的編碼核酸序列包括如SEQ ID NO: 39所示的核苷酸序列。在某些實施方式中,所述Fc結構域的編碼核酸序列由如SEQ ID NO: 39所示的核苷酸序列組成。在某些實施方式中,所述Fc結構域的編碼核酸序列與如SEQ ID NO: 39所示的核苷酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的序列同一性。
GAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGGGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAA(SEQ ID NO: 39)
在某些實施方式中,所述Fc結構域包括如SEQ ID NO: 25所示的胺基酸序列。在某些實施方式中,所述Fc結構域由如SEQ ID NO: 25所示的胺基酸序列組成。在某些實施方式送,所述Fc結構域的胺基酸序列與如SEQ ID NO: 25所示的胺基酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的序列同一性。
TCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK(SEQ ID NO: 25)
在某些實施方式中,所述Fc結構域的編碼核酸序列包括如SEQ ID NO: 40所示的核苷酸序列。在某些實施方式中,所述Fc結構域的編碼核酸序列由如SEQ ID NO: 40所示的核苷酸序列組成。在某些實施方式中,所述Fc結構域的編碼核酸序列與如SEQ ID NO: 40所示的核苷酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的序列同一性。
ACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGGGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAA(SEQ ID NO: 40)。
在某些實施方式中,所述Fc結構域包括如SEQ ID NO: 32所示的胺基酸序列。在某些實施方式中,所述Fc結構域由如SEQ ID NO: 32所示的胺基酸序列組成。在某些實施方式中,所述Fc結構域的胺基酸序列與如SEQ ID NO: 32所示的胺基酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的序列同一性。
ELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK(SEQ ID NO: 32)。
在某些實施方式中,所述Fc結構域包含一個或多個延長所述融合蛋白的半衰期的突變。在某些實施方式中,所述Fc結構域與所述第一多肽的C末端連接。在某些實施方式中,所述Fc結構域與所述第一多肽的N末端連接。
在某些實施方式中,所述第二多肽為白蛋白。在某些實施方式中,所述白蛋白包含人血清白蛋白的一個或多個結構域。在某些實施方式中,所述白蛋白包含人血清白蛋白的D3結構域。
在某些實施方式中,本申請案提供的融合蛋白進一步包含標記。在某些實施方式中,所述標記選自下組:螢光標記、發光標記、純化標記和生色標記。在某些實施方式中,所述標記選自下組:c-Myc標記、HA標記、VSV-G標記、FLAG標記、V5標記和HIS標記。在某些實施方式中,所述標記為HIS標記。在某些實施方式中,所述標記是包含6個、7個、8個、9個或10個組胺酸的HIS標記。在某些實施方式中,所述第二多肽位於所述第一多肽的C末端,所述標記位於所述第二多肽的C末端。
在某些實施方式中,本申請案提供的融合蛋白包括如SEQ ID NO: 26、SEQ ID NO: 27、SEQ ID NO: 28、SEQ ID NO: 29、SEQ ID NO: 30、SEQ ID NO: 31所示的胺基酸序列。在某些實施方式中,本申請案提供的融合蛋白由選自下組的胺基酸序列組成:SEQ ID NO: 26、SEQ ID NO: 27、SEQ ID NO: 28、SEQ ID NO: 29、SEQ ID NO: 30、SEQ ID NO: 31,或者與其具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%的序列同一性。
SEQ ID NO | 胺基酸序列 |
26 | ASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLGGGGSEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKHHHHHH |
27 | MYRMQLLSCIALSLALVTNSGTASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLGGGGSEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKHHHHHHHH |
28 | ASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLDENGNVGGGGSHHHHHHHHHHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK |
29 | ASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLDENGNVLADDNTETQGGGGSHHHHHHHHHHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK |
30 | ASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLDENGNVLADDNTETQRYTTVSIQYGGGGSHHHHHHHHHHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK |
31 | ASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLDENGNVLADDNTETQRYTTVSIQYKFEDGSEIPNTAGGTFTGGGGSHHHHHHHHHHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK |
在某些實施方式中,本申請案提供的融合蛋白包括如SEQ ID NO: 2、SEQ ID NO: 4、SEQ ID NO: 6、SEQ ID NO: 8、SEQ ID NO: 10、SEQ ID NO: 12所示的胺基酸序列。在某些實施方式中,本申請案提供的融合蛋白由選自下組的胺基酸序列組成:SEQ ID NO: 2、SEQ ID NO: 4、SEQ ID NO: 6、SEQ ID NO: 8、SEQ ID NO: 10、SEQ ID NO: 12,或者與其具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%的序列同一性。
SEQ ID NO | 胺基酸序列 |
2 | HMASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLGGGGSEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKHHHHHHAA |
4 | KLMYRMQLLSCIALSLALVTNSGTASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLGGGGSEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKHHHHHHHHAA |
6 | HMASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLDENGNVGGGGSHHHHHHHHHHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKAA |
8 | HMASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLDENGNVLADDNTETQGGGGSHHHHHHHHHHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKAA |
10 | HMASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLDENGNVLADDNTETQRYTTVSIQYGGGGSHHHHHHHHHHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKAA |
12 | HMASKPDIKVGDYVKMGVYNNASILWRCVSIDNNGPLMLADKIVDTLAYDAKTNDNSNSKSHSRSYKRDDYGSNYWKDSNMRSWLNSTAAEGKVDWLCGNPPKDGYVSGVGAYNEKAGFLNAFSKSEIAAMKTVTQRSLVSHPEYNKGIVDGDANSDLLYYTDISEAVANYDSSYFETTTEKVFLLDVKQANAVWKNLKGYYVAYNNDGMAWPYWLRTPVTDCNHDMRYISSSGQVGRYAPWYSDLGVRPAFYLDSEYFVTTSGSGSQSSPYIGSAPNKQEDDYTISEPAEDANPDWNVSTEQSIQLTLGPWYSNDGKYSNPTIPVYTIQKTRSDTENMVVVVCGEGYTKSQQGKFINDVKRLWQDAMKYEPYRSYADRFNVYALCTASESTFDNGGSTFFDVIVDKYNSPVISNNLHGSQWKNHIFERCIGPEFIEKIHDAHIKKKCDPNTIPSGSEYEPYYYVHDYIAQFAMVVNTKSDFGGAYNNREYGFHYFISPSDSYRASKTFAHEFGHGLLGLGDEYSNGYLLDDKELKSLNLSSVEDPEKIKWRQLLGFRNTYTCRNAYGSKMLVSSYECIMRDTNYQFCEVCRLQGFKRMSQLVKDVDLYVATPEVKEYTGAYSKPSDFTDLETSSYYNYTYNRNDRLLSGNSKSRFNTNMNGKKIELRTVIQNISDKNARQLKFKMWIKHSDGSVATDSSGNPLQTVQTFDIPVWNDKANFWPLGALDHIKSDFNSGLKSCSLIYQIPSDAQLKSGDTVAFQVLDENGNVLADDNTETQRYTTVSIQYKFEDGSEIPNTAGGTFTGGGGSHHHHHHHHHHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKAA |
在某些實施方式中,本申請案提供的融合蛋白在受試者體內的血循環中的半衰期為至少1天、至少2天、至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天、至少13天、至少14天。
核酸
在另一方面,本申請案提供了一種分離的核酸,其包含編碼本申請案所述的IgA蛋白酶截短體的核苷酸序列或包含編碼本申請案所述的融合蛋白的核苷酸序列。
本申請案所用的術語「核酸」或「核苷酸」是指單鏈或雙鏈形式的去氧核糖核酸(DNA)或核糖核酸(RNA)及其聚合物。除非另有說明,否則特定的核苷酸序列還隱含地涵蓋其保守修飾的變體(例如簡併的密碼子取代)、等位基因、直向同源物、SNP和互補序列以及明確指出的序列。具體而言,簡併的密碼子取代可通過產生這樣的序列來實現:其中一個或多個選定的(或全部)密碼子的第三位置被混合鹼基和/或去氧肌苷殘基取代(參見Batzer et al., Nucleic Acid Res. 19:5081 (1991);Ohtsuka et al., J. Biol. Chem. 260:2605-2608 (1985)以及Rossolini et al., Mol. Cell. Probes 8:91-98 (1994))。
使用傳統的步驟,可以容易地對編碼本申請案所述的IgA蛋白酶截短體的DNA或者編碼本申請案所述的融合蛋白的DNA進行分離和定序(例如通過使用能夠與編碼所述IgA蛋白酶截短體或融合蛋白的基因特異性結合的寡核苷酸探針)。編碼DNA也可以通過合成方法獲得。
在某些實施方式中,本申請案提供的核酸包括如SEQ ID NO: 33、SEQ ID NO: 34、SEQ ID NO: 35、SEQ ID NO: 36、SEQ ID NO: 37、SEQ ID NO: 38所示的核酸序列。在某些實施方式中,本申請案提供的核酸由選自下組的核苷酸序列組成:SEQ ID NO: 33、SEQ ID NO: 34、SEQ ID NO: 35、SEQ ID NO: 36、SEQ ID NO: 37、SEQ ID NO: 38,或者與其具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性。
SEQ ID NO | 核苷酸序列 |
33 | GCGAGCAAACCGGACATCAAAGTGGGCGACTACGTGAAAATGGGTGTGTATAATAACGCAAGCATCCTGTGGCGCTGTGTGAGCATCGACAACAATGGCCCGCTGATGCTGGCCGATAAAATTGTTGACACGCTGGCGTATGATGCTAAAACCAACGACAATTCGAACAGCAAATCTCATAGTCGTTCCTACAAACGCGATGACTACGGCAGCAACTATTGGAAAGATAGTAATATGCGCTCCTGGCTGAACTCAACCGCGGCCGAGGGTAAAGTGGATTGGCTGTGCGGCAATCCGCCGAAAGACGGTTACGTCAGCGGCGTGGGTGCATATAATGAAAAAGCTGGTTTTCTGAACGCGTTCTCAAAATCGGAAATTGCAGCTATGAAAACGGTGACCCAGCGTAGCCTGGTTTCTCATCCGGAATATAATAAAGGCATTGTTGATGGTGACGCGAACTCGGATCTGCTGTATTACACCGACATCAGCGAAGCAGTGGCTAACTACGATAGCTCTTATTTTGAAACCACGACCGAAAAAGTTTTCCTGCTGGATGTCAAACAGGCGAACGCCGTCTGGAAAAATCTGAAAGGCTATTACGTGGCTTACAACAATGATGGTATGGCATGGCCGTATTGGCTGCGTACCCCGGTGACGGATTGTAATCATGACATGCGCTATATTAGTTCCTCAGGCCAGGTTGGTCGTTACGCTCCGTGGTATTCTGATCTGGGCGTCCGTCCGGCGTTTTACCTGGACAGTGAATATTTCGTGACGACCAGCGGCTCTGGTAGTCAGTCGAGCCCGTACATTGGTTCCGCGCCGAACAAACAAGAAGATGACTATACCATCTCAGAACCGGCGGAAGATGCCAACCCGGACTGGAATGTTTCGACGGAACAGAGCATTCAACTGACCCTGGGCCCGTGGTACTCGAATGATGGTAAATATAGCAACCCGACCATTCCGGTGTATACCATCCAGAAAACGCGCTCGGATACCGAAAACATGGTGGTTGTCGTGTGCGGCGAAGGTTATACCAAATCACAGCAAGGCAAATTTATCAATGATGTTAAACGTCTGTGGCAGGACGCTATGAAATATGAACCGTACCGTAGCTATGCGGATCGCTTTAATGTGTATGCACTGTGTACGGCTTCCGAATCAACCTTCGATAACGGCGGTTCTACCTTTTTCGATGTGATCGTTGACAAATACAACTCTCCGGTTATCAGTAACAATCTGCATGGCAGTCAGTGGAAAAATCACATTTTTGAACGCTGCATCGGTCCGGAATTCATTGAAAAAATCCATGATGCCCACATTAAGAAAAAATGTGACCCGAACACCATCCCGTCGGGTAGCGAATACGAACCGTATTACTATGTGCATGATTATATTGCACAGTTTGCTATGGTTGTCAATACCAAATCCGACTTCGGCGGTGCATATAACAATCGCGAATACGGCTTTCACTATTTCATCTCTCCGAGTGATTCCTACCGTGCCTCTAAAACCTTTGCACATGAATTCGGCCACGGTCTGCTGGGCCTGGGTGATGAATACTCGAATGGTTATCTGCTGGATGACAAAGAACTGAAAAGCCTGAACCTGTCTAGTGTGGAAGATCCGGAAAAAATTAAATGGCGTCAGCTGCTGGGCTTTCGCAATACGTACACCTGCCGTAACGCGTATGGTTCTAAAATGCTGGTTTCCTCATACGAATGTATCATGCGCGATACCAACTATCAATTTTGCGAAGTCTGTCGCCTGCAGGGCTTCAAACGTATGAGCCAACTGGTTAAAGATGTCGACCTGTATGTGGCCACGCCGGAAGTTAAAGAATACACCGGTGCATATAGTAAACCGTCCGATTTTACGGACCTGGAAACCTCGAGCTACTACAACTACACCTACAACCGTAACGATCGCCTGCTGAGTGGCAACTCAAAATCGCGTTTCAATACGAACATGAATGGCAAGAAAATTGAACTGCGCACCGTTATTCAGAACATCAGCGATAAAAACGCCCGTCAACTGAAATTCAAAATGTGGATCAAACATTCAGATGGCTCGGTGGCAACCGACTCTAGTGGTAACCCGCTGCAGACCGTCCAAACGTTTGATATTCCGGTGTGGAACGACAAAGCCAATTTCTGGCCGCTGGGCGCACTGGATCACATCAAATCCGACTTTAATTCAGGTCTGAAAAGCTGCTCTCTGATTTATCAGATCCCGTCTGATGCTCAACTGAAAAGTGGCGACACCGTGGCGTTCCAGGTTCTG |
34 | GCGAGCAAACCGGACATCAAAGTGGGCGACTACGTGAAAATGGGTGTGTATAATAACGCAAGCATCCTGTGGCGCTGTGTGAGCATCGACAACAATGGCCCGCTGATGCTGGCCGATAAAATTGTTGACACGCTGGCGTATGATGCTAAAACCAACGACAATTCGAACAGCAAATCTCATAGTCGTTCCTACAAACGCGATGACTACGGCAGCAACTATTGGAAAGATAGTAATATGCGCTCCTGGCTGAACTCAACCGCGGCCGAGGGTAAAGTGGATTGGCTGTGCGGCAATCCGCCGAAAGACGGTTACGTCAGCGGCGTGGGTGCATATAATGAAAAAGCTGGTTTTCTGAACGCGTTCTCAAAATCGGAAATTGCAGCTATGAAAACGGTGACCCAGCGTAGCCTGGTTTCTCATCCGGAATATAATAAAGGCATTGTTGATGGTGACGCGAACTCGGATCTGCTGTATTACACCGACATCAGCGAAGCAGTGGCTAACTACGATAGCTCTTATTTTGAAACCACGACCGAAAAAGTTTTCCTGCTGGATGTCAAACAGGCGAACGCCGTCTGGAAAAATCTGAAAGGCTATTACGTGGCTTACAACAATGATGGTATGGCATGGCCGTATTGGCTGCGTACCCCGGTGACGGATTGTAATCATGACATGCGCTATATTAGTTCCTCAGGCCAGGTTGGTCGTTACGCTCCGTGGTATTCTGATCTGGGCGTCCGTCCGGCGTTTTACCTGGACAGTGAATATTTCGTGACGACCAGCGGCTCTGGTAGTCAGTCGAGCCCGTACATTGGTTCCGCGCCGAACAAACAAGAAGATGACTATACCATCTCAGAACCGGCGGAAGATGCCAACCCGGACTGGAATGTTTCGACGGAACAGAGCATTCAACTGACCCTGGGCCCGTGGTACTCGAATGATGGTAAATATAGCAACCCGACCATTCCGGTGTATACCATCCAGAAAACGCGCTCGGATACCGAAAACATGGTGGTTGTCGTGTGCGGCGAAGGTTATACCAAATCACAGCAAGGCAAATTTATCAATGATGTTAAACGTCTGTGGCAGGACGCTATGAAATATGAACCGTACCGTAGCTATGCGGATCGCTTTAATGTGTATGCACTGTGTACGGCTTCCGAATCAACCTTCGATAACGGCGGTTCTACCTTTTTCGATGTGATCGTTGACAAATACAACTCTCCGGTTATCAGTAACAATCTGCATGGCAGTCAGTGGAAAAATCACATTTTTGAACGCTGCATCGGTCCGGAATTCATTGAAAAAATCCATGATGCCCACATTAAGAAAAAATGTGACCCGAACACCATCCCGTCGGGTAGCGAATACGAACCGTATTACTATGTGCATGATTATATTGCACAGTTTGCTATGGTTGTCAATACCAAATCCGACTTCGGCGGTGCATATAACAATCGCGAATACGGCTTTCACTATTTCATCTCTCCGAGTGATTCCTACCGTGCCTCTAAAACCTTTGCACATGAATTCGGCCACGGTCTGCTGGGCCTGGGTGATGAATACTCGAATGGTTATCTGCTGGATGACAAAGAACTGAAAAGCCTGAACCTGTCTAGTGTGGAAGATCCGGAAAAAATTAAATGGCGTCAGCTGCTGGGCTTTCGCAATACGTACACCTGCCGTAACGCGTATGGTTCTAAAATGCTGGTTTCCTCATACGAATGTATCATGCGCGATACCAACTATCAATTTTGCGAAGTCTGTCGCCTGCAGGGCTTCAAACGTATGAGCCAACTGGTTAAAGATGTCGACCTGTATGTGGCCACGCCGGAAGTTAAAGAATACACCGGTGCATATAGTAAACCGTCCGATTTTACGGACCTGGAAACCTCGAGCTACTACAACTACACCTACAACCGTAACGATCGCCTGCTGAGTGGCAACTCAAAATCGCGTTTCAATACGAACATGAATGGCAAGAAAATTGAACTGCGCACCGTTATTCAGAACATCAGCGATAAAAACGCCCGTCAACTGAAATTCAAAATGTGGATCAAACATTCAGATGGCTCGGTGGCAACCGACTCTAGTGGTAACCCGCTGCAGACCGTCCAAACGTTTGATATTCCGGTGTGGAACGACAAAGCCAATTTCTGGCCGCTGGGCGCACTGGATCACATCAAATCCGACTTTAATTCAGGTCTGAAAAGCTGCTCTCTGATTTATCAGATCCCGTCTGATGCTCAACTGAAAAGTGGCGACACCGTGGCGTTCCAGGTTCTG |
35 | GCGAGCAAACCGGACATCAAAGTGGGCGACTACGTGAAAATGGGTGTGTATAATAACGCAAGCATCCTGTGGCGCTGTGTGAGCATCGACAACAATGGCCCGCTGATGCTGGCCGATAAAATTGTTGACACGCTGGCGTATGATGCTAAAACCAACGACAATTCGAACAGCAAATCTCATAGTCGTTCCTACAAACGCGATGACTACGGCAGCAACTATTGGAAAGATAGTAATATGCGCTCCTGGCTGAACTCAACCGCGGCCGAGGGTAAAGTGGATTGGCTGTGCGGCAATCCGCCGAAAGACGGTTACGTCAGCGGCGTGGGTGCATATAATGAAAAAGCTGGTTTTCTGAACGCGTTCTCAAAATCGGAAATTGCAGCTATGAAAACGGTGACCCAGCGTAGCCTGGTTTCTCATCCGGAATATAATAAAGGCATTGTTGATGGTGACGCGAACTCGGATCTGCTGTATTACACCGACATCAGCGAAGCAGTGGCTAACTACGATAGCTCTTATTTTGAAACCACGACCGAAAAAGTTTTCCTGCTGGATGTCAAACAGGCGAACGCCGTCTGGAAAAATCTGAAAGGCTATTACGTGGCTTACAACAATGATGGTATGGCATGGCCGTATTGGCTGCGTACCCCGGTGACGGATTGTAATCATGACATGCGCTATATTAGTTCCTCAGGCCAGGTTGGTCGTTACGCTCCGTGGTATTCTGATCTGGGCGTCCGTCCGGCGTTTTACCTGGACAGTGAATATTTCGTGACGACCAGCGGCTCTGGTAGTCAGTCGAGCCCGTACATTGGTTCCGCGCCGAACAAACAAGAAGATGACTATACCATCTCAGAACCGGCGGAAGATGCCAACCCGGACTGGAATGTTTCGACGGAACAGAGCATTCAACTGACCCTGGGCCCGTGGTACTCGAATGATGGTAAATATAGCAACCCGACCATTCCGGTGTATACCATCCAGAAAACGCGCTCGGATACCGAAAACATGGTGGTTGTCGTGTGCGGCGAAGGTTATACCAAATCACAGCAAGGCAAATTTATCAATGATGTTAAACGTCTGTGGCAGGACGCTATGAAATATGAACCGTACCGTAGCTATGCGGATCGCTTTAATGTGTATGCACTGTGTACGGCTTCCGAATCAACCTTCGATAACGGCGGTTCTACCTTTTTCGATGTGATCGTTGACAAATACAACTCTCCGGTTATCAGTAACAATCTGCATGGCAGTCAGTGGAAAAATCACATTTTTGAACGCTGCATCGGTCCGGAATTCATTGAAAAAATCCATGATGCCCACATTAAGAAAAAATGTGACCCGAACACCATCCCGTCGGGTAGCGAATACGAACCGTATTACTATGTGCATGATTATATTGCACAGTTTGCTATGGTTGTCAATACCAAATCCGACTTCGGCGGTGCATATAACAATCGCGAATACGGCTTTCACTATTTCATCTCTCCGAGTGATTCCTACCGTGCCTCTAAAACCTTTGCACATGAATTCGGCCACGGTCTGCTGGGCCTGGGTGATGAATACTCGAATGGTTATCTGCTGGATGACAAAGAACTGAAAAGCCTGAACCTGTCTAGTGTGGAAGATCCGGAAAAAATTAAATGGCGTCAGCTGCTGGGCTTTCGCAATACGTACACCTGCCGTAACGCGTATGGTTCTAAAATGCTGGTTTCCTCATACGAATGTATCATGCGCGATACCAACTATCAATTTTGCGAAGTCTGTCGCCTGCAGGGCTTCAAACGTATGAGCCAACTGGTTAAAGATGTCGACCTGTATGTGGCCACGCCGGAAGTTAAAGAATACACCGGTGCATATAGTAAACCGTCCGATTTTACGGACCTGGAAACCTCGAGCTACTACAACTACACCTACAACCGTAACGATCGCCTGCTGAGTGGCAACTCAAAATCGCGTTTCAATACGAACATGAATGGCAAGAAAATTGAACTGCGCACCGTTATTCAGAACATCAGCGATAAAAACGCCCGTCAACTGAAATTCAAAATGTGGATCAAACATTCAGATGGCTCGGTGGCAACCGACTCTAGTGGTAACCCGCTGCAGACCGTCCAAACGTTTGATATTCCGGTGTGGAACGACAAAGCCAATTTCTGGCCGCTGGGCGCACTGGATCACATCAAATCCGACTTTAATTCAGGTCTGAAAAGCTGCTCTCTGATTTATCAGATCCCGTCTGATGCTCAACTGAAAAGTGGCGACACCGTGGCGTTCCAGGTTCTGGATGAAAACGGTAATGTG |
36 | GCGAGCAAACCGGACATCAAAGTGGGCGACTACGTGAAAATGGGTGTGTATAATAACGCAAGCATCCTGTGGCGCTGTGTGAGCATCGACAACAATGGCCCGCTGATGCTGGCCGATAAAATTGTTGACACGCTGGCGTATGATGCTAAAACCAACGACAATTCGAACAGCAAATCTCATAGTCGTTCCTACAAACGCGATGACTACGGCAGCAACTATTGGAAAGATAGTAATATGCGCTCCTGGCTGAACTCAACCGCGGCCGAGGGTAAAGTGGATTGGCTGTGCGGCAATCCGCCGAAAGACGGTTACGTCAGCGGCGTGGGTGCATATAATGAAAAAGCTGGTTTTCTGAACGCGTTCTCAAAATCGGAAATTGCAGCTATGAAAACGGTGACCCAGCGTAGCCTGGTTTCTCATCCGGAATATAATAAAGGCATTGTTGATGGTGACGCGAACTCGGATCTGCTGTATTACACCGACATCAGCGAAGCAGTGGCTAACTACGATAGCTCTTATTTTGAAACCACGACCGAAAAAGTTTTCCTGCTGGATGTCAAACAGGCGAACGCCGTCTGGAAAAATCTGAAAGGCTATTACGTGGCTTACAACAATGATGGTATGGCATGGCCGTATTGGCTGCGTACCCCGGTGACGGATTGTAATCATGACATGCGCTATATTAGTTCCTCAGGCCAGGTTGGTCGTTACGCTCCGTGGTATTCTGATCTGGGCGTCCGTCCGGCGTTTTACCTGGACAGTGAATATTTCGTGACGACCAGCGGCTCTGGTAGTCAGTCGAGCCCGTACATTGGTTCCGCGCCGAACAAACAAGAAGATGACTATACCATCTCAGAACCGGCGGAAGATGCCAACCCGGACTGGAATGTTTCGACGGAACAGAGCATTCAACTGACCCTGGGCCCGTGGTACTCGAATGATGGTAAATATAGCAACCCGACCATTCCGGTGTATACCATCCAGAAAACGCGCTCGGATACCGAAAACATGGTGGTTGTCGTGTGCGGCGAAGGTTATACCAAATCACAGCAAGGCAAATTTATCAATGATGTTAAACGTCTGTGGCAGGACGCTATGAAATATGAACCGTACCGTAGCTATGCGGATCGCTTTAATGTGTATGCACTGTGTACGGCTTCCGAATCAACCTTCGATAACGGCGGTTCTACCTTTTTCGATGTGATCGTTGACAAATACAACTCTCCGGTTATCAGTAACAATCTGCATGGCAGTCAGTGGAAAAATCACATTTTTGAACGCTGCATCGGTCCGGAATTCATTGAAAAAATCCATGATGCCCACATTAAGAAAAAATGTGACCCGAACACCATCCCGTCGGGTAGCGAATACGAACCGTATTACTATGTGCATGATTATATTGCACAGTTTGCTATGGTTGTCAATACCAAATCCGACTTCGGCGGTGCATATAACAATCGCGAATACGGCTTTCACTATTTCATCTCTCCGAGTGATTCCTACCGTGCCTCTAAAACCTTTGCACATGAATTCGGCCACGGTCTGCTGGGCCTGGGTGATGAATACTCGAATGGTTATCTGCTGGATGACAAAGAACTGAAAAGCCTGAACCTGTCTAGTGTGGAAGATCCGGAAAAAATTAAATGGCGTCAGCTGCTGGGCTTTCGCAATACGTACACCTGCCGTAACGCGTATGGTTCTAAAATGCTGGTTTCCTCATACGAATGTATCATGCGCGATACCAACTATCAATTTTGCGAAGTCTGTCGCCTGCAGGGCTTCAAACGTATGAGCCAACTGGTTAAAGATGTCGACCTGTATGTGGCCACGCCGGAAGTTAAAGAATACACCGGTGCATATAGTAAACCGTCCGATTTTACGGACCTGGAAACCTCGAGCTACTACAACTACACCTACAACCGTAACGATCGCCTGCTGAGTGGCAACTCAAAATCGCGTTTCAATACGAACATGAATGGCAAGAAAATTGAACTGCGCACCGTTATTCAGAACATCAGCGATAAAAACGCCCGTCAACTGAAATTCAAAATGTGGATCAAACATTCAGATGGCTCGGTGGCAACCGACTCTAGTGGTAACCCGCTGCAGACCGTCCAAACGTTTGATATTCCGGTGTGGAACGACAAAGCCAATTTCTGGCCGCTGGGCGCACTGGATCACATCAAATCCGACTTTAATTCAGGTCTGAAAAGCTGCTCTCTGATTTATCAGATCCCGTCTGATGCTCAACTGAAAAGTGGCGACACCGTGGCGTTCCAGGTTCTGGATGAAAACGGTAATGTGCTGGCGGATGACAACACGGAAACCCAG |
37 | GCGAGCAAACCGGACATCAAAGTGGGCGACTACGTGAAAATGGGTGTGTATAATAACGCAAGCATCCTGTGGCGCTGTGTGAGCATCGACAACAATGGCCCGCTGATGCTGGCCGATAAAATTGTTGACACGCTGGCGTATGATGCTAAAACCAACGACAATTCGAACAGCAAATCTCATAGTCGTTCCTACAAACGCGATGACTACGGCAGCAACTATTGGAAAGATAGTAATATGCGCTCCTGGCTGAACTCAACCGCGGCCGAGGGTAAAGTGGATTGGCTGTGCGGCAATCCGCCGAAAGACGGTTACGTCAGCGGCGTGGGTGCATATAATGAAAAAGCTGGTTTTCTGAACGCGTTCTCAAAATCGGAAATTGCAGCTATGAAAACGGTGACCCAGCGTAGCCTGGTTTCTCATCCGGAATATAATAAAGGCATTGTTGATGGTGACGCGAACTCGGATCTGCTGTATTACACCGACATCAGCGAAGCAGTGGCTAACTACGATAGCTCTTATTTTGAAACCACGACCGAAAAAGTTTTCCTGCTGGATGTCAAACAGGCGAACGCCGTCTGGAAAAATCTGAAAGGCTATTACGTGGCTTACAACAATGATGGTATGGCATGGCCGTATTGGCTGCGTACCCCGGTGACGGATTGTAATCATGACATGCGCTATATTAGTTCCTCAGGCCAGGTTGGTCGTTACGCTCCGTGGTATTCTGATCTGGGCGTCCGTCCGGCGTTTTACCTGGACAGTGAATATTTCGTGACGACCAGCGGCTCTGGTAGTCAGTCGAGCCCGTACATTGGTTCCGCGCCGAACAAACAAGAAGATGACTATACCATCTCAGAACCGGCGGAAGATGCCAACCCGGACTGGAATGTTTCGACGGAACAGAGCATTCAACTGACCCTGGGCCCGTGGTACTCGAATGATGGTAAATATAGCAACCCGACCATTCCGGTGTATACCATCCAGAAAACGCGCTCGGATACCGAAAACATGGTGGTTGTCGTGTGCGGCGAAGGTTATACCAAATCACAGCAAGGCAAATTTATCAATGATGTTAAACGTCTGTGGCAGGACGCTATGAAATATGAACCGTACCGTAGCTATGCGGATCGCTTTAATGTGTATGCACTGTGTACGGCTTCCGAATCAACCTTCGATAACGGCGGTTCTACCTTTTTCGATGTGATCGTTGACAAATACAACTCTCCGGTTATCAGTAACAATCTGCATGGCAGTCAGTGGAAAAATCACATTTTTGAACGCTGCATCGGTCCGGAATTCATTGAAAAAATCCATGATGCCCACATTAAGAAAAAATGTGACCCGAACACCATCCCGTCGGGTAGCGAATACGAACCGTATTACTATGTGCATGATTATATTGCACAGTTTGCTATGGTTGTCAATACCAAATCCGACTTCGGCGGTGCATATAACAATCGCGAATACGGCTTTCACTATTTCATCTCTCCGAGTGATTCCTACCGTGCCTCTAAAACCTTTGCACATGAATTCGGCCACGGTCTGCTGGGCCTGGGTGATGAATACTCGAATGGTTATCTGCTGGATGACAAAGAACTGAAAAGCCTGAACCTGTCTAGTGTGGAAGATCCGGAAAAAATTAAATGGCGTCAGCTGCTGGGCTTTCGCAATACGTACACCTGCCGTAACGCGTATGGTTCTAAAATGCTGGTTTCCTCATACGAATGTATCATGCGCGATACCAACTATCAATTTTGCGAAGTCTGTCGCCTGCAGGGCTTCAAACGTATGAGCCAACTGGTTAAAGATGTCGACCTGTATGTGGCCACGCCGGAAGTTAAAGAATACACCGGTGCATATAGTAAACCGTCCGATTTTACGGACCTGGAAACCTCGAGCTACTACAACTACACCTACAACCGTAACGATCGCCTGCTGAGTGGCAACTCAAAATCGCGTTTCAATACGAACATGAATGGCAAGAAAATTGAACTGCGCACCGTTATTCAGAACATCAGCGATAAAAACGCCCGTCAACTGAAATTCAAAATGTGGATCAAACATTCAGATGGCTCGGTGGCAACCGACTCTAGTGGTAACCCGCTGCAGACCGTCCAAACGTTTGATATTCCGGTGTGGAACGACAAAGCCAATTTCTGGCCGCTGGGCGCACTGGATCACATCAAATCCGACTTTAATTCAGGTCTGAAAAGCTGCTCTCTGATTTATCAGATCCCGTCTGATGCTCAACTGAAAAGTGGCGACACCGTGGCGTTCCAGGTTCTGGATGAAAACGGTAATGTGCTGGCGGATGACAACACGGAAACCCAGCGCTACACGACCGTTTCTATCCAATAC |
38 | GCGAGCAAACCGGACATCAAAGTGGGCGACTACGTGAAAATGGGTGTGTATAATAACGCAAGCATCCTGTGGCGCTGTGTGAGCATCGACAACAATGGCCCGCTGATGCTGGCCGATAAAATTGTTGACACGCTGGCGTATGATGCTAAAACCAACGACAATTCGAACAGCAAATCTCATAGTCGTTCCTACAAACGCGATGACTACGGCAGCAACTATTGGAAAGATAGTAATATGCGCTCCTGGCTGAACTCAACCGCGGCCGAGGGTAAAGTGGATTGGCTGTGCGGCAATCCGCCGAAAGACGGTTACGTCAGCGGCGTGGGTGCATATAATGAAAAAGCTGGTTTTCTGAACGCGTTCTCAAAATCGGAAATTGCAGCTATGAAAACGGTGACCCAGCGTAGCCTGGTTTCTCATCCGGAATATAATAAAGGCATTGTTGATGGTGACGCGAACTCGGATCTGCTGTATTACACCGACATCAGCGAAGCAGTGGCTAACTACGATAGCTCTTATTTTGAAACCACGACCGAAAAAGTTTTCCTGCTGGATGTCAAACAGGCGAACGCCGTCTGGAAAAATCTGAAAGGCTATTACGTGGCTTACAACAATGATGGTATGGCATGGCCGTATTGGCTGCGTACCCCGGTGACGGATTGTAATCATGACATGCGCTATATTAGTTCCTCAGGCCAGGTTGGTCGTTACGCTCCGTGGTATTCTGATCTGGGCGTCCGTCCGGCGTTTTACCTGGACAGTGAATATTTCGTGACGACCAGCGGCTCTGGTAGTCAGTCGAGCCCGTACATTGGTTCCGCGCCGAACAAACAAGAAGATGACTATACCATCTCAGAACCGGCGGAAGATGCCAACCCGGACTGGAATGTTTCGACGGAACAGAGCATTCAACTGACCCTGGGCCCGTGGTACTCGAATGATGGTAAATATAGCAACCCGACCATTCCGGTGTATACCATCCAGAAAACGCGCTCGGATACCGAAAACATGGTGGTTGTCGTGTGCGGCGAAGGTTATACCAAATCACAGCAAGGCAAATTTATCAATGATGTTAAACGTCTGTGGCAGGACGCTATGAAATATGAACCGTACCGTAGCTATGCGGATCGCTTTAATGTGTATGCACTGTGTACGGCTTCCGAATCAACCTTCGATAACGGCGGTTCTACCTTTTTCGATGTGATCGTTGACAAATACAACTCTCCGGTTATCAGTAACAATCTGCATGGCAGTCAGTGGAAAAATCACATTTTTGAACGCTGCATCGGTCCGGAATTCATTGAAAAAATCCATGATGCCCACATTAAGAAAAAATGTGACCCGAACACCATCCCGTCGGGTAGCGAATACGAACCGTATTACTATGTGCATGATTATATTGCACAGTTTGCTATGGTTGTCAATACCAAATCCGACTTCGGCGGTGCATATAACAATCGCGAATACGGCTTTCACTATTTCATCTCTCCGAGTGATTCCTACCGTGCCTCTAAAACCTTTGCACATGAATTCGGCCACGGTCTGCTGGGCCTGGGTGATGAATACTCGAATGGTTATCTGCTGGATGACAAAGAACTGAAAAGCCTGAACCTGTCTAGTGTGGAAGATCCGGAAAAAATTAAATGGCGTCAGCTGCTGGGCTTTCGCAATACGTACACCTGCCGTAACGCGTATGGTTCTAAAATGCTGGTTTCCTCATACGAATGTATCATGCGCGATACCAACTATCAATTTTGCGAAGTCTGTCGCCTGCAGGGCTTCAAACGTATGAGCCAACTGGTTAAAGATGTCGACCTGTATGTGGCCACGCCGGAAGTTAAAGAATACACCGGTGCATATAGTAAACCGTCCGATTTTACGGACCTGGAAACCTCGAGCTACTACAACTACACCTACAACCGTAACGATCGCCTGCTGAGTGGCAACTCAAAATCGCGTTTCAATACGAACATGAATGGCAAGAAAATTGAACTGCGCACCGTTATTCAGAACATCAGCGATAAAAACGCCCGTCAACTGAAATTCAAAATGTGGATCAAACATTCAGATGGCTCGGTGGCAACCGACTCTAGTGGTAACCCGCTGCAGACCGTCCAAACGTTTGATATTCCGGTGTGGAACGACAAAGCCAATTTCTGGCCGCTGGGCGCACTGGATCACATCAAATCCGACTTTAATTCAGGTCTGAAAAGCTGCTCTCTGATTTATCAGATCCCGTCTGATGCTCAACTGAAAAGTGGCGACACCGTGGCGTTCCAGGTTCTGGATGAAAACGGTAATGTGCTGGCGGATGACAACACGGAAACCCAGCGCTACACGACCGTTTCTATCCAATACAAATTCGAAGATGGCAGTGAAATCCCGAATACGGCGGGCGGTACCTTCACC |
在某些實施方式中,本申請案提供的核酸包括如SEQ ID NO: 3、SEQ ID NO: 5、SEQ ID NO: 7、SEQ ID NO: 9、SEQ ID NO: 11、SEQ ID NO: 13所示的核酸序列。在某些實施方式中,本申請案提供的核酸由選自下組的核苷酸序列組成:SEQ ID NO: 3、SEQ ID NO: 5、SEQ ID NO: 7、SEQ ID NO: 9、SEQ ID NO: 11、SEQ ID NO: 13,或者與其具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性。
SEQ ID NO | 核苷酸序列 |
3 | CATATGGCGAGCAAACCGGACATCAAAGTGGGCGACTACGTGAAAATGGGTGTGTATAATAACGCAAGCATCCTGTGGCGCTGTGTGAGCATCGACAACAATGGCCCGCTGATGCTGGCCGATAAAATTGTTGACACGCTGGCGTATGATGCTAAAACCAACGACAATTCGAACAGCAAATCTCATAGTCGTTCCTACAAACGCGATGACTACGGCAGCAACTATTGGAAAGATAGTAATATGCGCTCCTGGCTGAACTCAACCGCGGCCGAGGGTAAAGTGGATTGGCTGTGCGGCAATCCGCCGAAAGACGGTTACGTCAGCGGCGTGGGTGCATATAATGAAAAAGCTGGTTTTCTGAACGCGTTCTCAAAATCGGAAATTGCAGCTATGAAAACGGTGACCCAGCGTAGCCTGGTTTCTCATCCGGAATATAATAAAGGCATTGTTGATGGTGACGCGAACTCGGATCTGCTGTATTACACCGACATCAGCGAAGCAGTGGCTAACTACGATAGCTCTTATTTTGAAACCACGACCGAAAAAGTTTTCCTGCTGGATGTCAAACAGGCGAACGCCGTCTGGAAAAATCTGAAAGGCTATTACGTGGCTTACAACAATGATGGTATGGCATGGCCGTATTGGCTGCGTACCCCGGTGACGGATTGTAATCATGACATGCGCTATATTAGTTCCTCAGGCCAGGTTGGTCGTTACGCTCCGTGGTATTCTGATCTGGGCGTCCGTCCGGCGTTTTACCTGGACAGTGAATATTTCGTGACGACCAGCGGCTCTGGTAGTCAGTCGAGCCCGTACATTGGTTCCGCGCCGAACAAACAAGAAGATGACTATACCATCTCAGAACCGGCGGAAGATGCCAACCCGGACTGGAATGTTTCGACGGAACAGAGCATTCAACTGACCCTGGGCCCGTGGTACTCGAATGATGGTAAATATAGCAACCCGACCATTCCGGTGTATACCATCCAGAAAACGCGCTCGGATACCGAAAACATGGTGGTTGTCGTGTGCGGCGAAGGTTATACCAAATCACAGCAAGGCAAATTTATCAATGATGTTAAACGTCTGTGGCAGGACGCTATGAAATATGAACCGTACCGTAGCTATGCGGATCGCTTTAATGTGTATGCACTGTGTACGGCTTCCGAATCAACCTTCGATAACGGCGGTTCTACCTTTTTCGATGTGATCGTTGACAAATACAACTCTCCGGTTATCAGTAACAATCTGCATGGCAGTCAGTGGAAAAATCACATTTTTGAACGCTGCATCGGTCCGGAATTCATTGAAAAAATCCATGATGCCCACATTAAGAAAAAATGTGACCCGAACACCATCCCGTCGGGTAGCGAATACGAACCGTATTACTATGTGCATGATTATATTGCACAGTTTGCTATGGTTGTCAATACCAAATCCGACTTCGGCGGTGCATATAACAATCGCGAATACGGCTTTCACTATTTCATCTCTCCGAGTGATTCCTACCGTGCCTCTAAAACCTTTGCACATGAATTCGGCCACGGTCTGCTGGGCCTGGGTGATGAATACTCGAATGGTTATCTGCTGGATGACAAAGAACTGAAAAGCCTGAACCTGTCTAGTGTGGAAGATCCGGAAAAAATTAAATGGCGTCAGCTGCTGGGCTTTCGCAATACGTACACCTGCCGTAACGCGTATGGTTCTAAAATGCTGGTTTCCTCATACGAATGTATCATGCGCGATACCAACTATCAATTTTGCGAAGTCTGTCGCCTGCAGGGCTTCAAACGTATGAGCCAACTGGTTAAAGATGTCGACCTGTATGTGGCCACGCCGGAAGTTAAAGAATACACCGGTGCATATAGTAAACCGTCCGATTTTACGGACCTGGAAACCTCGAGCTACTACAACTACACCTACAACCGTAACGATCGCCTGCTGAGTGGCAACTCAAAATCGCGTTTCAATACGAACATGAATGGCAAGAAAATTGAACTGCGCACCGTTATTCAGAACATCAGCGATAAAAACGCCCGTCAACTGAAATTCAAAATGTGGATCAAACATTCAGATGGCTCGGTGGCAACCGACTCTAGTGGTAACCCGCTGCAGACCGTCCAAACGTTTGATATTCCGGTGTGGAACGACAAAGCCAATTTCTGGCCGCTGGGCGCACTGGATCACATCAAATCCGACTTTAATTCAGGTCTGAAAAGCTGCTCTCTGATTTATCAGATCCCGTCTGATGCTCAACTGAAAAGTGGCGACACCGTGGCGTTCCAGGTTCTGGGCGGCGGTGGATCCGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGGGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAACACCATCATCATCATCATTAAGCGGCCGC |
5 | AAGCTTATGTATAGAATGCAGCTGCTGTCCTGTATTGCTCTGAGCCTGGCACTGGTTACAAACAGCGGTACCGCGAGCAAACCGGACATCAAAGTGGGCGACTACGTGAAAATGGGTGTGTATAATAACGCAAGCATCCTGTGGCGCTGTGTGAGCATCGACAACAATGGCCCGCTGATGCTGGCCGATAAAATTGTTGACACGCTGGCGTATGATGCTAAAACCAACGACAATTCGAACAGCAAATCTCATAGTCGTTCCTACAAACGCGATGACTACGGCAGCAACTATTGGAAAGATAGTAATATGCGCTCCTGGCTGAACTCAACCGCGGCCGAGGGTAAAGTGGATTGGCTGTGCGGCAATCCGCCGAAAGACGGTTACGTCAGCGGCGTGGGTGCATATAATGAAAAAGCTGGTTTTCTGAACGCGTTCTCAAAATCGGAAATTGCAGCTATGAAAACGGTGACCCAGCGTAGCCTGGTTTCTCATCCGGAATATAATAAAGGCATTGTTGATGGTGACGCGAACTCGGATCTGCTGTATTACACCGACATCAGCGAAGCAGTGGCTAACTACGATAGCTCTTATTTTGAAACCACGACCGAAAAAGTTTTCCTGCTGGATGTCAAACAGGCGAACGCCGTCTGGAAAAATCTGAAAGGCTATTACGTGGCTTACAACAATGATGGTATGGCATGGCCGTATTGGCTGCGTACCCCGGTGACGGATTGTAATCATGACATGCGCTATATTAGTTCCTCAGGCCAGGTTGGTCGTTACGCTCCGTGGTATTCTGATCTGGGCGTCCGTCCGGCGTTTTACCTGGACAGTGAATATTTCGTGACGACCAGCGGCTCTGGTAGTCAGTCGAGCCCGTACATTGGTTCCGCGCCGAACAAACAAGAAGATGACTATACCATCTCAGAACCGGCGGAAGATGCCAACCCGGACTGGAATGTTTCGACGGAACAGAGCATTCAACTGACCCTGGGCCCGTGGTACTCGAATGATGGTAAATATAGCAACCCGACCATTCCGGTGTATACCATCCAGAAAACGCGCTCGGATACCGAAAACATGGTGGTTGTCGTGTGCGGCGAAGGTTATACCAAATCACAGCAAGGCAAATTTATCAATGATGTTAAACGTCTGTGGCAGGACGCTATGAAATATGAACCGTACCGTAGCTATGCGGATCGCTTTAATGTGTATGCACTGTGTACGGCTTCCGAATCAACCTTCGATAACGGCGGTTCTACCTTTTTCGATGTGATCGTTGACAAATACAACTCTCCGGTTATCAGTAACAATCTGCATGGCAGTCAGTGGAAAAATCACATTTTTGAACGCTGCATCGGTCCGGAATTCATTGAAAAAATCCATGATGCCCACATTAAGAAAAAATGTGACCCGAACACCATCCCGTCGGGTAGCGAATACGAACCGTATTACTATGTGCATGATTATATTGCACAGTTTGCTATGGTTGTCAATACCAAATCCGACTTCGGCGGTGCATATAACAATCGCGAATACGGCTTTCACTATTTCATCTCTCCGAGTGATTCCTACCGTGCCTCTAAAACCTTTGCACATGAATTCGGCCACGGTCTGCTGGGCCTGGGTGATGAATACTCGAATGGTTATCTGCTGGATGACAAAGAACTGAAAAGCCTGAACCTGTCTAGTGTGGAAGATCCGGAAAAAATTAAATGGCGTCAGCTGCTGGGCTTTCGCAATACGTACACCTGCCGTAACGCGTATGGTTCTAAAATGCTGGTTTCCTCATACGAATGTATCATGCGCGATACCAACTATCAATTTTGCGAAGTCTGTCGCCTGCAGGGCTTCAAACGTATGAGCCAACTGGTTAAAGATGTCGACCTGTATGTGGCCACGCCGGAAGTTAAAGAATACACCGGTGCATATAGTAAACCGTCCGATTTTACGGACCTGGAAACCTCGAGCTACTACAACTACACCTACAACCGTAACGATCGCCTGCTGAGTGGCAACTCAAAATCGCGTTTCAATACGAACATGAATGGCAAGAAAATTGAACTGCGCACCGTTATTCAGAACATCAGCGATAAAAACGCCCGTCAACTGAAATTCAAAATGTGGATCAAACATTCAGATGGCTCGGTGGCAACCGACTCTAGTGGTAACCCGCTGCAGACCGTCCAAACGTTTGATATTCCGGTGTGGAACGACAAAGCCAATTTCTGGCCGCTGGGCGCACTGGATCACATCAAATCCGACTTTAATTCAGGTCTGAAAAGCTGCTCTCTGATTTATCAGATCCCGTCTGATGCTCAACTGAAAAGTGGCGACACCGTGGCGTTCCAGGTTCTGGGCGGCGGTGGATCCGAACCTAAGAGTTGCGATAAAACCCACACTTGCCCTCCCTGTCCGGCCCCCGAACTGCTCGGCGGACCCTCAGTCTTCCTGTTCCCCCCAAAGCCAAAGGACACATTGATGATCAGCAGGACTCCTGAAGTGACATGCGTGGTCGTAGACGTGTCACACGAGGACCCGGAGGTGAAGTTCAACTGGTACGTGGACGGAGTGGAGGTGCATAATGCCAAAACAAAGCCCAGAGAAGAGCAGTATAACAGTACCTACAGAGTGGTGTCAGTGCTGACCGTGCTTCATCAGGATTGGCTGAACGGGAAGGAGTACAAGTGTAAGGTGAGTAATAAGGCTCTGCCTGCCCCAATTGAGAAGACAATCTCTAAAGCCAAGGGGCAGCCCCGGGAACCCCAAGTGTATACACTCCCACCGTCCCGCGATGAACTGACAAAAAACCAGGTATCACTCACTTGTCTGGTAAAGGGCTTCTATCCATCTGACATTGCCGTGGAGTGGGAATCAAACGGCCAACCCGAGAATAATTATAAGACAACCCCGCCCGTGCTGGATTCCGACGGATCTTTTTTCCTGTATAGCAAATTGACTGTCGACAAAAGTCGGTGGCAGCAGGGCAATGTGTTTTCTTGCAGCGTCATGCATGAGGCGCTGCACAACCACTATACTCAGAAGTCATTGAGCTTGAGCCCTGGTAAGCACCATCATCACCATCACCATCATTAGGCGGCCGC |
7 | CATATGGCGAGCAAACCGGACATCAAAGTGGGCGACTACGTGAAAATGGGTGTGTATAATAACGCAAGCATCCTGTGGCGCTGTGTGAGCATCGACAACAATGGCCCGCTGATGCTGGCCGATAAAATTGTTGACACGCTGGCGTATGATGCTAAAACCAACGACAATTCGAACAGCAAATCTCATAGTCGTTCCTACAAACGCGATGACTACGGCAGCAACTATTGGAAAGATAGTAATATGCGCTCCTGGCTGAACTCAACCGCGGCCGAGGGTAAAGTGGATTGGCTGTGCGGCAATCCGCCGAAAGACGGTTACGTCAGCGGCGTGGGTGCATATAATGAAAAAGCTGGTTTTCTGAACGCGTTCTCAAAATCGGAAATTGCAGCTATGAAAACGGTGACCCAGCGTAGCCTGGTTTCTCATCCGGAATATAATAAAGGCATTGTTGATGGTGACGCGAACTCGGATCTGCTGTATTACACCGACATCAGCGAAGCAGTGGCTAACTACGATAGCTCTTATTTTGAAACCACGACCGAAAAAGTTTTCCTGCTGGATGTCAAACAGGCGAACGCCGTCTGGAAAAATCTGAAAGGCTATTACGTGGCTTACAACAATGATGGTATGGCATGGCCGTATTGGCTGCGTACCCCGGTGACGGATTGTAATCATGACATGCGCTATATTAGTTCCTCAGGCCAGGTTGGTCGTTACGCTCCGTGGTATTCTGATCTGGGCGTCCGTCCGGCGTTTTACCTGGACAGTGAATATTTCGTGACGACCAGCGGCTCTGGTAGTCAGTCGAGCCCGTACATTGGTTCCGCGCCGAACAAACAAGAAGATGACTATACCATCTCAGAACCGGCGGAAGATGCCAACCCGGACTGGAATGTTTCGACGGAACAGAGCATTCAACTGACCCTGGGCCCGTGGTACTCGAATGATGGTAAATATAGCAACCCGACCATTCCGGTGTATACCATCCAGAAAACGCGCTCGGATACCGAAAACATGGTGGTTGTCGTGTGCGGCGAAGGTTATACCAAATCACAGCAAGGCAAATTTATCAATGATGTTAAACGTCTGTGGCAGGACGCTATGAAATATGAACCGTACCGTAGCTATGCGGATCGCTTTAATGTGTATGCACTGTGTACGGCTTCCGAATCAACCTTCGATAACGGCGGTTCTACCTTTTTCGATGTGATCGTTGACAAATACAACTCTCCGGTTATCAGTAACAATCTGCATGGCAGTCAGTGGAAAAATCACATTTTTGAACGCTGCATCGGTCCGGAATTCATTGAAAAAATCCATGATGCCCACATTAAGAAAAAATGTGACCCGAACACCATCCCGTCGGGTAGCGAATACGAACCGTATTACTATGTGCATGATTATATTGCACAGTTTGCTATGGTTGTCAATACCAAATCCGACTTCGGCGGTGCATATAACAATCGCGAATACGGCTTTCACTATTTCATCTCTCCGAGTGATTCCTACCGTGCCTCTAAAACCTTTGCACATGAATTCGGCCACGGTCTGCTGGGCCTGGGTGATGAATACTCGAATGGTTATCTGCTGGATGACAAAGAACTGAAAAGCCTGAACCTGTCTAGTGTGGAAGATCCGGAAAAAATTAAATGGCGTCAGCTGCTGGGCTTTCGCAATACGTACACCTGCCGTAACGCGTATGGTTCTAAAATGCTGGTTTCCTCATACGAATGTATCATGCGCGATACCAACTATCAATTTTGCGAAGTCTGTCGCCTGCAGGGCTTCAAACGTATGAGCCAACTGGTTAAAGATGTCGACCTGTATGTGGCCACGCCGGAAGTTAAAGAATACACCGGTGCATATAGTAAACCGTCCGATTTTACGGACCTGGAAACCTCGAGCTACTACAACTACACCTACAACCGTAACGATCGCCTGCTGAGTGGCAACTCAAAATCGCGTTTCAATACGAACATGAATGGCAAGAAAATTGAACTGCGCACCGTTATTCAGAACATCAGCGATAAAAACGCCCGTCAACTGAAATTCAAAATGTGGATCAAACATTCAGATGGCTCGGTGGCAACCGACTCTAGTGGTAACCCGCTGCAGACCGTCCAAACGTTTGATATTCCGGTGTGGAACGACAAAGCCAATTTCTGGCCGCTGGGCGCACTGGATCACATCAAATCCGACTTTAATTCAGGTCTGAAAAGCTGCTCTCTGATTTATCAGATCCCGTCTGATGCTCAACTGAAAAGTGGCGACACCGTGGCGTTCCAGGTTCTGGATGAAAACGGTAATGTGGGCGGCGGTGGATCCCACCATCATCACCACCATCATCATCACCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGGGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATAAGCGGCCGC |
9 | CATATGGCGAGCAAACCGGACATCAAAGTGGGCGACTACGTGAAAATGGGTGTGTATAATAACGCAAGCATCCTGTGGCGCTGTGTGAGCATCGACAACAATGGCCCGCTGATGCTGGCCGATAAAATTGTTGACACGCTGGCGTATGATGCTAAAACCAACGACAATTCGAACAGCAAATCTCATAGTCGTTCCTACAAACGCGATGACTACGGCAGCAACTATTGGAAAGATAGTAATATGCGCTCCTGGCTGAACTCAACCGCGGCCGAGGGTAAAGTGGATTGGCTGTGCGGCAATCCGCCGAAAGACGGTTACGTCAGCGGCGTGGGTGCATATAATGAAAAAGCTGGTTTTCTGAACGCGTTCTCAAAATCGGAAATTGCAGCTATGAAAACGGTGACCCAGCGTAGCCTGGTTTCTCATCCGGAATATAATAAAGGCATTGTTGATGGTGACGCGAACTCGGATCTGCTGTATTACACCGACATCAGCGAAGCAGTGGCTAACTACGATAGCTCTTATTTTGAAACCACGACCGAAAAAGTTTTCCTGCTGGATGTCAAACAGGCGAACGCCGTCTGGAAAAATCTGAAAGGCTATTACGTGGCTTACAACAATGATGGTATGGCATGGCCGTATTGGCTGCGTACCCCGGTGACGGATTGTAATCATGACATGCGCTATATTAGTTCCTCAGGCCAGGTTGGTCGTTACGCTCCGTGGTATTCTGATCTGGGCGTCCGTCCGGCGTTTTACCTGGACAGTGAATATTTCGTGACGACCAGCGGCTCTGGTAGTCAGTCGAGCCCGTACATTGGTTCCGCGCCGAACAAACAAGAAGATGACTATACCATCTCAGAACCGGCGGAAGATGCCAACCCGGACTGGAATGTTTCGACGGAACAGAGCATTCAACTGACCCTGGGCCCGTGGTACTCGAATGATGGTAAATATAGCAACCCGACCATTCCGGTGTATACCATCCAGAAAACGCGCTCGGATACCGAAAACATGGTGGTTGTCGTGTGCGGCGAAGGTTATACCAAATCACAGCAAGGCAAATTTATCAATGATGTTAAACGTCTGTGGCAGGACGCTATGAAATATGAACCGTACCGTAGCTATGCGGATCGCTTTAATGTGTATGCACTGTGTACGGCTTCCGAATCAACCTTCGATAACGGCGGTTCTACCTTTTTCGATGTGATCGTTGACAAATACAACTCTCCGGTTATCAGTAACAATCTGCATGGCAGTCAGTGGAAAAATCACATTTTTGAACGCTGCATCGGTCCGGAATTCATTGAAAAAATCCATGATGCCCACATTAAGAAAAAATGTGACCCGAACACCATCCCGTCGGGTAGCGAATACGAACCGTATTACTATGTGCATGATTATATTGCACAGTTTGCTATGGTTGTCAATACCAAATCCGACTTCGGCGGTGCATATAACAATCGCGAATACGGCTTTCACTATTTCATCTCTCCGAGTGATTCCTACCGTGCCTCTAAAACCTTTGCACATGAATTCGGCCACGGTCTGCTGGGCCTGGGTGATGAATACTCGAATGGTTATCTGCTGGATGACAAAGAACTGAAAAGCCTGAACCTGTCTAGTGTGGAAGATCCGGAAAAAATTAAATGGCGTCAGCTGCTGGGCTTTCGCAATACGTACACCTGCCGTAACGCGTATGGTTCTAAAATGCTGGTTTCCTCATACGAATGTATCATGCGCGATACCAACTATCAATTTTGCGAAGTCTGTCGCCTGCAGGGCTTCAAACGTATGAGCCAACTGGTTAAAGATGTCGACCTGTATGTGGCCACGCCGGAAGTTAAAGAATACACCGGTGCATATAGTAAACCGTCCGATTTTACGGACCTGGAAACCTCGAGCTACTACAACTACACCTACAACCGTAACGATCGCCTGCTGAGTGGCAACTCAAAATCGCGTTTCAATACGAACATGAATGGCAAGAAAATTGAACTGCGCACCGTTATTCAGAACATCAGCGATAAAAACGCCCGTCAACTGAAATTCAAAATGTGGATCAAACATTCAGATGGCTCGGTGGCAACCGACTCTAGTGGTAACCCGCTGCAGACCGTCCAAACGTTTGATATTCCGGTGTGGAACGACAAAGCCAATTTCTGGCCGCTGGGCGCACTGGATCACATCAAATCCGACTTTAATTCAGGTCTGAAAAGCTGCTCTCTGATTTATCAGATCCCGTCTGATGCTCAACTGAAAAGTGGCGACACCGTGGCGTTCCAGGTTCTGGATGAAAACGGTAATGTGCTGGCGGATGACAACACGGAAACCCAGGGCGGCGGTGGATCCCACCATCATCACCACCATCATCATCACCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGGGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATAAGCGGCCGC |
11 | CATATGGCGAGCAAACCGGACATCAAAGTGGGCGACTACGTGAAAATGGGTGTGTATAATAACGCAAGCATCCTGTGGCGCTGTGTGAGCATCGACAACAATGGCCCGCTGATGCTGGCCGATAAAATTGTTGACACGCTGGCGTATGATGCTAAAACCAACGACAATTCGAACAGCAAATCTCATAGTCGTTCCTACAAACGCGATGACTACGGCAGCAACTATTGGAAAGATAGTAATATGCGCTCCTGGCTGAACTCAACCGCGGCCGAGGGTAAAGTGGATTGGCTGTGCGGCAATCCGCCGAAAGACGGTTACGTCAGCGGCGTGGGTGCATATAATGAAAAAGCTGGTTTTCTGAACGCGTTCTCAAAATCGGAAATTGCAGCTATGAAAACGGTGACCCAGCGTAGCCTGGTTTCTCATCCGGAATATAATAAAGGCATTGTTGATGGTGACGCGAACTCGGATCTGCTGTATTACACCGACATCAGCGAAGCAGTGGCTAACTACGATAGCTCTTATTTTGAAACCACGACCGAAAAAGTTTTCCTGCTGGATGTCAAACAGGCGAACGCCGTCTGGAAAAATCTGAAAGGCTATTACGTGGCTTACAACAATGATGGTATGGCATGGCCGTATTGGCTGCGTACCCCGGTGACGGATTGTAATCATGACATGCGCTATATTAGTTCCTCAGGCCAGGTTGGTCGTTACGCTCCGTGGTATTCTGATCTGGGCGTCCGTCCGGCGTTTTACCTGGACAGTGAATATTTCGTGACGACCAGCGGCTCTGGTAGTCAGTCGAGCCCGTACATTGGTTCCGCGCCGAACAAACAAGAAGATGACTATACCATCTCAGAACCGGCGGAAGATGCCAACCCGGACTGGAATGTTTCGACGGAACAGAGCATTCAACTGACCCTGGGCCCGTGGTACTCGAATGATGGTAAATATAGCAACCCGACCATTCCGGTGTATACCATCCAGAAAACGCGCTCGGATACCGAAAACATGGTGGTTGTCGTGTGCGGCGAAGGTTATACCAAATCACAGCAAGGCAAATTTATCAATGATGTTAAACGTCTGTGGCAGGACGCTATGAAATATGAACCGTACCGTAGCTATGCGGATCGCTTTAATGTGTATGCACTGTGTACGGCTTCCGAATCAACCTTCGATAACGGCGGTTCTACCTTTTTCGATGTGATCGTTGACAAATACAACTCTCCGGTTATCAGTAACAATCTGCATGGCAGTCAGTGGAAAAATCACATTTTTGAACGCTGCATCGGTCCGGAATTCATTGAAAAAATCCATGATGCCCACATTAAGAAAAAATGTGACCCGAACACCATCCCGTCGGGTAGCGAATACGAACCGTATTACTATGTGCATGATTATATTGCACAGTTTGCTATGGTTGTCAATACCAAATCCGACTTCGGCGGTGCATATAACAATCGCGAATACGGCTTTCACTATTTCATCTCTCCGAGTGATTCCTACCGTGCCTCTAAAACCTTTGCACATGAATTCGGCCACGGTCTGCTGGGCCTGGGTGATGAATACTCGAATGGTTATCTGCTGGATGACAAAGAACTGAAAAGCCTGAACCTGTCTAGTGTGGAAGATCCGGAAAAAATTAAATGGCGTCAGCTGCTGGGCTTTCGCAATACGTACACCTGCCGTAACGCGTATGGTTCTAAAATGCTGGTTTCCTCATACGAATGTATCATGCGCGATACCAACTATCAATTTTGCGAAGTCTGTCGCCTGCAGGGCTTCAAACGTATGAGCCAACTGGTTAAAGATGTCGACCTGTATGTGGCCACGCCGGAAGTTAAAGAATACACCGGTGCATATAGTAAACCGTCCGATTTTACGGACCTGGAAACCTCGAGCTACTACAACTACACCTACAACCGTAACGATCGCCTGCTGAGTGGCAACTCAAAATCGCGTTTCAATACGAACATGAATGGCAAGAAAATTGAACTGCGCACCGTTATTCAGAACATCAGCGATAAAAACGCCCGTCAACTGAAATTCAAAATGTGGATCAAACATTCAGATGGCTCGGTGGCAACCGACTCTAGTGGTAACCCGCTGCAGACCGTCCAAACGTTTGATATTCCGGTGTGGAACGACAAAGCCAATTTCTGGCCGCTGGGCGCACTGGATCACATCAAATCCGACTTTAATTCAGGTCTGAAAAGCTGCTCTCTGATTTATCAGATCCCGTCTGATGCTCAACTGAAAAGTGGCGACACCGTGGCGTTCCAGGTTCTGGATGAAAACGGTAATGTGCTGGCGGATGACAACACGGAAACCCAGCGCTACACGACCGTTTCTATCCAATACGGCGGCGGTGGATCCCACCATCATCACCACCATCATCATCACCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGGGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATAAGCGGCCGC |
13 | CATATGGCGAGCAAACCGGACATCAAAGTGGGCGACTACGTGAAAATGGGTGTGTATAATAACGCAAGCATCCTGTGGCGCTGTGTGAGCATCGACAACAATGGCCCGCTGATGCTGGCCGATAAAATTGTTGACACGCTGGCGTATGATGCTAAAACCAACGACAATTCGAACAGCAAATCTCATAGTCGTTCCTACAAACGCGATGACTACGGCAGCAACTATTGGAAAGATAGTAATATGCGCTCCTGGCTGAACTCAACCGCGGCCGAGGGTAAAGTGGATTGGCTGTGCGGCAATCCGCCGAAAGACGGTTACGTCAGCGGCGTGGGTGCATATAATGAAAAAGCTGGTTTTCTGAACGCGTTCTCAAAATCGGAAATTGCAGCTATGAAAACGGTGACCCAGCGTAGCCTGGTTTCTCATCCGGAATATAATAAAGGCATTGTTGATGGTGACGCGAACTCGGATCTGCTGTATTACACCGACATCAGCGAAGCAGTGGCTAACTACGATAGCTCTTATTTTGAAACCACGACCGAAAAAGTTTTCCTGCTGGATGTCAAACAGGCGAACGCCGTCTGGAAAAATCTGAAAGGCTATTACGTGGCTTACAACAATGATGGTATGGCATGGCCGTATTGGCTGCGTACCCCGGTGACGGATTGTAATCATGACATGCGCTATATTAGTTCCTCAGGCCAGGTTGGTCGTTACGCTCCGTGGTATTCTGATCTGGGCGTCCGTCCGGCGTTTTACCTGGACAGTGAATATTTCGTGACGACCAGCGGCTCTGGTAGTCAGTCGAGCCCGTACATTGGTTCCGCGCCGAACAAACAAGAAGATGACTATACCATCTCAGAACCGGCGGAAGATGCCAACCCGGACTGGAATGTTTCGACGGAACAGAGCATTCAACTGACCCTGGGCCCGTGGTACTCGAATGATGGTAAATATAGCAACCCGACCATTCCGGTGTATACCATCCAGAAAACGCGCTCGGATACCGAAAACATGGTGGTTGTCGTGTGCGGCGAAGGTTATACCAAATCACAGCAAGGCAAATTTATCAATGATGTTAAACGTCTGTGGCAGGACGCTATGAAATATGAACCGTACCGTAGCTATGCGGATCGCTTTAATGTGTATGCACTGTGTACGGCTTCCGAATCAACCTTCGATAACGGCGGTTCTACCTTTTTCGATGTGATCGTTGACAAATACAACTCTCCGGTTATCAGTAACAATCTGCATGGCAGTCAGTGGAAAAATCACATTTTTGAACGCTGCATCGGTCCGGAATTCATTGAAAAAATCCATGATGCCCACATTAAGAAAAAATGTGACCCGAACACCATCCCGTCGGGTAGCGAATACGAACCGTATTACTATGTGCATGATTATATTGCACAGTTTGCTATGGTTGTCAATACCAAATCCGACTTCGGCGGTGCATATAACAATCGCGAATACGGCTTTCACTATTTCATCTCTCCGAGTGATTCCTACCGTGCCTCTAAAACCTTTGCACATGAATTCGGCCACGGTCTGCTGGGCCTGGGTGATGAATACTCGAATGGTTATCTGCTGGATGACAAAGAACTGAAAAGCCTGAACCTGTCTAGTGTGGAAGATCCGGAAAAAATTAAATGGCGTCAGCTGCTGGGCTTTCGCAATACGTACACCTGCCGTAACGCGTATGGTTCTAAAATGCTGGTTTCCTCATACGAATGTATCATGCGCGATACCAACTATCAATTTTGCGAAGTCTGTCGCCTGCAGGGCTTCAAACGTATGAGCCAACTGGTTAAAGATGTCGACCTGTATGTGGCCACGCCGGAAGTTAAAGAATACACCGGTGCATATAGTAAACCGTCCGATTTTACGGACCTGGAAACCTCGAGCTACTACAACTACACCTACAACCGTAACGATCGCCTGCTGAGTGGCAACTCAAAATCGCGTTTCAATACGAACATGAATGGCAAGAAAATTGAACTGCGCACCGTTATTCAGAACATCAGCGATAAAAACGCCCGTCAACTGAAATTCAAAATGTGGATCAAACATTCAGATGGCTCGGTGGCAACCGACTCTAGTGGTAACCCGCTGCAGACCGTCCAAACGTTTGATATTCCGGTGTGGAACGACAAAGCCAATTTCTGGCCGCTGGGCGCACTGGATCACATCAAATCCGACTTTAATTCAGGTCTGAAAAGCTGCTCTCTGATTTATCAGATCCCGTCTGATGCTCAACTGAAAAGTGGCGACACCGTGGCGTTCCAGGTTCTGGATGAAAACGGTAATGTGCTGGCGGATGACAACACGGAAACCCAGCGCTACACGACCGTTTCTATCCAATACAAATTCGAAGATGGCAGTGAAATCCCGAATACGGCGGGCGGTACCTTCACCGGCGGCGGTGGATCCCACCATCATCACCACCATCATCATCACCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGGGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATAAGCGGCCGC |
載體和細胞
在另一方面,本申請案提供了一種載體,其包含編碼本申請案所述的IgA蛋白酶截短體的核酸或包含編碼本申請案所述的融合蛋白的核酸。
使用本領域習知的重組技術,可以將編碼所述IgA蛋白酶截短體或融合蛋白的分離的多核苷酸插入載體,用於進一步的選殖(DNA的擴增)或用於表現。有多種載體可供選擇。載體組分通常包括但不限於下列的一種或多種:訊號序列、複製起始點、一種或多種標記基因、增強子元件、啟動子(例如SV40、CMV、EF-1α)和轉錄終止序列。
在某些實施方式中,本申請案提供的核酸編碼IgA蛋白酶截短體或融合蛋白、與核酸序列可操作連接的至少一種啟動子(例如SV40、CMV、EF-1α)和至少一種選擇標記。載體的實例包括但不限於:逆轉錄病毒(包括慢病毒)、腺病毒、腺相關病毒、皰疹病毒(例如單純皰疹病毒)、痘病毒、桿狀病毒、乳頭瘤病毒、乳多空病毒(例如SV40)、λ噬菌體和M13噬菌體、質體pcDNA3.3、pMD18-T、pOptivec、pCMV、pEGFP、pIRES、pQD-Hyg-GSeu、pALTER、pBAD、pcDNA、pCal、pL、pET、pGEMEX、pGEX、pCI、pEGFT、pSV2、pFUSE、pVITRO、pVIVO、pMAL、pMONO、pSELECT、pUNO、pDUO、Psg5L、pBABE、pWPXL、pBI、p15TV-L、pPro18、pTD、pRS10、pLexA、pACT2.2、pCMV-SCRIPT.RTM.、pCDM8、pCDNA1.1/amp、pcDNA3.1、pRc/RSV、PCR 2.1、pEF-1、pFB、pSG5、pXT1、pCDEF3、pSVSPORT、pEF-Bos等。
可以將包含編碼所述IgA蛋白酶截短體或融合蛋白的核酸序列的載體引入宿主細胞,用於選殖或基因表現。適用於選殖或表現本申請案中所述的載體中的DNA的宿主細胞為上述的原核、酵母或高等真核細胞。適用於本申請案用途的原核細胞包括真細菌,如革蘭氏陰性菌或革蘭氏陽性菌,例如,腸桿菌科(
Enterobacteriaceae),例如,埃希氏菌屬(
Escherichia)(例如,大腸桿菌(
E. coli))、腸桿菌屬(
Enterobacter)、歐文氏菌屬(
Erwinia)、克雷白氏桿菌屬(
Klebsiella)、變形桿菌屬(
Proteus)、沙門氏菌屬(
Salmonella)(例如,鼠傷寒沙門(氏)桿菌(
Salmonella typhimurium))、沙雷氏菌屬(
Serratia)(例如,黏質沙雷氏菌(
Serratia marcescans))、志賀氏菌屬(
Shigella)、桿菌屬(
Bacilli)(例如,枯草芽孢桿菌(
B. subtilis)和地衣芽孢桿菌(
B. licheniformis))、假單胞菌屬(
Pseudomonas)(例如,綠膿桿菌(
P. aeruginosa)、以及鏈黴菌屬(
Streptomyces)。在某些實施方式中,所述細胞是大腸桿菌細胞。
除了原核細胞以外,真核生物細胞,例如真核微生物如絲狀真菌或酵母也可用作編碼IgA蛋白酶截短體或融合蛋白的載體的合適的選殖或表現宿主。釀酒酵母(
Saccharomyces cerevisiae),或麵包酵母是最常用的低等真核宿主微生物。但是,許多其他屬、種和株都比較常用且在本申請案中適用,例如,粟酒裂殖酵母(
Schizosaccharomyces pombe);克魯維酵母屬(
Kluyveromyces)宿主,例如,乳酸克魯維酵母(
K. lactis)、脆壁克魯維酵母(
K. fragilis)(ATCC 12,424)、保加利亞克魯維酵母(
K. bulgaricus)(ATCC 16,045)、魏氏克魯維酵母(
K. wickeramii)(ATCC 24,178)、克魯雄酵母(
K. waltii)(ATCC 56,500)、果蠅克魯維酵母(
K. drosophilarum)(ATCC 36,906)、耐熱克魯維酵母(
K. thermotolerans)和馬克斯克魯維酵母(
K. marxianus);解脂耶氏酵母(
yarrowia)(EP 402,226);巴斯德畢赤酵母(
Pichia pastoris)(EP 183,070);假絲酵母(
Candida);裡氏木黴(
Trichoderma reesia)(EP 244,234);鏈孢黴(
Neurospora crassa);西方許旺酵母(
Schwanniomyces),例如,西方許旺酵母(
Schwanniomyces occidentalis);和絲狀真菌(
filamentous fungi),例如,脈孢菌(
Neurospora)、青黴菌(
Penicillium)、彎頸黴(
Tolypocladium)和曲黴菌(
Aspergillus)(例如,鉤巢麯黴(
A. nidulans)和黑麯黴(
A. niger))。在某些實施方式中,所述真核生物細胞是哺乳動物細胞。在某些實施方式中,所述哺乳動物細胞是人細胞或中國倉鼠卵巢(CHO)細胞。在某些實施方式中,所述哺乳動物細胞是人胚胎腎細胞293(HEK293細胞)。
藥物組合物
在另一方面,本申請案提供了一種藥物組合物,其包含本申請案所述的IgA蛋白酶截短體、包含本申請案所述的融合蛋白、包含本申請案所述的核酸、包含本申請案所述的載體或者包含本申請案所述的細胞,以及藥學上可接受的載體。
用於本申請案中揭露的藥物組合物的藥學上可接受的載體可包括,例如,藥學上可接受的液體、凝膠或固體載劑、水相溶媒、非水相溶媒、抗微生物物質、等滲物質、緩衝液、抗氧化劑、麻醉劑、懸浮劑/分散劑、螯合劑、稀釋劑、佐劑、輔料或無毒輔助物質,其他本領域習知的組分或以上的多種組合。
適用的組分可包括,例如,抗氧劑、填充劑、黏合劑、崩解劑、緩衝液、防腐劑、潤滑劑、矯味劑、增稠劑、著色劑、乳化劑或穩定劑例如糖和環糊精。適用的抗氧劑可包括,例如,甲硫胺酸、抗壞血酸、EDTA、硫代硫酸鈉、鉑、過氧化氫酶、檸檬酸、半胱胺酸、巰基甘油、巰基乙酸、巰基山梨醇、丁基甲基茴香醚、丁基化羥基甲苯和/或沒食子酸丙酯。如本申請案所揭露,在包含本申請案揭露的IgA蛋白酶截短體或融合蛋白的組合物中包括一種或多種抗氧劑如甲硫胺酸,可降低所述IgA蛋白酶截短體或融合蛋白的氧化。本申請案進一步提供多種防止所述IgA蛋白酶截短體或融合蛋白氧化、延長其保質期和/或提高其活性的方法,例如,通過將本申請案中提供的IgA蛋白酶截短體或融合蛋白與一種或多種抗氧劑(例如,甲硫胺酸)混合來實現。
進一步地說,藥學上可接受的載體可包括,例如,水相介質如氯化鈉注射液、林格氏液注射液、等滲葡萄糖注射液、無菌水注射液、或葡萄糖和乳酸林格注射液、非水介質例如:植物來源的不揮發性油、棉花籽油、玉米油、芝麻油、或者花生油、細菌抑制或真菌抑制濃度下的抗菌物質、等滲劑如:氯化鈉或葡萄糖、緩衝液如:磷酸鹽或枸櫞酸酸鹽緩衝液,抗氧化劑如:硫酸氫鈉,局部麻醉劑如:鹽酸普魯卡因,助懸劑和分散劑如:羧甲基纖維素鈉、羥丙基甲基纖維素或聚乙烯吡咯烷酮,乳化劑如:聚山梨醇酯80(吐溫-80)、螯合試劑如EDTA(乙二胺四乙酸)或EGTA(乙二醇雙(2-胺基乙基醚)四乙酸)、乙醇、聚乙二醇、丙二醇、氫氧化鈉、鹽酸、檸檬酸或乳酸。作為運載體的抗菌劑可加入多劑量容器中的藥物組合物中,其包括酚類或甲酚、汞製劑、苯甲醇、氯代丁醇、甲基和丙基對羥基苯甲酸酯、噻汞撒、氯苯甲烷銨和氯苯乙銨。適用的輔料可包括,例如,水、鹽、葡萄糖、甘油或乙醇。適用的無毒輔助物質可包括,例如,潤濕劑、乳化劑、pH緩衝劑、穩定劑、增溶劑,或者醋酸鈉、去水山梨糖醇月桂酸酯、三乙醇胺油酸酯或者環糊精之類的物質。
所述藥物組合物可以是液體溶液、懸浮液、乳劑、丸劑、膠囊、片劑、持續釋放製劑或粉末。口服製劑可以包括標準運載體如藥物級的甘露醇、乳糖、澱粉、硬脂酸鎂、聚乙烯吡咯烷酮、糖精鈉、纖維素、碳酸鎂等。
在某些實施方式中,所述藥物組合物被製劑成可注射的組合物。可注射的藥物組合物可以任何常規的形式製備,例如,液體溶劑、懸浮劑、乳化劑或適用於產生液體溶劑、懸浮劑或乳化劑的固體形式。注射製劑可包括現用的無菌和/或無熱原溶液、使用前現與溶劑結合的無菌乾燥的可溶物,如凍乾粉,包括皮下片、注射即用的無菌懸浮劑、使用前現與介質結合的無菌乾燥不溶產品,和無菌和/或無熱原的乳劑。溶劑可以為水相或非水相。
在某些實施方式中,單位劑量的注射製劑包裝在一個安瓿、一支管或一支帶有針的針筒中。本領域習知,所有注射給藥的製劑應為無菌無熱原。
在某些實施方式中,通過將本申請案中揭露的IgA蛋白酶截短體或融合蛋白溶解於某適當的溶劑中可製備無菌凍乾的粉末。所述溶劑可含有一種可提高粉末或由粉末制得的重組溶液的穩定性,或改善粉末或重組溶液的其他藥理組分。適用的輔料包括,但不限於,水、葡萄糖、三梨糖醇、果糖、玉米糖漿、木糖醇、甘油、葡萄糖、蔗糖或其他適用的物質。溶劑可含有緩衝液,如枸櫞酸緩衝液、磷酸鈉或磷酸鉀緩衝液或其他本通常知識者習知的緩衝液,在一種實施方式中,緩衝液的pH為中性。在本領域習知的標準條件下進行對所述溶解進行隨後的過濾除菌,然後凍乾製得理想的製劑。在一種實施方式中,將所得的溶劑分裝至小管中凍乾。每支小管可容納單次劑量或多次劑量的所述IgA蛋白酶截短體或融合蛋白或其組合物。每支小管中的裝入量可略微高於每次劑量所需或多次劑量所需(例如10%過量),從而保證取樣精確和給藥精確。凍乾粉可在適當的條件下儲存,如在約4°C到室溫範圍。
用注射用水將凍乾粉重溶得到用於注射給藥的製劑。在一種實施方式中,可將凍乾粉加至無菌無熱原水或其他適用的液體載劑中重溶。精確的量由選擇的療法決定,可根據經驗值決定。
治療或預防疾病的方法
在另一方面,本申請案提供了一種治療或預防IgA沉積相關疾病的方法,其包括向需要治療或預防的受試者施用本申請案所述的IgA蛋白酶截短體、本申請案所述的融合蛋白或者本申請案所述的藥物組合物。
在另一方面,本申請案提供了本申請案所述的IgA蛋白酶截短體、本申請案所述的融合蛋白或者本申請案所述的藥物組合物在製備用於治療或預防IgA沉積相關疾病的藥物中的用途。
在另一方面,本申請案提供了用於治療或預防IgA沉積相關疾病的IgA蛋白酶截短體、融合蛋白或者藥物組合物。
在某些實施方式中,本申請案所述的IgA沉積相關疾病包括IgA腎病、皰疹樣皮炎、類過敏性紫斑(又稱IgA血管炎)、川崎病、紫斑性腎炎、IgA血管炎腎損害、IgA類風濕因子陽性的類風濕性關節炎、IgA型抗GBM病或IgA型ANCA相關血管炎。在某些實施方式中,本申請案所述的IgA沉積相關疾病為IgA腎病。在某些實施方式中,本申請案所述的IgA沉積相關疾病為IgA1腎病。在某些實施方式中,本申請案所述的IgA沉積相關疾病為IgA血管炎。在某些實施方式中,本申請案所述的IgA沉積相關疾病為川崎病。
所有實施例中的涉及的生物學材料如大腸桿菌菌株、各種選殖與表現質體、培養基、工具酶、緩衝液,和各種培養方法、蛋白提取和純化方法、其它的分子生物學操作方法,均為該領域技術人員所熟悉,可以參考Sambrook等人編著的「分子選殖」(實驗室手冊,冷泉港,1989)及「精編分子生物學實驗指南」(美/F.奧斯伯等著,顏子穎等譯,北京,科學出版社,1998)。
實施例
1
:
AK183 IgA
蛋白酶的最短活性位點研究
發明人將來自多枝梭菌(
Clostridium ramosum)AK183株的野生型IgA蛋白酶(其胺基酸序列如SEQ ID NO: 1所示)N末端的訊息肽(即,SEQ ID NO: 1的第1至30位胺基酸)及C末端的跨膜區加胞內區(即,SEQ ID NO: 1的第1205至1234位胺基酸)去掉,然後將人IgG1的Fc序列(HR-CH2-CH3,其胺基酸序列如SEQ ID NO: 24所示)加在了去掉了訊息肽、跨膜區和胞內區的IgA蛋白酶的胺基酸序列(即,由SEQ ID NO: 1的第31位至1204位胺基酸組成的IgA蛋白酶截短體)的N末端,建構了PET30a-Fc-AK183質體。
然後,發明人以PET30a-Fc-AK183質體為範本,進行終止突變,建構了一系列Fc-AK183截短體,以研究AK183 IgA蛋白酶的最短活性位點。基於前期研究結果,發明人認為在AK183 IgA蛋白酶的第730位至第840位胺基酸之間存在自切位點。因此,發明人進行了第一輪終止突變,終止突變位點為AK183 IgA蛋白酶的第738位、第769位、第799位、第834位這四個胺基酸位點,結果如圖1所示。結果顯示,第738位、第769位的胺基酸終止突變後得到的AK183(31-737)、AK183(31-768) IgA蛋白酶截短片段無體外酶切活性,而第799位或第834位的胺基酸終止突變後得到的AK183(31-798)、AK183(31-833) IgA蛋白酶截短片段有活性。因此,第一輪終止突變結論為:AK183 IgA蛋白酶的最短活性位點位於第768位至第798位胺基酸之間;接著進行了第二輪終止突變,突變位點為AK183 IgA蛋白酶的第774位、第779位、第783位、第788位或者第793位這五個胺基酸位點,結果如圖2所示,第774位、第779位、第783位或者第788位的胺基酸終止突變後得到的AK183(31-773)、AK183(31-778)、AK183(31-782)、AK183(31-787) IgA蛋白酶截短片段無體外酶切活性,而第793位的胺基酸終止突變後得到的AK183(31-792) IgA蛋白酶截短片段仍有活性。因此,第二輪終止突變結論為:AK183 IgA蛋白酶的最短活性位點位於第787位至第792位胺基酸之間;然後,發明人進行了第三輪終止突變,突變位點為AK183 IgA蛋白酶的第789位、第790位、第791位或者第792位這四個胺基酸位點,結果如圖3所示,第789位和第790位的胺基酸終止突變後得到的AK183(31-788)、AK183(31-789) IgA蛋白酶截短片段無體外酶切活性,而第791位或第792位的胺基酸終止突變後得到的AK183(31-790)、AK183(31-791) IgA蛋白酶截短片段仍有活性(其中第791位可能由於蛋白酶構象問題,活性不完全,僅表現出輕微酶切作用)。因此,第三輪終止突變結論為:AK183 IgA蛋白酶的最短活性片段為AK183(31-790)。
實施例
2
:製備包含
AK183 IgA
蛋白酶截短體的融合蛋白
2.1 質體建構
在確定了AK183 IgA蛋白酶最短活性片段AK183(31-790)後,發明人將Fc結構域放在了AK183 IgA蛋白酶的第790位胺基酸的C端,中間加GGGGS連接,Fc的C端加6XHis標記用於蛋白純化,建構了PET30a-AK183(31-790)-Fc質體,建構流程如圖4所示。然後,發明人以PET30a-AK183(31-790)-Fc質體為範本,通過PCR在AK183(31-790)截短體後面加了第791個及第792個胺基酸,建構了PET30a-AK183(31-792)-Fc質體。
申請人同時委託北京六合華大基因科技有限公司建構了PET30a-AK183(31-798)-Fc、PET30a-AK183(31-807)-Fc、PET30a-AK183(31-816)-Fc、PET30a-AK183(31-833)-Fc四個備選亞株,備選亞株的Fc(CH2-CH3)除去了鉸鏈區,其胺基酸序列如SEQ ID NO: 6所示(SEQ ID NO: 6與SEQ ID NO: 2相比,缺少了SEQ ID NO: 2的前9個胺基酸EPKSCDKTH),且在IgA蛋白酶截短體與Fc中間添加了10個His(位於連接子GGGGS後面,Fc前面)。四個備選亞株用於後期蛋白酶產量及純度篩選的備選方案。
2.2 融合蛋白製備方法
將表現載體轉染入大腸桿菌(BL21-DE3)勝任細胞,經含50μg/ml的卡納黴素的LB瓊脂培養皿抗性選擇,然後挑取單株菌落至含相應抗生素的LB培養液中搖菌至指數生長期(OD600:0.6~0.8),至指數生長期後,加入0.1~0.5 mM的異丙基-β-D-硫代半乳糖苷(IPTG)誘導,16℃低溫誘導表現24h。完成表現後按照常規方法處理大腸桿菌胞體超聲碎裂後高速離心並保留上清,然後採用親和層析及分子篩純化得到所述重組融合蛋白。
PET30a-AK183(31-792)-Fc質體表現的AK183(31-792)-Fc融合蛋白的胺基酸序列如SEQ ID NO: 2所示,其編碼核酸序列如SEQ ID NO: 3所示;PET30a-AK183(31-798)-Fc質體表現的AK183(31-798)-Fc融合蛋白的胺基酸序列如SEQ ID NO: 6所示,其編碼核酸序列如SEQ ID NO: 7所示;PET30a-AK183(31-807)-Fc質體表現的AK183(31-807)-Fc融合蛋白的胺基酸序列如SEQ ID NO: 8所示,其編碼核酸序列如SEQ ID NO: 9所示;PET30a-AK183(31-816)-Fc質體表現的AK183(31-816)-Fc融合蛋白的胺基酸序列如SEQ ID NO: 10所示,其編碼核酸序列如SEQ ID NO: 11所示;PET30a-AK183(31-833)-Fc質體表現的AK183(31-833)-Fc融合蛋白的胺基酸序列如SEQ ID NO: 12所示,其編碼核酸序列如SEQ ID NO: 13所示。
2.3 體外活性測試方法
將獲得的包含AK183 IgA蛋白酶截短體的融合蛋白與從IgA腎病患者血漿中提純的基質IgA1在體外混合,37℃下反應2~12h,然後進行西方墨點法,驗證其對基質IgA1的酶切活性。
2.4 體內活性測試方法
將獲得的包含AK183 IgA蛋白酶截短體的融合蛋白通過尾靜脈注射到人源化IgA1 alpha鏈敲入(α1KI-Tg)C57BL/6小鼠體內,分別在收集注射前,注射後5min,2h,4h,24h的血液樣本,然後進行西方墨點法驗證。
2.5 結果
實驗表明,PET30a-AK183(31-790)-Fc質體成功表現AK183(31-790)-Fc融合蛋白(如圖5所示)。同時,AK183(31-792)-Fc融合蛋白有預期的全長蛋白表現(如圖6a所示),也具有體外針對IgA1的酶切活性(如圖6b所示)。備選的其它四個亞株PET30a-AK183(31-798)-Fc、PET30a-AK183(31-807)-Fc、PET30a-AK183(31-816)-Fc、PET30a-AK183(31-833)-Fc均表現融合蛋白,並且均具有體外酶切活性(如圖7所示)。發明人還驗證了亞株PET30a-AK183(31-807)-Fc表現的AK183(31-807)-Fc融合蛋白的體內活性,結果如圖8所示,人源化IgA1小鼠(α1KI-Tg)C57BL/6在接受單針尾靜脈注射此融合蛋白後血液中完整的IgA1重鏈(H)全部消失,並且持續到至少24h。
2.6 真核表現系統
以上實驗均在大腸桿菌(BL21-DE3)勝任細胞(即,原核表現系統)中進行。接下來,發明人將AK183(31-792)-Fc融合cDNA序列選殖入pcDNA3.1/hygro(+)表現載體中,融合蛋白的N端加上ATGTACAGGATGCAACTCCTGTCTTGCATTGCACTAAGTCTTGCACTTGTCACGAATTCG(SEQ ID NO: 41)編碼表現人IL-2的訊息肽序列,建構了pcDNA3.1/hygro(+)-IL2-AK183(31-792)-Fc質體,用於轉染真核表現系統HEK293 細胞。其中對Fc序列進行了針對真核表現系統的密碼子優化。pcDNA3.1/hygro(+)-IL2-AK183(31-792)-Fc表現的IL2-AK183(31-792)-Fc融合蛋白的胺基酸序列如SEQ ID NO: 4所示,其編碼核酸序列如SEQ ID NO: 5所示。
AK183(31-792)-Fc融合蛋白在HEK293細胞中的表現結果如圖9所示。結果表明,AK183(31-792)-Fc融合蛋白有預期的全長表現,且在真核系統中表現的融合蛋白存在二聚體(dimer)形式。
雖然本申請案通過引用特定實施例的方式對發明進行特定的展現和描述,但是本申請案所屬技術領域中具有通常知識者都應該理解,在不脫離本申請案揭露內容的主旨和保護範圍的情況下,上述內容還可以進行各種形式和細節上的變化。
無
無
TW202346581A_112103015_SEQL.xml
Claims (55)
- 一種分離的IgA蛋白酶截短體,其包含來自多枝梭菌( Clostridium ramosum)的野生型IgA蛋白酶的非天然截短片段,或者與所述非天然截短片段具有至少90%或至少95%的序列同一性。
- 如請求項1所述的IgA蛋白酶截短體,其中所述非天然截短片段在所述多枝梭菌( Clostridium ramosum)的野生型IgA蛋白酶的基礎上有胺基酸突變或缺失,使得所述IgA蛋白酶截短體喪失或降低自酶切功能。
- 如請求項2所述的IgA蛋白酶截短體,其中所述胺基酸突變或缺失發生在所述多枝梭菌( Clostridium ramosum)的野生型IgA蛋白酶的天然自酶切位點、所述天然自酶切位點的上游5個位點以內和/或下游5個位點以內。
- 如請求項1~3中任一項所述的IgA蛋白酶截短體,其中所述非天然截短片段為來自多枝梭菌( Clostridium ramosum)的野生型IgA蛋白酶的N末端截短片段或C末端截短片段。
- 如前述請求項中任一項所述的IgA蛋白酶截短體,其中所述多枝梭菌( Clostridium ramosum)為 Clostridium ramosumAK183株。
- 如請求項4或5所述的IgA蛋白酶截短體,其中所述N末端截短片段包含來自多枝梭菌( Clostridium ramosum)的野生型IgA蛋白酶的N末端第31位起的至少760個連續胺基酸的多肽片段,或者與所述多肽片段具有至少90%或至少95%的序列同一性。
- 如請求項6所述的IgA蛋白酶截短體,其中所述多枝梭菌( Clostridium ramosum)的野生型IgA蛋白酶的胺基酸序列如SEQ ID NO: 1所示。
- 如請求項7所述的IgA蛋白酶截短體,其中所述天然自酶切位點在如SEQ ID NO: 1所示的胺基酸序列的第730位至840位之間(例如,第792位至第797位之間)。
- 如請求項8所述的IgA蛋白酶截短體,其中所述天然自酶切位點在如SEQ ID NO: 1所示的胺基酸序列的第790位、第791位、第792位、第793位、第794位、第795位、第796位、第797位、第798位、第799位或第800位。
- 如前述請求項中任一項所述的IgA蛋白酶截短體,其包含如SEQ ID NO: 1所示的胺基酸序列的第31位起的至少760個(例如,至少761個、至少762個、至少763個、至少764個、至少765個、至少766個、至少767個、至少768個、至少769個、至少770個、至少771個、至少772個、至少773個、至少774個、至少775個、至少776個、至少777個、至少778個、至少779個、至少780個、至少781個、至少782個、至少783個、至少784個、至少785個、至少786個、至少787個、至少788個、至少789個、至少790個、至少791個、至少792個、至少793個、至少794個、至少795個、至少796個、至少797個、至少798個、至少799個、至少800個、至少801個、至少802個、至少803個、至少804個、至少805個、至少806個、至少807個、至少808個、至少809個、至少810個、至少900個、至少950個、至少1000個、至少1100個、至少1150個、至少1200個)連續胺基酸的多肽片段。
- 如前述請求項中任一項所述的IgA蛋白酶截短體,其包含選自下組的多肽片段:如SEQ ID NO: 1所示的胺基酸序列的第31位至第790位胺基酸、如SEQ ID NO: 1所示的胺基酸序列的第31位至第792位胺基酸、如SEQ ID NO: 1所示的胺基酸序列的第31位至第798位胺基酸、如SEQ ID NO: 1所示的胺基酸序列的第31位至第807位胺基酸、如SEQ ID NO: 1所示的胺基酸序列的第31位至第816位胺基酸、如SEQ ID NO: 1所示的胺基酸序列的第31位至第833位胺基酸以及與其具有至少90%或至少95%的序列同一性的多肽片段。
- 如前述請求項中任一項所述的IgA蛋白酶截短體,其在所述多肽片段的胺基酸序列基礎上,在一個或多個位點具有胺基酸的保守替換。
- 如前述請求項中任一項所述的IgA蛋白酶截短體,其具有特異性切割人IgA的酶活性。
- 如請求項13所述的IgA蛋白酶截短體,其具有特異性切割人IgA重鏈的酶活性。
- 如請求項14所述的IgA蛋白酶截短體,其具有特異性切割人IgA重鏈CH1與鉸鏈區交匯處的酶活性。
- 如請求項13~15中任一項所述的IgA蛋白酶截短體,其具有特異性切割人IgA1的酶活性。
- 一種融合蛋白,其包含第一多肽和第二多肽,其中所述第一多肽包含如前述請求項中任一項所述的IgA蛋白酶截短體,所述第二多肽包含用於延長所述第一多肽在受試者體內半衰期的胺基酸序列。
- 如請求項17所述的融合蛋白,其中所述第一多肽和所述第二多肽之間通過連接子連接。
- 如請求項17所述的融合蛋白,其中所述第一多肽和所述第二多肽之間直接連接。
- 如請求項18所述的融合蛋白,其中所述連接子選自下組:可切割連接子、不可切割連接子、肽連接子、柔性連接子、剛性連接子、螺旋連接子和非螺旋連接子。
- 如請求項20所述的融合蛋白,其中所述連接子包括肽連接子。
- 如請求項21所述的融合蛋白,所述肽連接子包括含有甘胺酸和絲胺酸的連接子。
- 如請求項22所述的融合蛋白,其中所述含有甘胺酸和絲胺酸的連接子包括如SEQ ID NO: 21 (GGGS)或SEQ ID NO: 22 (GGGGS)所示的一個或多個重複。
- 如請求項21所述的融合蛋白,其中所述連接子包括如SEQ ID NO: 23 (GGCGGCGGTGGATCC)所示的胺基酸序列。
- 如請求項17~24中任一項所述的融合蛋白,其中所述第二多肽選自:Fc結構域和白蛋白。
- 如請求項25所述的融合蛋白,其中所述Fc結構域包含鉸鏈區。
- 如請求項26所述的融合蛋白,其中所述Fc結構域來源於人IgG Fc結構域。
- 如請求項27所述的融合蛋白,其中所述Fc結構域來源於人IgG1 Fc結構域、人IgG2 Fc結構域、人IgG3 Fc結構域或人IgG4 Fc結構域。
- 如請求項25~28中任一項所述的融合蛋白,其中所述Fc結構域包含與SEQ ID NO: 24、SEQ ID NO: 25或SEQ ID NO: 32具有至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的序列同一性的胺基酸序列。
- 如請求項29所述的融合蛋白,其中所述Fc結構域包含如SEQ ID NO: 24、SEQ ID NO: 25或SEQ ID NO: 32所示的胺基酸序列。
- 如請求項25~30中任一項所述的融合蛋白,其中所述Fc結構域包含一個或多個延長所述融合蛋白的半衰期的突變。
- 如請求項25~31中任一項所述的融合蛋白,其中所述Fc結構域與所述第一多肽的C末端連接。
- 如請求項25所述的融合蛋白,其中所述白蛋白包含人血清白蛋白的一個或多個結構域。
- 如請求項33所述的融合蛋白,其中所述白蛋白包含人血清白蛋白的D3結構域。
- 如請求項17~34中任一項所述的融合蛋白,其進一步包含標記。
- 如請求項35所述的融合蛋白,其中所述標記選自下組:螢光標記、發光標記、純化標記和生色標記。
- 如請求項35或36所述的融合蛋白,其中所述標記選自下組:c-Myc標記、HA標記、VSV-G標記、FLAG標記、V5標記和HIS標記。
- 如請求項37所述的融合蛋白,其中所述標記是包含6個、7個、8個、9個或10個組胺酸的HIS標記。
- 如請求項35~38中任一項所述的融合蛋白,其中所述第二多肽位於所述第一多肽的C末端,所述標記位於所述第二多肽的C末端。
- 如請求項35~39中任一項所述的融合蛋白,其中所述融合蛋白在受試者體內的血循環中的半衰期為至少1天、至少2天、至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天、至少13天、至少14天。
- 一種分離的核酸,其包含編碼如請求項1~16中任一項所述的IgA蛋白酶截短體的核苷酸序列或包含編碼如請求項17~40中任一項所述的融合蛋白的核苷酸序列。
- 如請求項41所述的核酸,其包含選自下組的核苷酸序列:SEQ ID NO: 3、SEQ ID NO: 5、SEQ ID NO: 7、SEQ ID NO: 9、SEQ ID NO: 11、SEQ ID NO: 13、SEQ ID NO: 33、SEQ ID NO: 34、SEQ ID NO: 35、SEQ ID NO: 36、SEQ ID NO: 37、SEQ ID NO: 38以及與其具有至少90%或至少95%的序列同一性的核苷酸序列。
- 一種載體,其包含如請求項41或42所述的核酸。
- 一種細胞,其包含如請求項41或42所述的核酸或如請求項43所述的載體。
- 如請求項44所述的細胞,其中所述細胞是原核生物細胞或真核生物細胞。
- 如請求項45所述的細胞,其中所述原核生物細胞是大腸桿菌細胞。
- 如請求項45所述的細胞,其中所述真核生物細胞是哺乳動物細胞。
- 如請求項47所述的細胞,其中所述哺乳動物細胞是人細胞或中國倉鼠卵巢(CHO)細胞。
- 如請求項48所述的細胞,其中所述哺乳動物細胞是人胚胎腎細胞293(HEK293細胞)。
- 一種藥物組合物,其包含如請求項1~16中任一項所述的IgA蛋白酶截短體、包含如請求項17~40中任一項所述的融合蛋白、包含如請求項41或42所述的核酸、包含如請求項43所述的載體或者包含如請求項44~49中任一項所述的細胞,以及藥學上可接受的載體。
- 一種產生融合蛋白的方法,其包括培養如請求項44~49中任一項所述的細胞的步驟。
- 一種治療或預防IgA沉積相關疾病的方法,其包括向需要治療或預防的受試者施用如請求項1~16中任一項所述的IgA蛋白酶截短體、如請求項17~40中任一項所述的融合蛋白或者如請求項50所述的藥物組合物。
- 一種如請求項1~16中任一項所述的IgA蛋白酶截短體、如請求項17~40中任一項所述的融合蛋白或者如請求項50所述的藥物組合物在製備用於治療或預防IgA沉積相關疾病的藥物中的用途。
- 如請求項52所述的方法或者如請求項53所述的用途,其中所述IgA沉積相關疾病包括IgA腎病、皰疹樣皮炎、類過敏性紫斑(又稱IgA血管炎)、川崎病、紫斑性腎炎、IgA血管炎腎損害、IgA類風濕因子陽性的類風濕性關節炎、IgA型抗GBM病或IgA型ANCA相關血管炎。
- 如請求項52所述的方法或者如請求項53所述的用途,其中所述IgA沉積相關疾病為IgA腎病、IgA血管炎或川崎病。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210112254 | 2022-01-29 | ||
CN2022101122547 | 2022-01-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202346581A true TW202346581A (zh) | 2023-12-01 |
Family
ID=90039299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW112103015A TW202346581A (zh) | 2022-01-29 | 2023-01-30 | IgA蛋白酶截短體、包含IgA蛋白酶截短體的融合蛋白及其用途 |
Country Status (2)
Country | Link |
---|---|
AR (1) | AR128388A1 (zh) |
TW (1) | TW202346581A (zh) |
-
2023
- 2023-01-30 TW TW112103015A patent/TW202346581A/zh unknown
- 2023-01-30 AR ARP230100217A patent/AR128388A1/es unknown
Also Published As
Publication number | Publication date |
---|---|
AR128388A1 (es) | 2024-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109843323B (zh) | 用于黄病毒疫苗接种的组合物和方法 | |
JP2019056013A (ja) | ヒト成長ホルモン類似体を用いた小児成長ホルモン分泌不全症の治療 | |
US10624955B2 (en) | Cholix toxin-derived fusion molecules for oral delivery of biologically active cargo | |
JP2004522424A (ja) | アポリポタンパク質類似体 | |
KR20230015310A (ko) | 2019-ncov (sars-cov-2) 백신 | |
AU2014222509A1 (en) | CSF1 therapeutics | |
EP1724342B1 (en) | Process for preparing variant of erysipelothrix rhusiopathiae surface protective antigen in e. coli | |
JP5122438B2 (ja) | キメラタンパク質、それらの製造およびそれを含有する医薬組成物 | |
RU2426745C2 (ru) | Рекомбинантный химерный белок фактора ингибирования нейтрофилов и гиругена и содержащая его фармацевтическая композиция | |
US11952602B2 (en) | Variants of porcine trypsin | |
JP2023540486A (ja) | 免疫原性コロナウイルス融合タンパク質および関連方法 | |
WO2009095500A1 (en) | Inhibitors of lentiviral replication | |
KR20220007619A (ko) | 면역조절 조성물 및 방법 | |
KR20220095204A (ko) | 혈청 알부민과 성장 호르몬의 융합 단백질을 함유하는 수성 의약 조성물 | |
TW202346581A (zh) | IgA蛋白酶截短體、包含IgA蛋白酶截短體的融合蛋白及其用途 | |
WO2023143563A1 (zh) | IgA蛋白酶截短体、包含IgA蛋白酶截短体的融合蛋白及其用途 | |
WO2023236878A1 (zh) | 包含IgA蛋白酶截短体的融合蛋白及其用途 | |
KR101651330B1 (ko) | 세포투과성이 우수한 tat-a20 융합단백질의 제조방법 및 이의 용도 | |
TW202413403A (zh) | 包含IgA蛋白酶截短體的融合蛋白及其用途 | |
EA038673B1 (ru) | Плазмидная днк, кодирующая дефенсин hnp-1, либо hnp-2, либо hnp-3 | |
RU2783315C2 (ru) | Варианты свиного трипсина | |
US20230322863A1 (en) | Reagents and methods for preventing, treating or limiting severe acute respiratory syndrome (sars) coronavirus infection | |
US20240108707A1 (en) | Chagas disease vaccine antigens with improved stability and decreased aggregation | |
KR20240022417A (ko) | 바실러스 서브틸리스 플라젤린 변이체 및 이의 용도 | |
WO2023117742A1 (en) | Vaccine compositions and their use |