KR20230049763A - 산-알파 글루코시다제 변이체 및 이의 용도 - Google Patents
산-알파 글루코시다제 변이체 및 이의 용도 Download PDFInfo
- Publication number
- KR20230049763A KR20230049763A KR1020237011129A KR20237011129A KR20230049763A KR 20230049763 A KR20230049763 A KR 20230049763A KR 1020237011129 A KR1020237011129 A KR 1020237011129A KR 20237011129 A KR20237011129 A KR 20237011129A KR 20230049763 A KR20230049763 A KR 20230049763A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- leu
- gaa
- pro
- gly
- Prior art date
Links
- 102000004366 Glucosidases Human genes 0.000 title abstract description 4
- 108010056771 Glucosidases Proteins 0.000 title abstract description 4
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 286
- 229920001184 polypeptide Polymers 0.000 claims description 283
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 283
- 150000007523 nucleic acids Chemical class 0.000 claims description 181
- 102000039446 nucleic acids Human genes 0.000 claims description 157
- 108020004707 nucleic acids Proteins 0.000 claims description 157
- 108090000623 proteins and genes Proteins 0.000 claims description 128
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 123
- 102000004169 proteins and genes Human genes 0.000 claims description 117
- 239000013598 vector Substances 0.000 claims description 112
- 210000004027 cell Anatomy 0.000 claims description 82
- 210000000234 capsid Anatomy 0.000 claims description 65
- 150000001413 amino acids Chemical group 0.000 claims description 61
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 47
- 239000013607 AAV vector Substances 0.000 claims description 44
- 230000014509 gene expression Effects 0.000 claims description 39
- 210000004185 liver Anatomy 0.000 claims description 39
- 238000000034 method Methods 0.000 claims description 33
- 208000007345 glycogen storage disease Diseases 0.000 claims description 30
- 201000004543 glycogen storage disease III Diseases 0.000 claims description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 25
- 208000032008 Glycogen storage disease due to glycogen debranching enzyme deficiency Diseases 0.000 claims description 24
- YNVAHBUBGBLIEY-WGDLNXRISA-N (1e,4e)-1,5-bis(2-hydroxyphenyl)penta-1,4-dien-3-one Chemical compound OC1=CC=CC=C1\C=C\C(=O)\C=C\C1=CC=CC=C1O YNVAHBUBGBLIEY-WGDLNXRISA-N 0.000 claims description 23
- 206010053185 Glycogen storage disease type II Diseases 0.000 claims description 23
- 239000002773 nucleotide Substances 0.000 claims description 21
- 125000003729 nucleotide group Chemical group 0.000 claims description 21
- 239000013603 viral vector Substances 0.000 claims description 21
- 206010018464 Glycogen storage disease type I Diseases 0.000 claims description 20
- 201000004541 glycogen storage disease I Diseases 0.000 claims description 20
- 210000005229 liver cell Anatomy 0.000 claims description 20
- 108091092195 Intron Proteins 0.000 claims description 18
- 201000004502 glycogen storage disease II Diseases 0.000 claims description 18
- 201000010099 disease Diseases 0.000 claims description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 17
- 238000001727 in vivo Methods 0.000 claims description 16
- 101001018026 Homo sapiens Lysosomal alpha-glucosidase Proteins 0.000 claims description 15
- 102000045921 human GAA Human genes 0.000 claims description 14
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 claims description 13
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 claims description 13
- 230000008488 polyadenylation Effects 0.000 claims description 13
- 101001035782 Gallus gallus Hemoglobin subunit beta Proteins 0.000 claims description 12
- 239000003623 enhancer Substances 0.000 claims description 12
- 101150024875 hbb2 gene Proteins 0.000 claims description 12
- 239000008194 pharmaceutical composition Substances 0.000 claims description 10
- 102000013918 Apolipoproteins E Human genes 0.000 claims description 9
- 108010025628 Apolipoproteins E Proteins 0.000 claims description 9
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 8
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 8
- 239000003814 drug Substances 0.000 claims description 8
- 241000202702 Adeno-associated virus - 3 Species 0.000 claims description 7
- 206010010356 Congenital anomaly Diseases 0.000 claims description 7
- 241000332595 Grouper sleepy disease iridovirus Species 0.000 claims description 7
- 108010000259 Thyroxine-Binding Globulin Proteins 0.000 claims description 7
- 201000009339 glycogen storage disease VII Diseases 0.000 claims description 7
- 210000000663 muscle cell Anatomy 0.000 claims description 7
- 230000001177 retroviral effect Effects 0.000 claims description 7
- XUIIKFGFIJCVMT-UHFFFAOYSA-N thyroxine-binding globulin Natural products IC1=CC(CC([NH3+])C([O-])=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-UHFFFAOYSA-N 0.000 claims description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 6
- 108010006025 bovine growth hormone Proteins 0.000 claims description 6
- 230000006058 immune tolerance Effects 0.000 claims description 6
- 241000958487 Adeno-associated virus 3B Species 0.000 claims description 5
- 102000009027 Albumins Human genes 0.000 claims description 5
- 108010088751 Albumins Proteins 0.000 claims description 5
- 239000003937 drug carrier Substances 0.000 claims description 5
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 4
- 241000702421 Dependoparvovirus Species 0.000 claims description 4
- 102100038614 Hemoglobin subunit gamma-1 Human genes 0.000 claims description 4
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 claims description 4
- 108010071690 Prealbumin Proteins 0.000 claims description 4
- 102000009190 Transthyretin Human genes 0.000 claims description 4
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 claims description 4
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 claims description 4
- 229940024142 alpha 1-antitrypsin Drugs 0.000 claims description 4
- 229940079593 drug Drugs 0.000 claims description 4
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 3
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 2
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 2
- 241000649045 Adeno-associated virus 10 Species 0.000 claims description 2
- 102100028709 Thyroxine-binding globulin Human genes 0.000 claims 2
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 52
- 125000003275 alpha amino acid group Chemical group 0.000 description 52
- 241000699670 Mus sp. Species 0.000 description 49
- 230000000694 effects Effects 0.000 description 46
- 238000006467 substitution reaction Methods 0.000 description 43
- 108020004414 DNA Proteins 0.000 description 41
- 229920002527 Glycogen Polymers 0.000 description 40
- 229940096919 glycogen Drugs 0.000 description 40
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 34
- 108010087924 alanylproline Proteins 0.000 description 29
- 108010078144 glutaminyl-glycine Proteins 0.000 description 27
- 210000001519 tissue Anatomy 0.000 description 27
- 241001465754 Metazoa Species 0.000 description 25
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 25
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 23
- 108020004705 Codon Proteins 0.000 description 22
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 22
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 22
- 108010050848 glycylleucine Proteins 0.000 description 22
- 238000002347 injection Methods 0.000 description 22
- 239000007924 injection Substances 0.000 description 22
- 108010047495 alanylglycine Proteins 0.000 description 21
- 108091026890 Coding region Proteins 0.000 description 20
- 239000002953 phosphate buffered saline Substances 0.000 description 20
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 19
- 108010054813 diprotin B Proteins 0.000 description 19
- 108010061238 threonyl-glycine Proteins 0.000 description 19
- 238000011282 treatment Methods 0.000 description 19
- 241000282414 Homo sapiens Species 0.000 description 18
- 108010029020 prolylglycine Proteins 0.000 description 18
- 108010048818 seryl-histidine Proteins 0.000 description 18
- 108010070944 alanylhistidine Proteins 0.000 description 17
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 16
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 15
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 15
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 15
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 15
- 108010049041 glutamylalanine Proteins 0.000 description 15
- 108010025306 histidylleucine Proteins 0.000 description 15
- 108010018006 histidylserine Proteins 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 230000028327 secretion Effects 0.000 description 15
- 108010076282 Factor IX Proteins 0.000 description 14
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 14
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 14
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 14
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 14
- 108700019146 Transgenes Proteins 0.000 description 14
- 108010077245 asparaginyl-proline Proteins 0.000 description 14
- 239000000203 mixture Substances 0.000 description 14
- 238000007619 statistical method Methods 0.000 description 14
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 13
- 102100022641 Coagulation factor IX Human genes 0.000 description 13
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 13
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 13
- 241000699666 Mus <mouse, genus> Species 0.000 description 13
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 13
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 13
- 238000000540 analysis of variance Methods 0.000 description 13
- 229960004222 factor ix Drugs 0.000 description 13
- 210000003205 muscle Anatomy 0.000 description 13
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 12
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 12
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 12
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 12
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 12
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 12
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 12
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 12
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 12
- 108010092114 histidylphenylalanine Proteins 0.000 description 12
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 12
- 108010057821 leucylproline Proteins 0.000 description 12
- 108010090894 prolylleucine Proteins 0.000 description 12
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 12
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 11
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 11
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 11
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 11
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 11
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 11
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 11
- AJNGQVUFQUVRQT-JYJNAYRXSA-N Pro-Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 AJNGQVUFQUVRQT-JYJNAYRXSA-N 0.000 description 11
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 11
- 108010005233 alanylglutamic acid Proteins 0.000 description 11
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 11
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 11
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 11
- 108010089804 glycyl-threonine Proteins 0.000 description 11
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 11
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 11
- 108010079317 prolyl-tyrosine Proteins 0.000 description 11
- 210000002966 serum Anatomy 0.000 description 11
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 10
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 10
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 10
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 10
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 10
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 10
- 108010058102 Glycogen Debranching Enzyme System Proteins 0.000 description 10
- 102000017475 Glycogen debranching enzyme Human genes 0.000 description 10
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 10
- 241000880493 Leptailurus serval Species 0.000 description 10
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 10
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 10
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 10
- 108010079364 N-glycylalanine Proteins 0.000 description 10
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 10
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 10
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 10
- WYKFHMXJQQQNQL-UHFFFAOYSA-N Tyr-Arg-Pro-Tyr Natural products C1CCC(C(=O)NC(CC=2C=CC(O)=CC=2)C(O)=O)N1C(=O)C(CCCN=C(N)N)NC(=O)C(N)CC1=CC=C(O)C=C1 WYKFHMXJQQQNQL-UHFFFAOYSA-N 0.000 description 10
- 230000035508 accumulation Effects 0.000 description 10
- 238000009825 accumulation Methods 0.000 description 10
- 210000004369 blood Anatomy 0.000 description 10
- 239000008280 blood Substances 0.000 description 10
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 10
- 238000001415 gene therapy Methods 0.000 description 10
- 239000008103 glucose Substances 0.000 description 10
- 108010087823 glycyltyrosine Proteins 0.000 description 10
- 108010037850 glycylvaline Proteins 0.000 description 10
- 108010077112 prolyl-proline Proteins 0.000 description 10
- 108010004914 prolylarginine Proteins 0.000 description 10
- 108010026333 seryl-proline Proteins 0.000 description 10
- 108010038745 tryptophylglycine Proteins 0.000 description 10
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 9
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 9
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 9
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 9
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 9
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 9
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 9
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 9
- 108010066427 N-valyltryptophan Proteins 0.000 description 9
- BQMFWUKNOCJDNV-HJWJTTGWSA-N Phe-Val-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQMFWUKNOCJDNV-HJWJTTGWSA-N 0.000 description 9
- DSGSTPRKNYHGCL-JYJNAYRXSA-N Pro-Phe-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O DSGSTPRKNYHGCL-JYJNAYRXSA-N 0.000 description 9
- 108010047857 aspartylglycine Proteins 0.000 description 9
- 108010036413 histidylglycine Proteins 0.000 description 9
- 108010010679 lysyl-valyl-leucyl-aspartic acid Proteins 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 9
- 108010070643 prolylglutamic acid Proteins 0.000 description 9
- 230000001225 therapeutic effect Effects 0.000 description 9
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 9
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 8
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 8
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 8
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 8
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 8
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 8
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 8
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 8
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 8
- YUZPQIQWXLRFBW-ACZMJKKPSA-N Cys-Glu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O YUZPQIQWXLRFBW-ACZMJKKPSA-N 0.000 description 8
- PQHYZJPCYRDYNE-QWRGUYRKSA-N Cys-Gly-Phe Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PQHYZJPCYRDYNE-QWRGUYRKSA-N 0.000 description 8
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 8
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 8
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 8
- YJSCHRBERYWPQL-DCAQKATOSA-N Gln-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N YJSCHRBERYWPQL-DCAQKATOSA-N 0.000 description 8
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 8
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 8
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 8
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 8
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 8
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 8
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 8
- UEGIPZAXNBYCCP-NKWVEPMBSA-N Gly-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)CN)C(=O)O UEGIPZAXNBYCCP-NKWVEPMBSA-N 0.000 description 8
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 8
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 8
- KHUFDBQXGLEIHC-BZSNNMDCSA-N His-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 KHUFDBQXGLEIHC-BZSNNMDCSA-N 0.000 description 8
- JSQIXEHORHLQEE-MEYUZBJRSA-N His-Phe-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JSQIXEHORHLQEE-MEYUZBJRSA-N 0.000 description 8
- PBVQWNDMFFCPIZ-ULQDDVLXSA-N His-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 PBVQWNDMFFCPIZ-ULQDDVLXSA-N 0.000 description 8
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 8
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 8
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 8
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 8
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 8
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 8
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 8
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 8
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 8
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 8
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 8
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 8
- IYXDSYWCVVXSKB-CIUDSAMLSA-N Met-Asn-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IYXDSYWCVVXSKB-CIUDSAMLSA-N 0.000 description 8
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 8
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 8
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 8
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 8
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 8
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 8
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 8
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 8
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 8
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 8
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 8
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 8
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 8
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 8
- IBBBOLAPFHRDHW-BPUTZDHNSA-N Trp-Asn-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N IBBBOLAPFHRDHW-BPUTZDHNSA-N 0.000 description 8
- YSGAPESOXHFTQY-IHRRRGAJSA-N Tyr-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N YSGAPESOXHFTQY-IHRRRGAJSA-N 0.000 description 8
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 8
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 8
- WHVSJHJTMUHYBT-SRVKXCTJSA-N Val-Met-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N WHVSJHJTMUHYBT-SRVKXCTJSA-N 0.000 description 8
- 108010027338 isoleucylcysteine Proteins 0.000 description 8
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 8
- 108010051242 phenylalanylserine Proteins 0.000 description 8
- 239000002243 precursor Substances 0.000 description 8
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 8
- 108010020532 tyrosyl-proline Proteins 0.000 description 8
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 7
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 7
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 7
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 7
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 7
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 7
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 7
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 7
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 7
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 7
- DXTYEWAQOXYRHZ-KKXDTOCCSA-N Ala-Phe-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DXTYEWAQOXYRHZ-KKXDTOCCSA-N 0.000 description 7
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 7
- PPPXVIBMLFWNSK-BQBZGAKWSA-N Arg-Gly-Cys Chemical compound C(C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N PPPXVIBMLFWNSK-BQBZGAKWSA-N 0.000 description 7
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 7
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 7
- AZHXYLJRGVMQKW-UMPQAUOISA-N Arg-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N)O AZHXYLJRGVMQKW-UMPQAUOISA-N 0.000 description 7
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 7
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 7
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 7
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 7
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 7
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 7
- ZFHXNNXMNLWKJH-HJPIBITLSA-N Cys-Tyr-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZFHXNNXMNLWKJH-HJPIBITLSA-N 0.000 description 7
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 7
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 7
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 7
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 7
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 7
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 7
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 7
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 7
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 7
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 7
- CBWKURKPYSLMJV-SOUVJXGZSA-N Glu-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CBWKURKPYSLMJV-SOUVJXGZSA-N 0.000 description 7
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 7
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 7
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 7
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 7
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 7
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 7
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 7
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 7
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 7
- UPGJWSUYENXOPV-HGNGGELXSA-N His-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N UPGJWSUYENXOPV-HGNGGELXSA-N 0.000 description 7
- LJUIEESLIAZSFR-SRVKXCTJSA-N His-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LJUIEESLIAZSFR-SRVKXCTJSA-N 0.000 description 7
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 7
- YERBCFWVWITTEJ-NAZCDGGXSA-N His-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N)O YERBCFWVWITTEJ-NAZCDGGXSA-N 0.000 description 7
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 7
- LOXMWQOKYBGCHF-JBDRJPRFSA-N Ile-Cys-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O LOXMWQOKYBGCHF-JBDRJPRFSA-N 0.000 description 7
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 7
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 7
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 7
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 7
- CUXRXAIAVYLVFD-ULQDDVLXSA-N Leu-Arg-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUXRXAIAVYLVFD-ULQDDVLXSA-N 0.000 description 7
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 7
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 7
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 7
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 7
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 7
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 7
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 7
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 7
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 7
- GVIVXNFKJQFTCE-YUMQZZPRSA-N Met-Gly-Gln Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O GVIVXNFKJQFTCE-YUMQZZPRSA-N 0.000 description 7
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 7
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 7
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 7
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 7
- FXYXBEZMRACDDR-KKUMJFAQSA-N Phe-His-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FXYXBEZMRACDDR-KKUMJFAQSA-N 0.000 description 7
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 7
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 7
- SRILZRSXIKRGBF-HRCADAONSA-N Phe-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N SRILZRSXIKRGBF-HRCADAONSA-N 0.000 description 7
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 7
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 7
- JLDZQPPLTJTJLE-IHPCNDPISA-N Phe-Trp-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JLDZQPPLTJTJLE-IHPCNDPISA-N 0.000 description 7
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 7
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 7
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 7
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 7
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 7
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 7
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 7
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 7
- JRBWMRUPXWPEID-JYJNAYRXSA-N Pro-Trp-Cys Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CS)C(=O)O)C(=O)[C@@H]1CCCN1 JRBWMRUPXWPEID-JYJNAYRXSA-N 0.000 description 7
- QMABBZHZMDXHKU-FKBYEOEOSA-N Pro-Tyr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QMABBZHZMDXHKU-FKBYEOEOSA-N 0.000 description 7
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 7
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 7
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 7
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 7
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 7
- KIEIJCFVGZCUAS-MELADBBJSA-N Ser-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N)C(=O)O KIEIJCFVGZCUAS-MELADBBJSA-N 0.000 description 7
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 7
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 7
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 7
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 7
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 7
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 7
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 7
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 7
- TWJDQTTXXZDJKV-BPUTZDHNSA-N Trp-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O TWJDQTTXXZDJKV-BPUTZDHNSA-N 0.000 description 7
- PHNBFZBKLWEBJN-BPUTZDHNSA-N Trp-Glu-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PHNBFZBKLWEBJN-BPUTZDHNSA-N 0.000 description 7
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 7
- HLDFBNPSURDYEN-VHWLVUOQSA-N Trp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HLDFBNPSURDYEN-VHWLVUOQSA-N 0.000 description 7
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 7
- FHHYVSCGOMPLLO-IHPCNDPISA-N Trp-Tyr-Asp Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 FHHYVSCGOMPLLO-IHPCNDPISA-N 0.000 description 7
- RWTFCAMQLFNPTK-UMPQAUOISA-N Trp-Val-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)=CNC2=C1 RWTFCAMQLFNPTK-UMPQAUOISA-N 0.000 description 7
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 7
- AZZLDIDWPZLCCW-ZEWNOJEFSA-N Tyr-Ile-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O AZZLDIDWPZLCCW-ZEWNOJEFSA-N 0.000 description 7
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 7
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 7
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 7
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 7
- UBTBGUDNDFZLGP-SRVKXCTJSA-N Val-Arg-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UBTBGUDNDFZLGP-SRVKXCTJSA-N 0.000 description 7
- ZQGPWORGSNRQLN-NHCYSSNCSA-N Val-Asp-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZQGPWORGSNRQLN-NHCYSSNCSA-N 0.000 description 7
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 7
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 7
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 7
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 7
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 7
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 7
- 108010044940 alanylglutamine Proteins 0.000 description 7
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 7
- 108010068380 arginylarginine Proteins 0.000 description 7
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 7
- 108010093581 aspartyl-proline Proteins 0.000 description 7
- 108010068265 aspartyltyrosine Proteins 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 7
- 108010004073 cysteinylcysteine Proteins 0.000 description 7
- 239000013604 expression vector Substances 0.000 description 7
- 239000006166 lysate Substances 0.000 description 7
- 238000010172 mouse model Methods 0.000 description 7
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 7
- 108010031719 prolyl-serine Proteins 0.000 description 7
- 238000001890 transfection Methods 0.000 description 7
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 6
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 6
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 6
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 6
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 6
- VHEVVUZDDUCAKU-FXQIFTODSA-N Ala-Met-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O VHEVVUZDDUCAKU-FXQIFTODSA-N 0.000 description 6
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 6
- CKIBTNMWVMKAHB-RWGOJESNSA-N Ala-Trp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC=3C4=CC=CC=C4NC=3)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 CKIBTNMWVMKAHB-RWGOJESNSA-N 0.000 description 6
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 6
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 6
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 6
- ODBSSLHUFPJRED-CIUDSAMLSA-N Asn-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ODBSSLHUFPJRED-CIUDSAMLSA-N 0.000 description 6
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 6
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 6
- AMRANMVXQWXNAH-ZLUOBGJFSA-N Asp-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O AMRANMVXQWXNAH-ZLUOBGJFSA-N 0.000 description 6
- RQYMKRMRZWJGHC-BQBZGAKWSA-N Asp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N RQYMKRMRZWJGHC-BQBZGAKWSA-N 0.000 description 6
- 108090000565 Capsid Proteins Proteins 0.000 description 6
- 102100023321 Ceruloplasmin Human genes 0.000 description 6
- LPBUBIHAVKXUOT-FXQIFTODSA-N Cys-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N LPBUBIHAVKXUOT-FXQIFTODSA-N 0.000 description 6
- 102100036912 Desmin Human genes 0.000 description 6
- 108010044052 Desmin Proteins 0.000 description 6
- FJAYYNIXQNERSO-ACZMJKKPSA-N Gln-Cys-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FJAYYNIXQNERSO-ACZMJKKPSA-N 0.000 description 6
- RNPGPFAVRLERPP-QEJZJMRPSA-N Gln-Trp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RNPGPFAVRLERPP-QEJZJMRPSA-N 0.000 description 6
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 6
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 6
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 6
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 6
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 6
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 6
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 6
- CKONPJHGMIDMJP-IHRRRGAJSA-N His-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CKONPJHGMIDMJP-IHRRRGAJSA-N 0.000 description 6
- 241000282412 Homo Species 0.000 description 6
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 description 6
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 6
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 6
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 6
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 6
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 6
- WCTCIIAGNMFYAO-DCAQKATOSA-N Leu-Cys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O WCTCIIAGNMFYAO-DCAQKATOSA-N 0.000 description 6
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 6
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 6
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 6
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 6
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 6
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 6
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 6
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 6
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 6
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 6
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 6
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 6
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 6
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 6
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 6
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 6
- 108091081024 Start codon Proteins 0.000 description 6
- RJBFAHKSFNNHAI-XKBZYTNZSA-N Thr-Gln-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O RJBFAHKSFNNHAI-XKBZYTNZSA-N 0.000 description 6
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 6
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 6
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 6
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 6
- 102000002248 Thyroxine-Binding Globulin Human genes 0.000 description 6
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 6
- QHWMVGCEQAPQDK-UMPQAUOISA-N Trp-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O QHWMVGCEQAPQDK-UMPQAUOISA-N 0.000 description 6
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 6
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 6
- HNERGSKJJZQGEA-JYJNAYRXSA-N Tyr-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HNERGSKJJZQGEA-JYJNAYRXSA-N 0.000 description 6
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 6
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 6
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 210000005045 desmin Anatomy 0.000 description 6
- 238000002641 enzyme replacement therapy Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 102000051631 human SERPINA1 Human genes 0.000 description 6
- 230000003834 intracellular effect Effects 0.000 description 6
- 108010003700 lysyl aspartic acid Proteins 0.000 description 6
- 108010034507 methionyltryptophan Proteins 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 230000002463 transducing effect Effects 0.000 description 6
- 108010045269 tryptophyltryptophan Proteins 0.000 description 6
- 238000001262 western blot Methods 0.000 description 6
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 5
- OMFMCIVBKCEMAK-CYDGBPFRSA-N Ala-Leu-Val-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O OMFMCIVBKCEMAK-CYDGBPFRSA-N 0.000 description 5
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 5
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 5
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 5
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 5
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 5
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 5
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 5
- 241000282693 Cercopithecidae Species 0.000 description 5
- 108700010070 Codon Usage Proteins 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 5
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 5
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 5
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 5
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 5
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 5
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 5
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 5
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 5
- WGVPDSNCHDEDBP-KKUMJFAQSA-N His-Asp-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WGVPDSNCHDEDBP-KKUMJFAQSA-N 0.000 description 5
- MPXGJGBXCRQQJE-MXAVVETBSA-N His-Ile-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O MPXGJGBXCRQQJE-MXAVVETBSA-N 0.000 description 5
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 5
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 5
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 5
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- YCUSPBPZVJDMII-YUMQZZPRSA-N Met-Gly-Glu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O YCUSPBPZVJDMII-YUMQZZPRSA-N 0.000 description 5
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 241000286209 Phasianidae Species 0.000 description 5
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 5
- HQVPQXMCQKXARZ-FXQIFTODSA-N Pro-Cys-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O HQVPQXMCQKXARZ-FXQIFTODSA-N 0.000 description 5
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 5
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 5
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 5
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 5
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 5
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 5
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 5
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 5
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 5
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 5
- DVIIYMVCSUQOJG-QEJZJMRPSA-N Trp-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DVIIYMVCSUQOJG-QEJZJMRPSA-N 0.000 description 5
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 5
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 230000002950 deficient Effects 0.000 description 5
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 238000001990 intravenous administration Methods 0.000 description 5
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 5
- 239000013642 negative control Substances 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- HSHNITRMYYLLCV-UHFFFAOYSA-N 4-methylumbelliferone Chemical compound C1=C(O)C=CC2=C1OC(=O)C=C2C HSHNITRMYYLLCV-UHFFFAOYSA-N 0.000 description 4
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 4
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 4
- HJGZVLLLBJLXFC-LSJOCFKGSA-N Ala-His-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O HJGZVLLLBJLXFC-LSJOCFKGSA-N 0.000 description 4
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 4
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 4
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 4
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 4
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 4
- 108010051330 Arg-Pro-Gly-Pro Proteins 0.000 description 4
- FOWOZYAWODIRFZ-JYJNAYRXSA-N Arg-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCN=C(N)N)N FOWOZYAWODIRFZ-JYJNAYRXSA-N 0.000 description 4
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 4
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 4
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 4
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 4
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 4
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 4
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 4
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 4
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 4
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 4
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 4
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 4
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 4
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 4
- 108091029523 CpG island Proteins 0.000 description 4
- PKNIZMPLMSKROD-BIIVOSGPSA-N Cys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N PKNIZMPLMSKROD-BIIVOSGPSA-N 0.000 description 4
- GHUVBPIYQYXXEF-SRVKXCTJSA-N Cys-Cys-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 GHUVBPIYQYXXEF-SRVKXCTJSA-N 0.000 description 4
- NMWZMKLDGZXRKP-BZSNNMDCSA-N Cys-Phe-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NMWZMKLDGZXRKP-BZSNNMDCSA-N 0.000 description 4
- 241000701022 Cytomegalovirus Species 0.000 description 4
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 4
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 4
- FGWRYRAVBVOHIB-XIRDDKMYSA-N Gln-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O FGWRYRAVBVOHIB-XIRDDKMYSA-N 0.000 description 4
- AKDOUBMVLRCHBD-SIUGBPQLSA-N Gln-Tyr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AKDOUBMVLRCHBD-SIUGBPQLSA-N 0.000 description 4
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 4
- RXESHTOTINOODU-JYJNAYRXSA-N Glu-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RXESHTOTINOODU-JYJNAYRXSA-N 0.000 description 4
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 4
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 4
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 4
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 4
- LJXWZPHEMJSNRC-KBPBESRZSA-N Gly-Gln-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LJXWZPHEMJSNRC-KBPBESRZSA-N 0.000 description 4
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 4
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 4
- TTYVAUJGNMVTRN-GJZGRUSLSA-N Gly-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)CN TTYVAUJGNMVTRN-GJZGRUSLSA-N 0.000 description 4
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 4
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 4
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 4
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 4
- WSWWTQYHFCBKBT-DVJZZOLTSA-N Gly-Thr-Trp Chemical compound C[C@@H](O)[C@H](NC(=O)CN)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O WSWWTQYHFCBKBT-DVJZZOLTSA-N 0.000 description 4
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 4
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 4
- HRGGKHFHRSFSDE-CIUDSAMLSA-N His-Asn-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N HRGGKHFHRSFSDE-CIUDSAMLSA-N 0.000 description 4
- JMSONHOUHFDOJH-GUBZILKMSA-N His-Ser-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 JMSONHOUHFDOJH-GUBZILKMSA-N 0.000 description 4
- JHCVYQKVKOLAIU-NAKRPEOUSA-N Ile-Cys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N JHCVYQKVKOLAIU-NAKRPEOUSA-N 0.000 description 4
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 4
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 4
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 4
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 4
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 4
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 4
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 4
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 4
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 4
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 4
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 4
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 4
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 4
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 4
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 4
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 4
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 4
- XBAJINCXDBTJRH-WDSOQIARSA-N Lys-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N XBAJINCXDBTJRH-WDSOQIARSA-N 0.000 description 4
- BLIPQDLSCFGUFA-GUBZILKMSA-N Met-Arg-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O BLIPQDLSCFGUFA-GUBZILKMSA-N 0.000 description 4
- BCRQJDMZQUHQSV-STQMWFEESA-N Met-Gly-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BCRQJDMZQUHQSV-STQMWFEESA-N 0.000 description 4
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 4
- UDOYVQQKQHZYMB-DCAQKATOSA-N Met-Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDOYVQQKQHZYMB-DCAQKATOSA-N 0.000 description 4
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 4
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 4
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 4
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 4
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 4
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 4
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 4
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 4
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 4
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 4
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 4
- 108020005067 RNA Splice Sites Proteins 0.000 description 4
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 4
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 4
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 4
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 4
- SDFUZKIAHWRUCS-QEJZJMRPSA-N Ser-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N SDFUZKIAHWRUCS-QEJZJMRPSA-N 0.000 description 4
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 4
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 4
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 4
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 4
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 4
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 4
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 4
- DDDLIMCZFKOERC-SVSWQMSJSA-N Thr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N DDDLIMCZFKOERC-SVSWQMSJSA-N 0.000 description 4
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 4
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 4
- GQPQJNMVELPZNQ-GBALPHGKSA-N Thr-Ser-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O GQPQJNMVELPZNQ-GBALPHGKSA-N 0.000 description 4
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 4
- DXDMNBJJEXYMLA-UBHSHLNASA-N Trp-Asn-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 DXDMNBJJEXYMLA-UBHSHLNASA-N 0.000 description 4
- RPVDDQYNBOVWLR-HOCLYGCPSA-N Trp-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RPVDDQYNBOVWLR-HOCLYGCPSA-N 0.000 description 4
- STKZKWFOKOCSLW-UMPQAUOISA-N Trp-Thr-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 STKZKWFOKOCSLW-UMPQAUOISA-N 0.000 description 4
- 238000010162 Tukey test Methods 0.000 description 4
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 4
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 4
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 4
- HHFMNAVFGBYSAT-IGISWZIWSA-N Tyr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HHFMNAVFGBYSAT-IGISWZIWSA-N 0.000 description 4
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 4
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 4
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 4
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 4
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 4
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 4
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 4
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 4
- SDHZOOIGIUEPDY-JYJNAYRXSA-N Val-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 SDHZOOIGIUEPDY-JYJNAYRXSA-N 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 108010079547 glutamylmethionine Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 230000008348 humoral response Effects 0.000 description 4
- 230000028993 immune response Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000007918 intramuscular administration Methods 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 108010085203 methionylmethionine Proteins 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000000750 progressive effect Effects 0.000 description 4
- 230000009885 systemic effect Effects 0.000 description 4
- 229940124597 therapeutic agent Drugs 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- 108010044292 tryptophyltyrosine Proteins 0.000 description 4
- OFHXPCLWHLXQHT-JKQORVJESA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2,6-diaminohexanoyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN OFHXPCLWHLXQHT-JKQORVJESA-N 0.000 description 3
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 3
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 3
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 3
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 3
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 3
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 3
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 3
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 3
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 3
- QHHVSXGWLYEAGX-GUBZILKMSA-N Asp-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QHHVSXGWLYEAGX-GUBZILKMSA-N 0.000 description 3
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 3
- OQMGSMNZVHYDTQ-ZKWXMUAHSA-N Asp-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N OQMGSMNZVHYDTQ-ZKWXMUAHSA-N 0.000 description 3
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 3
- MHYHLWUGWUBUHF-GUBZILKMSA-N Cys-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N MHYHLWUGWUBUHF-GUBZILKMSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- IGNGBUVODQLMRJ-CIUDSAMLSA-N Gln-Ala-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IGNGBUVODQLMRJ-CIUDSAMLSA-N 0.000 description 3
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 3
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 3
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 3
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 3
- XMVLTPMCUJTJQP-FXQIFTODSA-N Glu-Gln-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N XMVLTPMCUJTJQP-FXQIFTODSA-N 0.000 description 3
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 3
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 3
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 3
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 3
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 3
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 3
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 3
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 3
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 3
- FLYSHWAAHYNKRT-JYJNAYRXSA-N His-Gln-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLYSHWAAHYNKRT-JYJNAYRXSA-N 0.000 description 3
- 102000008100 Human Serum Albumin Human genes 0.000 description 3
- 108091006905 Human Serum Albumin Proteins 0.000 description 3
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 3
- CCHSQWLCOOZREA-GMOBBJLQSA-N Ile-Asp-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N CCHSQWLCOOZREA-GMOBBJLQSA-N 0.000 description 3
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 3
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 3
- NFHJQETXTSDZSI-DCAQKATOSA-N Leu-Cys-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NFHJQETXTSDZSI-DCAQKATOSA-N 0.000 description 3
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 3
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 3
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 3
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 3
- MJWVXZABPOKJJF-ACRUOGEOSA-N Leu-Phe-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MJWVXZABPOKJJF-ACRUOGEOSA-N 0.000 description 3
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 3
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 3
- 241000282567 Macaca fascicularis Species 0.000 description 3
- ODFBIJXEWPWSAN-CYDGBPFRSA-N Met-Ile-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O ODFBIJXEWPWSAN-CYDGBPFRSA-N 0.000 description 3
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 3
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 3
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 3
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 3
- JKJSIYKSGIDHPM-WBAXXEDZSA-N Phe-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O JKJSIYKSGIDHPM-WBAXXEDZSA-N 0.000 description 3
- ZVRJWDUPIDMHDN-ULQDDVLXSA-N Phe-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 ZVRJWDUPIDMHDN-ULQDDVLXSA-N 0.000 description 3
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 3
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 3
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 3
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 3
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 3
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 3
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 3
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 3
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 3
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 3
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 3
- ISLDRLHVPXABBC-IEGACIPQSA-N Thr-Leu-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISLDRLHVPXABBC-IEGACIPQSA-N 0.000 description 3
- JTMZSIRTZKLBOA-NWLDYVSISA-N Trp-Thr-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JTMZSIRTZKLBOA-NWLDYVSISA-N 0.000 description 3
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 3
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 3
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 3
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 3
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 3
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 3
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 3
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 238000001952 enzyme assay Methods 0.000 description 3
- 238000007478 fluorogenic assay Methods 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000005847 immunogenicity Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 210000005228 liver tissue Anatomy 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 210000003712 lysosome Anatomy 0.000 description 3
- 230000001868 lysosomic effect Effects 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 230000002503 metabolic effect Effects 0.000 description 3
- 108010024607 phenylalanylalanine Proteins 0.000 description 3
- 108010073101 phenylalanylleucine Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 230000000069 prophylactic effect Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000000241 respiratory effect Effects 0.000 description 3
- 230000004202 respiratory function Effects 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- VBICKXHEKHSIBG-UHFFFAOYSA-N 1-monostearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(O)CO VBICKXHEKHSIBG-UHFFFAOYSA-N 0.000 description 2
- WEZDRVHTDXTVLT-GJZGRUSLSA-N 2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WEZDRVHTDXTVLT-GJZGRUSLSA-N 0.000 description 2
- YEJQWBFDKKTPNO-UHFFFAOYSA-N 2-[[2-[[1-(2-amino-3-methylbutanoyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]-3-methylbutanoic acid Chemical compound CC(C)C(N)C(=O)N1CCCC1C(=O)NCC(=O)NC(C(C)C)C(O)=O YEJQWBFDKKTPNO-UHFFFAOYSA-N 0.000 description 2
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 2
- CRWFEKLFPVRPBV-CIUDSAMLSA-N Ala-Gln-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CRWFEKLFPVRPBV-CIUDSAMLSA-N 0.000 description 2
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 2
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 2
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 2
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 2
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- YFWTXMRJJDNTLM-LSJOCFKGSA-N Arg-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFWTXMRJJDNTLM-LSJOCFKGSA-N 0.000 description 2
- NUBPTCMEOCKWDO-DCAQKATOSA-N Arg-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N NUBPTCMEOCKWDO-DCAQKATOSA-N 0.000 description 2
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 2
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 2
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 2
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 2
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 2
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 2
- BKDDABUWNKGZCK-XHNCKOQMSA-N Asn-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O BKDDABUWNKGZCK-XHNCKOQMSA-N 0.000 description 2
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 2
- NVMMUAUTQCWYHD-ABHRYQDASA-N Asp-Val-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 NVMMUAUTQCWYHD-ABHRYQDASA-N 0.000 description 2
- GYNUXDMCDILYIQ-QRTARXTBSA-N Asp-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N GYNUXDMCDILYIQ-QRTARXTBSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- CAXGCBSRJLADPD-FXQIFTODSA-N Cys-Pro-Asn Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CAXGCBSRJLADPD-FXQIFTODSA-N 0.000 description 2
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- BJPPYOMRAVLXBY-YUMQZZPRSA-N Gln-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N BJPPYOMRAVLXBY-YUMQZZPRSA-N 0.000 description 2
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 2
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 2
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 2
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- LPHGXOWFAXFCPX-KKUMJFAQSA-N Glu-Pro-Phe Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O LPHGXOWFAXFCPX-KKUMJFAQSA-N 0.000 description 2
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 2
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 2
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 2
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- HHSOPSCKAZKQHQ-PEXQALLHSA-N Gly-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN HHSOPSCKAZKQHQ-PEXQALLHSA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 2
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 2
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 2
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 2
- 208000028782 Hereditary disease Diseases 0.000 description 2
- TVQGUFGDVODUIF-LSJOCFKGSA-N His-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N TVQGUFGDVODUIF-LSJOCFKGSA-N 0.000 description 2
- ZNNNYCXPCKACHX-DCAQKATOSA-N His-Gln-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZNNNYCXPCKACHX-DCAQKATOSA-N 0.000 description 2
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 2
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 2
- FHKZHRMERJUXRJ-DCAQKATOSA-N His-Ser-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 FHKZHRMERJUXRJ-DCAQKATOSA-N 0.000 description 2
- SWBUZLFWGJETAO-KKUMJFAQSA-N His-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O SWBUZLFWGJETAO-KKUMJFAQSA-N 0.000 description 2
- 101000771674 Homo sapiens Apolipoprotein E Proteins 0.000 description 2
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 2
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 description 2
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 2
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 2
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 2
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 2
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 2
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 2
- MAXILRZVORNXBE-PMVMPFDFSA-N Leu-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MAXILRZVORNXBE-PMVMPFDFSA-N 0.000 description 2
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 2
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 2
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 2
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 2
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 2
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 2
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 2
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 2
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 2
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 208000015439 Lysosomal storage disease Diseases 0.000 description 2
- 241000282553 Macaca Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 208000024556 Mendelian disease Diseases 0.000 description 2
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 2
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 2
- LLKWSEXLNFBKIF-CYDGBPFRSA-N Met-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCSC LLKWSEXLNFBKIF-CYDGBPFRSA-N 0.000 description 2
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 2
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 2
- UEXCHCYDPAIVDE-SRVKXCTJSA-N Phe-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEXCHCYDPAIVDE-SRVKXCTJSA-N 0.000 description 2
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 2
- PPHFTNABKQRAJV-JYJNAYRXSA-N Phe-His-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PPHFTNABKQRAJV-JYJNAYRXSA-N 0.000 description 2
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 2
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 2
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 2
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 2
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 2
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 2
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 2
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 2
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 2
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 2
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 2
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 2
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 2
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 2
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 description 2
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 2
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 2
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 2
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 2
- OJFFAQFRCVPHNN-JYBASQMISA-N Ser-Thr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OJFFAQFRCVPHNN-JYBASQMISA-N 0.000 description 2
- WMZVVNLPHFSUPA-BPUTZDHNSA-N Ser-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 WMZVVNLPHFSUPA-BPUTZDHNSA-N 0.000 description 2
- NERYDXBVARJIQS-JYBASQMISA-N Ser-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N)O NERYDXBVARJIQS-JYBASQMISA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 2
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 2
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 2
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 2
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 2
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 2
- UKULIGGCYQMLJE-UHFFFAOYSA-N Trp Gly Tyr Ser Chemical compound C=1NC2=CC=CC=C2C=1CC(N)C(=O)NCC(=O)NC(C(=O)NC(CO)C(O)=O)CC1=CC=C(O)C=C1 UKULIGGCYQMLJE-UHFFFAOYSA-N 0.000 description 2
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 2
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 2
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 2
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 2
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 2
- CWOSXNKDOACNJN-BZSNNMDCSA-N Val-Arg-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N CWOSXNKDOACNJN-BZSNNMDCSA-N 0.000 description 2
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 2
- OXVPMZVGCAPFIG-BQFCYCMXSA-N Val-Gln-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N OXVPMZVGCAPFIG-BQFCYCMXSA-N 0.000 description 2
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 2
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 2
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 2
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- AYHNXCJKBLYVOA-KSZLIROESA-N Val-Trp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N AYHNXCJKBLYVOA-KSZLIROESA-N 0.000 description 2
- SVLAAUGFIHSJPK-JYJNAYRXSA-N Val-Trp-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CO)C(=O)O)N SVLAAUGFIHSJPK-JYJNAYRXSA-N 0.000 description 2
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010036533 arginylvaline Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000011969 continuous reassessment method Methods 0.000 description 2
- 101150044687 crm gene Proteins 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000006735 deficit Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000012153 distilled water Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000925 erythroid effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 2
- 210000003494 hepatocyte Anatomy 0.000 description 2
- 102000053020 human ApoE Human genes 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 230000001506 immunosuppresive effect Effects 0.000 description 2
- 239000007943 implant Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 230000002132 lysosomal effect Effects 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 210000004379 membrane Anatomy 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 210000000653 nervous system Anatomy 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 229920001542 oligosaccharide Polymers 0.000 description 2
- 150000002482 oligosaccharides Chemical class 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- -1 serum Substances 0.000 description 2
- 210000002027 skeletal muscle Anatomy 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 2
- 238000009423 ventilation Methods 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 101710178229 1,4-beta-D-glucan glucohydrolase Proteins 0.000 description 1
- UAIUNKRWKOVEES-UHFFFAOYSA-N 3,3',5,5'-tetramethylbenzidine Chemical compound CC1=C(N)C(C)=CC(C=2C=C(C)C(N)=C(C)C=2)=C1 UAIUNKRWKOVEES-UHFFFAOYSA-N 0.000 description 1
- 108010036211 5-HT-moduline Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- HIIJOGIBQXHFKE-HHKYUTTNSA-N Ala-Thr-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O HIIJOGIBQXHFKE-HHKYUTTNSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- 102000003966 Alpha-1-microglobulin Human genes 0.000 description 1
- 101800001761 Alpha-1-microglobulin Proteins 0.000 description 1
- 241001664176 Alpharetrovirus Species 0.000 description 1
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 1
- BIOCIVSVEDFKDJ-GUBZILKMSA-N Arg-Arg-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O BIOCIVSVEDFKDJ-GUBZILKMSA-N 0.000 description 1
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 1
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- PZBSKYJGKNNYNK-ULQDDVLXSA-N Arg-Leu-Tyr Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O PZBSKYJGKNNYNK-ULQDDVLXSA-N 0.000 description 1
- JWCCFNZJIRZUCL-AVGNSLFASA-N Arg-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JWCCFNZJIRZUCL-AVGNSLFASA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- OEUQMKNNOWJREN-AVGNSLFASA-N Asp-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N OEUQMKNNOWJREN-AVGNSLFASA-N 0.000 description 1
- BIVYLQMZPHDUIH-WHFBIAKZSA-N Asp-Gly-Cys Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)C(=O)O BIVYLQMZPHDUIH-WHFBIAKZSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- LBFYTUPYYZENIR-GHCJXIJMSA-N Asp-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N LBFYTUPYYZENIR-GHCJXIJMSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- VMVUDJUXJKDGNR-FXQIFTODSA-N Asp-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N VMVUDJUXJKDGNR-FXQIFTODSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- WOKXEQLPBLLWHC-IHRRRGAJSA-N Asp-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 WOKXEQLPBLLWHC-IHRRRGAJSA-N 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 238000000035 BCA protein assay Methods 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- OBMZMSLWNNWEJA-XNCRXQDQSA-N C1=CC=2C(C[C@@H]3NC(=O)[C@@H](NC(=O)[C@H](NC(=O)N(CC#CCN(CCCC[C@H](NC(=O)[C@@H](CC4=CC=CC=C4)NC3=O)C(=O)N)CC=C)NC(=O)[C@@H](N)C)CC3=CNC4=C3C=CC=C4)C)=CNC=2C=C1 Chemical compound C1=CC=2C(C[C@@H]3NC(=O)[C@@H](NC(=O)[C@H](NC(=O)N(CC#CCN(CCCC[C@H](NC(=O)[C@@H](CC4=CC=CC=C4)NC3=O)C(=O)N)CC=C)NC(=O)[C@@H](N)C)CC3=CNC4=C3C=CC=C4)C)=CNC=2C=C1 OBMZMSLWNNWEJA-XNCRXQDQSA-N 0.000 description 1
- 238000011746 C57BL/6J (JAX™ mouse strain) Methods 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 208000031229 Cardiomyopathies Diseases 0.000 description 1
- 102100039501 Chymotrypsinogen B Human genes 0.000 description 1
- 101710178550 Chymotrypsinogen B2 Proteins 0.000 description 1
- 102000013831 Coagulation factor IX Human genes 0.000 description 1
- 102100026735 Coagulation factor VIII Human genes 0.000 description 1
- 102000055157 Complement C1 Inhibitor Human genes 0.000 description 1
- 108700040183 Complement C1 Inhibitor Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- PRXCTTWKGJAPMT-ZLUOBGJFSA-N Cys-Ala-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O PRXCTTWKGJAPMT-ZLUOBGJFSA-N 0.000 description 1
- BNRHLRWCERLRTQ-BPUTZDHNSA-N Cys-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N BNRHLRWCERLRTQ-BPUTZDHNSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 201000003542 Factor VIII deficiency Diseases 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 101150115151 GAA gene Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- UWZLBXOBVKRUFE-HGNGGELXSA-N Gln-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N UWZLBXOBVKRUFE-HGNGGELXSA-N 0.000 description 1
- IPHGBVYWRKCGKG-FXQIFTODSA-N Gln-Cys-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O IPHGBVYWRKCGKG-FXQIFTODSA-N 0.000 description 1
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 1
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 1
- VHLZDSUANXBJHW-QWRGUYRKSA-N Gln-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHLZDSUANXBJHW-QWRGUYRKSA-N 0.000 description 1
- NVHJGTGTUGEWCG-ZVZYQTTQSA-N Gln-Trp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O NVHJGTGTUGEWCG-ZVZYQTTQSA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- ARIORLIIMJACKZ-KKUMJFAQSA-N Glu-Pro-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ARIORLIIMJACKZ-KKUMJFAQSA-N 0.000 description 1
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- NMROINAYXCACKF-WHFBIAKZSA-N Gly-Cys-Cys Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O NMROINAYXCACKF-WHFBIAKZSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- SIYTVHWNKGIGMD-HOTGVXAUSA-N Gly-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)CN SIYTVHWNKGIGMD-HOTGVXAUSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 1
- AAXMRLWFJFDYQO-GUBZILKMSA-N His-Asp-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O AAXMRLWFJFDYQO-GUBZILKMSA-N 0.000 description 1
- VHHYJBSXXMPQGZ-AVGNSLFASA-N His-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N VHHYJBSXXMPQGZ-AVGNSLFASA-N 0.000 description 1
- PYNUBZSXKQKAHL-UWVGGRQHSA-N His-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O PYNUBZSXKQKAHL-UWVGGRQHSA-N 0.000 description 1
- ULRFSEJGSHYLQI-YESZJQIVSA-N His-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ULRFSEJGSHYLQI-YESZJQIVSA-N 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 101000928628 Homo sapiens Apolipoprotein C-I Proteins 0.000 description 1
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 1
- 241000484121 Human parvovirus Species 0.000 description 1
- 102100029199 Iduronate 2-sulfatase Human genes 0.000 description 1
- 101710096421 Iduronate 2-sulfatase Proteins 0.000 description 1
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- YQEZLKZALYSWHR-UHFFFAOYSA-N Ketamine Chemical compound C=1C=CC=C(Cl)C=1C1(NC)CCCCC1=O YQEZLKZALYSWHR-UHFFFAOYSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- 241000283953 Lagomorpha Species 0.000 description 1
- 208000032420 Latent Infection Diseases 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- YWFZWQKWNDOWPA-XIRDDKMYSA-N Leu-Trp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O YWFZWQKWNDOWPA-XIRDDKMYSA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- NNJVILVZKWQKPM-UHFFFAOYSA-N Lidocaine Chemical compound CCN(CC)CC(=O)NC1=C(C)C=CC=C1C NNJVILVZKWQKPM-UHFFFAOYSA-N 0.000 description 1
- 101710096786 Lysosomal acid alpha-glucosidase Proteins 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- WYEXWKAWMNJKPN-UBHSHLNASA-N Met-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCSC)N WYEXWKAWMNJKPN-UBHSHLNASA-N 0.000 description 1
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- FAKYXUOUQCRGMO-FDARSICLSA-N Met-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCSC)N FAKYXUOUQCRGMO-FDARSICLSA-N 0.000 description 1
- CNFMPVYIVQUJOO-NHCYSSNCSA-N Met-Val-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O CNFMPVYIVQUJOO-NHCYSSNCSA-N 0.000 description 1
- 206010068836 Metabolic myopathy Diseases 0.000 description 1
- 206010028289 Muscle atrophy Diseases 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 101100172173 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) hcr-1 gene Proteins 0.000 description 1
- 240000007019 Oxalis corniculata Species 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 1
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- IEOHQGFKHXUALJ-JYJNAYRXSA-N Phe-Met-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IEOHQGFKHXUALJ-JYJNAYRXSA-N 0.000 description 1
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 1
- VGTJSEYTVMAASM-RPTUDFQQSA-N Phe-Thr-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VGTJSEYTVMAASM-RPTUDFQQSA-N 0.000 description 1
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 1
- 229920005372 Plexiglas® Polymers 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 1
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 1
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 1
- LPGSNRSLPHRNBW-AVGNSLFASA-N Pro-His-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 LPGSNRSLPHRNBW-AVGNSLFASA-N 0.000 description 1
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 1
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 239000008156 Ringer's lactate solution Substances 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 1
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 1
- JOHPFOKBAAOQDI-UBHSHLNASA-N Ser-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JOHPFOKBAAOQDI-UBHSHLNASA-N 0.000 description 1
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- NDLHSJWPCXKOGG-VLCNGCBASA-N Thr-Trp-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N)O NDLHSJWPCXKOGG-VLCNGCBASA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 1
- VEYXZZGMIBKXCN-UBHSHLNASA-N Trp-Asp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VEYXZZGMIBKXCN-UBHSHLNASA-N 0.000 description 1
- SMDQRGAERNMJJF-JQWIXIFHSA-N Trp-Cys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CS)C(O)=O)=CNC2=C1 SMDQRGAERNMJJF-JQWIXIFHSA-N 0.000 description 1
- DTPARJBMONKGGC-IHPCNDPISA-N Trp-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N DTPARJBMONKGGC-IHPCNDPISA-N 0.000 description 1
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- NUQZCPSZHGIYTA-HKUYNNGSSA-N Tyr-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NUQZCPSZHGIYTA-HKUYNNGSSA-N 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- XJFXZQKJQGYFMM-GUBZILKMSA-N Val-Cys-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N XJFXZQKJQGYFMM-GUBZILKMSA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- GTACFKZDQFTVAI-STECZYCISA-N Val-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 GTACFKZDQFTVAI-STECZYCISA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- WQZGKKKJIJFFOK-DVKNGEFBSA-N alpha-D-glucose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-DVKNGEFBSA-N 0.000 description 1
- 102000016679 alpha-Glucosidases Human genes 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012742 biochemical analysis Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000008499 blood brain barrier function Effects 0.000 description 1
- 210000001218 blood-brain barrier Anatomy 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 1
- ZEWYCNBZMPELPF-UHFFFAOYSA-J calcium;potassium;sodium;2-hydroxypropanoic acid;sodium;tetrachloride Chemical compound [Na].[Na+].[Cl-].[Cl-].[Cl-].[Cl-].[K+].[Ca+2].CC(O)C(O)=O ZEWYCNBZMPELPF-UHFFFAOYSA-J 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 229940105774 coagulation factor ix Drugs 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000003405 delayed action preparation Substances 0.000 description 1
- HRLIOXLXPOHXTA-NSHDSACASA-N dexmedetomidine Chemical compound C1([C@@H](C)C=2C(=C(C)C=CC=2)C)=CN=C[N]1 HRLIOXLXPOHXTA-NSHDSACASA-N 0.000 description 1
- 229960004253 dexmedetomidine Drugs 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 208000037771 disease arising from reactivation of latent virus Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- HQPMKSGTIOYHJT-UHFFFAOYSA-N ethane-1,2-diol;propane-1,2-diol Chemical compound OCCO.CC(O)CO HQPMKSGTIOYHJT-UHFFFAOYSA-N 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 210000003191 femoral vein Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- YQEMORVAKMFKLG-UHFFFAOYSA-N glycerine monostearate Natural products CCCCCCCCCCCCCCCCCC(=O)OC(CO)CO YQEMORVAKMFKLG-UHFFFAOYSA-N 0.000 description 1
- SVUQHVRAGMNPLW-UHFFFAOYSA-N glycerol monostearate Natural products CCCCCCCCCCCCCCCCC(=O)OCC(O)CO SVUQHVRAGMNPLW-UHFFFAOYSA-N 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 102000057593 human F8 Human genes 0.000 description 1
- 229960000900 human factor viii Drugs 0.000 description 1
- 230000028996 humoral immune response Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 238000005462 in vivo assay Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 210000004347 intestinal mucosa Anatomy 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 229960003299 ketamine Drugs 0.000 description 1
- 238000011813 knockout mouse model Methods 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 229960004194 lidocaine Drugs 0.000 description 1
- 239000003589 local anesthetic agent Substances 0.000 description 1
- 238000001325 log-rank test Methods 0.000 description 1
- ZLNQQNXFFQJAID-UHFFFAOYSA-L magnesium carbonate Chemical compound [Mg+2].[O-]C([O-])=O ZLNQQNXFFQJAID-UHFFFAOYSA-L 0.000 description 1
- 239000001095 magnesium carbonate Substances 0.000 description 1
- 229910000021 magnesium carbonate Inorganic materials 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 239000003094 microcapsule Substances 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 210000002200 mouth mucosa Anatomy 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000003098 myoblast Anatomy 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 239000006179 pH buffering agent Substances 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007331 pathological accumulation Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 229960001412 pentobarbital Drugs 0.000 description 1
- WEXRUCMBJFQVBZ-UHFFFAOYSA-N pentobarbital Chemical compound CCCC(C)C1(CC)C(=O)NC(=O)NC1=O WEXRUCMBJFQVBZ-UHFFFAOYSA-N 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 229940124531 pharmaceutical excipient Drugs 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 229920001993 poloxamer 188 Polymers 0.000 description 1
- 239000004926 polymethyl methacrylate Substances 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 238000010149 post-hoc-test Methods 0.000 description 1
- 235000011056 potassium acetate Nutrition 0.000 description 1
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 1
- 230000036515 potency Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000009256 replacement therapy Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 210000003019 respiratory muscle Anatomy 0.000 description 1
- 230000036387 respiratory rate Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- CVHZOJJKTDOEJC-UHFFFAOYSA-N saccharin Chemical compound C1=CC=C2C(=O)NS(=O)(=O)C2=C1 CVHZOJJKTDOEJC-UHFFFAOYSA-N 0.000 description 1
- 210000003752 saphenous vein Anatomy 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000013606 secretion vector Substances 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- RYYKJJJTJZKILX-UHFFFAOYSA-M sodium octadecanoate Chemical compound [Na+].CCCCCCCCCCCCCCCCCC([O-])=O RYYKJJJTJZKILX-UHFFFAOYSA-M 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 229910001220 stainless steel Inorganic materials 0.000 description 1
- 239000010935 stainless steel Substances 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 229940036555 thyroid hormone Drugs 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2408—Glucanases acting on alpha -1,4-glucosidic bonds
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/12—Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
- A61K35/34—Muscles; Smooth muscle cells; Heart; Cardiac stem cells; Myoblasts; Myocytes; Cardiomyocytes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/12—Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
- A61K35/37—Digestive system
- A61K35/407—Liver; Hepatocytes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/47—Hydrolases (3) acting on glycosyl compounds (3.2), e.g. cellulases, lactases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/08—Drugs for disorders of the metabolism for glucose homeostasis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0652—Cells of skeletal and connective tissues; Mesenchyme
- C12N5/0658—Skeletal muscle cells, e.g. myocytes, myotubes, myoblasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/067—Hepatocytes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/06—Fusion polypeptide containing a localisation/targetting motif containing a lysosomal/endosomal localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/15011—Lentivirus, not HIV, e.g. FIV, SIV
- C12N2740/15041—Use of virus, viral particle or viral elements as a vector
- C12N2740/15043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/0102—Alpha-glucosidase (3.2.1.20)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Virology (AREA)
- Cell Biology (AREA)
- Molecular Biology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Developmental Biology & Embryology (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Diabetes (AREA)
- Obesity (AREA)
- Hematology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Cardiology (AREA)
- Physiology (AREA)
- Nutrition Science (AREA)
- Vascular Medicine (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
Abstract
본 발명은 산-알파 글루코시다제의 변이체 및 이의 용도에 관한 것이다.
Description
본 발명은 산-알파 글루코시다제 (GAA)의 변이체 및 이의 용도에 관한 것이다. 상기 변이체는 이종성 신호 펩티드에 연결된다.
제II형 당원 축적병 (GSD) 및 산 말타제 결핍증이라고도 알려진 폼페 병은 리소솜 효소 산 알파-글루코시다제 (GAA)의 결핍으로 초래되는 상염색체 열성 물질대사성 근육병증이다. GAA는 리소솜 내에서 글리코겐을 포도당으로 가수분해하는 엑소-1,4 및 1,6-α-글루코시다제이다. GAA의 결핍은 리소솜 내에 글리코겐 축적을 야기시켜서 호흡기, 심장 및 골격 근육에 대한 점진적인 손상을 초래한다. 이 질환은 그 범위가 일반적으로 1세 내지 2세까지 치명적인 급속 진행성 유아 과정부터 아동과 성인에서 상당한 이환율 및 조기 사망률을 초래하는 보다 느리게 진행되는 이종성 과정에 이른다. [Hirschhorn RR, The Metabolic and Molecular Bases of Inherited Disease, 3: 3389-3420 (2001, McGraw-Hill); Van der Ploeg and Reuser, Lancet 372: 1342-1351 (2008)].
폼페 병을 치료하기 위한 현행 인간 요법은 달리 효소-대체 요법 (ERT)라고 하는 재조합 인간 GAA의 투여를 포함한다. ERT는 중증, 유아 GSD II에 대한 효능이 입증되었다. 그러나, 효소 요법의 이득은 빈번한 주입 필요성 및 재조합 hGAA에 대한 억제제 항체의 발생으로 인해 제한적이다 (Amalfitano, A., et al. (2001) Genet. In Med. 3:132-138). 더 나아가서, ERT는 전신을 효율적으로 교정하지 않는데, 아마도 말초 정맥 전달 이후 단백질의 불충분한 생체분포, 몇몇 조직으로부터의 흡수 결여 및 높은 면역원성의 조합때문인 듯 하다.
ERT에 대한 대안 또는 부가물로서, GSD-II를 치료하기 위한 유전자 요법 접근법의 실현가능성이 조사되었다 (Amalfitano, A., et al. (1999) Proc. Natl. Acad. Sci. USA 96:8861-8866, Ding, E., et al. (2002) Mol. Ther. 5:436-446, Fraites, T. J., et al. (2002) Mol. Ther. 5:571-578, Tsujino, S., et al. (1998) Hum. Gene Ther. 9:1609-1616). 그러나, 유전자 결함을 교정하기 위한 근육-지정 유전자 전달은 이식유전자의 근육 발현이 다른 조직과 비교하여 더 면역원성이 되는 경향이 있다는 사실 및 이 질환의 전신 성질의 한계에 직면해야 한다.
문헌 [Doerfler et al., 2016]은 하나는 간 특이적 프로모터의 제어 하에 있고 나머지 하나는 근육-특이적 프로모터의 제어 하에 있는, 인간 코돈-최적화된 GAA를 코딩하는 2개 구성체의 병용 투여를 기술한다. 간-특이적 프로모터 구동된 GAA의 발현은 Gaa-/- 마우스 모델에서 GAA에 대한 면역 관용을 촉진시키도록 적용되는 반면, 근육-특이적 프로모터 구동된 GAA의 발현은 요법의 표적이 되는 조직의 일부분에서 치료적 단백질의 발현을 제공한다. 그러나, 이러한 전략은 다수 구성체의 사용을 필요로 하고 GAA의 신체 전반적 발현이 일어나지 않는다는 점에서 전체적으로 만족스럽지 않다.
변형된 GAA 단백질은 과거에 리소솜 축적병의 치료를 개선시키기 위해 제안되었었다. 특히, 국제 공개 특허 출원 WO2004064750 및 문헌 [Sun et al., 2006]은 분비 경로로 단백질의 표적화를 증강시키기 위한 방법으로서 GAA에 작동적으로 연결된 신호 펩티드를 포함하는 키메라 GAA 폴리펩티드를 개시한다.
그러나, 환자에게 이용가능한 요법들이 전체적으로 만족스럽지 않고 개선된 GAA 폴리펩티드 및 GAA 생산이 여전히 당분야에서 요구된다. 특히, GAA 치료의 장기간 효능, 고수준의 GAA 생산, 생산된 GAA 폴리펩티드에 대한 개선된 면역학적 관용, 및 이를 필요로 하는 세포 및 조직에 의한 GAA의 개선된 흡수에 대한 요구가 여전히 존재한다. 또한, WO2004064750 및 문헌 [Sun et al., 2006]에서, 여기에 개시된 키메라 GAA 폴리펩티드의 조직 분포는 전체적으로 만족스럽지 않다. 그러므로, 모든 관심 조직은 아니더라도 대부분에서 글리코겐 축적의 교정을 가능하게 함으로써, 완전하게 치료적일 수 있는 GAA 폴리펩티드에 대한 요구가 여전히 존재한다.
본 발명은 야생형 GAA 단백질과 비교하여 더 높은 수준으로 발현되고 분비되며, 전신 글리코겐의 병리학적 축적의 개선된 교정을 유발시키고 그 결과로 GAA에 대한 면역학적 관용을 유도하는 GAA 변이체에 관한 것이다.
일 양상에 따라서, 본 발명은 신호 펩티드 모이어티 및 기능성 GAA 모이어티를 포함하는 기능성 키메라 GAA 폴리펩티드를 코딩하는 핵산 분자를 제공한다. 코딩된 키메라 GAA 폴리펩티드에서, GAA 폴리펩티드의 내생성 (또는 천연) 신호 펩티드는 다른 단백질의 신호 펩티드로 교체된다. 그러므로, 핵산 분자는 GAA 폴리펩티드에 작동적으로 연결된, GAA 이외의 다른 단백질 유래 신호 펩티드를 포함하는 키메라 GAA 폴리펩티드를 코딩한다. 코딩된 키메라 폴리펩티드는 기능성 GAA 단백질로서, GAA의 천연 신호 펩티드 (예컨대 인간 GAA를 코딩하는 야생형 핵산인 SEQ ID NO: 1의 뉴클레오티드 1 내지 81에 상응하는 것)에 상응하는 아미노산 서열은 상이한 단백질의 아미노산 서열로 교체된다. 바람직한 구체예에서, 코딩된 신호 펩티드는 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 아미노산 서열을 갖는다. 특정 구체예에서, GAA 모이어티는 부모 GAA 폴리펩티드의 N-말단 절두 형태이다.
특정 구체예에서, GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 1 내지 75개의 연속되는 아미노산이 결실되고, 부모 폴리펩티드는 이의 신호 펩티드가 없는 GAA 폴리펩티드의 전구체 형태에 상응한다. 특정 구체예에서, 상기 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 적어도 2개, 특히 적어도 2개, 특히 적어도 3개, 특히 적어도 4개, 특히 적어도 5개, 특히 적어도 6개, 특히 적어도 7개, 특히 적어도 8개의 연속되는 아미노산이 결실된다. 다른 구체예에서, 상기 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 최대로 75개, 특히 최대로 70개, 특히 최대로 60개, 특히 최대로 55개, 특히 최대로 50개, 특히 최대로 47개, 특히 최대로 46개, 특히 최대로 45개, 특히 최대로 44개, 특히 최대로 43개의 연속되는 아미노산이 결실된다. 보다 특정한 구체예에서, 상기 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 최대로 47개, 특히 최대로 46개, 특히 최대로 45개, 특히 최대로 44개, 특히 최대로 43개의 연속되는 아미노산이 결실된다. 다른 특정 구체예에서, 상기 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 1 내지 75개, 특히 1 내지 47개, 특히 1 내지 46개, 특히 1 내지 45개, 특히 1 내지 44개, 특히 1 내지 43개의 연속되는 아미노산이 결실된다. 다른 구체예에서, 상기 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 2 내지 43개, 특히 3 내지 43개, 특히 4 내지 43개, 특히 5 내지 43개, 특히 6 내지 43개, 특히 7 내지 43개, 특히 8 내지 43개의 연속되는 아미노산이 결실된다. 보다 특정한 구체예에서, 상기 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 6, 7, 8, 9, 10, 27, 28, 29, 30, 31, 40, 41, 42, 43, 44, 45, 46 또는 47개의 연속되는 아미노산이 결실되고, 특히 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 7, 8, 9, 28, 29, 30, 41, 42, 43 또는 44, 보다 특히 8, 29, 42 또는 43개의 연속되는 아미노산이 결실된다. 예시적인 부모 GAA 폴리펩티드는 SEQ ID NO: 5 또는 SEQ ID NO: 36으로 표시된 인간 GAA 폴리펩티드로 대표된다.
다른 특정 구체예에서, 본 발명의 핵산 분자는 생체 내에서 키메라 GAA의 발현을 개선시키고/시키거나 이에 대한 면역 관용을 개선시키도록 최적화된 뉴클레오티드 서열이다.
특정 구체예에서, 본 발명의 핵산 분자는 하기 표 1, 표 1' 또는 표 1", 특히 표 1' 또는 표 1"에 표시된 모이어티를 포함하는 키메라 GAA 폴리펩티드를 코딩한다:
표 1
표 1'
표 1"
예를 들어, 이러한 핵산 분자는 하기 표 2, 표 2' 또는 표 2"에 표시된 조합의 결과일 수 있다:
표 2
표 2'
표 2"
또 다른 양상에서, 본 발명은 하나 이상의 조절성 서열 예컨대 프로모터, 인트론, 폴리아데닐화 신호 및/또는 인핸서 (예를 들어, 시스-조절성 모듈, 또는 CRM)에 작동적으로 연결된 본 발명의 핵산 분자를 포함하는 핵산 구성체에 관한 것이다. 특정 구체예에서, 프로모터는 바람직하게 알파-1 항트립신 프로모터 (hAAT), 트랜스타이레틴 프로모터, 알부민 프로모터 및 타이록신-결합 글로불린 (TBG) 프로모터로 이루어진 군에서 선택되는 간-특이적 프로모터이다. 다른 특정 구체예에서, 프로모터는 근육-특이적 프로모터, 예컨대 Spc5-12, MCK 및 데스민 프로모터이다. 다른 구체예에서, 프로모터는 편재성 프로모터 예컨대 CMV, CAG 및 PGK 프로모터이다. 핵산 구성체는 임의로 인트론, 특히 인간 베타 글로빈 b2 (또는 HBB2) 인트론, FIX 인트론, 닭 베타-글로빈 인트론 및 SV40 인트론으로 이루어진 군에서 선택되는 인트론을 더 포함할 수 있고, 상기 인트론은 임의로 변형된 인트론 예컨대 SEQ ID NO: 7의 변형된 HBB2 인트론, SEQ ID NO: 9의 변형된 FIX 인트론, 또는 SEQ ID NO: 11의 변형된 닭 베타-글로빈 인트론이다.
다른 특정 구체예에서, 핵산 구성체는 바람직하게 이 순서대로, 인핸서; 인트론; 프로모터, 특히 간-특이적 프로모터; 키메라 GAA 폴리펩티드를 코딩하는 핵산 서열; 및 폴리아데닐화 신호를 포함하고, 구성체는 바람직하게, 이 순서대로, ApoE 제어 영역; HBB2 인트론, 특히 변형된 HBB2 인트론; hAAT 프로모터; 키메라 GAA 폴리펩티드를 코딩하는 핵산 서열; 및 소 성장 호르몬 폴리아데닐화 신호를 포함한다. 특별한 구체예에서, 핵산 구성체는 표 2, 표 2' 또는 표 2", 특히 표 2' 또는 2"에 표시된 서열의 조합으로 이루어진 군에서 선택되는 뉴클레오티드 서열, 보다 특히 SEQ ID NO: 17 (SEQ ID NO: 26 및 SEQ ID NO: 32의 융합체에 상응), 18 (SEQ ID NO: 27 및 SEQ ID NO: 32의 융합체에 상응) 또는 19 (SEQ ID NO: 28 및 SEQ ID NO: 32의 융합체에 상응)의 뉴클레오티드 서열을 포함한다.
다른 양상에 따라서, 본 발명은 본 발명에 따른 핵산 분자 또는 핵산 구성체를 포함하는 벡터에 관한 것이다. 특정 구체예에서, 벡터는 바이러스 벡터, 바람직하게 레트로바이러스 벡터, 예컨대 렌티바이러스 벡터, 또는 AAV 벡터이다.
다른 구체예에 따라서, 바이러스 벡터는 단일-가닥 또는 이중-가닥 자기-상보성 AAV 벡터, 바람직하게 AAV-유래 캡시드, 예컨대 AAV1, AAV2, 변이체 AAV2, AAV3, 변이체 AAV3, AAV3B, 변이체 AAV3B, AAV4, AAV5, AAV6, 변이체 AAV6, AAV7, AAV8, AAV9, AAV10 예컨대 AAVcy10 및 AAVrh10, AAVrh74, AAVdj, AAV-Anc80, AAV-LK03, AAV2i8 및 돼지 AAV, 예컨대 AAVpo4 및 AAVpo6 캡시드를 갖거나 또는 키메라 캡시드를 갖는 AAV 벡터이다.
추가의 특정한 구체예에 따라서, AAV 벡터는 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 보다 특히 AAV8 캡시드를 갖는다.
다른 양상에서, 본 발명은 본 발명의 핵산 분자, 핵산 구성체 또는 벡터로 형질전환된 세포에 관한 것이다. 특정 구체예에서, 세포는 간 세포 또는 근육 세포이다.
다른 양상에 따라서, 본 발명은 신호 펩티드 모이어티 및 기능성 GAA 모이어티를 포함하는 키메라 GAA 폴리펩티드에 관한 것이다. 신호 펩티드 모이어티는 SEQ ID NO: 2 내지 4, 바람직하게 SEQ ID NO: 2로 이루어진 군에서 선택된다. 더 나아가서, GAA 모이어티는 부모 GAA 폴리펩티드의 절두된 형태, 예컨대 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 1 내지 75개의 연속되는 아미노산이 절두되고, 특히 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 6, 7, 8, 9, 10, 20, 41, 42, 43 또는 44개의 연속되는 아미노산이 절두되고, 예컨대 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 8 또는 42개의 연속되는 아미노산이 절두된 GAA 모이어티일 수 있고, 여기서 GAA 모이어티는 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5의 인간 GAA 단백질의 절두된 형태이다. 특정 구체예에서, GAA 모이어티는 부모 GAA 폴리펩티드 (보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5의 부모 GAA 폴리펩티드)와 비교하여 이의 N-말단부에서 8개의 연속되는 아미노산이 절두된다. 본 발명의 특정 구체예에서, 본 발명의 키메라 GAA 폴리펩티드는 표 1, 표 1' 또는 표 1", 특히 표 1' 또는 표 1"에 표시된 아미노산 서열의 조합으로 이루어진 군에서 선택된다. 부모 GAA 폴리펩티드의 절두형을 포함하는 키메라 GAA 폴리펩티드의 추가의 특정 구체예가 하기 구체적인 내용에서 개시된다.
다른 양상에서, 본 발명은 약학적으로 허용가능한 담체에, 본 명세서에 개시된 핵산 서열, 핵산 구성체, 벡터, 세포 또는 키메라 폴리펩티드를 포함하는 약학 조성물에 관한 것이다.
본 발명의 다른 양상은 약물로서 사용을 위한, 본 발명의 핵산 서열, 핵산 구성체, 벡터, 세포 또는 키메라 폴리펩티드에 관한 것이다.
또 다른 양상에서, 본 발명은 당원 축적병을 치료하기 위한 방법에서 사용을 위한, 본 발명의 핵산 서열, 핵산 구성체, 벡터, 세포 또는 키메라 폴리펩티드에 관한 것이다. 특정 구체예에서, 당원 축적병은 GSDI, GSDII, GSDIII, GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 또는 심장의 치명적인 선천성 당원 축적병이다. 보다 특정한 구체예에서, 당원 축적병은 GSDI, GSDII 및 GSDIII으로 이루어진 군, 보다 특히 GSDII 및 GSDIII으로 이루어진 군에서 선택된다. 보다 더 특정한 구체예에서, 당원 축적병은 GSDII이다.
도 1. 신호 펩티드가 시험관 내 및 생체 내에서 다양한 정도로 hGAA의 분비를 증강시킨다. 패널 A. 인간 간세포암 세포 (Huh7)는 Lipofectamine™에 의해서 대조군 플라스미드 (GFP), 간 특이적 프로모터의 전사 제어 하에서 야생형 hGAA를 발현하는 플라스미드 (sp1로 표시), 또는 합성 기원 또는 다른 고도의 분비성 단백질로부터 유래된 신호 펩티드 1-8 (sp2 (sp1-8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 플라스미드로 형질감염되었다. 형질감염 후 48시간에, 배양 배지 중 hGAA의 활성은 형광원성 효소 어세이를 통해 측정하였고 4-메틸엄벨리페론의 표준 곡선에 대해서 GAA 활성을 평가하였다. 히스토그램 그래프는 3회의 상이한 실험으로부터 유래된 분비형 hGAA의 수준의 평균 ± SE를 도시한다. 통계 분석은 ANOVA로 수행하였다 (* = 모의 형질감염 세포 대비 p < 0.05). 패널 B. 히스토그램 그래프는 PBS (PBS) 또는 1E12 vg/kg의 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 1 내지 3 및 7-8 (sp1-3, 7-8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 AAV8 벡터의 주사 후 1개월에 3개월령 C57Bl6J 마우스 (n=5 마우스/그룹)의 혈청 중 hGAA의 활성의 평균 ± SE를 도시한다. 혈청 중 hGAA의 활성은 형광원성 효소 어세이를 통해 정량하였고 GAA 활성은 재조합 hGAA 단백질의 표준 그래프에 대해 평가하였다. 통계 분석은 ANOVA로 수행하였다 (* = PBS 주사 대비 p < 0.05, § = sp2 대비 p < 0.05).
도 2. sp7 신호 펩티드는 폼페 병 마우스 모델에서 순환성 hGAA의 수준을 증가시키고 호흡기 손상을 구제한다. 4개월령 야생형 (WT) 및 GAA-/- 마우스 (n=6-9 마우스/그룹)는 PBS 또는 2E12 vg/kg의 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 1, 2, 7 및 8 (sp1, 2, 7, 8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 AAV8이 정맥내로 주사되었다. 패널 A. 히스토그램 그래프는 벡터 주사 후 3개월에 혈액 중 형광원성 어세이를 통해서 측정된 hGAA 활성을 보여준다. 통계 분석은 ANOVA로 수행하였다 (* = 표시된 대로 p < 0.05, § = sp1 처치 마우스 대비 p < 0.05). 패널 B. 카플란-마이어 생존 그래프는 상기 기술된 바와 같이 처치된 마우스에서 측정하였고 6개월 동안 추적하였다. 통계 분석은 log-순위 검정으로 수행하였다 (* = p < 0.05). 패널 C. 호흡 기능 평가. 히스토그램은 표시된 벡터로 처치 후 3개월 (회색 막대) 및 6개월 (검은색 막대)에 측정된 밀리리터 (mL) 단위의 1회 호흡량을 도시한다. 통계 분석은 ANOVA로 수행되었고, 히스토그램에서 sp1 처치된 GAA -/- 동물 대비 수득된 p-값이 기록되어 있다 (* = p < 0.05).
도 3. 사두근 내 글리코겐 함량의 생물학적 교정. 4개월령 GAA-/- 마우스는 PBS 또는 2E12 vg/kg의 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 1, 7 및 8 (sp1, 7, 8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 AAV8 벡터가 정맥내 주사되었다. 패널 A. 사두근에서 형광원성 어세이로 측정된 hGAA 활성. 패널 B. 히스토그램에서는 사두근에서 측정된 글리코겐의 효소 분해 이후에 방출된 포도당으로서 표시된 글리코겐 함량을 도시한다. 통계 분석은 ANOVA로 수행되었다 (* = PBS 주사된 GAA -/- 마우스 대비 p < 0.05).
도 4. 심장, 횡격막 및 사두근 내 글리코겐 함량의 생화학적 교정. 4개월령 야생형 (WT) 및 GAA-/- 마우스 (n=4-5 마우스/그룹)는 PBS 및 6E11 vg/kg의 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 1, 7 및 8 (sp1, 7, 8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 AAV8 벡터가 정맥내 주사되었다. 패널 A. 히스토그램 그래프는 벡터 주사 이후 3개월에 혈액 중 형광원성 어세이를 통해 측정된 hGAA 활성을 도시한다. 통계 분석은 ANOVA로 수행되었고, 히스토그램에서는 PBS 처치된 GAA -/- 동물 대비 수득된 p-값으로 기록되어 있다 (* = p < 0.05). 패널 B-D. 히스토그램 그래프는 심장 (패널 B), 횡격막 (패널 C) 및 사두근 (패널 D)에서 측정된 글리코겐의 효소 분해 후 방출된 포도당으로서 표시된 글리코겐 함량을 도시한다. 통계 분석은 ANOVA로 수행되었다 (* = PBS 주사된 GAA -/- 마우스 대비 p < 0.05, § = sp1-처치된 마우스 대비 p < 0,05).
도 5. 고도로 분비된 hGAA는 폼페 병 마우스 모델의 이식유전자에 대하여 유도된 체액성 반응을 감소시킨다. 4개월령 GAA-/- 마우스는 PBS 또는 신호 펩티드 1 (co), 신호 펩티드 2 (sp2-Δ8-co), 신호 펩티드 7 (sp7-Δ8-co) 또는 신호 펩티드 8 (sp8-Δ8-co)이 융합되는, Δ8 hGAA를 코딩하는, 인간 알파-1-항트립신 프로모터의 전사 제어 하의 최적화된 서열을 포함하는 AAV8 벡터의 2가지 상이한 용량 (5E11 또는 2E12 vg/kg)이 정맥내로 주사되었다. 주사 후 1개월에, 혈청은 ELISA를 통해 항-hGAA 항체의 존재에 대해 분석되었다. 정량은 표준물로서 정제된 마우스 IgG를 사용하여 수행되었다. 통계 분석은 두네트 (Dunnett)의 사후 검정과 ANOVA를 통해 수행되었다 (* = p < 0.01).
도 6. AAV8-hAAT-sp7-Δ8-hGAAco1 주사는 NHP에서 혈중 hGAA의 효율적인 분비 및 근육 내 흡수를 야기시킨다. 2마리의 마카카 파시쿨라리스 (Macaca Fascicularis) 원숭이는 0일에 2E12 vg/kg의 AAV8-hAAT-sp7-Δ8-hGAAco1이 주사되었다. 패널 A. hGAA 웨스턴 블롯은 벡터 투여 전 12일 및 투여 후 30일에 수득된 2마리 원숭이로부터의 혈청에서 수행되었다. 좌측은 샘플과 함께 흘려준 분자량 마커 (st)의 밴드 위치가 표시되어 있다. 패널 B. 벡터 주사 후 3개월에 원숭이를 희생시켰고 hGAA 흡수의 생화학적 평가를 위해 조직을 수집하였다. hGAA 웨스턴 블롯은 이두근 및 횡격막으로부터 수득된 조직 추출물에서 수행되었다. 항-튜불린 항체가 로딩 대조군으로서 사용되었다. 샘플과 동시에 흘려준 분자량 마커의 밴드 위치가 표시되어 있다.
도 7. 이종성 sp7 또는 sp8 신호 펩티드와 조합된 GAA 변이체를 코딩하는 플라스미드로 형질감염된 세포의 배지 중 증가된 GAA 활성. 천연 GAA sp1 신호 펩티드 (co)와 조합된 천연 GAA를 코딩하거나 또는 이종성 sp7 또는 sp8 신호 펩티드 (sp7-co 또는 sp8-co)와 조합된 천연 GAA를 포함하는 조작된 GAA를 코딩하는 최적화된 서열을 포함하는 플라스미드의 형질감염 이후 48시간에 HuH7 세포의 배지 (패널 A) 및 용해물 (패널 B)에서 측정된 GAA 활성. eGFP를 코딩하는 플라스미드가 음성 대조군으로서 사용되었다. 통계 분석은 터키 사후 검정과 단측 ANOVA로 수행되었다. 데이타는 2회의 독립 실험의 평균 ± SD이다. * p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001.
도 8. hGAA 발현 벡터가 주사된 GDE -/- 동물의 간 중 글리코겐 함량의 생화학적 교정. 3개월령 야생형 (WT) 또는 GDE -/- 마우스는 PBS 또는 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 7 (AAV8-hAAT-sp7--Δ8-hGAAco1)이 융합된 코돈 최적화된 hGAA를 발현하는 AAV8 벡터가 1E11 또는 1E12 vg/마우스의 용량으로 정맥내 주사되었다. 히스토그램 그래프는 간에서 측정된, 글리코겐의 효소 분해 후 방출된 포도당으로 표시된 글리코겐 함량을 도시한다. 통계 분석은 ANOVA로 수행되었다 (* = PBS 주사된 GDE -/- 마우스 대비 p < 0.05, §= PBS 주사 WT 동물 대비 p < 0.05).
도 9. 상이한 GAA 변이체를 코딩하는 플라스미드가 형질감염된 세포의 배지 중 GAA 활성. GAA 활성은 천연 GAA sp1 신호 펩티드 (co)와 조합된 천연 GAA를 코딩하거나 또는 이종성 sp7 신호 펩티드 (sp7-co)와 조합된 천연 GAA를 포함하는 조작된 GAA를 코딩하는 최적화된 서열을 포함하는 플라스미드의 형질감염 후 24시간 (패널 A) 및 48시간 (패널 B)에 HuH7 세포의 배지 중에서 측정되었다. sp7 신호 펩티드 이후에 GAA 코딩 서열 내 상이한 결실의 효과를 평가하였다 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co, sp7-Δ62-co). eGFP를 코딩하는 플라스미드가 음성 대조군으로서 사용되었다. 통계 분석은 터키 사후 검정과 단측 ANOVA로 수행되었다. 막대에서 해쉬 마크 (#)는 co 대비 통계적으로 유의한 편차를 보여주고; tau 기호 (τ)는 sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co 대비 통계적으로 유의한 편차를 보여준다. 데이타는 2회의 독립 실험의 평균 ± SD이다. * p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001이고 상이한 기호를 사용한 경우는 예외이다.
도 10. 상이한 GAA 변이체의 세포내 GAA 활성. GAA 활성은 천연 GAA sp1 신호 펩티드 (co)와 조합된 천연 GAA를 코딩하거나 또는 이종성 sp7 신호 펩티드 (sp7-co)와 조합된 천연 GAA를 포함하는 조작된 GAA를 코딩하는 최적화된 서열을 포함하는 플라스미드의 형질감염 후 48시간에 HuH7 세포의 용해물에서 측정되었다. 신호 펩티드 이후에 GAA 코딩 서열 내 상이한 결실의 효과가 평가되었다 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co, sp7-Δ62-co). eGFP를 코딩하는 플라스미드는 음성 대조군으로서 사용되었다. 통계 분석은 터키 사후 검정과 단측 ANOVA로 수행되었다. tau 기호 (τ)는 sp7-co, sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co 대비 통계적으로 유의한 편차를 보여준다. 데이타는 2회의 독립 실험의 평균 ± SD를 보여준다. * p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001이고 상이한 기호를 사용한 경우는 예외이다.
도 11. sp6 또는 sp8 신호 펩티드와 조합된 Δ8 결실을 사용한 세포 배지 중 증가된 GAA 활성. GAA 활성은 천연 GAA sp1 신호 펩티드 (co)와 조합된 천연 GAA를 코딩하거나 또는 이종성 sp6 또는 sp8 신호 펩티드 (sp6-co 또는 sp8-co)와 조합된 천연 GAA를 포함하는 조작된 GAA를 코딩하는 최적화된 서열을 포함하는 플라스미드의 형질감염 후 48시간에 HuH7 세포의 배지 (패널 A) 및 용해물 (패널 B)에서 측정되었다. 신호 펩티드 이후에 GAA 코딩 서열 내 8개 아미노산의 결실의 효과가 평가되었다 (sp6-Δ8-co, sp8-Δ8-co). eGFP를 코딩하는 플라스미드가 음성 대조군으로서 사용되었다. 통계 분석은 터키 사후 검정과 단측 ANOVA로 수행되었다. 막대의 별표는 co 대비 통계적으로 유의한 편차를 보여준다. 데이타는 2회의 독립 실험의 평균 ± SD이다. * p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001이고 상이한 기호가 사용된 경우는 예외이다.
도 2. sp7 신호 펩티드는 폼페 병 마우스 모델에서 순환성 hGAA의 수준을 증가시키고 호흡기 손상을 구제한다. 4개월령 야생형 (WT) 및 GAA-/- 마우스 (n=6-9 마우스/그룹)는 PBS 또는 2E12 vg/kg의 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 1, 2, 7 및 8 (sp1, 2, 7, 8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 AAV8이 정맥내로 주사되었다. 패널 A. 히스토그램 그래프는 벡터 주사 후 3개월에 혈액 중 형광원성 어세이를 통해서 측정된 hGAA 활성을 보여준다. 통계 분석은 ANOVA로 수행하였다 (* = 표시된 대로 p < 0.05, § = sp1 처치 마우스 대비 p < 0.05). 패널 B. 카플란-마이어 생존 그래프는 상기 기술된 바와 같이 처치된 마우스에서 측정하였고 6개월 동안 추적하였다. 통계 분석은 log-순위 검정으로 수행하였다 (* = p < 0.05). 패널 C. 호흡 기능 평가. 히스토그램은 표시된 벡터로 처치 후 3개월 (회색 막대) 및 6개월 (검은색 막대)에 측정된 밀리리터 (mL) 단위의 1회 호흡량을 도시한다. 통계 분석은 ANOVA로 수행되었고, 히스토그램에서 sp1 처치된 GAA -/- 동물 대비 수득된 p-값이 기록되어 있다 (* = p < 0.05).
도 3. 사두근 내 글리코겐 함량의 생물학적 교정. 4개월령 GAA-/- 마우스는 PBS 또는 2E12 vg/kg의 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 1, 7 및 8 (sp1, 7, 8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 AAV8 벡터가 정맥내 주사되었다. 패널 A. 사두근에서 형광원성 어세이로 측정된 hGAA 활성. 패널 B. 히스토그램에서는 사두근에서 측정된 글리코겐의 효소 분해 이후에 방출된 포도당으로서 표시된 글리코겐 함량을 도시한다. 통계 분석은 ANOVA로 수행되었다 (* = PBS 주사된 GAA -/- 마우스 대비 p < 0.05).
도 4. 심장, 횡격막 및 사두근 내 글리코겐 함량의 생화학적 교정. 4개월령 야생형 (WT) 및 GAA-/- 마우스 (n=4-5 마우스/그룹)는 PBS 및 6E11 vg/kg의 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 1, 7 및 8 (sp1, 7, 8)이 융합된 서열 최적화된 hGAA (hGAAco)를 발현하는 AAV8 벡터가 정맥내 주사되었다. 패널 A. 히스토그램 그래프는 벡터 주사 이후 3개월에 혈액 중 형광원성 어세이를 통해 측정된 hGAA 활성을 도시한다. 통계 분석은 ANOVA로 수행되었고, 히스토그램에서는 PBS 처치된 GAA -/- 동물 대비 수득된 p-값으로 기록되어 있다 (* = p < 0.05). 패널 B-D. 히스토그램 그래프는 심장 (패널 B), 횡격막 (패널 C) 및 사두근 (패널 D)에서 측정된 글리코겐의 효소 분해 후 방출된 포도당으로서 표시된 글리코겐 함량을 도시한다. 통계 분석은 ANOVA로 수행되었다 (* = PBS 주사된 GAA -/- 마우스 대비 p < 0.05, § = sp1-처치된 마우스 대비 p < 0,05).
도 5. 고도로 분비된 hGAA는 폼페 병 마우스 모델의 이식유전자에 대하여 유도된 체액성 반응을 감소시킨다. 4개월령 GAA-/- 마우스는 PBS 또는 신호 펩티드 1 (co), 신호 펩티드 2 (sp2-Δ8-co), 신호 펩티드 7 (sp7-Δ8-co) 또는 신호 펩티드 8 (sp8-Δ8-co)이 융합되는, Δ8 hGAA를 코딩하는, 인간 알파-1-항트립신 프로모터의 전사 제어 하의 최적화된 서열을 포함하는 AAV8 벡터의 2가지 상이한 용량 (5E11 또는 2E12 vg/kg)이 정맥내로 주사되었다. 주사 후 1개월에, 혈청은 ELISA를 통해 항-hGAA 항체의 존재에 대해 분석되었다. 정량은 표준물로서 정제된 마우스 IgG를 사용하여 수행되었다. 통계 분석은 두네트 (Dunnett)의 사후 검정과 ANOVA를 통해 수행되었다 (* = p < 0.01).
도 6. AAV8-hAAT-sp7-Δ8-hGAAco1 주사는 NHP에서 혈중 hGAA의 효율적인 분비 및 근육 내 흡수를 야기시킨다. 2마리의 마카카 파시쿨라리스 (Macaca Fascicularis) 원숭이는 0일에 2E12 vg/kg의 AAV8-hAAT-sp7-Δ8-hGAAco1이 주사되었다. 패널 A. hGAA 웨스턴 블롯은 벡터 투여 전 12일 및 투여 후 30일에 수득된 2마리 원숭이로부터의 혈청에서 수행되었다. 좌측은 샘플과 함께 흘려준 분자량 마커 (st)의 밴드 위치가 표시되어 있다. 패널 B. 벡터 주사 후 3개월에 원숭이를 희생시켰고 hGAA 흡수의 생화학적 평가를 위해 조직을 수집하였다. hGAA 웨스턴 블롯은 이두근 및 횡격막으로부터 수득된 조직 추출물에서 수행되었다. 항-튜불린 항체가 로딩 대조군으로서 사용되었다. 샘플과 동시에 흘려준 분자량 마커의 밴드 위치가 표시되어 있다.
도 7. 이종성 sp7 또는 sp8 신호 펩티드와 조합된 GAA 변이체를 코딩하는 플라스미드로 형질감염된 세포의 배지 중 증가된 GAA 활성. 천연 GAA sp1 신호 펩티드 (co)와 조합된 천연 GAA를 코딩하거나 또는 이종성 sp7 또는 sp8 신호 펩티드 (sp7-co 또는 sp8-co)와 조합된 천연 GAA를 포함하는 조작된 GAA를 코딩하는 최적화된 서열을 포함하는 플라스미드의 형질감염 이후 48시간에 HuH7 세포의 배지 (패널 A) 및 용해물 (패널 B)에서 측정된 GAA 활성. eGFP를 코딩하는 플라스미드가 음성 대조군으로서 사용되었다. 통계 분석은 터키 사후 검정과 단측 ANOVA로 수행되었다. 데이타는 2회의 독립 실험의 평균 ± SD이다. * p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001.
도 8. hGAA 발현 벡터가 주사된 GDE -/- 동물의 간 중 글리코겐 함량의 생화학적 교정. 3개월령 야생형 (WT) 또는 GDE -/- 마우스는 PBS 또는 인간 알파-1-항트립신 프로모터의 전사 제어 하에 있고 신호 펩티드 7 (AAV8-hAAT-sp7--Δ8-hGAAco1)이 융합된 코돈 최적화된 hGAA를 발현하는 AAV8 벡터가 1E11 또는 1E12 vg/마우스의 용량으로 정맥내 주사되었다. 히스토그램 그래프는 간에서 측정된, 글리코겐의 효소 분해 후 방출된 포도당으로 표시된 글리코겐 함량을 도시한다. 통계 분석은 ANOVA로 수행되었다 (* = PBS 주사된 GDE -/- 마우스 대비 p < 0.05, §= PBS 주사 WT 동물 대비 p < 0.05).
도 9. 상이한 GAA 변이체를 코딩하는 플라스미드가 형질감염된 세포의 배지 중 GAA 활성. GAA 활성은 천연 GAA sp1 신호 펩티드 (co)와 조합된 천연 GAA를 코딩하거나 또는 이종성 sp7 신호 펩티드 (sp7-co)와 조합된 천연 GAA를 포함하는 조작된 GAA를 코딩하는 최적화된 서열을 포함하는 플라스미드의 형질감염 후 24시간 (패널 A) 및 48시간 (패널 B)에 HuH7 세포의 배지 중에서 측정되었다. sp7 신호 펩티드 이후에 GAA 코딩 서열 내 상이한 결실의 효과를 평가하였다 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co, sp7-Δ62-co). eGFP를 코딩하는 플라스미드가 음성 대조군으로서 사용되었다. 통계 분석은 터키 사후 검정과 단측 ANOVA로 수행되었다. 막대에서 해쉬 마크 (#)는 co 대비 통계적으로 유의한 편차를 보여주고; tau 기호 (τ)는 sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co 대비 통계적으로 유의한 편차를 보여준다. 데이타는 2회의 독립 실험의 평균 ± SD이다. * p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001이고 상이한 기호를 사용한 경우는 예외이다.
도 10. 상이한 GAA 변이체의 세포내 GAA 활성. GAA 활성은 천연 GAA sp1 신호 펩티드 (co)와 조합된 천연 GAA를 코딩하거나 또는 이종성 sp7 신호 펩티드 (sp7-co)와 조합된 천연 GAA를 포함하는 조작된 GAA를 코딩하는 최적화된 서열을 포함하는 플라스미드의 형질감염 후 48시간에 HuH7 세포의 용해물에서 측정되었다. 신호 펩티드 이후에 GAA 코딩 서열 내 상이한 결실의 효과가 평가되었다 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co, sp7-Δ62-co). eGFP를 코딩하는 플라스미드는 음성 대조군으로서 사용되었다. 통계 분석은 터키 사후 검정과 단측 ANOVA로 수행되었다. tau 기호 (τ)는 sp7-co, sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co 대비 통계적으로 유의한 편차를 보여준다. 데이타는 2회의 독립 실험의 평균 ± SD를 보여준다. * p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001이고 상이한 기호를 사용한 경우는 예외이다.
도 11. sp6 또는 sp8 신호 펩티드와 조합된 Δ8 결실을 사용한 세포 배지 중 증가된 GAA 활성. GAA 활성은 천연 GAA sp1 신호 펩티드 (co)와 조합된 천연 GAA를 코딩하거나 또는 이종성 sp6 또는 sp8 신호 펩티드 (sp6-co 또는 sp8-co)와 조합된 천연 GAA를 포함하는 조작된 GAA를 코딩하는 최적화된 서열을 포함하는 플라스미드의 형질감염 후 48시간에 HuH7 세포의 배지 (패널 A) 및 용해물 (패널 B)에서 측정되었다. 신호 펩티드 이후에 GAA 코딩 서열 내 8개 아미노산의 결실의 효과가 평가되었다 (sp6-Δ8-co, sp8-Δ8-co). eGFP를 코딩하는 플라스미드가 음성 대조군으로서 사용되었다. 통계 분석은 터키 사후 검정과 단측 ANOVA로 수행되었다. 막대의 별표는 co 대비 통계적으로 유의한 편차를 보여준다. 데이타는 2회의 독립 실험의 평균 ± SD이다. * p < 0.05, ** p < 0.01, *** p < 0.001, **** p < 0.0001이고 상이한 기호가 사용된 경우는 예외이다.
본 발명은 키메라 GAA 폴리펩티드를 코딩하는 핵산 분자에 관한 것이다. 이러한 키메라 GAA 폴리펩티드는 신호 펩티드 모이어티 및 기능성 GAA 모이어티를 포함하고, 여기서 신호 펩티드 모이어티는 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택된다. 발명자는 놀랍게도 GAA 단백질과 이들 신호 펩티드 중 하나의 융합이 이의 면역원성은 감소시키면서 GAA 분비는 상당히 개선시킨다는 것을 확인하였다.
리소솜 산 α-글루코시다제 또는 "GAA" (E.C. 3.2. 1.20) (1,4-α-D-글루칸 글루코하이드롤라제)는 올리고사카라이드의 α-1,4 및 α-1,6 연결 둘 모두를 가수분해하여 포도당을 유리시키는 엑소-1,4-α-D-글루코시다제이다. GAA의 결핍으로 인해 제II형 당원 축적병 (GSDII)이 발생되고, 이를 또한 폼페 병이라고도 한다 (그러나 이 용어는 공식적으로 질환의 유아기 개시 형태를 의미함). 이 효소는 분지 지점에서 둔화되는 글리코겐의 완전한 분해를 촉매한다. 17번 염색체 상의 28 kb 인간 산 α-글루코시다제 유전자는 3.6 kb mRNA를 코딩하여 952개 아미노산 폴리펩티드를 생산한다 (Hoefsloot et al., (1988) EMBO J. 7: 1697; Martiniuk et al., (1990) DNA and Cell Biology 9: 85). 효소는 세포질 망상구조 내에서 공번역 N-연결 글리코실화를 수용한다. 이것은 110-kDa 전구체 형태로서 합성되어서, 광범위한 글리코실화 변형, 인산화 및 대략 90-kDa 엔도솜 중간체에서 최종 리소솜 76 및 67 kDa 형태로 단백질가수분해 프로세싱을 통해 성숙된다 (Hoefsloot, (1988) EMBO J. 7: 1697; Hoefsloot et al., (1990) Biochem. J. 272: 485; Wisselaar et al., (1993) J. Biol. Chem. 268: 2223; Hermans et al., (1993) Biochem. J. 289: 681).
GSD II가 있는 환자에서, α-글루코시다제의 결핍은 리소솜 내 글리코겐의 대량 축적을 초래하여, 세포 기능을 파괴한다 (Hirschhorn, R. and Reuser, A. J. (2001), in The Metabolic and Molecular Basis for Inherited Disease, (eds, Scriver, C. R. et al.) pages 3389-3419 (McGraw-Hill, New York)). 가장 일반적인 유아기 형태에서, 환자는 진행성 근육 변성 및 심근병증을 나타내고 2세 이전에 사망한다. 중증 쇠약증이 청소년 및 성인 개시 형태에 존재한다.
더 나아가서, 다른 GSD를 갖는 환자는 GAA의 최적화된 형태의 투여를 통해서 이득을 얻을 수 있다. 예를 들어, GAA의 투여는 제III형 당원 축적병 (GSD III) 환자 유래의 초대 근아세포 중에서 글리코겐을 감소시키는 것으로 확인되었다 (Sun et al. (2013) Mol Genet Metab 108(2): 145; WO2010/005565).
본 명세서에서 사용되는 용어 "GAA" 또는 "GAA 폴리펩티드"는 성숙 (∼76 또는 ∼67 kDa) 및 전구체 (예, ∼110 kDa) GAA, 특히 전구체 형태를 비롯하여, GAA의 기능성 유도체, 즉 GAA (즉, 천연 GAA 단백질의 적어도 하나의 생물학적 활성을 가지며, 예를 들어 상기에 정의된 바와 같이 글리코겐을 가수분해할 수 있음) 및 GAA 변이체 (예를 들어, 문헌 [Kunita et al., (1997) Biochemica et Biophysica Acta 1362: 269]에 기술된 GAA II; 문헌 [Hirschhorn, R. and Reuser, A. J. (2001) In The Metabolic and Molecular Basis for Inherited Disease (Scriver, C. R. , Beaudet, A. L., Sly, W. S. & Valle, D. Eds.), pp. 3389- 3419. McGraw-Hill, New York, 페이지 3403-3405 참조]에 기재된 GAA 다형체 및 SNP)의 생물학적 기능을 보유하는 삽입(들), 결실(들) 및/또는 치환(들)에 의해 변형되거나 또는 돌연변이된 GAA 단백질 또는 이의 단편을 포괄한다. 당분야에 공지된 임의의 GAA 코딩 서열이 사용될 수 있고, 예를 들어, SEQ ID NO: 1; GenBank 수탁 번호 NM_00152 및 문헌 [Hoefsloot et al., (1988) EMBO J. 7: 1697] 및 [Van Hove et al., (1996) Proc. Natl. Acad. Sci. USA 93: 65 (인간)], GenBank 수탁 번호 NM_008064 (마우스), 및 문헌 [Kunita et al., (1997) Biochemica et Biophysica Acta 1362: 269 (메추라기)]을 참조한다.
본 발명의 문맥에서, "GAA의 전구체 형태"는 이의 천연 신호 펩티드를 포함하는 GAA 폴리펩티드의 형태이다. 예를 들어, SEQ ID NO: 12 및 SEQ ID NO: 37의 서열은 인간 GAA (hGAA) 변이체의 전구체 형태이다. SEQ ID NO: 12 및 SEQ ID NO: 37 내에서, 아미노산 잔기 1-27은 hGAA 폴리펩티드의 신호 펩티드에 상응한다.
본 발명의 문맥에서, 본 발명의 절두형 GAA 폴리펩티드는 부모 GAA 폴리펩티드로부터 유래된다. 본 발명에 따라서, "부모 GAA 폴리펩티드"는 상기에 정의된 바와 같이 기능성, 전구체 GAA 서열일 수 있지만, 이의 신호 펩티드는 없을 수 있다. 예를 들어, 야생형 인간 GAA 폴리펩티드를 참조하면, 완전한 야생형 GAA 폴리펩티드 (즉, GAA의 전구체 형태)는 SEQ ID NO: 12 또는 SEQ ID NO: 37로 표시되고 신호 펩티드 (SEQ ID NO: 12 또는 SEQ ID NO: 37의 아미노산 1-27에 상응)를 갖지만, 이들 야생형 인간 GAA 폴리펩티드의 절두된 GAA 형태의 기초로서 제공되는 부모 GAA 폴리펩티드는 SEQ ID NO: 5 및 SEQ ID NO: 36으로 표시되고 신호 펩티드를 갖지 않는다. 이러한 예에서, 후자가 SEQ ID NO: 12의 아미노산 28-952 및 SEQ ID NO: 37의 아미노산 28-952에 상응하고, 부모 GAA 폴리펩티드를 의미한다.
GAA 폴리펩티드의 코딩 서열은 조류 및 포유동물 종을 포함한 임의의 공급원으로부터 유래될 수 있다. 본 명세서에서 사용되는 용어 "조류"는 제한없이 닭, 오리, 거위, 메추라기, 칠면조 및 꿩을 포함한다. 본 명세서에서 사용되는 용어 "포유동물"은 제한없이 인간, 유인원 및 다른 인간이외의 영장류, 소, 양, 염소, 말, 고양이, 개, 토끼목 등을 포함한다. 본 발명의 구체예에서, 본 발명의 핵산은 인간, 마우스 또는 메추라기, 특히 인간, GAA 폴리펩티드를 코딩한다. 추가의 특정 구체예에서, 본 발명의 핵산 분자에 의해 코딩되는 GAA 폴리펩티드는 이의 신호 펩티드가 없는 hGAA에 상응하는 SEQ ID NO: 5 또는 SEQ ID NO: 36으로 표시되는 아미노산 서열을 포함한다 (특히, hGAA의 천연 신호 펩티드는 이의 천연 신호 펩티드를 포함하는 hGAA에 상응하는 SEQ ID NO: 12 또는 SEQ ID NO: 37의 아미노산 1-27에 상응함).
본 발명의 다른 구체예에서, 본 발명의 핵산 분자는 SEQ ID NO: 37의 야생형 hGAA를 코딩하는 서열인, SEQ ID NO: 1로 표시된 서열의 뉴클레오티드 82-2859와 적어도 75% (예컨대 적어도 77%), 적어도 80% 또는 적어도 82% (예컨대 적어도 83%) 동일성을 갖는다 (SEQ ID NO: 1의 뉴클레오티드 1-81은 hGAA의 천연 신호 펩티드를 코딩하는 일부분임).
본 발명의 핵산 분자의 GAA 모이어티는 바람직하게 생체 내 이식유전자 발현을 위해 최적화된 서열인, SEQ ID NO: 13 또는 14의 뉴클레오티드 서열과 적어도 85%, 더 바람직하게 적어도 90%, 및 보다 더 바람직하게 적어도 92% 동일성, 특히 적어도 95% 동일성, 예를 들어 적어도 98%, 99% 또는 100% 동일성을 갖는다.
또한, 본 발명의 핵산 분자가 코딩하는 키메라 GAA 단백질의 신호 펩티드 모이어티는 최종 서열이 기능성 신호 펩티드, 즉 GAA 단백질의 분비를 가능하게 하는 신호 펩티드에 해당하는 한, SEQ ID NO: 2 내지 4에 표시된 서열과 비교하여 1 내지 5개, 특히 1 내지 4개, 특히 1 내지 3개, 보다 특히 1 내지 2개, 특히 1개의 아미노산 결실(들), 삽입(들) 또는 치환(들)을 포함할 수 있다. 특정 구체예에서, 신호 펩티드 모이어티 서열은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 서열로 이루어진다.
용어 "동일한" 및 이의 편차는 2개 핵산 분자 간 서열 동일성을 의미한다. 2개의 비교되는 서열 둘 모두에서 한 위치가 동일한 염기로 점유된 경우, 예를 들어 2개의 DNA 분자 각각의 위치를 아데닌이 점유하고 있으면, 그 분자들은 그 위치에서 동일하다. 2개 서열 간 동일성의 %는 2개 서열이 공유하는 일치된 위치의 개수를 비교된 위치의 개수로 나누고 100을 곱한 함수이다. 예를 들어, 2개 서열에서 10개 위치 중 6개가 일치되면 그 2개 서열은 60%가 동일하다. 일반적으로, 2개 서열을 정렬하여 최대 동일성이 제공될 때 비교한다. 당업자에게 공지된 다양한 생물정보학 도구 예컨대 BLAST 또는 FASTA를 사용하여 핵산 서열을 정렬할 수 있을 것이다.
특정 구체예에서, 본 발명의 핵산 분자의 GAA 모이어티는 SEQ ID NO: 13 또는 SEQ ID NO: 14로 표시된 서열을 포함한다.
본 발명의 핵산 분자는 기능성 GAA 폴리펩티드를 코딩하며, 다시 말해서, 발현될 때, 야생형 GAA 단백질의 기능성을 갖는 인간 GAA 폴리펩티드를 코딩한다. 상기에 정의된 바와 같이, 야생형 GAA의 기능성은 올리고사카라이드 및 폴리사카라이드, 보다 특히 글리코겐의 α-1,4 및 α-1,6 연결부 둘 모두를 가수분해하여 포도당을 유리시키는 것이다. 본 발명의 핵산이 코딩하는 기능성 GAA 폴리펩티드는 SEQ ID NO: 1, SEQ ID NO: 13 또는 SEQ ID NO: 14의 핵산 서열에 의해 코딩되는 야생형 GAA 폴리펩티드 (즉, SEQ ID NO: 5의 아미노산 서열을 갖는 GAA 폴리펩티드)와 비교하여 적어도 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 적어도 100%의 글리코겐에 대한 가수분해 활성을 가질 수 있다. 본 발명의 핵산에 의해 코딩되는 GAA 단백질의 활성은 SEQ ID SEQ ID NO: 1, NO:13 또는 SEQ ID NO: 14의 핵산 서열에 의해 코딩되는 야생형 GAA 폴리펩티드 (즉, SEQ ID NO: 5의 아미노산 서열을 갖는 GAA 폴리펩티드)의 활성의 100% 초과, 예컨대 110%, 120%, 130%, 140%를 초과하거나, 또는 심지어 150%를 초과할 수 있다.
당업자는 본 발명에 따른 핵산이 기능성 GAA 단백질을 발현하는지 여부를 쉽게 결정할 수 있다. 적합한 방법은 당업자에게 자명할 것이다. 예를 들어, 시험관 내 방법으로 적합한 것에는 벡터, 예컨대 플라스미드 또는 바이러스 벡터에 핵산을 삽입시키는 단계, 숙주 세포, 예컨대 293T 또는 HeLa 세포 또는 다른 세포 예컨대 Huh7을 벡터로 형질감염 또는 형질도입시키는 단계, 및 GAA 활성에 대해 어세이하는 단계를 포함한다. 대안적으로, 적합한 생체 내 방법은 폼페 병 또는 다른 당원 축적 질병의 마우스 모델에 핵산을 함유하는 벡터를 형질도입시키는 단계 및 마우스의 혈장 내 기능성 GAA 및 조직 내 GAA의 존재에 대해 어세이하는 단계를 포함한다. 적합한 방법은 하기 실험 부분에서 보다 상세하게 설명된다.
본 발명자는 상기 기술된 핵산 분자가 야생형 GAA cDNA와 비교하여 시험관 내 및 생체 내 둘 모두에서 기능성 GAA 단백질의 높은 수준의 발현을 야기시킨다는 것을 놀랍게도 발견하였다. 더 나아가서, 또한 본 발명자가 확인한 바와 같이, 본 발명의 핵산 분자를 발현하는 간 및 근육 세포로부터 생산된 키메라 GAA 폴리펩티드는 이식유전자에 대해서 체액성 면역 반응을 유도시키지 않는다. 이것은 이 핵산 분자가 GAA 폴리펩티드를 높은 수준으로 생산하는데 사용될 수 있고, 치료적 이득을 제공할 수 있는데, 예컨대 면역억제성 치료에 대한 도움을 제거하고, 저용량 면역억제성 치료를 가능하게 하고, 본 발명의 핵산 분자를 이를 필요로 하는 대상체에게 반복 투여할 수 있게 한다는 것을 의미한다. 그러므로, 본 발명의 핵산 분자는 GAA 발현 및/또는 활성이 결핍된 상황 또는 GAA의 고수준 발현이 질환, 예컨대 당원 축적병을 경감시킬 수 있는 상황에서 특별히 관심이 있다. 특히, 당원 축적병은 GSDI (폰 기에르케병), GSDII (폼페 병), GSDIII (코리병), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 또는 심장의 치명적인 선천성 당원 축적병일 수 있다. 보다 특히, 당원 축적병은 GSDI, GSDII 및 GSDIII으로 이루어진 군, 보다 더 특히 GSDII 및 GSDIII으로 이루어진 군에서 선택된다. 보다 더 특정한 구체예에서, 당원 축적병은 GSDII이다. 특히, 본 발명의 핵산 분자는 GAA-결핍 병태, 또는 글리코겐의 축적과 연관된 다른 병태 예컨대 GSDI (폰 기에르케병), GSDII (폼페 병), GSDIII (코리병), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 및 심장의 치명적인 선천성 당원 축적병, 보다 특히 GSDI, GSDII 또는 GSDIII, 보다 더 특히 GSDII 및 GSDIII를 치료하기 위한 유전자 요법에서 유용할 수 있다. 보다 더 특정한 구체예에서, 본 발명의 핵산 분자는 GSDII를 치료하기 위한 유전자 요법에서 유용할 수 있다.
기능성 GAA를 코딩하는 본 발명의 핵산 분자의 서열은 생체 내에서 GAA 폴리펩티드의 발현을 위해 최적화된다. 서열 최적화는 코돈 최적화, GC 함량의 증가, CpG 아일랜드의 수 감소, 선택적 오픈 리딩 프레임 (alternative open reading frame) (ARF)의 수 감소 및 스플라이스 도너 및 스플라이스 억셉터 부위의 수 감소를 비롯해 핵산 서열 내 많은 변화를 포함할 수 있다. 유전자 코드의 축퇴성때문에, 상이한 핵산 분자가 동일한 단백질을 코딩할 수 있다. 상이한 유기체의 유전자 코드는 종종 다른 것들에 비해 동일한 아미노산을 코딩하는 몇몇 코돈 중 하나를 사용하는 쪽으로 편향된다는 것도 역시 충분히 공지되어 있다. 코돈 최적화를 통해서, 소정 세포 상황에서 존재하는 코돈 편향성을 이용하는 변화를 뉴클레오티드 서열에 도입시켜서 코돈 최적화된 뉴클레오티드 서열이 코돈 비최적화된 서열과 비교하여 비교적 높은 수준으로 이러한 소정 세포 상황에서 더 발현될 수 있도록 할 수 있을 것이다. 본 발명의 바람직한 구체예에서, 절두형 GAA를 코딩하는 이러한 서열 최적화된 뉴클레오티드 서열은 예를 들어 인간 특이적 코돈 용법 편향성을 이용함으로써, 동일한 절두형 GAA 단백질을 코딩하는 코돈 비최적화된 뉴클레오티드 서열과 비교하여 인간 세포에서 이의 발현을 개선시키도록 코돈 최적화된다.
표 3은 본 발명자가 수행한 서열 최적화와 관련된 관련 매개변수의 설명을 제공한다:
표 3. 최적화된 서열의 설명. 표는 야생형 서열과 비교하여 2종의 hGAA 최적화된 서열의 특징을 예시한다. a) 코돈 적합도 지수 및 b) 희귀 코돈 분석 도구 (http://www.genscript.com)를 사용해 계산된 GC 함량. c) 및 d) 는 각각 5'에서 3' (aORF 5'→3') 및 3'에서 5' (aORF 3'→5') 가닥 상에서 계산된 선택적 오픈 리딩 프레임이다. e) 및 f) 는 각각 스플라이싱 부위 온라인 예측 도구 (http://www.fruitfly.org/seq_tools/splice.html)를 사용해 계산된 억셉터 (SA) 및 도너 (SD) 스플라이싱 부위이다. g) 및 h) 는 각각 야생형 (wt) 및 최적화된 co1 서열에 대해서 계산된 %동일성이다. i) MethDB 온라인 도구 (http://www.methdb.de/links.html)를 사용해 계산된 CpG 아일랜드. CpG 아일랜드는 GC 함량 > 60%이고 관찰/기대 비율 > 0.6인, 100 bp보다 긴 서열이다.
특정 구체예에서, 최적화된 GAA 코딩 서열은 SEQ ID NO: 1의 야생형 hGAA 코딩 서열의 뉴클레오티드 82-2859와 비교하여, 코돈 최적화되고/되거나, 증가된 GC 함량을 갖고/갖거나, 감소된 수의 선택적 오픈 리딩 프레임을 갖고/갖거나, 감소된 수의 스플라이스 도너 및/또는 스플라이스 억셉터 부위를 갖는다. 예를 들어, 본 발명의 핵산 서열은 그 결과로 야생형 GAA 서열의 서열과 비교하여 GAA 서열의 GC 함량의 적어도 2, 3, 4, 5 또는 10% 증가가 일어난다. 특정 구체예에서, 본 발명의 핵산 서열은 야생형 GAA 뉴클레오티드 서열의 서열과 비교하여 GAA 서열의 GC 함량의 2, 3, 4 또는 보다 특히, 5% 또는 10% (특히 5%) 증가가 일어난다. 특정 구체예에서, 기능성 GAA 폴리펩티드를 코딩하는 본 발명의 핵산 서열은 SEQ ID NO: 1로 표시된 서열의 뉴클레오티드 82-2859와 "실질적으로 동일하고", 다시 말해서 약 70%가 동일하거나, 더 바람직하게 약 80%가 동일하거나, 보다 더 바람직하게 약 90%가 동일하거나, 보다 더 바람직하게 약 95%가 동일하거나, 보다 더 바람직하게 약 97%, 98% 또는 심지어 99%가 동일하다. 상기에 언급된 바와 같이, GC 함량 및/또는 ARF의 수 이외에도, 서열 최적화는 또한 서열의 CpG 아일랜드의 수 감소 및/또는 스플라이스 도너 및 억셉터 부위의 수 감소를 포함할 수 있다. 물론, 당업자에게 충분히 공지된 바와 같이, 서열 최적화는 모든 이들 매개변수 간의 균형인데, 최적화된 서열이 이식유전자의 개선, 예컨대 생체 내에서 이식유전자에 대한 면역 반응 감소 및/또는 개선된 발현을 유도시키는 한, 상기 매개변수 중 적어도 하나가 개선되지만 나머지 매개변수 중 하나 이상은 그렇지 않다면 서열이 최적화된 것으로 간주될 수 있다는 의미이다.
또한, 인간 세포의 코돈 용법으로 기능성 GAA를 코딩하는 뉴클레오티드 서열의 적합화는 코돈 적합도 지수 (codon adaptation index) (CAI)로서 표시될 수 있다. 본 명세서에서 코돈 적합도 지수는 고도로 발현되는 인간 유전자의 코돈 용법쪽으로 유전자의 코돈 용법의 상대적 적합도의 척도로서 정의된다. 각 코돈의 상대적 적합도 (w)는 동일한 아미노산에 대해 가장 풍부한 코돈에 대한 각 코돈의 용법의 비율이다. CAI는 이들 상대적 적합도 값의 기하 평균으로서 정의된다. 비동의 코돈 및 종결 코돈 (유전자 코드에 의존적)은 배제된다. CAI 값은 0 내지 1의 범위이고, 더 높은 값은 가장 풍부한 코돈이 더 높은 비율이라는 것을 의미한다 (문헌 [Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295] 참조; 또한 문헌 [Kim et al, Gene. 1997, 199:293-301]; [zur Megede et al, Journal of Virology, 2000, 74: 2628-2635] 참조). 바람직하게, GAA를 코딩하는 핵산 분자는 적어도 0.75 (특히 0.77), 0.8, 0.85, 0.90, 0.92 또는 0.94의 CAI를 갖는다.
일 구체예에서, 본 발명의 핵산 분자는 SEQ ID NO: 13 또는 SEQ ID NO: 14의 뉴클레오티드 서열에 의해 코딩되는 단백질에 대해서 0 내지 50개, 0 내지 30개, 0 내지 20개, 0 내지 15개, 0 내지 10개, 또는 0 내지 5개의 아미노산 변화를 갖는 단백질을 코딩한다. 더 나아가서, 본 발명의 핵산에 의해 코딩되는 GAA 단백질은 당분야에 공지된 기능성 GAA 단백질의 변이체일 수 있고, 여기서 본 발명의 핵산 분자는 당분야에 공지된 GAA 단백질에 대해서 0 내지 50개, 0 내지 30개, 0 내지 20개, 0 내지 15개, 0 내지 10개, 또는 0 내지 5개 아미노산 변화를 갖는 단백질을 코딩한다. 기능성 변이체를 디자인하기 위한 기초로서 제공될 수 있는 당분야에 공지된 이러한 GAA 단백질은 GAA의 Uniprot 등재 (수탁 번호 P10253; GenBank CAA68763.1에 상응; SEQ ID NO: 37)에서 확인할 수 있다. 추가의 특정 구체예에서, 본 발명의 핵산 서열의 GAA 모이어티는 변이체 GAA 폴리펩티드, 또는 본 명세서에 정의된 바와 같은 이러한 펩티드의 기능성 변이체, 예컨대 GenBank 수탁 번호 AAA52506.1 (SEQ ID NO: 38), EAW89583.1 (SEQ ID NO: 39) 및 ABI53718.1 (SEQ ID NO: 40)로서 식별되는 폴리펩티드로 이루어진 군에서 선택되는 것들을 코딩한다. 다른 변이체 GAA 폴리펩티드는 WO2012/145644, WO00/34451 및 US6,858,425에 기술된 것들을 포함한다. 특정 구체예에서, 부모 GAA 폴리펩티드는 SEQ ID NO: 12 또는 SEQ ID NO: 37로 표시되는 아미노산 서열로부터 유래된다.
특정 구체예에서, 본 발명의 핵산 분자에 의해 코딩되는 GAA 폴리펩티드는 기능성 GAA이고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5에 표시된 hGAA 단백질과 서열 동일성을 가지며, 임의로 절두 형태가 적어도 80%, 특히 적어도 85%, 90%, 95%, 보다 특히 적어도 96%, 97%, 98%, 또는 99%의 서열 동일성에 대한 기준으로서 고려되면 절두의 수행을 고려한다. 특정 구체예에서, 본 발명의 핵산 분자에 의해 코딩되는 GAA 단백질은 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시된 서열을 갖는다.
폴리펩티드를 언급시 용어 "동일한" 및 이의 편차는 2개의 비교되는 폴리펩티드 서열 내 위치가 동일한 아미노산에 의해 점유되어 있을 때 (예를 들어, 2개 폴리펩티드 각각의 위치가 류신으로 점유되어 있으면), 그 폴리펩티드들은 그 위치가 동일하다는 것을 의미한다. 2개 폴리펩티드 간 동일성의 백분율은 2개 서열이 공유하는 일치된 위치의 수를 비교되는 위치의 수로 나누고 100을 곱한 함수이다. 예를 들어, 2개 폴리펩티드의 10개 위치 중 6개가 일치되면 그 2개 서열은 60%가 동일하다. 일반적으로, 2개의 서열이 최대 동일성을 제공하도록 정렬될 때 비교된다. 당업자에게 공지된 다양한 생물정보학 도구, 예컨대 BLAST 또는 FASTA가 핵산 서열을 정렬시키는데 사용될 수 있다.
용어 "핵산 서열" (또는 핵산 분자)은 단일 또는 이중 가닥 형태의 DNA 또는 RNA 분자, 특히 본 발명에 따른 GAA 단백질을 코딩하는 DNA를 의미한다.
본 발명은 또한 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드를 포함하는 키메라 기능성 GAA 폴리펩티드를 코딩하는 핵산 분자에 관한 것이다.
특히, 본 발명자는 신호 펩티드 교체가 인간 알파-1-항트립신 (hAAT, WO2004064750 및 문헌 [Sun et al. 2006]에 기재된 키메라 GAA 단백질)의 신호 펩티드에 융합된 GAA를 포함하는 이전에 보고된 다른 키메라 GAA 폴리펩티드와 비교하여 기능성 GAA 폴리펩티드를 더 높은 발현 수준 및 더 높은 분비성으로 생산하게 된다는 것을 놀랍게도 더욱 확인하였다. 본 발명의 핵산 분자에서, 신호 펩티드 모이어티는 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 아미노산 서열을 갖는 신호 펩티드를 코딩하는 서열에 상응한다 (달리 본 명세서에서 "대안적 신호 펩티드"라고 함). 본 발명의 핵산 분자는 또한 기능성 GAA 폴리펩티드에 작동적으로 연결된 대안적 신호 펩티드를 포함하는 키메라 GAA 폴리펩티드를 코딩하는 최적화된 서열일 수 있다.
야생형 GAA 폴리펩티드와 비교하여, 야생형 GAA의 내생성 신호 펩티드는 외생성 신호 펩티드, 즉, GAA와 상이한 단백질로부터 유래된 신호 펩티드로 교체된다. GAA 단백질의 나머지에 융합된 외생성 신호 펩티드는 이의 천연 신호 펩티드를 포함하는 상응하는 GAA 폴리펩티드와 비교하여 최종 키메라 GAA 폴리펩티드의 분비성을 증가시킨다. 더 나아가서, 본 발명의 특정한 구체예에 따라서, 대안적 신호 펩티드에 상응하는 뉴클레오티드 서열은 상기 제공된 바와 같은 최적화된 서열일 수 있다.
본 발명에서 활용가능한 신호 펩티드는 이두로네이트-2-술파타제 유래의 아미노산 1-25 (SEQ ID NO: 3), 키모트립시노겐 B2 유래 아미노산 1-20 (SEQ ID NO: 2) 및 프로테아제 C1 억제제 유래 아미노산 1-23 (SEQ ID NO: 4)을 포함한다. SEQ ID NO: 2 내지 SEQ ID NO: 4의 신호 펩티드는 이의 천연 펩티드를 포함하는 GAA, 또는 hAAT의 신호 펩티드를 포함하는 키메라 GAA 단백질과 비교했을 때 시험관 내 및 생체 내 둘 모두에서 키메라 GAA 단백질의 더 높은 분비를 가능하게 한다.
세포로부터 분비되는 새롭게 합성된 GAA의 상대적인 비율은 당분야에 공지되고 실시예에 기술된 방법을 통해서 통상적으로 결정할 수 있다. 분비되는 단백질은 세포 배양 배지, 혈청, 유액 등에서 단백질 활성 어세이 (예를 들어, 효소 어세이)를 통해서 또는 단백질 자체를 직접 측정 (예를 들어, 웨스턴 블롯)하여 검출될 수 있다.
당업자는 키메라 GAA 폴리펩티드가 예를 들어 핵산 구성체의 조작 결과로서, 예컨대 제한효소 부위의 첨가로 인해, 추가적인 아미노산을, 이들 추가적인 아미노산이 신호 펩티드 또는 GAA 폴리펩티드를 비기능성으로 만들지 않는 한, 함유할 수 있다는 것을 더욱 이해하게 될 것이다. 추가적인 아미노산은 보유가 비기능성 폴리펩티드를 야기시키지 않는다면 성숙한 폴리펩티드에 의해 보유될 수 있거나 또는 절단될 수 있다.
더 나아가서, 본 명세서에 기술된 바와 같은 핵산 분자에 의해 코딩되는 키메라 GAA 폴리펩티드는 GAA의 기능성, 절두 형태인 GAA 모이어티를 포함할 수 있다. "절두 형태"란, 부모 GAA 폴리펩티드의 N-말단부로부터 결실된 하나 또는 몇개의 연속되는 아미노산을 포함하는 GAA 폴리펩티드를 의미한다. 그러므로, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 부모 GAA 폴리펩티드의 N-말단 절두 형태일 수 있다. 본 발명에 따라서, "부모 GAA 폴리펩티드"는 신호 펩티드가 없는 GAA 폴리펩티드, 예컨대 신호 펩티드가 없는 GAA의 전구체 형태, 특히 SEQ ID NO: 5, 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시된 hGAA 폴리펩티드이고, 상기 개시된 바와 같은 임의의 변이체일 수 있다. 예를 들어, 전형적인 야생형 인간 GAA 폴리펩티드를 참조하여, 완전한 야생형 GAA 폴리펩티드는 SEQ ID NO: 12 또는 SEQ ID NO: 37로 대표되고, 신호 펩티드를 갖는 반면, 이러한 야생형 인간 GAA 폴리펩티드의 절두된 GAA 형태를 위한 기초로서 제공되는 부모 GAA 폴리펩티드는 각각 SEQ ID NO: 5 또는 SEQ ID NO: 36으로 대표되고, 신호 펩티드를 갖지 않는다. 이러한 예에서, 후자를 부모 GAA 폴리펩티드라고 한다. 이러한 특정한 구체예의 변이체에서, 적어도 하나의 아미노산은 부모 GAA 단백질의 N-말단부로부터 결실된다. 특정 구체예에서, GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부로부터 적어도 1개, 특히 적어도 2개, 특히 적어도 3개, 특히 적어도 4개, 특히 적어도 5개, 특히 적어도 6개, 특히 적어도 7개, 특히 적어도 8개의 연속되는 아미노산이 결실될 수 있다. 예를 들어, GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부로부터 1 내지 75개의 연속되는 아미노산 또는 75개를 초과하는 연속되는 아미노산이 결실될 수 있다. 다른 구체예에서, 상기 GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 최대로 75개, 특히 최대로 70개, 특히 최대로 60개, 특히 최대로 55개, 특히 최대로 50개, 특히 최대로 47개, 특히 최대로 46개, 특히 최대로 45개, 특히 최대로 44개, 특히 최대로 43개의 연속되는 아미노산이 결실된다. 추가의 특정 구체예에서, 상기 GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 최대로 47개, 특히 최대로 46개, 특히 최대로 45개, 특히 최대로 44개, 특히 최대로 43개의 연속되는 아미노산이 결실된다. 특히, 절두된 GAA 모이어티는 부모 GAA 단백질과 비교하여 이의 N-말단부로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74 또는 75개의 연속되는 아미노산이 결실될 수 있다 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 폴리펩티드의 절두 형태). 다른 특정 구체예에서, 상기 GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 1 내지 75개, 특히 1 내지 47개, 특히 1 내지 46개, 특히 1 내지 45개, 특히 1 내지 44개, 특히 1 내지 43개의 연속되는 아미노산이 결실된다. 다른 구체예에서, 상기 GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 2 내지 43개, 특히 3 내지 43개, 특히 4 내지 43개, 특히 5 내지 43개, 특히 6 내지 43개, 특히 7 내지 43개, 특히 8 내지 43개의 연속되는 아미노산이 결실된다 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 폴리펩티드의 절두 형태). 대안적인 명명법을 사용하여, 부모 GAA 폴리펩티드에서 1개 아미노산의 절두로 생성된 GAA 폴리펩티드는 Δ1 GAA 절두 형태라고 하고, N-말단부로부터 2개의 연속되는 아미노산의 절두로 생성된 GAA 폴리펩티드는 Δ2 GAA 절두 형태라고 하며, 부모 GAA 폴리펩티드에서 3개의 연속되는 아미노산의 절두로 생성된 GAA 폴리펩티드는 Δ3 GAA 절두 형태 등이라고 한다. 특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, Δ47, Δ48, Δ49, Δ50, Δ51, Δ52, Δ53, Δ54, Δ55, Δ56, Δ57, Δ58, Δ59, Δ60, Δ61, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74 또는 Δ75의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46 또는 Δ47의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45 또는 Δ46의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44 또는 Δ45의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43 또는 Δ44의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 또는 Δ43의 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)를 포함한다.
특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ6, Δ7, Δ8, Δ9 또는 Δ10 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ7, Δ8 또는 Δ9 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ8 절두 형태이다.
특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ27, Δ28, Δ29, Δ30 또는 Δ31 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ28, Δ29 또는 Δ30 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ29 절두 형태이다.
다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ40, Δ41, Δ42, Δ43 또는 Δ44 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ41, Δ42 또는 Δ43 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ42 절두 형태이다.
다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ41, Δ42, Δ43, Δ44 또는 Δ45 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ42, Δ43 또는 Δ44 절두 형태이고, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ43 절두 형태이다.
다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46 또는 Δ47 절두 형태이다.
다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ7, Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43 또는 Δ44 절두 형태이다.
다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 또는 Δ44 절두 형태이다.
다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ8, Δ29, Δ42, Δ43 또는 Δ47 절두 형태이다.
다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ8, Δ29, Δ42 또는 Δ43 절두 형태이다.
다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ8 또는 Δ42 절두 형태이다.
본 발명의 특정 구체예에서, 본 발명의 키메라 GAA 폴리펩티드는 기능성 부모 인간 GAA 폴리펩티드로부터 유래된 절두형 GAA 모이어티를 포함한다. 추가의 특정 구체예에서, 부모 hGAA 폴리펩티드는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드이다. 이러한 구체예의 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, Δ47, Δ48, Δ49, Δ50, Δ51, Δ52, Δ53, Δ54, Δ55, Δ56, Δ57, Δ58, Δ59, Δ60, Δ61, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74 또는 Δ75 GAA 절두 형태이다. 추가의 특정 구체예에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성 (예를 들어 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성)을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46 또는 Δ47, 특히 Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 또는 Δ44, 특히 Δ8, Δ29, Δ42 또는 Δ43, 특히 Δ8 또는 Δ42 절두 형태이다.
이러한 구체예의 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45 또는 Δ46 GAA 절두 형태이다.
이러한 구체예의 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44 또는 Δ45 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43 또는 Δ44 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 서열을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 또는 Δ42 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 보다 더 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, 또는 Δ43 GAA 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9 또는 Δ10, 특히 Δ7, Δ8 또는 Δ9, 보다 특히 Δ8 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ27, Δ28, Δ29, Δ30 또는 Δ31, 특히 Δ28, Δ29 또는 Δ30, 보다 특히 Δ29 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ40, Δ41, Δ42, Δ43 또는 Δ44, 특히 Δ41, Δ42 또는 Δ43, 보다 특히 Δ42 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ41, Δ42, Δ43, Δ44 또는 Δ45, 특히 Δ42, Δ43 또는 Δ44, 보다 특히 Δ43 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44 또는 Δ45, 특히 Δ7, Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43 또는 Δ44, 특히 Δ8, Δ29, Δ42 또는 Δ43 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 또는 Δ44, 특히 Δ8 또는 Δ42 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8, Δ29, Δ42, Δ43 또는 Δ47 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8, Δ29, Δ42 또는 Δ43 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5와 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8 또는 Δ42 절두 형태이다.
특별한 구체예에서, 본 발명의 키메라 GAA 폴리펩티드의 GAA 모이어티는 SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41, SEQ ID NO: 42 또는 SEQ ID NO: 43으로 표시되는 서열로 이루어진 아미노산 서열, 특히 SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41 또는 SEQ ID NO: 42로 표시되는 서열로 이루어진 아미노산 서열, 특히 SEQ ID NO: 29 또는 SEQ ID NO: 30으로 표시되는 서열로 이루어진 아미노산 서열을 갖는다.
본 발명은 또한 본 발명의 핵산 분자를 포함하는 핵산 구성체에 관한 것이다. 핵산 구성체는 하나 이상의 발현 제어 서열 및/또는 이식유전자의 발현을 개선시키는 다른 서열 및/또는 코딩된 단백질의 분비를 증강시키는 서열 및/또는 코딩된 단백질의 흡수를 증강시키는 서열에 작동적으로 연결된 본 발명의 핵산 서열을 포함하는 발현 카세트에 해당될 수 있다. 본 명세서에서 사용되는 용어 "작동적으로 연결된"은 기능적 관련성의 폴리뉴클레오티드 엘리먼트의 연결을 의미한다. 핵산은 다른 핵산 서열과 기능적 관련성으로 위치될 때 "작동적으로 연결된"다. 예를 들어, 프로모터, 또는 다른 전사 조절성 서열은 코딩 서열의 전사에 영향을 미치면 코딩 서열에 작동적으로 연결되는 것이다. 이러한 발현 제어 서열, 예컨대 프로모터, 인핸서 (예컨대 시스-조절성 모듈 (CRM)), 인트론, 폴리A 신호 등이 당분야에 공지되어 있다.
특히, 발현 카세트는 프로모터를 포함할 수 있다. 프로모터는 편재성 또는 조직-특이적 프로모터, 특히 GAA의 발현이 바람직한 세포 또는 조직 예컨대 GAA 발현이 GAA-결핍 환자에서 바람직한 세포 또는 조직에서 발현을 촉진할 수 있는 프로모터일 수 있다. 특정 구체예에서, 프로모터는 간-특이적 프로모터 예컨대 알파-1 항트립신 프로모터 (hAAT) (SEQ ID NO: 15), 트랜스타이레틴 프로모터, 알부민 프로모터, 타이록신-결합 글로불린 (TBG) 프로모터, LSP 프로모터 (갑상선 호르몬-결합 글로불린 프로모터 서열, 2개 카피의 알파1-마이크로글로불린/비쿠닌 인핸서 서열, 및 리더 서열을 포함함 - 34.Ill, C. R., et al. (1997). Optimization of the human factor VIII complementary DNA expression plasmid for gene therapy of hemophilia A. Blood Coag. Fibrinol. 8: S23-S30.) 등이다. 다른 유용한 간-특이적 프로모터, 예를 들어 Cold Spring Harbor Laboratory 에서 편집한 간 특이적 유전자 프로모터 데이타베이스 (http://rulai.cshl.edu/LSPD/)에 열거된 것들이 당분야에 공지되어 있다. 본 발명의 상황에서 바람직한 프로모터는 hAAT 프로모터이다. 다른 구체예에서, 프로모터는 하나의 관심 조직 또는 세포 (예컨대 근육 세포), 및 간 세포에서 발현을 유도하는 프로모터이다. 예를 들어, 어느 정도로, 근육 세포에 특이적인 프로모터 예컨대 데스민, Spc5-12 및 MCK 프로모터는 간 세포로 약간의 발현 누수가 존재할 수 있는데, 이것은 본 발명의 핵산으로부터 발현되는 GAA 단백질에 대해 대상체의 면역 관용을 유도시키기 위해 유리할 수 있다.
다른 조직-특이적 또는 조직-비특이적 프로모터가 본 발명의 실시에서 유용할 수 있다. 예를 들어, 발현 카세트는 간 특이적 프로모터와 상이한 프로모터인 조직-특이적 프로모터를 포함할 수 있다. 예를 들어 프로모터는 근육-특이적일 수 있고, 예컨대 데스민 프로모터 (및 데스민 프로모터 변이체 예컨대 천연 또는 인공 인핸서를 포함하는 데스민 프로모터), SPc5-12 프로모터 또는 MCK 프로모터일 수 있다. 다른 구체예에서, 프로모터는 다른 세포 계통에 특이적인 프로모터, 예컨대 적혈구 계통의 세포로부터 GAA 폴리펩티드의 발현을 위한, 에리쓰로포이어틴 프로모터이다.
다른 구체예에서, 프로모터는 편재성 프로모터이다. 대표적인 편재성 프로모터는 사이토메갈로바이러스 인핸서/닭 베타 액틴 (CAG) 프로모터, 사이토메갈로바이러스 인핸서/프로모터 (CMV), PGK 프로모터, SV40 초기 프로모터 등을 포함한다.
또한, 프로모터는 또한 내생성 프로모터 예컨대 알부민 프로모터 또는 GAA 프로모터일 수 있다.
특정 구체예에서, 프로모터는 인핸서 서열, 예컨대 시스-조절성 모듈 (CRM) 또는 인공 인핸서 서열과 연관된다. 예를 들어, 프로모터는 인핸서 서열 예컨대 인간 ApoE 제어 영역 (또는 인간 아포리포단백질 E/C-I 유전자의 유전자좌, 간 제어 영역 HCR-1 - GenBank 수탁 번호 U32510, SEQ ID NO: 16으로 표시됨)과 연관될 수 있다. 특정 구체예에서, 인핸서 서열 예컨대 ApoE 서열은 간-특이적 프로모터 예컨대 상기 열거된 것들, 및 특히 예컨대 hAAT 프로모터와 연관된다. 본 발명의 실시에서 유용한 다른 CRM은 문헌 [Rincon et al., Mol Ther. 2015 Jan;23(1):43-52], [Chuah et al., Mol Ther. 2014 Sep;22(9):1605-13] 또는 [Nair et al., Blood. 2014 May 15;123(20):3195-9]에 기술된 것들을 포함한다.
다른 특정 구체예에서, 핵산 구성체는 인트론, 특히 프로모터 및 GAA 코딩 서열 사이에 위치된 인트론을 포함한다. 인트론은 mRNA 안정성 및 단백질 생산을 증가시키기 위해 도입될 수 있다. 추가 구체예에서, 핵산 구성체는 인간 베타 글로빈 b2 (또는 HBB2) 인트론, 응고 인자 IX (FIX) 인트론, SV40 인트론 또는 닭 베타-글로빈 인트론을 포함한다. 다른 추가의 구체예에서, 본 발명의 핵산 구성체는 상기 인트론에 존재하는 선택적 오픈 리딩 프레임 (ARF)의 수를 감소시키거나, 또는 심지어 완전히 제거시키도록 디자인된 변형된 인트론 (특히 변형된 HBB2 또는 FIX 인트론)을 함유한다. 바람직하게, ARF는 50 bp에 걸쳐 포괄된 그 길이가 제거되고 출발 코돈과 인 프레임으로 중지 코돈을 갖는다. ARF는 인트론의 서열을 변형시켜 제거될 수 있다. 예를 들어, 변형은 뉴클레오티드 치환, 삽입 또는 결실에 의해서, 바람직하게 뉴클레오티드 치환에 의해서 수행될 수 있다. 예시로서, 관심 인트론의 서열에 존재하는 ATG 또는 GTG 출발 코돈에서 하나 이상의 뉴클레오티드, 특히 하나의 뉴클레오티드는 비출발 코돈이 생성되도록 교체될 수 있다. 예를 들어, ATG 또는 GTG는 관심 인트론의 서열 내에서, 출발 코돈이 아닌 CTG에 의해 교체될 수 있다.
핵산 구성체에서 사용되는 고전적인 HBB2 인트론은 SEQ ID NO: 6으로 표시된다. 예를 들어, 이러한 HBB2 인트론은 상기 인트론 내에서 출발 코돈 (ATG 및 GTG 코돈)을 제거하여 변형될 수 있다. 특정 구체예에서, 구성체에 포함된 변형된 HBB2 인트론은 SEQ ID NO: 7로 표시된 서열을 갖는다. 핵산 구성체에서 사용되는 고전적인 FIX 인트론은 인간 FIX의 제1 인트론으로부터 유래되고 SEQ ID NO: 8로 표시된다. FIX 인트론은 상기 인트론 내에서 출발 코돈 (ATG 및 GTG 코돈)을 제거하여 변형될 수 있다. 특정 구체예에서, 본 발명의 구성체에 포함된 변형된 FIX 인트론은 SEQ ID NO: 9로 표시된 서열을 갖는다. 핵산 구성체에서 사용되는 고전적인 닭-베타 글로빈 인트론은 SEQ ID NO: 10으로 표시된다. 닭-베타 글로빈 인트론은 상기 인트론 내에서 출발 코돈 (ATG 및 GTG 코돈)을 제거하여 변형될 수 있다. 특정 구체예에서, 본 발명의 구성체에 포함된 변형된 닭-베타 글로빈 인트론은 SEQ ID NO: 11로 표시된 서열을 갖는다.
본 발명자는 이러한 변형된 인트론, 특히 변형된 HBB2 또는 FIX 인트론이 유리한 특성을 가지며 이식유전자의 발현을 상당히 개선시킬 수 있다는 것을 이전에 WO2015/162302에서 확인하였다.
특정 구체예에서, 본 발명의 핵산 구성체는 5'에서 3'의 배향으로, 임의로 인핸서가 선행되는 프로모터, 본 발명의 코딩 서열 (즉, 본 발명의 최적화된 GAA 코딩 서열, 본 발명의 키메라 GAA 코딩 서열, 또는 본 발명의 키메라 및 최적화된 GAA 코딩 서열), 및 폴리아데닐화 신호 (예컨대 소 성장 호르몬 폴리아데닐화 신호, SV40 폴리아데닐화 신호, 또는 다른 천연 발생 또는 인공 폴리아데닐화 신호)를 포함하는 발현 카세트이다. 특정 구체예에서, 본 발명의 핵산 구성체는 5'에서 3'의 배향으로, 임의로 인핸서가 선행된 프로모터, (예컨대 ApoE 제어 영역), 인트론 (특히 상기에 정의된 바와 같은 인트론), 본 발명의 코딩 서열, 및 폴리아데닐화 신호를 포함하는 발현 카세트이다. 추가의 특정 구체예에서, 본 발명의 핵산 구성체는 5'에서 3'의 배향으로, 인핸서 예컨대 ApoE 제어 영역, 프로모터, 인트론 (특히 상기에 정의된 바와 같은 인트론), 본 발명의 코딩 서열, 및 폴리아데닐화 신호를 포함하는 발현 카세트이다. 본 발명의 추가의 특정한 구체예에서, 발현 카세트는 5'에서 3'의 배향으로, ApoE 제어 영역, hAAT-간 특이적 프로모터, HBB2 인트론 (특히 상기에 정의된 바와 같은 변형된 HBB2 인트론), 본 발명의 코딩 서열, 및 소 성장 호르몬 폴리아데닐화 신호를 포함하는 발현 카세트, 예컨대 SEQ ID NO: 2 내지 4로 표시된 신호 펩티드-코딩 서열 각각과 조합된 SEQ ID NO: 13의 서열-최적화된 GAA 핵산 분자를 포함하는, SEQ ID NO: 20 내지 SEQ ID NO: 22 중 어느 하나로 표시된 핵산 구성체를 포함한다. 다른 구체예에서, 발현 카세트는 상기 표 2, 표 2" 또는 표 2", 특히 표 2' 또는 표 2"에 표시된 서열의 조합 중 어느 하나로부터 생성된 코딩 서열을 함유한다.
특정 구체예에서, 발현 카세트는 ApoE 제어 영역, hAAT-간 특이적 프로모터, 코돈-최적화된 HBB2 인트론, 본 발명의 코딩 서열 및 소 성장 호르몬 폴리아데닐화 신호를 포함한다.
본 발명의 핵산 구성체를 디자인하는 경우에, 당업자는 세포 또는 장기로 상기 구성체를 전달하기 위해 사용되는 벡터의 크기 제약에 대해 주의하게 될 것이다. 특히, 당업자는 AAV 벡터의 주요한 한계가 AAV 혈청형마다 다양할 수 있지만 대략 부모 바이러스 게놈의 크기로 제한된다고 여겨지는 이의 카고 수용능이라는 것을 알고 있다. 예를 들어, 5 kb가 일반적으로 AAV8 캡시드에 패키징되는 것으로 여겨지는 최대 크기이다 (Wu Z. et al., Mol Ther., 2010, 18(1): 80-86; Lai Y. et al., Mol Ther., 2010, 18(1): 75-79; Wang Y. et al., Hum Gene Ther Methods, 2012, 23(4): 225-33). 따라서, 당업자는 AAV 5'-ITR 및 3'-ITR을 코딩하는 서열을 포함하는 최종 핵산 서열이, 바람직하게 시행되는 AAV 벡터의 카고 수용능의 110%를 넘지않도록, 특히 바람직하게 5.5 kb를 넘지 않도록 본 발명의 핵산 구성체의 성분을 선택하도록 본 발명을 실시하는데 주의하게 될 것이다.
본 발명은 또한 본 명세서에 개시된 바와 같은 핵산 분자 또는 구성체를 포함하는 벡터에 관한 것이다. 특히, 본 발명의 벡터는 단백질 발현, 바람직하게 유전자 요법에서 사용에 적합한 벡터이다. 일 구체예에서, 벡터는 플라스미드 벡터이다. 다른 구체예에서, 벡터는 본 발명의 핵산 분자, 특히 본 발명의 GAA 폴리펩티드를 코딩하는 메신저 RNA를 함유하는 나노입자이다. 다른 구체예에서, 벡터는 표적 세포의 게놈으로 본 발명의 핵산 분자 또는 구성체의 통합을 가능하게 하는, 트랜스포존을 기반으로 하는 시스템, 예컨대 초활성 슬리핑 뷰티 (SB100X) 트랜스포존 시스템이다 (Mates et al. 2009). 다른 구체예에서, 벡터는 임의의 관심 세포, 예컨대 간 조직 또는 세포, 근육 세포, CNS 세포 (예컨대 뇌 세포), 또는 조혈 줄기 세포 예컨대 적혈구 계통의 세포 (예컨대 적혈구)를 표적으로 하는 유전자 요법에 적합한 바이러스 벡터이다. 이 경우에서, 본 발명의 핵산 구성체는 당분야에서 충분히 공지된 바와 같이, 효율적인 바이러스 벡터를 생산하는데 적합한 서열을 함유한다. 특정 구체예에서, 바이러스 벡터는 통합된 바이러스로부터 유래된다. 특히, 바이러스 벡터는 레트로바이러스 또는 렌티바이러스로부터 유래될 수 있다. 추가의 특정 구체예에서, 바이러스 벡터는 AAV 벡터, 예컨대 간 조직 또는 세포를 형질도입시키는데 적합한 AAV 벡터, 보다 특히 AAV-1, AAV-2 및 AAV-2 변이체 (예컨대 문헌 [Ling et al., 2016 Jul 18, Hum Gene Ther Methods. [Epub ahead of print]]에 개시된, Y44+500+730F+T491V 변화를 갖는 조작된 캡시드를 포함하는 사중-돌연변이체 캡시드 최적화된 AAV-2), AAV-3 및 AAV-3 변이체 (예컨대 문헌 [Vercauteren et al., 2016, Mol. Ther. Vol. 24(6), p. 1042]에 개시된 2개 아미노산 변화, S663V+T492V를 갖는 조작된 AAV3 캡시드를 포함하는 AAV3-ST 변이체), AAV-3B 및 AAV-3B 변이체, AAV-4, AAV-5, AAV-6 및 AAV-6 변이체 (예컨대 문헌 [Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, p.16026]에 개시된 삼중 돌연변이된 AAV6 캡시드 Y731F/Y705F/T492V를 포함하는 AAV6 변이체), AAV-7, AAV-8, AAV-9, AAV-10 예컨대 AAV-cy10 및 AAV-rh10, AAV-rh74, AAV-dj, Anc80, LK03, AAV2i8, 돼지 AAV 혈청형 예컨대 AAVpo4 및 AAVpo6 등의 벡터 또는 레트로바이러스 벡터 예컨대 렌티바이러스 벡터 및 알파-레트로바이러스이다. 당분야에 공지된 바와 같이, 사용에 고려되는 특이적 바이러스 벡터에 따라서, 추가적인 적합한 서열이 기능성 바이러스 벡터를 수득하기 위해 본 발명의 핵산 구성체에 도입될 것이다. 적합한 서열은 AAV 벡터의 경우 AAV ITR, 또는 렌티바이러스 벡터의 경우 LTR을 포함한다. 이와 같이, 본 발명은 또한 각 측면 상에 ITR 또는 LTR이 측접된 상기에 정의된 바와 같은 발현 카세트에 관한 것이다.
바이러스 벡터의 장점은 하기 본 개시 내용의 일부에서 기술한다. 바이러스 벡터, 예컨대 레트로바이러스 벡터, 예를 들어 렌티바이러스 벡터, 또는 비병원성 파보바이러스, 더 바람직하게 AAV 벡터는 본 발명의 핵산 분자 또는 구성체를 전달하는데 바람직하다. 인간 파보바이러스 아데노-연합 바이러스 (AAV)는 잠복 감염을 확고히 하기 위해서 감염된 세포의 게놈으로 통합될 수 있는 천연적으로 복제가 결핍된 디펜도바이러스이다. 마지막 특성은 통합이 염색체 19 (19q13.3-qter) 상에 위치된 AAVS1이라고 불리는 인간 게놈 내 특별한 위치에서 발생되기 때문에 포유동물 바이러스 사이에서 고유한 것으로 보인다.
그러므로, AAV 벡터는 인간 유전자 요법을 위한 잠재적인 벡터로서 상당한 관심이 유발되었다. 바이러스의 바람직한 특성 중에는 임의의 인간 질환과 이의 연관성의 결여, 분열 및 비분열 세포 둘 모두를 감염시키는 이의 능력, 및 감염시킬 수 있는 상이한 조직으로부터 유래된 광범위 세포주가 있다.
충분히 특징규명되고 인간 또는 인간이외의 영장류 (NHP)로부터 단리된 AAV의 혈청형 중에서, 인간 혈청형 2는 유전자 전달 벡터로서 개발된 최초의 AAV이다. 다른 현재 사용되는 AAV 혈청형은 AAV-1, AAV-2 변이체 (예컨대 문헌 [Ling et al., 2016 Jul 18, Hum Gene Ther Methods. [Epub ahead of print]]에 개시된, Y44+500+730F+T491V 변화를 갖는 조작된 캡시드를 포함하는 사중-돌연변이체 캡시드 최적화된 AAV-2), AAV-3 및 AAV-3 변이체 (예컨대 문헌 [Vercauteren et al., 2016, Mol. Ther. Vol. 24(6), p. 1042]에 개시된, 2개 아미노산 변화, S663V+T492V를 갖는 조작된 AAV3 캡시드를 포함하는 AAV3-ST 변이체), AAV-3B 및 AAV-3B 변이체, AAV-4, AAV-5, AAV-6 및 AAV-6 변이체 (예컨대 문헌 [Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, p.16026]에 개시된 삼중 돌연변이된 AAV6 캡시드 Y731F/Y705F/T492V를 포함하는 AAV6 변이체), AAV-7, AAV-8, AAV-9, AAV-10 예컨대 cy10 및 AAV-rh10, AAV-rh74, AAV-dj, Anc80, LK03, AAV2i8, 돼지 AAV 혈청형 예컨대 AAVpo4 및 AAVpo6, 및 AAV 혈청형의 티로신, 리신 및 세린 캡시드 돌연변이체 등을 포함한다. 또한, 다른 비천연의 조작된 변이체 및 키메라 AAV가 또한 유용할 수 있다.
AAV 바이러스는 핵산 서열의 세포 특이적 전달, 면역원성의 최소화, 안정성 및 입자 수명의 조율, 효율적인 분해, 핵으로 정확한 전달을 위해 이들 입자들을 최적화하는 것을 가능하게 만드는 통상의 분자 생물학 기술을 사용해 조작될 수 있다.
벡터로 조립을 위한 바람직한 AAV 단편은 vp1, vp2, vp3 및 초가변 영역을 포함하는 cap 단백질, rep 78, rep 68, rep 52 및 rep 40을 포함하는 rep 단백질, 및 이들 단백질을 코딩하는 서열을 포함한다. 이들 단편은 다양한 벡터 시스템 및 숙주 세포에서 쉽게 이용될 수 있다.
Rep 단백질이 결여된 AAV-기반 재조합 벡터는 낮은 효율성으로 숙주의 게놈으로 통합되고 표적 세포에서 수년 동안 지속될 수 있는 안정한 원형 에피솜으로서 주로 존재한다.
AAV 천연 혈청형을 사용하는 대안으로서, 제한없이, 비천연 발생 캡시드 단백질을 갖는 AAV를 포함하여, 인공 AAV 혈청형이 본 발명의 상황에서 사용될 수 있다. 이러한 인공 캡시드는 상이한 선택된 AAV 혈청형, 동일한 AAV 혈청형의 비인접 부분, 비-AAV 바이러스 공급원, 또는 비바이러스 공급원으로부터 수득될 수 있는 이종성 서열과 조합된 선택된 AAV 서열 (예를 들어, vp1 캡시드 단백질의 단편)을 사용하여, 임의의 적합한 기술을 통해 생성될 수 있다. 인공 AAV 혈청형은 제한없이, 키메라 AAV 캡시드, 재조합 AAV 캡시드, 또는 "인간화" AAV 캡시드일 수 있다.
따라서, 본 발명은 본 발명의 핵산 분자 또는 구성체를 포함하는 AAV 벡터에 관한 것이다. 본 발명의 상황에서, AAV 벡터는 관심 표적 세포, 특히 간세포를 형질도입시킬 수 있는 AAV 캡시드를 포함한다. 특정한 구체예에 따라서, AAV 벡터는 AAV-1, AAV-2, AAV-2 변이체 (예컨대 문헌 [Ling et al., 2016 Jul 18, Hum Gene Ther Methods. [Epub ahead of print]]에 개시된, Y44+500+730F+T491V 변화를 갖는 조작된 캡시드를 포함하는 사중-돌연변이체 캡시드 최적화된 AAV-2), AAV-3 및 AAV-3 변이체 (예컨대 문헌 [Vercauteren et al., 2016, Mol. Ther. Vol. 24(6), p. 1042]에 개시된 2개 아미노산 변화, S663V+T492V를 갖는 조작된 AAV3 캡시드를 포함하는 AAV3-ST 변이체), AAV-3B 및 AAV-3B 변이체, AAV-4, AAV-5, AAV-6 및 AAV-6 변이체 (예컨대 문헌 [Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, p.16026]에 개시된 삼중 돌연변이된 AAV6 캡시드 Y731F/Y705F/T492V 형태를 포함하는 AAV6 변이체), AAV-7, AAV-8, AAV-9, AAV-10 예컨대 AAV-cy10 및 AAV-rh10, AAV-rh74, AAV-dj, Anc80, LK03, AAV2i8, 돼지 AAV 예컨대 AAVpo4 및 AAVpo6, 및 AAV 혈청형의 티로신, 리신 및 세린 캡시드 돌연변이체 등의 혈청형의 것이다. 특정 구체예에서, AAV 벡터는 AAV8, AAV9, AAVrh74 또는 AAV2i8 혈청형의 것이다 (즉, AAV 벡터는 AAV8, AAV9, AAVrh74 또는 AAV2i8 혈청형의 캡시드를 가짐). 추가의 특정 구체예에서, AAV 벡터는 위형화된 벡터로서, 다시 말해서 이의 게놈 및 캡시드는 상이한 혈청형의 AAV로부터 유래된다. 예를 들어, 위형화된 AAV 벡터는 그 게놈이 상기에 언급된 AAV 혈청형 중 하나로부터 유래되고, 그의 캡시드가 다른 혈청형으로부터 유래된 벡터일 수 있다. 예를 들어, 위형화된 벡터의 게놈은 AAV8, AAV9, AAVrh74 또는 AAV2i8 혈청형으로부터 유래된 캡시드를 가질 수 있고, 이의 게놈은 상이한 혈청형으로부터 유래될 수 있다. 특정 구체예에서, AAV 벡터는 AAV8, AAV9 또는 AAVrh74 혈청형의 캡시드, 특히 AAV8 또는 AAV9 혈청형의 캡시드, 보다 특히 AAV8 혈청형의 캡시드를 갖는다.
특별한 구체예에서, 벡터가 근육 세포로 이식유전자를 전달하는데 사용을 위한 경우에, AAV 벡터는 특히 AAV8, AAV9 및 AAVrh74로 이루어진 군에서 선택될 수 있다.
다른 특별한 구체예에서, 벡터가 간 세포로 이식유전자를 전달하는데 사용을 위한 경우에, AAV 벡터는 다른 것들 중에서, AAV5, AAV8, AAV9, AAV-LK03, AAV-Anc80 및 AAV3B로 이루어진 군에서 선택될 수 있다.
다른 구체예에서, 캡시드는 변형된 캡시드이다. 본 발명의 상황에서, "변형된 캡시드"는 하나 이상의 야생형 AAV VP 캡시드 단백질로부터 유래된 하나 이상의 변이체 VP 캡시드 단백질을 포함하는 캡시드 또는 키메라 캡시드일 수 있다.
특정 구체예에서, AAV 벡터는 키메라 벡터이고, 다시 말해서, 이의 캡시드는 적어도 2종의 상이한 AAV 혈청형으로부터 유래된 VP 캡시드 단백질을 포함하거나, 또는 적어도 2종의 AAV 혈청형으로부터 유래된 VP 단백질 영역 또는 도메인이 조합된 적어도 하나의 키메라 VP 단백질을 포함한다. 간 세포를 형질도입시키는데 유용한 이러한 키메라 AAV 벡터의 예는 문헌 [Shen et al., Molecular Therapy, 2007] 및 [Tenney et al., Virology, 2014]에 기술되어 있다. 예를 들어 키메라 AAV 벡터는 상기에 특별히 언급된 임의의 것들과 같은, AAV8 혈청형과 상이한 AAV 혈청형의 서열과 AAV8 캡시드 서열의 조합으로부터 유래될 수 있다. 다른 구체예에서, AAV 벡터의 캡시드는 하나 이상의 변이체 VP 캡시드 단백질 예컨대 WO2015013313에 기술된 것들, 특히 높은 간 향성이 존재하는 RHM4-1, RHM15-1, RHM15-2, RHM15-3/RHM15-5, RHM15-4 및 RHM15-6 캡시드 변이체를 포함한다.
다른 구체예에서, 변형된 캡시드는 에러 프론 PCR 및/또는 펩티드 삽입으로 삽입된 캡시드 변형으로부터 또한 유래될 수 있다 (예를 들어, 문헌 [Bartel et al., 2011]에 기술된 바와 같음). 또한, 캡시드 변이체는 단일 아미노산 변화 예컨대 티로신 돌연변이체를 포함할 수 있다 (예를 들어, 문헌 [Zhong et al., 2008]에 기술된 바와 같음).
또한, AAV 벡터의 게놈은 단일 가닥 또는 자기-상보성 이중-가닥 게놈일 수 있다 (McCarty et al., Gene Therapy, 2003). 자기-상보성 이중-가닥 AAV 벡터는 AAV 말단 반복부 중 하나로부터 말단 분해 부위 (trs)를 결실시켜 생성될 수 있다. 그 복제 게놈이 야생형 AAV 게놈의 절반 길이인 이들 변형된 벡터는 DNA 이량체를 패키징시키는 경향을 갖는다. 바람직한 구체예에서, 본 발명의 실시에서 실행되는 AAV 벡터는 단일 가닥 게놈을 가지며, 더욱 바람직하게는 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 예컨대 AAV8 또는 AAV9 캡시드, 보다 특히 AAV8 캡시드를 포함한다.
특히 바람직한 구체예에서, 본 발명은 단일-가닥 또는 이중-가닥, 자기-상보성 게놈 (예를 들어, 단일-가닥 게놈)에, 본 발명의 핵산 구성체를 포함하는 AAV 벡터에 관한 것이다. 일 구체예에서, AAV 벡터는 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 예컨대 AAV8 또는 AAV9 캡시드, 보다 특히 AAV8 캡시드를 포함한다. 추가의 특정 구체예에서, 상기 핵산은 프로모터, 특히 편재성 또는 간-특이적 프로모터에 작동적으로 연결된다. 특별한 변이체 구체예에 따라서, 프로모터는 편재성 프로모터 예컨대 사이토메갈로바이러스 인핸서/닭 베타 액틴(CAG) 프로모터, 사이토메갈로바이러스 인핸서/프로모터 (CMV), PGK 프로모터 및 SV40 초기 프로모터이다. 특별한 변이체에서, 편재성 프로모터는 CAG 프로모터이다. 다른 변이체에 따라서, 프로모터는 간-특이적 프로모터 예컨대 알파-1 항트립신 프로모터 (hAAT), 트랜스타이레틴 프로모터, 알부민 프로모터 및 타이록신-결합 글로불린 (TBG) 프로모터이다. 특별한 변이체에서, 간-특이적 프로모터는 SEQ ID NO: 15의 hAAT 간-특이적 프로모터이다. 추가의 특정 구체예에서, 본 발명의 AAV 벡터의 게놈에 포함된 핵산 구성체는 프로모터 및 GAA 코딩 서열을 코딩하는 핵산 서열 (즉, 본 발명의 최적화된 GAA 코딩 서열, 본 발명의 키메라 GAA 코딩 서열, 또는 본 발명의 키메라 및 최적화된 GAA 코딩 서열) 사이에 위치하는 인트론을 더 포함한다. AAV 벡터 게놈 내에 도입된 핵산 구성체 내에 포함될 수 있는 대표적인 인트론은 제한없이, 인간 베타 글로빈 b2 (또는 HBB2) 인트론, FIX 인트론 및 닭 베타-글로빈 인트론을 포함한다. AAV 벡터의 게놈 내 상기 인트론은 상기 인트론 내 선택적인 오픈 리딩 프레임 (ARF)의 수를 감소시키거나, 또는 심지어 전체로 제거되도록 디자인된 변형된 인트론일 수 있거나 또는 고전적인 (또는 비변형된) 인트론일 수 있다. 본 발명의 핵산이 AAV 벡터 내에 도입되는 이러한 구체예의 실시에서 사용될 수 있는 변형 및 미변형 인트론은 완전히 상기에 기술되어 있다. 특정 구체예에서, 본 발명의 AAV 벡터, 특히 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 예컨대 AAV8 또는 AAV9 캡시드, 보다 특히 AAV8 캡시드를 포함하는 AAV 벡터는 이의 게놈 내에 변형된 (또는 최적화된) 인트론 예컨대 SEQ ID NO: 7의 변형된 HBB2 인트론, SEQ ID NO: 9의 변형된 FIX 인트론 및 SEQ ID NO: 11의 변형된 닭 베타-글로빈 인트론을 포함한다. 추가의 특정 구체예에서, 본 발명의 벡터는 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 예컨대 AAV8 또는 AAV9 캡시드, 보다 특히 AAV8 캡시드를 포함하고, 5'에서 3'의 배향으로: AAV 5'-ITR (예컨대 AAV2 5'-ITR); ApoE 제어 영역; hAAT-간 특이적 프로모터; HBB2 인트론 (특히 상기 정의된 바와 같은 변형된 HBB2 인트론); 본 발명의 GAA 코딩 서열; 소 성장 호르몬 폴리아데닐화 신호; 및 AAV 3'-ITR (예컨대 AAV2 3'-ITR)을 함유하는 게놈, 예컨대 AAV 5'-ITR (예컨대 AAV2 5'-ITR) 및 AAV 3'-ITR (예컨대 AAV2 3'-ITR)이 측접된 SEQ ID NO: 20, 21 또는 22 (각각이 SEQ ID NO: 5의 부모 hGAA로부터 유래된 GAA의 Δ8 절두 형태를 코딩하는 최적화된 서열에 상응하는 SEQ ID NO: 17, 18 및 19로 표시되는 핵산 서열을 포함함)로 표시되는 핵산을 포함하는 게놈을 포함하는 AAV 벡터이다. 본 발명의 실시에서 유용한 다른 발현 카세트는 상기 표 2, 표 2' 또는 표 2", 특히 표 2' 또는 표 2"에 표시된 서열 조합 중 어느 하나의 신호 펩티드 모이어티 및 GAA 모이어티를 포함한다.
본 발명의 특정 구체예에서, 본 발명의 핵산 구성체는 상기에 기술된 바와 같은 간-특이적 프로모터를 포함하고, 벡터는 상기 기술된 바와 같이 간 조직 또는 세포를 형질도입시킬 수 있는 바이러스 벡터이다. 본 발명자들은 간의 프로관용원성 및 물질대사 특성이 간세포에서 GAA의 분비가능한 형태를 발현시키고 그 단백질에 대한 면역 관용을 유도시키도록 고도로 효율적이고 최적화된 벡터를 개발하기 위한 이러한 구체예 덕분에 유리하게 실행된다는 것을 확인한 데이타를 하기에 제시한다.
또한, 추가의 특정 구체예에서, 본 발명은 관심 세포에서 유전자 전달 및 치료 효능을 개선시키기 위해 2종의 벡터, 예컨대 2종의 바이러스 벡터, 특히 2종의 AAV 벡터의 조합을 제공한다. 예를 들어, 2종의 벡터는 이들 2종 벡터 각각에서 하나의 상이한 프로모터의 제어 하에, 본 발명의 GAA 단백질을 코딩하는 본 발명의 핵산 분자를 운반할 수 있다. 특정 구체예에서, 하나의 벡터는 간-특이적 프로모터 (상기 기술된 것 중 하나)인 프로모터를 포함하고, 나머지 벡터는 당원 축적 질병의 치료를 위해 다른 관심 조직에 특이적인 프로모터, 예컨대 근육-특이적 프로모터, 예를 들어 데스민 프로모터를 포함한다. 이러한 구체예의 특정 변이체에서, 벡터의 이러한 조합은 WO2015196179에 기술된 바와 같이 생산된 다수의 공동-패키징된 AAV 벡터에 상응한다.
다른 양상에서, 본 발명은 신호 펩티드 모이어티 및 GAA 모이어티를 포함하는 키메라 GAA 폴리펩티드를 제공하고, 여기서 천연 발생 GAA 신호 펩티드는 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드로 교체된다. 특정 구체예에서, 본 발명의 키메라 GAA 폴리펩티드는 상기 기술된 바와 같이, GAA의 절두 형태로부터 유래된 폴리펩티드일 수 있다. 예를 들어, 본 발명의 키메라 GAA 단백질은 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되는 신호 펩티드와 이의 N-말단부에서 융합되는, Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, Δ47, Δ48, Δ49, Δ50, Δ51, Δ52, Δ53, Δ54, Δ55, Δ56, Δ57, Δ58, Δ59, Δ60, Δ61, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74 또는 Δ75 GAA 절두 형태 모이어티 (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질의 절두 형태)일 수 있다.
특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ6, Δ7, Δ8, Δ9 또는 Δ10 절두 형태, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ7, Δ8 또는 Δ9 절두 형태, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ8 절두 형태이다.
다른 특정 구체예에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ27, Δ28, Δ29, Δ30 또는 Δ31, 특히 Δ28, Δ29 또는 Δ30, 보다 특히 Δ29 절두 형태이다.
다른 특정 구체예에서, 키메라 GAA 단백질의 GAA 모이어티는 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ40, Δ41, Δ42, Δ43 또는 Δ44 절두 형태, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ41, Δ42 또는 Δ43 절두 형태, 특히 GAA (특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시되는 부모 hGAA 단백질)의 Δ42 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ41, Δ42, Δ43, Δ44 또는 Δ45, 특히 Δ42, Δ43 또는 Δ44, 보다 특히 Δ43 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44 또는 Δ45, 특히 Δ7, Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43 또는 Δ44, 특히 Δ8, Δ29, Δ42 또는 Δ43 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 또는 Δ44, 특히 Δ8 또는 Δ42 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8, Δ29, Δ42, Δ43 또는 Δ47 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8, Δ29, Δ42 또는 Δ43 절두 형태이다.
이 구체예의 다른 변이체에서, 본 발명의 절두형 GAA 폴리펩티드는 hGAA 폴리펩티드, 및 보다 특히 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 hGAA 폴리펩티드, 또는 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1로 표시되는 서열에 아미노산 치환을 포함하고 SEQ ID NO: 1 또는 SEQ ID NO: 33, 특히 SEQ ID NO: 1과 적어도 80, 85, 90, 95, 96, 97, 98 또는 99%의 동일성을 갖는 이의 기능성 변이체의 Δ8 또는 Δ42 절두 형태이다.
특별한 구체예에서, 본 발명의 절두된 hGAA 폴리펩티드는 SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41, SEQ ID NO: 42 또는 SEQ ID NO: 43로 표시되는 서열, 또는 SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41, SEQ ID NO: 42 또는 SEQ ID NO: 43으로 표시된 서열과 비교하여 1 내지 5개 아미노, 특히 1 내지 4개, 특히 1 내지 3개, 보다 특히 1 내지 2개, 특히 1개의 아미노산 치환을 포함하는 이의 기능성 변이체로 이루어진 아미노산 서열을 갖는다. 다른 특정한 구체예에서, 본 발명의 절두된 hGAA 폴리펩티드는 SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41 또는 SEQ ID NO: 42로 표시되는 서열, 또는 SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 41 또는 SEQ ID NO: 42로 표시되는 서열과 비교하여 1 내지 5개의 아미노산 치환을 포함하는 이의 기능성 변이체로 이루어진 아미노산 서열을 갖는다. 특별한 구체예에서, 본 발명의 절두된 hGAA 폴리펩티드는 SEQ ID NO: 29 또는 SEQ ID NO: 30로 표시된 서열, 또는 SEQ ID NO: 29 또는 SEQ ID NO: 30으로 표시된 서열과 비교하여 1 내지 5개 아미노, 특히 1 내지 4개, 특히 1 내지 3개, 보다 특히 1 내지 2개, 특히 1개의 아미노산 치환을 포함하는 이의 기능성 변이체로 이루어진 아미노산 서열을 갖는다 .
특정 구체예에서, 키메라 GAA 폴리펩티드는 상기 표 1, 표 1' 또는 표 1", 특히 표 1' 또는 표 1"에 표시된 조합 중 하나에 의해 생성된 서열을 갖거나, 또는 생성된 서열 조합과 적어도 90% 동일성, 특히 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 이의 기능성 변이체이다.
본 발명은 또한 생체외 유전자 요법의 경우에서 처럼 본 발명의 핵산 분자 또는 구성체로 형질전환되는 세포, 예를 들어 간 세포에 관한 것이다. 본 발명의 세포는 이를 필요로 하는 대상체, 예컨대 GAA-결핍 환자에게, 임의의 적절한 투여 경로 예컨대 상기 대상체의 혈류 또는 간으로의 주사를 통해서 전달될 수 있다. 특정 구체예에서, 본 발명은 본 발명의 핵산을 간 세포, 특히 치료하려는 대상체의 간 세포에 도입시키는 단계, 및 상기 핵산이 도입된 형질전환된 간 세포를 대상체에게 투여하는 단계를 포함한다. 유리하게, 이러한 구체예는 상기 세포로부터 GAA를 분비시키는데 유용하다. 특정 구체예에서, 간 세포는 치료하려는 환자 유래의 간 세포이거나, 또는 환자에게 후속 투여를 위해서 더욱 형질전환시켜, 시험관 내에서 간 세포로 분화시킨 간 줄기 세포이다.
본 발명은 또한 그 게놈에 본 발명에 따른 GAA 단백질을 코딩하는 핵산 분자 또는 구성체를 포함하는 유전자이식된, 인간이외의 동물에 관한 것이다. 특정 구체예에서, 동물은 마우스이다.
하기 실시예에서 구체화되는 특별한 전달 시스템 이외에도, 다양한 전달 시스템이 공지되어 있으며, 예를 들어, 리포솜 내 캡슐화, 미세입자, 미세캡슐, 본 발명의 코딩 서열을 발현할 수 있는 재조합 세포, 수용체-매개 세포내이입, 레트로바이러스 또는 다른 벡터의 일부로서 치료적 핵산의 구축 등이 본 발명의 핵산 분자 또는 구성체를 투여하는데 사용될 수 있다.
구체예에 따라서, 임의의 적합한 경로를 통해서 대상체의 간으로 본 발명의키메라 GAA 폴리펩티드, 핵산 분자, 핵산 구성체 또는 세포를 도입시키는 것이 바람직할 수 있다. 또한 나형 DNA 예컨대 미니서클 및 트랜스포존이 전달 또는 렌티바이러스 벡터로 사용될 수 있다. 추가적으로, 유전자 편집 기술 예컨대 징크 핑거 뉴클레아제, 메가뉴클레아제, TALEN 및 CRISPR가 또한 본 발명의 코딩 서열을 전달하는데 사용될 수 있다.
본 발명은 또한 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드, 또는 세포를 포함하는 약학 조성물을 제공한다. 이러한 조성물은 치료제 (본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포)의 치료적 유효량, 및 약학적으로 허용가능한 담체를 포함한다. 특별한 구체예에서, 용어 "약학적으로 허용가능한"은 U.S. 또는 유럽 약전 또는 다른 일반적으로 동물 및 인간에서 사용에 대해 인정되는 약전에 열거되거나 또는 연방 정부 또는 주정부의 규제 기관이 승인한 것을 의미한다. 용어 "담체"는 치료제와 투여되는 희석제, 보강제, 부형제 또는 비히클을 의미한다. 이러한 약학 담체는 멸균된 액체, 예컨대 물 및 석유, 동물, 식물 또는 합성 기원의 것을 포함하는 오일, 예컨대 땅콩유, 대두유, 미네랄유, 참깨유 등일 수 있다. 물은 약학 조성물이 정맥내로 투여될 때 바람직한 담체이다. 또한 염수 용액 및 수성 덱스트로스 및 글리세롤 용액은 특히 주사용 용액을 위한 액상 담체로서 적용될 수 있다. 적합한 약학 부형제는 전분, 포도당, 락토스, 수크로스, 소듐 스테아레이트, 글리세롤 모노스테아레이트, 탈크, 소듐 클로라이드, 탈지유, 글리세롤, 프로필렌 글리콜, 물, 에탄올 등을 포함한다.
바람직하다면, 조성물은 또한 소량의 습윤제 또는 유화제, 또는 pH 완충제를 함유할 수도 있다. 이들 조성물은 용액제, 현탁제, 에멀션, 정제, 알약, 캡슐, 분말, 지속-방출형 제제 등의 형태를 취할 수 있다. 경구 제제는 표준 담체 예컨대 약학 등급의 만니톨, 락토스, 전분, 마그네슘 스테아레이트, 소듐 사카린, 셀룰로스, 마그네슘 카보네이트 등을 포함할 수 있다. 적합한 약학 담체의 예는 문헌 ["Remington's Pharmaceutical Sciences" by E. W. Martin]에 기술되어 있다. 이러한 조성물은 대상체에게 적절한 투여를 위한 형태를 제공하도록 적합한 양의 담체와 함께, 바람직하게 정제된 형태의 치료제의 치료적 유효량을 함유하게 될 것이다. 특정 구체예에서, 본 발명의 핵산, 벡터 또는 세포는 포스페이트-완충 염수를 포함하고 0.25% 인간 혈청 알부민이 보충된 조성물로 제제화된다. 다른 특정 구체예에서, 본 발명의 핵산, 벡터 또는 세포는 링거 락테이트 및 비이온성 계면활성제, 예컨대 총 조성물의 중량 기준으로 0.01 내지 0.0001%의 최종 농도, 예컨대 0.001%의 농도로 pluronic F68을 포함하는 조성물로 제제화된다. 제제는 혈청 알부민, 특히 인간 혈청 알부민, 예컨대 인간 혈청 알부민을 0.25%로 더 포함할 수 있다. 저장 또는 투여를 위해 적절한 다른 제제는 당분야, 특히 WO 2005/118792 또는 문헌 [Allay et al., 2011]에 공지되어 있다.
바람직한 구체예에서, 조성물은 인간에게 정맥내 투여를 위해 적합화된 약학 조성물로서 통상의 절차에 따라 제제화된다. 전형적으로, 정맥내 투여용 조성물은 멸균된 등장성 수성 완충액의 용액이다. 필요한 경우에, 조성물은 또한 주사 부위의 통능을 완화시키기 위해서 가용화제 및 국소 마취제 예컨대 리그노카인을 포함할 수 있다.
일 구체예에서, 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포는 소포체 특히 리포솜으로 전달될 수 있다. 또 다른 구체예에서, 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포는 제어 방출 시스템으로 전달될 수 있다
본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포의 투여 방법은 제한없이 피부내, 근육내, 복강내, 정맥내, 피하, 비내, 경막외 및 경구 경로를 포함한다. 특정 구체예에서, 투여는 정맥내 또는 근육내 경로를 통한다. 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포는 벡터화되거나 또는 그렇지 않건 무관하게, 임의의 편리한 경로를 통해서, 예를 들어 주입 또는 볼러스 주사를 통해서, 상피 또는 점막피부 내층 (예를 들어, 경구 점막, 직장 및 장 점막 등)을 통한 흡수에 의해 투여될 수 있고 다른 생물학적 활성제와 함께 투여될 수 있다. 투여는 전신이거나 또는 국소일 수 있다.
특별한 구체예에서, 치료를 필요로 하는 영역, 예를 들어 간에 국소적으로 본 발명의 약학 조성물을 투여하는 것이 바람직할 수 있다. 이것은 예를 들어, 임플란트를 통해 수행될 수 있고, 상기 임플란트는 막, 예컨대 시알라스틱 막, 또는 섬유를 포함하는, 다공성, 비다공성 또는 젤라틴성 재료이다.
당원 축적병의 치료에 효율적이게 되는 본 발명의 치료제 (즉, 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포)의 양은 표준 임상 기술을 통해 결정할 수 있다. 또한, 생체 내 및/또는 시험관 내 어세이는 임의로 최적 용량 범위를 예측하는데 도움이 되도록 적용될 수 있다. 제제에 적용되는 정확한 용량은 또한 투여 경로, 및 질환의 심각도에 따라 좌우될 것이고, 의사의 판단 및 각 환자의 상황에 따라 결정되어야 한다. 이를 필요로 하는 대상체에게 투여되는 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포의 용량은 제한없이, 투여 경로, 치료되는 특별한 질환, 대상체의 연령 또는 치료적 효과를 수득하는데 필요한 발현 수준을 포함한 몇몇 인자들을 기반으로 다양하게 될 것이다. 당업자는 당분야에서 이의 지식을 기반으로 하여, 이들 인자 및 다른 것들을 기반으로 요구되는 용량 범위를 쉽게 결정할 수 있다. 바이러스 벡터, 예컨대 AAV 벡터를 대상체에게 투여하는 단계를 포함하는 치료의 경우에서, 벡터의 전형적인 용량은 체중 킬로그램 당 적어도 1x108 벡터 게놈 (vg/kg), 예컨대 적어도 1x109 vg/kg, 적어도 1x1010 vg/kg, 적어도 1x1011 vg/kg, 적어도 1x1012 vg/kg 적어도 1x1013 vg/kg, 또는 적어도 1x1014 vg/kg이다.
본 발명은 또한 이를 필요로 하는 대상체에게 본 발명의 핵산, 벡터, 키메라 폴리펩티드, 약학 조성물 또는 세포의 치료 유효량을 전달하는 단계를 포함하는, 당원 축적병을 치료하기 위한 방법에 관한 것이다.
본 발명은 또한 이를 필요로 하는 대상체에게 본 발명의 핵산 분자, 핵산 구성체, 벡터, 약학 조성물 또는 세포의 치료적 유효량을 전달하는 단계를 포함하는,당원 축적병을 치료하기 위한 방법에 관한 것이고, 상기 방법은 이식유전자 (즉, 본 발명의 키메라 GAA 폴리펩티드)에 대해 면역 반응을 유도하지 않거나, 또는 이식유전자에 대한 감소된 면역 반응을 유도시킨다. 본 발명은 또한 당원 축적병을 치료하기 위한 방법에 관한 것이고, 상기 방법은 이를 필요로 하는 대상체에게 본 발명의 핵산 분자, 핵산 구성체, 벡터, 약학 조성물 또는 세포의 치료적 유효량을 반복 투여하는 단계를 포함한다. 이러한 양상에서, 본 발명의 핵산 분자 또는 핵산 구성체는 간 세포에서 기능성이어서, 이로부터 생산된 발현된 키메라 GAA 폴리펩티드에 대한 면역 관용을 가능하게 하는 프로모터를 포함한다. 역시, 이러한 양상에서, 이 양상에서 사용되는 약학 조성물은 간 세포에서 기능성인 프로모터를 포함하는 핵산 분자 또는 핵산 구성체를 포함한다. 간 세포의 전달의 경우에서, 상기 세포는 치료를 필요로 하는 대상체로부터 이전에 수집되고, 그들에게 본 발명의 핵산 분자 또는 핵산 구성체를 도입하여 본 발명의 키메라 GAA 폴리펩티드를 생산할 수 있게 조작된 세포일 수 있다. 구체예에 따라서, 반복 투여를 포함하는 양상에서, 상기 투여는 적어도 1회 또는 그 이상이 반복될 수 있고, 심지어 주기적인 스케줄에 따라서, 예컨대 1주, 1개월 또는 1년에 1회 수행되는 것이 고려될 수도 있다. 주기적 스케줄은 또한 2, 3, 4, 5, 6, 7, 8, 9 또는 10년 마다 1회, 또는 10년을 초과하여 1회 투여를 포함할 수 있다. 다른 특정 구체예에서, 본 발명의 바이러스 벡터의 각 투여의 투여는 각각의 연속 투여에 대해 상이한 바이러스를 사용하여 수행되고, 그리하여 이전에 투여된 바이러스 벡터에 대한 가능한 면역 반응으로 인한 효능의 감소를 피한다. 예를 들어, AAV8 캡시드를 포함하는 바이러스 벡터의 제1 투여를 수행할 수 있고, 이후에 AAV9 캡시드를 포함하는 벡터의 투여를 후속할 수 있거나, AAV와 비관련된 바이러스, 예컨대 레트로바이러스 또는 렌티바이러스 벡터의 투여가 후속될 수도 있다.
본 발명에 따라서, 치료는 치유, 완화 또는 예방 효과를 포함할 수 있다. 따라서, 치료적 및 예방적 치료는 특정 당원 축적병의 증상의 경감 또는 특정한 당원 축적병의 발생 위험성의 예방 또는 아니면 감소를 포함한다. 용어 "예방적"은 특정 병태의 개시 또는 중증도의 감소로서 간주될 수 있다. "예방적"은 또한 이전에 병태로 진단된 환자에서 특정한 병태의 재발 예방을 포함한다. "치료적"은 또한 존재하는 병태의 중증도를 감소시킬 수 있다. 본 명세서에서 용어 '치료'는 동물, 특히 포유동물, 보다 특히 인간 대상체에게 이득이 될 수 있는 임의의 양생법을 의미하고자 사용된다.
본 발명은 또한 본 발명의 핵산 분자 또는 핵산 구성체를 이를 필요로 하는 환자의 단리된 세포, 예를 들어 단리된 조혈 줄기 세포에 도입시키는 단계, 및 이를 필요로 하는 상기 환자에게 상기 세포를 도입시키는 단계를 포함하는, 당원 축적병의 치료를 위한 생체외 유전자 요법 방법에 관한 것이다. 이러한 양상의 특정한 구체예에서, 핵산 분자 또는 구성체는 상기 정의된 바와 같은 벡터에 의해 세포에 도입된다. 특정 구체예에서, 벡터는 통합성 바이러스 벡터이다. 추가의 특정 구체예에서, 바이러스 벡터는 레트로바이러스 벡터, 예컨대 렌바이러스 벡터이다. 예를 들어, 문헌 [van Til et al., 2010, Blood, 115(26), p. 5329]에 개시된 바와 같은 렌티바이러스 벡터가 본 발명의 방법의 실시에서 사용될 수 있다.
본 발명은 또한 약물로서 사용을 위한 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포에 관한 것이다.
본 발명은 또한 GAA 유전자의 돌연변이에 의해 초래되는 질환을 치료하기 위한 방법, 특히, 폼페 병을 치료하기 위한 방법에서 사용을 위한, 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포에 관한 것이다. 본 발명은 더 나아가서 당원 축적병, 예컨대 GSDI (폰 기에르케병), GSDII (폼페 병), GSDIII (코리병), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 및 심장의 치명적인 선천성 당원 축적병, 보다 특히 GSDI, GSDII 또는 GSDIII, 보다 더 특히 GSDII 및 GSDIII, 및 가장 특히 GSDII를 치료하기 위한 방법에서 사용을 위한, 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포에 관한 것이다. 본 발명의 키메라 GAA 폴리펩티드는 효소 대체 요법 (ERT)에서 사용을 위해, 예컨대 당원 축적병, 예컨대 GSDI (폰 기에르케병), GSDII (폼페 병), GSDIII (코리병), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 및 심장의 치명적인 선천성 당원 축적병, 보다 특히 GSDI, GSDII 또는 GSDIII, 보다 더 특히 GSDII 및 GSDIII 및 가장 특히 GSDII 중 하나의 효소 대체 요법에서 사용을 위해, 이를 필요로 하는 환자에게 투여될 수 있다.
본 발명은 또한 당원 축적병, 예컨대 GSDI (폰 기에르케병), GSDII (폼페 병), GSDIII (코리병), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 및 심장의 치명적인 선천성 당원 축적병, 보다 특히 GSDI, GSDII 또는 GSDIII, 보다 더 특히 GSDII 및 GSDIII, 및 가장 특히 GSDII를 치료하는데 유용한 약물의 제조에서, 본 발명의 핵산 분자, 핵산 구성체, 벡터, 키메라 GAA 폴리펩티드 또는 세포의 용도에 관한 것이다.
실시예
본 발명은 하기 실험 실시예 및 첨부된 도면을 참조하여 보다 상세하게 설명된다. 이들 실시예는 단지 예시의 목적으로 제공되고, 제한하려는 의도가 아니다.
재료 및 방법
GAA 활성
GAA 활성은 증류수 중 냉동 조직 샘플의 균질화 후에 측정하였다. 50-100 mg의 조직을 칭량하고 균질화시키고 나서, 20분 동안 10000 x g에서 원심분리하였다. 반응물은 96웰 플레이트에서 10 μl의 상청액 및 20 μl의 기질 - 4MUα-D-글루코시드를 사용해 설정하였다. 반응 혼합물을 37℃에서 1시간 동안 인큐베이션시킨 후, 150 μl의 소듐 카보네이트 완충액 pH 10.5을 첨가하여 중단시켰다. 449 nm (발광) 및 360 nm (여기)에서 EnSpire 알파 플레이트 판독기 (Perkin-Elmer)를 사용하여, 개별 반응 혼합물로부터 방출된 형광발광성 4MU를 측정하기 위해 표준 곡선 (0-2500 pmol/μl의 4MU)이 사용되었다. 청징된 상청액의 단백질 함량은 BCA (Thermo Fisher Scientific)를 통해 정량하였다. GAA 활성을 계산하기 위해서, 방출된 4MU 농도를 샘플 단백질 농도로 나누었고 활성은 nmol/hour/mg 단백질로서 기록하였다.
글리코겐 함량
글리코겐 ?t량은 상기에 기술된 바와 같이 수득된 조직 균질물의 아스질퍼러스 니거 (Aspergillus Niger) 아밀로글루코시다제에 의한 전체 분해 후 방출된 포도당으로서 간접적으로 측정되었다. 반응물은 20 μl의 조직 균질물 및 55 μl의 증류수로 96웰 플레이트에서 설정되었다. 샘플은 5분 동안 95℃에서 인큐베이션시킨 후 4℃에서 냉각시켰다. 25 μl의 아밀로글루코시다제 (0.1 M 포타슘 아세테이트 pH5.5에 1:50으로 희석)가 각 샘플에 첨가되었다. 아밀로글루코시다제가 없는 대조군 반응물도 역시 각 샘플에 대해 설정되었다. 샘플 및 대조군 반응물 둘 모두는 37℃에서 90분 동안 인큐베이션되었다. 반응은 샘플을 5분 동안 95℃에서 인큐베이션시켜서 중단되었다. 방출된 포도당은 포도당 어세이 키트 (Sigma-Aldrich)를 사용하여 540 nm에서 EnSpire 알파 플레이트 판독기 (Perkin-Elmer)를 사용하여 흡광도를 측정하여 결정되었다.
체적변동기록법 (Plethysmography)
플로우-쓰로우 (0.5 L/분) 체적변동기록법 (EMKA technologies)을 사용하여 대조군 및 Gaa-/- 마우스에서 호흡 패턴을 측정하였다. 투명한 플렉시글라스 챔버를 데이타 수집 전에 기지의 기류 및 압력 신호로 보정하였다. 신호는 IOX2 소프트웨어 (EMKA technologies)를 사용하여 분석하였다. 다음의 변수들을 측정하였다: 호흡 빈도, 1회 호흡량 및 분간 환기량. 환기량 데이타는 5-분 빈으로 수집하였다. 5분은 챔버에 대한 순응을 가능하게 한다. 순응 및 데이타 획득 둘 모두의 경우에, 마우스는 정상 산소 호흡하였다 (21% O2, 79% N2).
마우스 실험
Gaa -/- 마우스는 엑손 6의 표적화 파괴에 의해 생성시켰고 C57BL/6J/129X1/SvJ 백그라운드로 유지되었다 (Raben N. et al 1998). 벡터는 0.2 mL의 부피로 꼬리 정맥을 통해서 전달되었다. 혈청 샘플은 분비된 hGAA의 수준을 모니터링하기 위해 매월 수집되었다. PBS-주사된 영향받은 동물 및 야생형 한배새끼가 대조군으로서 사용되었다.
항-hGAA 항체 결정
Maxisorp 96 웰 플레이트 (Thermo Fisher Scientific)는 카보네이트 완충액 중 Myozime® 단백질로 4℃에서 밤새 코팅시켰다. 래트 재조합 IgG의 표준 곡선 (Sigma Aldrich)은 1 μg/mL로부터 시작하여 7회 2배 희석으로 웰에 코딩하였다. 차단 후, 혈장 샘플을 플레이트에 첨가하였고 1시간 동안 37℃에서 인큐베이션시켰다. 검출은 3,3',5,5'-테트라메틸벤지딘 기질 (BD Biosciences)을 웰에 첨가하여 수행하였고, H2SO4로 반응을 차단시킨 후 Enspire 플레이트 판독기 (Perkin Elmer) 상에 450 및 570 nm (백그라운드 감산용)에서 발색을 측정하였다.
NHP 실험
수컷 사이노몰거스 마카크를 스테인레스강 케이지에 수용하였고 12시간 명암 주기로 유지시켰다. 모든 마카크는 실험 시작 전에 < 1:5의 중화 항체 역가를 가졌다. 2E12 vg/kg 용량의 AAV8-hAAT-sp7-Δ8-hGAAco1을 대복재 정맥을 통해서 주입하였다. 혈액 샘플은 대퇴정맥을 통한 주사 전 12일 및 주사 후 30일에 채혈하였다. 전혈은 EDTA 함유 튜브에 채혈하였고 원심분리하여 혈청을 분리시켰다. 벡터 투여 후 3개월에 모든 마카크를 안락사시켰다. 동물들은 먼저 케타민/덱스메데토미딘의 혼합물로 마취시키고 나서 IV 주사되는 소듐 펜토바비탈을 사용해 안락사시켰다. 조직을 즉시 수집하였고 액체 질소에서 동결시켰다.
웨스턴 블롯 분석
전체 균질물을 동결된 근육으로부터 수득하였다. 단백질 농도는 제조사의 지시서에 따라서, Pierce BCA 단백질 어세이 (Thermo Fisher Scientific)를 통해 추출물에서 결정하였다. 웨스턴 블롯은 항 hGAA 항체 (Abcam)를 사용해 수행하였다. 항-튜불린 항체 (Sigma Aldrich)를 로딩 대조군으로서 사용하였다.
결과
폼페 병에 대한 현행 유전자 대체 요법을 개선시키고자 하는 노력으로, 우리는 야생형 신호 펩티드 (본 명세서에서 sp1로 표시됨)를 hGAA의 서열 최적화된 서열 (SEQ ID NO: 13)의 상이한 신호 펩티드 (sp2 내지 8, 표 4에 기술됨)로 교체시켜 이의 분비성이 증가되도록 hGAA 서열을 조작하였다.
표 4
우리는 간세포암 세포 (Huh-7)를 신호 펩티드 1 내지 8과 융합된 코돈 최적화된 hGAA (hGAAco)를 발현하는 플라스미드와 함께 GFP 또는 야생형 hGAA (hGAA; SEQ ID NO: 37)를 발현하는 플라스미드로 형질감염시켰다. 형질감염 후 48시간에, 성장 배지를 hGAA의 존재에 대해서 분석하였다. 특히 효율적인 신호 펩티드를 보유한 구성체 중 오직 4개만이 GFP-형질감염된 세포를 통해서 나타나는 음성 대조군에서 관찰된 것보다 유의하게 더 높은 hGAA의 분비 수준을 야기시켰다 (도 1A). 신호 펩티드 sp2, sp6, sp7 및 sp8을 보유하는 hGAA 키메라 단백질을 발현하는 구성체는 배지에서 더 높은 수준의 hGAA를 분비하였다 (GFP 대비 p < 0.05).
다음으로 우리는 삼중 형질감염 및 세슘 클로라이드 정제를 통해서 제조된 AAV8 벡터에 이들 구성체를 패키징하였고 그들을 야생형 C57BL/6J 마우스에게 주사하였다. 이어서 우리는 신호 펩티드 sp1, 2, 3, 7 및 8 (도 1B)이 사용된 구성체에 대해 생체 내 GAA 혈청 수준을 비교하였다. hGAAco를 발현하는 AAV8 벡터 1E12 vg/kg의 주사 후 1개월에 우리는 PBS 주사된 마우스와 비교하여 유의하게 더 높은 수준의 순환형 hGAA를 관찰하였다. 흥미롭게도, 순환형 hGAA의 수준은 sp2, 7 및 8과 융합된 hGAAco를 발현하는 벡터로 처치된 마우스에서 유의하게 더 높았다. 놀랍게도, 생체 내에서 sp2 구성체에 의해 획득된 분비 수준은 sp7- 및 sp8- 조작된 hGAA에서 측정된 것보다 유의하게 낮았다 (도 1B). 이들 데이타를 함께 취합하면 간에서 효율적으로 분비된 단백질로부터 유래된 신호 펩티드로 야생형 신호 펩티드의 치환이 생체 내에서 hGAA의 순환 수준을 증가시키는 효과적인 전략이라는 것을 의미한다. 게다가, sp7 및 8 신호 펩티드로 생체 내에서 수득된 예상치 않은 결과들은 모든 신호 펩티드가 생체 내에서 균등하게 효율적이지는 않고, 신호 펩티드 sp7 및 sp8이 sp1 및 sp2와 비교하여 생체 내에서 우수한 분비 효능을 유발시킨다는 것을 의미한다.
다음으로 질환의 동물 모델, GAA -/- 마우스에서 이러한 발견들을 확증하였다. 이 마우스 모델은 근력 손상 및 수명 감소를 초래하는, 상이한 장기 내 글리코겐 축적과 함께, 근육 내 효소의 잔류 활성이 존재하지 않았다.
GAA-/- 마우스에서 폼페 병 표현형의 구제에서 상이한 벡터의 유효성을 비교하기 위해서, 우리는 2E12 vg/kg의 hGAAco를 발현하는 벡터 및 신호 펩티드 sp2, 7 및 8과 융합된 조작된 형태의 주사의 효과를 장기간 동안 추적하였다. 주사 후 3개월에, 우리는 고도로 효율적인 신호 펩티드 sp2, 7 및 8을 보유하는 hGAAco를 발현하는 AAV8을 주사한 후 유의하게 증가된 순환형 hGAA를 관찰하였다 (도 2A). 특히, sp7 신호 펩티드가 융합된 hGAAco는 다른 2종의 구성체에서 관찰된 것보다 유의하게 더 높은 순환 hGAA의 수준을 야기시켰다. 이 실험에서 장기간의 추적조사는 GAA -/- 마우스의 생존을 추정할 수 있게 하였다. 마우스는 4개월령에 주사되었고 이후에 6개월 동안 추적조사되었다. 이 기간 동안 PBS 주사된 그룹에서 8/10 GAA-/- 마우스가 폐사된 반면 hGAAco 발현 구성체가 처치된 GAA-/- 동물 및 야생형 동물에서 단지 1/45 폐사가 기록되었다. 이러한 결과의 통계적 유의성 (도 2B)은 분비 수준과 독립적으로 모든 hGAAco 발현 벡터의 처치가 GAA -/- 마우스에서 관찰된 치명적인 표현형을 구제한다는 것을 의미한다. 이 마우스 모델에서 보고된 다른 표현형은 호흡 기능의 감소이다. 특히, 감소된 1회 호흡량이 보고되었고 (DeRuisseau et al PNAS 2008) 이러한 감소는 신경계에서 글리코겐의 축적에 기인한다는 것이 입증되었다. 신경계에서 글리코겐 수준의 구제는 혈관-뇌 장벽을 관통하는 hGAA의 능력에 의존적이고 이 단백질의 순환 수준에 직접적으로 의존한다는 것이 다른 리소솜 축적 질병에서 입증되었다 (Polito et al Hum. Mol. Genet. 2010, Cho et al Orph. J. of Rare Dis. 2015). 그러므로, 우리는 GAA -/- 마우스의 1회 호흡량에 대한 hGAA의 장기간, 높은 순환 수준의 효과를 평가하였다. 주사 후 3개월에, 유의하지는 않지만 (p = 0.104), GAA -/- 마우스는 감소된 1회 호흡량을 보인데 반해 sp7이 처치된 마우스는 WT 마우스에서 관찰된 것과 매우 유사한 1회 호흡량을 보였다 (p = 0.974) (도 2C, 좌측). 주사 후 6개월에, 오직 2마리의 GAA -/- 마우스가 생존하였고 그들은 덜 심각한 호흡 표현형을 갖는 것으로 나타났다. 역시, sp7 hGAAco로 처치된 마우스는 WT 동물에서 관찰된 것과 유사한 1회 호흡량을 가졌다 (p= 0.969) (도 2C, 우측). 중요하게, sp1 및 sp7 hGAAco가 처치된 마우스에서 측정된 1회 호흡량 간 통계적으로 유의한 편차 (p = 0.041)가 확인되어, sp7-GAA 처치된 마우스에서 보다 두드러진 개선이 확인되었다. 이들 데이타를 취합하면, sp7 신호 펩티드가 융합된 hGAAco를 발현하는 AAV8이 형질도입된 간은 GAA-/- 마우스에서 호흡기 기능의 완전한 표현형 교정을 수반하는 혈중 hGAA의 우수한 수준을 야기한다는 것을 의미한다.
다음으로 높은 수준의 순환형 hGAA가 골격근에서 글리코겐 축적을 구제하는지 여부를 검증하였다. 우리는 상기 기술된 바와 같이 주사된 마우스의 사두근에서 hGAA 활성을 측정하였다. hGAA 발현 벡터의 주사는 WT 동물에서 관찰된 것과 비슷한 수준으로 사두근 내 hGAA 활성의 증가를 야기시켰다 (도 3A). 사두근에서 글리코겐의 측정은 GAA -/- 마우스가 WT 동물보다 ∼20배 더 많이 글리코겐을 축적시킨다는 것을 의미한다 (p = 3.5E-6). 이러한 축적은 hGAA 발현 벡터의 처치로 반전되며 (GAA-/- 대비 p < 0.05), sp7가 있는 경우에 야생형 동물의 수준과 구별되지 않는, 최저 글리코겐 수준을 보였다 (WT 대비 p = 0.898) (도 3B).
효율적인 신호 펩티드와 hGAA의 융합이 생체 내에서 이의 분비를 개선시키고 질환의 표현형 보정을 증가시키는 것을 검증하기 위해서, 우리는 GAA -/- 마우스에게 저용량의 벡터를 주사하였고, 표현형의 생화학적 교정을 평가하였다. 신호 펩티드 1, 7 및 8과 융합된 hGAAco를 발현하는 벡터 6E11 vg/kg의 주사 후 3개월에, 우리는 순환형 hGAA를 측정하였다. 특히 sp 7 및 8은 PBS-처치 마우스와 비교하여 혈청에서 검출가능한 분비된 hGAA의 3배 증가를 야기하였다 (도 4A). 우리는 처치된 동물 및 대조군 유래 조직의 생화학적 분석을 수행하여 hGAAco를 발현하는 AAV8 벡터의 치료적 효과를 더욱 조사하였다. 우리는 상기에 기술된 바와 같이 처치된 GAA -/- 마우스의 심장, 횡격막 및 사두근에서 글리코겐 함량을 평가하였다. 특히, 우리는 hGAAco 발현 벡터로 처치 후 조직 내에서 hGAA의 고수준을 관찰하였고 (데이타는 도시하지 않음) 이것은 고려된 모든 조직에서 글리코겐 함량의 유의한 감소와 관련되었다 (도 4B-D). 특히, 심장 (도 4B)에서 고도로 효율적인 신호 펩티드 sp7 및 8을 보유하는 벡터로 처치 후 측정된 글리코겐의 수준은 영향받지 않은 야생형 동물에서 관찰된 것과 구별되지 않았다 (야생형 대비 각각 p = 0.983 및 0.996). 중요하게, sp7 및 sp8 벡터 둘 모두를 처치 후 관찰된 수준은 PBS-주사되거나 또는 야생형 hGAaco 발현 벡터 (sp1로 표시)로 처치된 GAA -/- 동물과 비교하여 유의하게 감소되었다.
우리는 우리의 벡터가 형질도입된 간이 이식유전자에 대해서 체액성 반응을 유도하였는지 여부를 검사하였다. 마우스는 간 특이적 프로모터의 전사 제어 하에서 sp2, sp7 또는 sp8과 융합된 Δ8-hGAAco1 또는 천연 sp1 신호 펩티드 (co)를 갖는 hGAAco1을 발현하는 AAV8 벡터가 정맥내 주사되었다. 결과는 도 5에 나타내었다. 항상성 프로모터의 전사 제어 하에서 Δ8-hGAAco1을 발현하는 AAV가 근육내로 주사된 Gaa-/-는 매우 높은 수준의 전체 IgG (∼150 μg/mL)를 보인데 반해서, 일반적으로 간에서 동일한 단백질을 발현하는 벡터는 더 낮은 수준의 체액성 반응을 보였다. 흥미롭게도, sp1 hGAAco1 (co) 발현 벡터가 주사된 마우스는 양쪽 용량에서 검출가능한 수준의 항체를 보였는데 반해서, 조작된 높은 분비 벡터가 주사된 마우스는 검출불가한 IgG 수준을 가졌다. 이들 데이타는 간에서 이식유전자의 발현이 말초 관용의 유도에 필수적이라는 것을 의미하고, 또한 그들은 효율적인 신호 펩티드와의 융합으로 획득된 hGAA의 높은 순환 수준이 단백질 그 자체에 대한 체액성 반응의 감소를 유도한다는 지표를 제공한다.
마우스 실험에서 선택된 최고 수행 벡터를 2마리의 인간외 영장류 (NHP, 마카카 파시쿨라리스 (Macaca Fascicularis) 종)에게 주사하여 근육에서 우리 벡터의 분비 및 흡수 효능을 검증하였다. 우리는 2마리 원숭이에게 2E12 vg/kg의 AAV8-hAAT-sp7-Δ8-hGAAco1을 주사하였다. 주사 후 1개월에 우리는 특이적 항-hGAA 항체를 사용한 웨스턴 블롯을 통해서 2마리 동물의 혈청에서 hGAA의 수준을 측정하였다. 우리는 2마리 원숭이에서 hGAA의 것과 호환되는 크기의 분명한 밴드를 관찰하였다. 이 밴드는 벡터 주사 전 12일에 수득된 혈청 샘플에서는 존재하지 않았고, 따라서 우리의 검출 방법의 특이도가 확증되었다 (도 6A). 주사 후 3개월에 우리는 동물들을 희생시켰고 조직을 수득하여 혈류 중 간에서 분비된 hGAA가 근육에 의해 효율적으로 흡수되었는지를 검증하였다. 우리는 2마리 원숭이의 이두근 및 횡격막으로부터 수득된 전체 용해물 상에서 hGAA에 특이적인 항체를 사용하여 웨스턴을 수행하였다. 흥미롭게 우리는 역시 혈류에서 최고 수준의 hGAA를 보여준 2번 동물에서 분명한 밴드를 관찰할 수 있었다 (도 6B). 또한, 1번 동물에서 우리는 분석된 양쪽 근육의 hGAA의 것과 일관된 분자량의 보다 희미한 밴드를 관찰할 수 있었다. 이들 데이타는 AAV8-hAAT-sp7-Δ8-hGAAco1 벡터가 NHP의 간에서 효율적으로 형질도입된다는 것을 의미한다. 또한 그들은 혈류에서 분비된 단백질이 근육에서 효율적으로 흡수되고 이러한 흡수는 혈액에서 측정된 hGAA의 수준과 관련된다는 것을 입증한다.
우리는 상이한 GAA 형태 (모두 코돈 최적화됨): 1. 천연 sp1 GAA 신호 펩티드를 포함하는 천연 GAA (co), 2. 이종성 sp7 또는 sp8 신호 펩티드를 함유하는 조작된 GAA (sp7-co, sp8-co)가 형질감염된 HuH7 세포의 용해물 및 배지에서 GAA 활성의 분석을 더욱 수행하였다. 이 분석은 천연 GAA (co)와 비교하여 조작된 형태가 형질감염된 세포의 배지에서 유의하게 더 높은 GAA 활성을 보여주었다 (도 7). 흥미롭게, 대신 세포내 GAA 활성이 조작된 형태와 비교하여 천연 GAA (co)를 사용시 유의하게 더 높았고, 이것은 천연 GAA가 주로 세포 내에서 유지된다는 것을 의미한다.
우리는 또한 GSDIII의 마우스 모델에서 마우스 실험에서 선택된 최고 수행 벡터 (AAV8-hAAT-sp7-Δ8-hGAAco1)의 효과를 결정하였다. 우리는 글리코겐 탈분지 효소 (GDE)에 대한 넉아웃 마우스 모델을 개발하였다. 이러한 모델은 제III형 당원 축적병 (GSDIII)이 걸린 인간에서 관찰된 질병의 표현형을 요약한다. 특히 GDE 활성이 완전하게 결여된 GDE -/- 마우스는 근력 손상을 가지며 상이한 조직에서 글리코겐이 축적된다. 흥미롭게 그들은 또한 간에서 글리코겐이 축적되는데 이것은 역시 인간에서도 확인된다. 여기서 우리는 간에서 sp7-Δ8-hGAA의 과발현이 GDE -/- 마우스에서 관찰된 글리코겐 축적을 구제하는지 여부를 검사하였다. 우리는 GDE-/- 마우스에게 1E11 또는 1E12 vg/마우스의 AAV8-hAAT-sp7-Δ8-hGAAco1을 주사하였다. 대조군으로서 야생형 (WT) 및 GDE -/- 마우스에게 PBS를 동시에 주사하였다. 벡터 투여 후 3개월에, 마우스를 희생시켰고 간에서 글리코겐의 수준을 정량하였다. 그 결과는 도 8에 기록되어 있다. 이미 보고된 바와 같이 (Pagliarani 등 및 우리의 모델), GDE -/- 마우스는 야생형 동물과 비교시 글리코겐이 5배 더 많게 간에서 글리코겐 축적의 유의한 증가를 보였다 (p=1.3E-7). 놀랍게도, 1E11 및 1E12 vg/마우스의 AAV8-hAAT-sp7-Δ8-hGAAco1 벡터 처치는 글리코겐 함량의 통계적으로 유의한 감소를 유도하였다 (각각 p=4.5E-5 및 1.4E-6). 중요하게, AAV8-hAAT-sp7-Δ8-hGAAco1 벡터가 주사된 마우스의 간에서 측정된 글리코겐의 수준은 특히 최고 용량에서 야생형 동물에서 측정된 것과 구별되지 않았다 (1E11 용량 코호트의 경우 p = 0.053 및 1E12 용량 코호트의 경우 0.244).
우리는 상이한 GAA 형태 (모두 코돈-최적화됨): 1. 천연 sp1 GAA 신호 펩티드 (co)를 포함하는 천연 GAA, 2. 이종성 sp7 신호 펩티드 (sp7-co)를 함유하는 조작된 GAA, 및 3. 다양한 수의 아미노산의 결실 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co 및 sp7-Δ62-co로서, 여기서 SEQ ID NO: 5의 처음 N-말단 아미노산의 8, 29, 42, 47 및 62가 각각 결실됨)이 후속되는 이종성 sp7 신호 펩티드를 함유하는 조작된 GAA가 형질감염된 HuH7 세포의 용해물 및 배지에서 GAA 활성의 분석을 수행하였다. 분석은 양쪽의 조작된 비결실 GAA (sp7-co) 및 천연 GAA (co)와 비교하여 Δ8, Δ29, Δ42 및 Δ43 GAA 형태가 형질감염된 세포의 배지에서 유의하게 더 높은 GAA 활성을 보여주었다 (도 9). 대신에 유의하게 더 낮은 GAA 활성이 다른 조작된 GAA 형태 [결실된 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) 및 비결실된 (sp7-co)]와 비교하여 Δ47 및 Δ62 GAA 형태로 형질감염된 세포의 배지에서 관찰되었다. 흥미롭게, (도 10) 세포내 GAA 활성은 생산적 결실 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) 및 비결실 형태 (sp7-co) 간에 차이가 없어서 그들이 모두 세포내에서 효율적으로 생산되어 프로세싱된다는 것을 의미한다. 대신 세포내 GAA 활성은 sp7-Δ47-co 및 sp7-Δ62-co 형태의 경우에 매우 낮았고 모든 다른 조작된 형태 [결실된 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) 및 비결실된 (sp7-co)]와 비교시 유의하게 낮았다.
우리는 또한 상이한 GAA 형태 (모두 코돈 최적화됨): 1. 천연 sp1 GAA 신호 펩티드 (co)를 포함하는 천연 GAA, 2. 이종성 sp6 또는 sp8 신호 펩티드 (sp6-co, sp8-co)를 함유하는 조작된 GAA, 및 3. 8 아미노산 (sp6-Δ8-co, sp8-Δ8-co)의 결실이 후속되는 이종성 sp6 또는 sp8 신호 펩티드를 함유하는 조작된 GAA로 형질감염된 HuH7 세포의 용해물 및 배지에서 GAA 활성의 분석을 수행하였다. 분석은 (도 11) i. 그들의 개별적인 조작된 비결실된 GAA 형태 (sp6-co 또는 sp8-co); 및 ii. 천연 GAA (co)와 비교하여 Δ8 형태가 형질감염된 세포의 배지에서 유의하게 더 높은 GAA 활성을 보였다. 흥미롭게, 세포내 GAA 활성은 모든 조작된 GAA 형태 (결실 및 비결실 둘 모두) 간에 차이가 없어서 그들이 모두 세포내에서 효율적으로 생산되어 프로세싱된다는 것을 의미한다 (세포 용해물 패널). 대신에 세포내 GAA 활성은 조작된 형태와 비교하여 천연 GAA (co)를 사용하여 유의하게 더 높았고, 천연 GAA가 주로 세포 내에서 유지된다는 것을 의미한다.
<110> GENETHON et al.
<120> ACID-ALPHA GLUCOSIDASE VARIANTS AND USES THEREOF
<130> B2298PC00
<160> 54
<170> PatentIn version 3.3
<210> 1
<211> 2859
<212> DNA
<213> homo sapiens
<400> 1
atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60
ttggcaaccg cagcgctcct ggggcacatc ctactccatg atttcctgct ggttccccga 120
gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180
agcagaccag ggccccggga tgcccaggca caccccgggc ggccgcgagc agtgcccaca 240
cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300
gaacagtgcg aggcccgcgg ctgttgctac atccctgcaa agcaggggct gcagggagcc 360
cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420
ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480
cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540
ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcatgtc 600
cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660
atcgtgcgcc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720
tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780
gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840
cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900
ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960
gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020
atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080
ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140
accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200
cagtggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260
ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320
atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380
ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440
tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500
gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560
gagccttcca acttcatcag gggctctgag gacggctgcc ccaacaatga gctggagaac 1620
ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680
agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740
atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800
tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 1860
tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920
ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980
tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040
ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100
ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160
gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220
gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280
gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccagta 2340
gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400
gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460
gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520
atggccctgg ctgtggccct gaccaagggt ggggaggccc gaggggagct gttctgggac 2580
gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640
aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700
ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760
gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820
ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859
<210> 2
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> sp7
<400> 2
Met Ala Phe Leu Trp Leu Leu Ser Cys Trp Ala Leu Leu Gly Thr Thr
1 5 10 15
Phe Gly
<210> 3
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> sp6
<400> 3
Met Pro Pro Pro Arg Thr Gly Arg Gly Leu Leu Trp Leu Gly Leu Val
1 5 10 15
Leu Ser Ser Val Cys Val Ala Leu Gly
20 25
<210> 4
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> sp8
<400> 4
Met Ala Ser Arg Leu Thr Leu Leu Thr Leu Leu Leu Leu Leu Leu Ala
1 5 10 15
Gly Asp Arg Ala Ser Ser
20
<210> 5
<211> 925
<212> PRT
<213> Artificial Sequence
<220>
<223> hGAAwt w/o sp
<400> 5
Gly His Ile Leu Leu His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser
1 5 10 15
Gly Ser Ser Pro Val Leu Glu Glu Thr His Pro Ala His Gln Gln Gly
20 25 30
Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro
35 40 45
Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp
50 55 60
Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly
65 70 75 80
Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly
85 90 95
Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu
100 105 110
Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr
115 120 125
Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val
130 135 140
Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala
145 150 155 160
Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val His Ser Arg
165 170 175
Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly
180 185 190
Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr
195 200 205
Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser
210 215 220
Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu
225 230 235 240
Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu
245 250 255
Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu
260 265 270
Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser
275 280 285
Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg
290 295 300
Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro
305 310 315 320
Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met
325 330 335
Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser
340 345 350
Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala His
355 360 365
Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg
370 375 380
Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met
385 390 395 400
Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp
405 410 415
Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp
420 425 430
Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro
435 440 445
Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr
450 455 460
Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe His
465 470 475 480
Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser
485 490 495
Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu
500 505 510
Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala
515 520 525
Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu
530 535 540
His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu
545 550 555 560
Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe
565 570 575
Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser
580 585 590
Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn
595 600 605
Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly
610 615 620
Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe
625 630 635 640
Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu
645 650 655
Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu
660 665 670
Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln
675 680 685
Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe
690 695 700
Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly
705 710 715 720
Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val
725 730 735
Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro
740 745 750
Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu
755 760 765
Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu
770 775 780
Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln
785 790 795 800
Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu
805 810 815
Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp
820 825 830
Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln
835 840 845
Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg
850 855 860
Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu
865 870 875 880
Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val
885 890 895
Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val
900 905 910
Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
915 920 925
<210> 6
<211> 441
<212> DNA
<213> Artificial Sequence
<220>
<223> HBB2 intron
<400> 6
gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60
cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120
gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180
atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240
aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300
ttattttatg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360
tcatgttcat acctcttatc ttcctcccac agctcctggg caacgtgctg gtctgtgtgc 420
tggcccatca ctttggcaaa g 441
<210> 7
<211> 441
<212> DNA
<213> modified HBB2 intron
<400> 7
gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60
cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120
gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180
atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240
aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300
ttattttctg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360
tcttgttcat acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc 420
tggcccatca ctttggcaaa g 441
<210> 8
<211> 1438
<212> DNA
<213> Artificial Sequence
<220>
<223> FIX intron
<400> 8
ggtttgtttc cttttttaaa atacattgag tatgcttgcc ttttagatat agaaatatct 60
gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120
acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180
atttttaaaa ctaaatagat cgacaatgct tatgatgcat ttatgtttaa taaacactgt 240
tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300
aaattaaaag tgggaaaaca aagaaatagc agaatatagt gaaaaaaaat aaccacatta 360
tttttgtttg gacttaccac tttgaaatca aaatgggaaa caaaagcaca aacaatggcc 420
ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480
aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540
cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600
ggaaaaaatc attttgtctc tatgtcaaac atcttggagt tgatatttgg ggaaacacaa 660
tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720
agttagctaa tgcaacatat atcactttgt tttttcacaa ctacagtgac tttatgtatt 780
tcccagagga aggcatacag ggaagaaatt atcccatttg gacaaacagc atgttctcac 840
aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900
accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960
cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020
tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080
agggtgatgg atcactttgc aaagatcctc aatgagctat tttcaagtga tgacaaagtg 1140
tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200
agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260
cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320
aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 1380
aaattttcat gatgttttct tttttgctaa aactaaagaa ttattctttt acatttca 1438
<210> 9
<211> 1438
<212> DNA
<213> Artificial Sequence
<220>
<223> modified FIX intron
<400> 9
ggtttgtttc cttttttaaa atacattgag tatgcttgcc ttttagatat agaaatatct 60
gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120
acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180
atttttaaaa ctaaatagat cgacattgct tttgttgcat ttatgtttaa taaacactgt 240
tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300
aaattaaaag tgggaaaaca aagaaatagc agaatatagt gaaaaaaaat aaccacatta 360
tttttgtttg gacttaccac tttgaaatca aattgggaaa caaaagcaca aacaatggcc 420
ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480
aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540
cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600
ggaaaaaatc attttgtctc tttgtcaaac atcttggagt tgatatttgg ggaaacacaa 660
tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720
agttagctat tgcaacatat atcactttgt tttttcacaa ctacagtgac tttttgtatt 780
tcccagagga aggcatacag ggaagaaatt atcccatttg gacaaacagc ttgttctcac 840
aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900
accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960
cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020
tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080
agggtgttgg atcactttgc aaagatcctc attgagctat tttcaagtgt tgacaaagtg 1140
tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200
agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260
cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320
aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 1380
aaattttctt gttgttttct tttttgctaa aactaaagaa ttattctttt acatttca 1438
<210> 10
<211> 881
<212> DNA
<213> Artificial Sequence
<220>
<223> chicken beta-globin intron
<400> 10
gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60
gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120
tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 180
aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420
gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480
cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540
tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600
ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660
cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 720
gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780
cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 840
gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881
<210> 11
<211> 881
<212> DNA
<213> Artificial Sequence
<220>
<223> modified chicken beta-globin intron
<400> 11
gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60
gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120
tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 180
aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420
gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480
cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540
tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600
ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660
cggctgtcga ggcgcggcga gccgcagcca ttgccttttt tggtaatcgt gcgagagggc 720
gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780
cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaat tgggcgggga 840
gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881
<210> 12
<211> 952
<212> PRT
<213> homo sapiens
<400> 12
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940
Glu Gln Phe Leu Val Ser Trp Cys
945 950
<210> 13
<211> 2778
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAco1 w/o sp
<400> 13
ggccatatcc tgctgcacga ctttctacta gtgcccagag agctgagcgg cagctctccc 60
gtgctggaag aaacacaccc tgcccatcag cagggcgcct ctagacctgg acctagagat 120
gcccaggccc accccggcag acctagagct gtgcctaccc agtgtgacgt gccccccaac 180
agcagattcg actgcgcccc tgacaaggcc atcacccagg aacagtgcga ggccagaggc 240
tgctgctaca tccctgccaa gcagggactg cagggcgctc agatgggaca gccctggtgc 300
ttcttcccac cctcctaccc cagctacaag ctggaaaacc tgagcagcag cgagatgggc 360
tacaccgcca ccctgaccag aaccaccccc acattcttcc caaaggacat cctgaccctg 420
cggctggacg tgatgatgga aaccgagaac cggctgcact tcaccatcaa ggaccccgcc 480
aatcggagat acgaggtgcc cctggaaacc ccccacgtgc actctagagc ccccagccct 540
ctgtacagcg tggaattcag cgaggaaccc ttcggcgtga tcgtgcggag acagctggat 600
ggcagagtgc tgctgaacac caccgtggcc cctctgttct tcgccgacca gttcctgcag 660
ctgagcacca gcctgcccag ccagtacatc acaggactgg ccgagcacct gagccccctg 720
atgctgagca catcctggac ccggatcacc ctgtggaaca gggatctggc ccctacccct 780
ggcgccaatc tgtacggcag ccaccctttc tacctggccc tggaagatgg cggatctgcc 840
cacggagtgt ttctgctgaa ctccaacgcc atggacgtgg tgctgcagcc tagccctgcc 900
ctgtcttgga gaagcacagg cggcatcctg gatgtgtaca tctttctggg ccccgagccc 960
aagagcgtgg tgcagcagta tctggatgtc gtgggctacc ccttcatgcc cccttactgg 1020
ggcctgggat tccacctgtg cagatggggc tactccagca ccgccatcac cagacaggtg 1080
gtggaaaaca tgaccagagc ccacttccca ctggatgtgc agtggaacga cctggactac 1140
atggacagca gacgggactt caccttcaac aaggacggct tccgggactt ccccgccatg 1200
gtgcaggaac tgcatcaggg cggcagacgg tacatgatga tcgtggatcc cgccatcagc 1260
tcctctggcc ctgccggctc ttacagaccc tacgacgagg gcctgcggag aggcgtgttc 1320
atcaccaacg agacaggcca gcccctgatc ggcaaagtgt ggcctggcag cacagccttc 1380
cccgacttca ccaatcctac cgccctggct tggtgggagg acatggtggc cgagttccac 1440
gaccaggtgc ccttcgacgg catgtggatc gacatgaacg agcccagcaa cttcatccgg 1500
ggcagcgagg atggctgccc caacaacgaa ctggaaaatc ccccttacgt gcccggcgtc 1560
gtgggcggaa cactgcaggc cgctacaatc tgtgccagca gccaccagtt tctgagcacc 1620
cactacaacc tgcacaacct gtacggcctg accgaggcca ttgccagcca ccgcgctctc 1680
gtgaaagcca gaggcacacg gcccttcgtg atcagcagaa gcacctttgc cggccacggc 1740
agatacgccg gacattggac tggcgacgtg tggtcctctt gggagcagct ggcctctagc 1800
gtgcccgaga tcctgcagtt caatctgctg ggcgtgccac tcgtgggcgc cgatgtgtgt 1860
ggcttcctgg gcaacacctc cgaggaactg tgtgtgcggt ggacacagct gggcgccttc 1920
taccctttca tgagaaacca caacagcctg ctgagcctgc cccaggaacc ctacagcttt 1980
agcgagcctg cacagcaggc catgcggaag gccctgacac tgagatacgc tctgctgccc 2040
cacctgtaca ccctgtttca ccaggcccat gtggccggcg agacagtggc cagacctctg 2100
tttctggaat tccccaagga cagcagcacc tggaccgtgg accatcagct gctgtgggga 2160
gaggctctgc tgattacccc agtgctgcag gcaggcaagg ccgaagtgac cggctacttt 2220
cccctgggca cttggtacga cctgcagacc gtgcctgtgg aagccctggg atctctgcct 2280
ccacctcctg ccgctcctag agagcctgcc attcactctg agggccagtg ggtcacactg 2340
cctgcccccc tggataccat caacgtgcac ctgagggccg gctacatcat accactgcag 2400
ggacctggcc tgaccaccac cgagtctaga cagcagccaa tggccctggc cgtggccctg 2460
accaaaggcg gagaagctag gggcgagctg ttctgggacg atggcgagag cctggaagtg 2520
ctggaaagag gcgcctatac ccaagtgatc ttcctggccc ggaacaacac catcgtgaac 2580
gagctggtgc gcgtgacctc tgaaggcgct ggactgcagc tgcagaaagt gaccgtgctg 2640
ggagtggcca cagcccctca gcaggtgctg tctaatggcg tgcccgtgtc caacttcacc 2700
tacagccccg acaccaaggt gctggacatc tgcgtgtcac tgctgatggg agagcagttt 2760
ctggtgtcct ggtgctga 2778
<210> 14
<211> 2778
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAco2 w/o sp
<400> 14
ggacacatcc tgctgcacga cttcctgttg gtgcctagag agctgagcgg atcatcccca 60
gtgctggagg agactcatcc tgctcaccaa cagggagctt ccagaccagg accgagagac 120
gcccaagccc atcctggtag accaagagct gtgcctaccc aatgcgacgt gccacccaac 180
tcccgattcg actgcgcgcc agataaggct attacccaag agcagtgtga agccagaggt 240
tgctgctaca tcccagcgaa gcaaggattg caaggcgccc aaatgggaca accttggtgt 300
ttcttccccc cttcgtaccc atcatataaa ctcgaaaacc tgtcctcttc ggaaatgggt 360
tatactgcca ccctcaccag aactactcct actttcttcc cgaaagacat cttgaccttg 420
aggctggacg tgatgatgga gactgaaaac cggctgcatt tcactatcaa agatcctgcc 480
aatcggcgat acgaggtccc tctggaaacc cctcacgtgc actcacgggc tccttctccg 540
ctttactccg tcgaattctc tgaggaaccc ttcggagtga tcgttagacg ccagctggat 600
ggtagagtgc tgttgaacac tactgtggcc ccacttttct tcgctgacca gtttctgcaa 660
ctgtccactt ccctgccatc ccagtacatt actggactcg ccgaacacct gtcgccactg 720
atgctctcga cctcttggac tagaatcact ttgtggaaca gagacttggc ccctactccg 780
ggagcaaatc tgtacggaag ccaccctttt tacctggcgc tcgaagatgg cggatccgct 840
cacggagtgt tcctgctgaa tagcaacgca atggacgtgg tgctgcaacc ttcccctgca 900
ctcagttgga gaagtaccgg gggtattctg gacgtgtaca tcttcctcgg accagaaccc 960
aagagcgtgg tgcagcaata tctggacgtg gtcggatacc cttttatgcc tccttactgg 1020
ggactgggat tccacctttg ccgttggggc tactcatcca ccgccattac cagacaggtg 1080
gtggagaata tgaccagagc ccacttccct ctcgacgtgc agtggaacga tctggactat 1140
atggactccc ggagagattt caccttcaac aaggacgggt tccgcgattt tcccgcgatg 1200
gttcaagagc tccaccaggg tggtcgaaga tatatgatga tcgtcgaccc agccatttcg 1260
agcagcggac ccgctggatc ttatagacct tacgacgaag gccttaggag aggagtgttc 1320
atcacaaacg agactggaca gcctttgatc ggtaaagtgt ggcctggatc aaccgccttt 1380
cctgacttta ccaatcccac tgccttggct tggtgggagg acatggtggc cgaattccac 1440
gaccaagtcc cctttgatgg aatgtggatc gatatgaacg aaccaagcaa ttttatcaga 1500
ggttccgaag acggttgccc caacaacgaa ctggaaaacc ctccttatgt gcccggagtc 1560
gtgggcggaa cattacaggc cgcgactatt tgcgccagca gccaccaatt cctgtccact 1620
cactacaacc tccacaacct ttatggatta accgaagcta ttgcaagtca cagggctctg 1680
gtgaaggcta gagggactag gccctttgtg atctcccgat ccacctttgc cggacacggg 1740
agatacgccg gtcactggac tggtgacgtg tggagctcat gggaacaact ggcctcctcc 1800
gtgccggaaa tcttacagtt caaccttctg ggtgtccctc ttgtcggagc agacgtgtgt 1860
gggtttcttg gtaacacctc cgaggaactg tgtgtgcgct ggactcaact gggtgcattc 1920
tacccattca tgagaaacca caactccttg ctgtccctgc cacaagagcc ctactcgttc 1980
agcgagcctg cacaacaggc tatgcggaag gcactgaccc tgagatacgc cctgcttcca 2040
cacttataca ctctcttcca tcaagcgcat gtggcaggag aaaccgttgc aaggcctctt 2100
ttccttgaat tccccaagga ttcctcgact tggacggtgg atcatcagct gctgtgggga 2160
gaagctctgc tgattactcc agtgttgcaa gccggaaaag ctgaggtgac cggatacttt 2220
ccgctgggaa cctggtacga cctccagact gtccctgttg aagcccttgg atcactgcct 2280
ccgcctccgg cagctccacg cgaaccagct atacattccg agggacagtg ggttacatta 2340
ccagctcctc tggacacaat caacgtccac ttaagagctg gctacattat ccctctgcaa 2400
ggaccaggac tgactacgac cgagagcaga cagcagccaa tggcactggc tgtggctctg 2460
accaagggag gggaagctag aggagaactc ttctgggatg atggggagtc ccttgaagtg 2520
ctggaaagag gcgcttacac tcaagtcatt ttccttgcac ggaacaacac cattgtgaac 2580
gaattggtgc gagtgaccag cgaaggagct ggacttcaac tgcagaaggt cactgtgctc 2640
ggagtggcta ccgctcctca gcaagtgctg tcgaatggag tccccgtgtc aaactttacc 2700
tactcccctg acactaaggt gctcgacatt tgcgtgtccc tcctgatggg agagcagttc 2760
cttgtgtcct ggtgttga 2778
<210> 15
<211> 397
<212> DNA
<213> Artificial Sequence
<220>
<223> hAAT promoter
<400> 15
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 360
cagcttcagg caccaccact gacctgggac agtgaat 397
<210> 16
<211> 321
<212> DNA
<213> Artificial Sequence
<220>
<223> ApoE control region
<400> 16
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg g 321
<210> 17
<211> 2808
<212> DNA
<213> Artificial Sequence
<220>
<223> sp7+hGAAco1-delta-8
<400> 17
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggcctacta 60
gtgcccagag agctgagcgg cagctctccc gtgctggaag aaacacaccc tgcccatcag 120
cagggcgcct ctagacctgg acctagagat gcccaggccc accccggcag acctagagct 180
gtgcctaccc agtgtgacgt gccccccaac agcagattcg actgcgcccc tgacaaggcc 240
atcacccagg aacagtgcga ggccagaggc tgctgctaca tccctgccaa gcagggactg 300
cagggcgctc agatgggaca gccctggtgc ttcttcccac cctcctaccc cagctacaag 360
ctggaaaacc tgagcagcag cgagatgggc tacaccgcca ccctgaccag aaccaccccc 420
acattcttcc caaaggacat cctgaccctg cggctggacg tgatgatgga aaccgagaac 480
cggctgcact tcaccatcaa ggaccccgcc aatcggagat acgaggtgcc cctggaaacc 540
ccccacgtgc actctagagc ccccagccct ctgtacagcg tggaattcag cgaggaaccc 600
ttcggcgtga tcgtgcggag acagctggat ggcagagtgc tgctgaacac caccgtggcc 660
cctctgttct tcgccgacca gttcctgcag ctgagcacca gcctgcccag ccagtacatc 720
acaggactgg ccgagcacct gagccccctg atgctgagca catcctggac ccggatcacc 780
ctgtggaaca gggatctggc ccctacccct ggcgccaatc tgtacggcag ccaccctttc 840
tacctggccc tggaagatgg cggatctgcc cacggagtgt ttctgctgaa ctccaacgcc 900
atggacgtgg tgctgcagcc tagccctgcc ctgtcttgga gaagcacagg cggcatcctg 960
gatgtgtaca tctttctggg ccccgagccc aagagcgtgg tgcagcagta tctggatgtc 1020
gtgggctacc ccttcatgcc cccttactgg ggcctgggat tccacctgtg cagatggggc 1080
tactccagca ccgccatcac cagacaggtg gtggaaaaca tgaccagagc ccacttccca 1140
ctggatgtgc agtggaacga cctggactac atggacagca gacgggactt caccttcaac 1200
aaggacggct tccgggactt ccccgccatg gtgcaggaac tgcatcaggg cggcagacgg 1260
tacatgatga tcgtggatcc cgccatcagc tcctctggcc ctgccggctc ttacagaccc 1320
tacgacgagg gcctgcggag aggcgtgttc atcaccaacg agacaggcca gcccctgatc 1380
ggcaaagtgt ggcctggcag cacagccttc cccgacttca ccaatcctac cgccctggct 1440
tggtgggagg acatggtggc cgagttccac gaccaggtgc ccttcgacgg catgtggatc 1500
gacatgaacg agcccagcaa cttcatccgg ggcagcgagg atggctgccc caacaacgaa 1560
ctggaaaatc ccccttacgt gcccggcgtc gtgggcggaa cactgcaggc cgctacaatc 1620
tgtgccagca gccaccagtt tctgagcacc cactacaacc tgcacaacct gtacggcctg 1680
accgaggcca ttgccagcca ccgcgctctc gtgaaagcca gaggcacacg gcccttcgtg 1740
atcagcagaa gcacctttgc cggccacggc agatacgccg gacattggac tggcgacgtg 1800
tggtcctctt gggagcagct ggcctctagc gtgcccgaga tcctgcagtt caatctgctg 1860
ggcgtgccac tcgtgggcgc cgatgtgtgt ggcttcctgg gcaacacctc cgaggaactg 1920
tgtgtgcggt ggacacagct gggcgccttc taccctttca tgagaaacca caacagcctg 1980
ctgagcctgc cccaggaacc ctacagcttt agcgagcctg cacagcaggc catgcggaag 2040
gccctgacac tgagatacgc tctgctgccc cacctgtaca ccctgtttca ccaggcccat 2100
gtggccggcg agacagtggc cagacctctg tttctggaat tccccaagga cagcagcacc 2160
tggaccgtgg accatcagct gctgtgggga gaggctctgc tgattacccc agtgctgcag 2220
gcaggcaagg ccgaagtgac cggctacttt cccctgggca cttggtacga cctgcagacc 2280
gtgcctgtgg aagccctggg atctctgcct ccacctcctg ccgctcctag agagcctgcc 2340
attcactctg agggccagtg ggtcacactg cctgcccccc tggataccat caacgtgcac 2400
ctgagggccg gctacatcat accactgcag ggacctggcc tgaccaccac cgagtctaga 2460
cagcagccaa tggccctggc cgtggccctg accaaaggcg gagaagctag gggcgagctg 2520
ttctgggacg atggcgagag cctggaagtg ctggaaagag gcgcctatac ccaagtgatc 2580
ttcctggccc ggaacaacac catcgtgaac gagctggtgc gcgtgacctc tgaaggcgct 2640
ggactgcagc tgcagaaagt gaccgtgctg ggagtggcca cagcccctca gcaggtgctg 2700
tctaatggcg tgcccgtgtc caacttcacc tacagccccg acaccaaggt gctggacatc 2760
tgcgtgtcac tgctgatggg agagcagttt ctggtgtcct ggtgctga 2808
<210> 18
<211> 2829
<212> DNA
<213> Artificial Sequence
<220>
<223> sp6+hGAAco1-delta-8
<400> 18
atgcctccac ctagaacagg cagaggcctg ctgtggctgg gcctggtgct gtctagtgtg 60
tgtgtggccc tgggcctact agtgcccaga gagctgagcg gcagctctcc cgtgctggaa 120
gaaacacacc ctgcccatca gcagggcgcc tctagacctg gacctagaga tgcccaggcc 180
caccccggca gacctagagc tgtgcctacc cagtgtgacg tgccccccaa cagcagattc 240
gactgcgccc ctgacaaggc catcacccag gaacagtgcg aggccagagg ctgctgctac 300
atccctgcca agcagggact gcagggcgct cagatgggac agccctggtg cttcttccca 360
ccctcctacc ccagctacaa gctggaaaac ctgagcagca gcgagatggg ctacaccgcc 420
accctgacca gaaccacccc cacattcttc ccaaaggaca tcctgaccct gcggctggac 480
gtgatgatgg aaaccgagaa ccggctgcac ttcaccatca aggaccccgc caatcggaga 540
tacgaggtgc ccctggaaac cccccacgtg cactctagag cccccagccc tctgtacagc 600
gtggaattca gcgaggaacc cttcggcgtg atcgtgcgga gacagctgga tggcagagtg 660
ctgctgaaca ccaccgtggc ccctctgttc ttcgccgacc agttcctgca gctgagcacc 720
agcctgccca gccagtacat cacaggactg gccgagcacc tgagccccct gatgctgagc 780
acatcctgga cccggatcac cctgtggaac agggatctgg cccctacccc tggcgccaat 840
ctgtacggca gccacccttt ctacctggcc ctggaagatg gcggatctgc ccacggagtg 900
tttctgctga actccaacgc catggacgtg gtgctgcagc ctagccctgc cctgtcttgg 960
agaagcacag gcggcatcct ggatgtgtac atctttctgg gccccgagcc caagagcgtg 1020
gtgcagcagt atctggatgt cgtgggctac cccttcatgc ccccttactg gggcctggga 1080
ttccacctgt gcagatgggg ctactccagc accgccatca ccagacaggt ggtggaaaac 1140
atgaccagag cccacttccc actggatgtg cagtggaacg acctggacta catggacagc 1200
agacgggact tcaccttcaa caaggacggc ttccgggact tccccgccat ggtgcaggaa 1260
ctgcatcagg gcggcagacg gtacatgatg atcgtggatc ccgccatcag ctcctctggc 1320
cctgccggct cttacagacc ctacgacgag ggcctgcgga gaggcgtgtt catcaccaac 1380
gagacaggcc agcccctgat cggcaaagtg tggcctggca gcacagcctt ccccgacttc 1440
accaatccta ccgccctggc ttggtgggag gacatggtgg ccgagttcca cgaccaggtg 1500
cccttcgacg gcatgtggat cgacatgaac gagcccagca acttcatccg gggcagcgag 1560
gatggctgcc ccaacaacga actggaaaat cccccttacg tgcccggcgt cgtgggcgga 1620
acactgcagg ccgctacaat ctgtgccagc agccaccagt ttctgagcac ccactacaac 1680
ctgcacaacc tgtacggcct gaccgaggcc attgccagcc accgcgctct cgtgaaagcc 1740
agaggcacac ggcccttcgt gatcagcaga agcacctttg ccggccacgg cagatacgcc 1800
ggacattgga ctggcgacgt gtggtcctct tgggagcagc tggcctctag cgtgcccgag 1860
atcctgcagt tcaatctgct gggcgtgcca ctcgtgggcg ccgatgtgtg tggcttcctg 1920
ggcaacacct ccgaggaact gtgtgtgcgg tggacacagc tgggcgcctt ctaccctttc 1980
atgagaaacc acaacagcct gctgagcctg ccccaggaac cctacagctt tagcgagcct 2040
gcacagcagg ccatgcggaa ggccctgaca ctgagatacg ctctgctgcc ccacctgtac 2100
accctgtttc accaggccca tgtggccggc gagacagtgg ccagacctct gtttctggaa 2160
ttccccaagg acagcagcac ctggaccgtg gaccatcagc tgctgtgggg agaggctctg 2220
ctgattaccc cagtgctgca ggcaggcaag gccgaagtga ccggctactt tcccctgggc 2280
acttggtacg acctgcagac cgtgcctgtg gaagccctgg gatctctgcc tccacctcct 2340
gccgctccta gagagcctgc cattcactct gagggccagt gggtcacact gcctgccccc 2400
ctggatacca tcaacgtgca cctgagggcc ggctacatca taccactgca gggacctggc 2460
ctgaccacca ccgagtctag acagcagcca atggccctgg ccgtggccct gaccaaaggc 2520
ggagaagcta ggggcgagct gttctgggac gatggcgaga gcctggaagt gctggaaaga 2580
ggcgcctata cccaagtgat cttcctggcc cggaacaaca ccatcgtgaa cgagctggtg 2640
cgcgtgacct ctgaaggcgc tggactgcag ctgcagaaag tgaccgtgct gggagtggcc 2700
acagcccctc agcaggtgct gtctaatggc gtgcccgtgt ccaacttcac ctacagcccc 2760
gacaccaagg tgctggacat ctgcgtgtca ctgctgatgg gagagcagtt tctggtgtcc 2820
tggtgctga 2829
<210> 19
<211> 2820
<212> DNA
<213> Artificial Sequence
<220>
<223> sp8+hGAAco1-delta-8
<400> 19
atggccagca gactgaccct gctgacactc cttctgctgc tgctggccgg cgatagagcc 60
agcagcctac tagtgcccag agagctgagc ggcagctctc ccgtgctgga agaaacacac 120
cctgcccatc agcagggcgc ctctagacct ggacctagag atgcccaggc ccaccccggc 180
agacctagag ctgtgcctac ccagtgtgac gtgcccccca acagcagatt cgactgcgcc 240
cctgacaagg ccatcaccca ggaacagtgc gaggccagag gctgctgcta catccctgcc 300
aagcagggac tgcagggcgc tcagatggga cagccctggt gcttcttccc accctcctac 360
cccagctaca agctggaaaa cctgagcagc agcgagatgg gctacaccgc caccctgacc 420
agaaccaccc ccacattctt cccaaaggac atcctgaccc tgcggctgga cgtgatgatg 480
gaaaccgaga accggctgca cttcaccatc aaggaccccg ccaatcggag atacgaggtg 540
cccctggaaa ccccccacgt gcactctaga gcccccagcc ctctgtacag cgtggaattc 600
agcgaggaac ccttcggcgt gatcgtgcgg agacagctgg atggcagagt gctgctgaac 660
accaccgtgg cccctctgtt cttcgccgac cagttcctgc agctgagcac cagcctgccc 720
agccagtaca tcacaggact ggccgagcac ctgagccccc tgatgctgag cacatcctgg 780
acccggatca ccctgtggaa cagggatctg gcccctaccc ctggcgccaa tctgtacggc 840
agccaccctt tctacctggc cctggaagat ggcggatctg cccacggagt gtttctgctg 900
aactccaacg ccatggacgt ggtgctgcag cctagccctg ccctgtcttg gagaagcaca 960
ggcggcatcc tggatgtgta catctttctg ggccccgagc ccaagagcgt ggtgcagcag 1020
tatctggatg tcgtgggcta ccccttcatg cccccttact ggggcctggg attccacctg 1080
tgcagatggg gctactccag caccgccatc accagacagg tggtggaaaa catgaccaga 1140
gcccacttcc cactggatgt gcagtggaac gacctggact acatggacag cagacgggac 1200
ttcaccttca acaaggacgg cttccgggac ttccccgcca tggtgcagga actgcatcag 1260
ggcggcagac ggtacatgat gatcgtggat cccgccatca gctcctctgg ccctgccggc 1320
tcttacagac cctacgacga gggcctgcgg agaggcgtgt tcatcaccaa cgagacaggc 1380
cagcccctga tcggcaaagt gtggcctggc agcacagcct tccccgactt caccaatcct 1440
accgccctgg cttggtggga ggacatggtg gccgagttcc acgaccaggt gcccttcgac 1500
ggcatgtgga tcgacatgaa cgagcccagc aacttcatcc ggggcagcga ggatggctgc 1560
cccaacaacg aactggaaaa tcccccttac gtgcccggcg tcgtgggcgg aacactgcag 1620
gccgctacaa tctgtgccag cagccaccag tttctgagca cccactacaa cctgcacaac 1680
ctgtacggcc tgaccgaggc cattgccagc caccgcgctc tcgtgaaagc cagaggcaca 1740
cggcccttcg tgatcagcag aagcaccttt gccggccacg gcagatacgc cggacattgg 1800
actggcgacg tgtggtcctc ttgggagcag ctggcctcta gcgtgcccga gatcctgcag 1860
ttcaatctgc tgggcgtgcc actcgtgggc gccgatgtgt gtggcttcct gggcaacacc 1920
tccgaggaac tgtgtgtgcg gtggacacag ctgggcgcct tctacccttt catgagaaac 1980
cacaacagcc tgctgagcct gccccaggaa ccctacagct ttagcgagcc tgcacagcag 2040
gccatgcgga aggccctgac actgagatac gctctgctgc cccacctgta caccctgttt 2100
caccaggccc atgtggccgg cgagacagtg gccagacctc tgtttctgga attccccaag 2160
gacagcagca cctggaccgt ggaccatcag ctgctgtggg gagaggctct gctgattacc 2220
ccagtgctgc aggcaggcaa ggccgaagtg accggctact ttcccctggg cacttggtac 2280
gacctgcaga ccgtgcctgt ggaagccctg ggatctctgc ctccacctcc tgccgctcct 2340
agagagcctg ccattcactc tgagggccag tgggtcacac tgcctgcccc cctggatacc 2400
atcaacgtgc acctgagggc cggctacatc ataccactgc agggacctgg cctgaccacc 2460
accgagtcta gacagcagcc aatggccctg gccgtggccc tgaccaaagg cggagaagct 2520
aggggcgagc tgttctggga cgatggcgag agcctggaag tgctggaaag aggcgcctat 2580
acccaagtga tcttcctggc ccggaacaac accatcgtga acgagctggt gcgcgtgacc 2640
tctgaaggcg ctggactgca gctgcagaaa gtgaccgtgc tgggagtggc cacagcccct 2700
cagcaggtgc tgtctaatgg cgtgcccgtg tccaacttca cctacagccc cgacaccaag 2760
gtgctggaca tctgcgtgtc actgctgatg ggagagcagt ttctggtgtc ctggtgctga 2820
2820
<210> 20
<211> 4300
<212> DNA
<213> Artificial Sequence
<220>
<223> construct: sp7+hGAAco1-delta-8
<400> 20
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780
cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020
taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 1140
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200
acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260
ctttggcaaa gcacgcgtgc caccatggcc tttctgtggc tgctgagctg ttgggccctg 1320
ctgggcacca ccttcggcct actagtgccc agagagctga gcggcagctc tcccgtgctg 1380
gaagaaacac accctgccca tcagcagggc gcctctagac ctggacctag agatgcccag 1440
gcccaccccg gcagacctag agctgtgcct acccagtgtg acgtgccccc caacagcaga 1500
ttcgactgcg cccctgacaa ggccatcacc caggaacagt gcgaggccag aggctgctgc 1560
tacatccctg ccaagcaggg actgcagggc gctcagatgg gacagccctg gtgcttcttc 1620
ccaccctcct accccagcta caagctggaa aacctgagca gcagcgagat gggctacacc 1680
gccaccctga ccagaaccac ccccacattc ttcccaaagg acatcctgac cctgcggctg 1740
gacgtgatga tggaaaccga gaaccggctg cacttcacca tcaaggaccc cgccaatcgg 1800
agatacgagg tgcccctgga aaccccccac gtgcactcta gagcccccag ccctctgtac 1860
agcgtggaat tcagcgagga acccttcggc gtgatcgtgc ggagacagct ggatggcaga 1920
gtgctgctga acaccaccgt ggcccctctg ttcttcgccg accagttcct gcagctgagc 1980
accagcctgc ccagccagta catcacagga ctggccgagc acctgagccc cctgatgctg 2040
agcacatcct ggacccggat caccctgtgg aacagggatc tggcccctac ccctggcgcc 2100
aatctgtacg gcagccaccc tttctacctg gccctggaag atggcggatc tgcccacgga 2160
gtgtttctgc tgaactccaa cgccatggac gtggtgctgc agcctagccc tgccctgtct 2220
tggagaagca caggcggcat cctggatgtg tacatctttc tgggccccga gcccaagagc 2280
gtggtgcagc agtatctgga tgtcgtgggc taccccttca tgccccctta ctggggcctg 2340
ggattccacc tgtgcagatg gggctactcc agcaccgcca tcaccagaca ggtggtggaa 2400
aacatgacca gagcccactt cccactggat gtgcagtgga acgacctgga ctacatggac 2460
agcagacggg acttcacctt caacaaggac ggcttccggg acttccccgc catggtgcag 2520
gaactgcatc agggcggcag acggtacatg atgatcgtgg atcccgccat cagctcctct 2580
ggccctgccg gctcttacag accctacgac gagggcctgc ggagaggcgt gttcatcacc 2640
aacgagacag gccagcccct gatcggcaaa gtgtggcctg gcagcacagc cttccccgac 2700
ttcaccaatc ctaccgccct ggcttggtgg gaggacatgg tggccgagtt ccacgaccag 2760
gtgcccttcg acggcatgtg gatcgacatg aacgagccca gcaacttcat ccggggcagc 2820
gaggatggct gccccaacaa cgaactggaa aatccccctt acgtgcccgg cgtcgtgggc 2880
ggaacactgc aggccgctac aatctgtgcc agcagccacc agtttctgag cacccactac 2940
aacctgcaca acctgtacgg cctgaccgag gccattgcca gccaccgcgc tctcgtgaaa 3000
gccagaggca cacggccctt cgtgatcagc agaagcacct ttgccggcca cggcagatac 3060
gccggacatt ggactggcga cgtgtggtcc tcttgggagc agctggcctc tagcgtgccc 3120
gagatcctgc agttcaatct gctgggcgtg ccactcgtgg gcgccgatgt gtgtggcttc 3180
ctgggcaaca cctccgagga actgtgtgtg cggtggacac agctgggcgc cttctaccct 3240
ttcatgagaa accacaacag cctgctgagc ctgccccagg aaccctacag ctttagcgag 3300
cctgcacagc aggccatgcg gaaggccctg acactgagat acgctctgct gccccacctg 3360
tacaccctgt ttcaccaggc ccatgtggcc ggcgagacag tggccagacc tctgtttctg 3420
gaattcccca aggacagcag cacctggacc gtggaccatc agctgctgtg gggagaggct 3480
ctgctgatta ccccagtgct gcaggcaggc aaggccgaag tgaccggcta ctttcccctg 3540
ggcacttggt acgacctgca gaccgtgcct gtggaagccc tgggatctct gcctccacct 3600
cctgccgctc ctagagagcc tgccattcac tctgagggcc agtgggtcac actgcctgcc 3660
cccctggata ccatcaacgt gcacctgagg gccggctaca tcataccact gcagggacct 3720
ggcctgacca ccaccgagtc tagacagcag ccaatggccc tggccgtggc cctgaccaaa 3780
ggcggagaag ctaggggcga gctgttctgg gacgatggcg agagcctgga agtgctggaa 3840
agaggcgcct atacccaagt gatcttcctg gcccggaaca acaccatcgt gaacgagctg 3900
gtgcgcgtga cctctgaagg cgctggactg cagctgcaga aagtgaccgt gctgggagtg 3960
gccacagccc ctcagcaggt gctgtctaat ggcgtgcccg tgtccaactt cacctacagc 4020
cccgacacca aggtgctgga catctgcgtg tcactgctga tgggagagca gtttctggtg 4080
tcctggtgct gactcgagag atctaccggt gaattcaccg cgggtttaaa ctgtgccttc 4140
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 4200
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 4260
tcattctatt ctggggggtg gggtgggggc tagctctaga 4300
<210> 21
<211> 4321
<212> DNA
<213> Artificial Sequence
<220>
<223> construct: sp6+hGAAco1-delta-8
<400> 21
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780
cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020
taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 1140
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200
acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260
ctttggcaaa gcacgcgtgc caccatgcct ccacctagaa caggcagagg cctgctgtgg 1320
ctgggcctgg tgctgtctag tgtgtgtgtg gccctgggcc tactagtgcc cagagagctg 1380
agcggcagct ctcccgtgct ggaagaaaca caccctgccc atcagcaggg cgcctctaga 1440
cctggaccta gagatgccca ggcccacccc ggcagaccta gagctgtgcc tacccagtgt 1500
gacgtgcccc ccaacagcag attcgactgc gcccctgaca aggccatcac ccaggaacag 1560
tgcgaggcca gaggctgctg ctacatccct gccaagcagg gactgcaggg cgctcagatg 1620
ggacagccct ggtgcttctt cccaccctcc taccccagct acaagctgga aaacctgagc 1680
agcagcgaga tgggctacac cgccaccctg accagaacca cccccacatt cttcccaaag 1740
gacatcctga ccctgcggct ggacgtgatg atggaaaccg agaaccggct gcacttcacc 1800
atcaaggacc ccgccaatcg gagatacgag gtgcccctgg aaacccccca cgtgcactct 1860
agagccccca gccctctgta cagcgtggaa ttcagcgagg aacccttcgg cgtgatcgtg 1920
cggagacagc tggatggcag agtgctgctg aacaccaccg tggcccctct gttcttcgcc 1980
gaccagttcc tgcagctgag caccagcctg cccagccagt acatcacagg actggccgag 2040
cacctgagcc ccctgatgct gagcacatcc tggacccgga tcaccctgtg gaacagggat 2100
ctggccccta cccctggcgc caatctgtac ggcagccacc ctttctacct ggccctggaa 2160
gatggcggat ctgcccacgg agtgtttctg ctgaactcca acgccatgga cgtggtgctg 2220
cagcctagcc ctgccctgtc ttggagaagc acaggcggca tcctggatgt gtacatcttt 2280
ctgggccccg agcccaagag cgtggtgcag cagtatctgg atgtcgtggg ctaccccttc 2340
atgccccctt actggggcct gggattccac ctgtgcagat ggggctactc cagcaccgcc 2400
atcaccagac aggtggtgga aaacatgacc agagcccact tcccactgga tgtgcagtgg 2460
aacgacctgg actacatgga cagcagacgg gacttcacct tcaacaagga cggcttccgg 2520
gacttccccg ccatggtgca ggaactgcat cagggcggca gacggtacat gatgatcgtg 2580
gatcccgcca tcagctcctc tggccctgcc ggctcttaca gaccctacga cgagggcctg 2640
cggagaggcg tgttcatcac caacgagaca ggccagcccc tgatcggcaa agtgtggcct 2700
ggcagcacag ccttccccga cttcaccaat cctaccgccc tggcttggtg ggaggacatg 2760
gtggccgagt tccacgacca ggtgcccttc gacggcatgt ggatcgacat gaacgagccc 2820
agcaacttca tccggggcag cgaggatggc tgccccaaca acgaactgga aaatccccct 2880
tacgtgcccg gcgtcgtggg cggaacactg caggccgcta caatctgtgc cagcagccac 2940
cagtttctga gcacccacta caacctgcac aacctgtacg gcctgaccga ggccattgcc 3000
agccaccgcg ctctcgtgaa agccagaggc acacggccct tcgtgatcag cagaagcacc 3060
tttgccggcc acggcagata cgccggacat tggactggcg acgtgtggtc ctcttgggag 3120
cagctggcct ctagcgtgcc cgagatcctg cagttcaatc tgctgggcgt gccactcgtg 3180
ggcgccgatg tgtgtggctt cctgggcaac acctccgagg aactgtgtgt gcggtggaca 3240
cagctgggcg ccttctaccc tttcatgaga aaccacaaca gcctgctgag cctgccccag 3300
gaaccctaca gctttagcga gcctgcacag caggccatgc ggaaggccct gacactgaga 3360
tacgctctgc tgccccacct gtacaccctg tttcaccagg cccatgtggc cggcgagaca 3420
gtggccagac ctctgtttct ggaattcccc aaggacagca gcacctggac cgtggaccat 3480
cagctgctgt ggggagaggc tctgctgatt accccagtgc tgcaggcagg caaggccgaa 3540
gtgaccggct actttcccct gggcacttgg tacgacctgc agaccgtgcc tgtggaagcc 3600
ctgggatctc tgcctccacc tcctgccgct cctagagagc ctgccattca ctctgagggc 3660
cagtgggtca cactgcctgc ccccctggat accatcaacg tgcacctgag ggccggctac 3720
atcataccac tgcagggacc tggcctgacc accaccgagt ctagacagca gccaatggcc 3780
ctggccgtgg ccctgaccaa aggcggagaa gctaggggcg agctgttctg ggacgatggc 3840
gagagcctgg aagtgctgga aagaggcgcc tatacccaag tgatcttcct ggcccggaac 3900
aacaccatcg tgaacgagct ggtgcgcgtg acctctgaag gcgctggact gcagctgcag 3960
aaagtgaccg tgctgggagt ggccacagcc cctcagcagg tgctgtctaa tggcgtgccc 4020
gtgtccaact tcacctacag ccccgacacc aaggtgctgg acatctgcgt gtcactgctg 4080
atgggagagc agtttctggt gtcctggtgc tgactcgaga gatctaccgg tgaattcacc 4140
gcgggtttaa actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc 4200
ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc 4260
atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggg ctagctctag 4320
a 4321
<210> 22
<211> 4312
<212> DNA
<213> Artificial Sequence
<220>
<223> sp8+hGAAco1-delta-8
<400> 22
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780
cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020
taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 1140
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200
acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260
ctttggcaaa gcacgcgtgc caccatggcc agcagactga ccctgctgac actccttctg 1320
ctgctgctgg ccggcgatag agccagcagc ctactagtgc ccagagagct gagcggcagc 1380
tctcccgtgc tggaagaaac acaccctgcc catcagcagg gcgcctctag acctggacct 1440
agagatgccc aggcccaccc cggcagacct agagctgtgc ctacccagtg tgacgtgccc 1500
cccaacagca gattcgactg cgcccctgac aaggccatca cccaggaaca gtgcgaggcc 1560
agaggctgct gctacatccc tgccaagcag ggactgcagg gcgctcagat gggacagccc 1620
tggtgcttct tcccaccctc ctaccccagc tacaagctgg aaaacctgag cagcagcgag 1680
atgggctaca ccgccaccct gaccagaacc acccccacat tcttcccaaa ggacatcctg 1740
accctgcggc tggacgtgat gatggaaacc gagaaccggc tgcacttcac catcaaggac 1800
cccgccaatc ggagatacga ggtgcccctg gaaacccccc acgtgcactc tagagccccc 1860
agccctctgt acagcgtgga attcagcgag gaacccttcg gcgtgatcgt gcggagacag 1920
ctggatggca gagtgctgct gaacaccacc gtggcccctc tgttcttcgc cgaccagttc 1980
ctgcagctga gcaccagcct gcccagccag tacatcacag gactggccga gcacctgagc 2040
cccctgatgc tgagcacatc ctggacccgg atcaccctgt ggaacaggga tctggcccct 2100
acccctggcg ccaatctgta cggcagccac cctttctacc tggccctgga agatggcgga 2160
tctgcccacg gagtgtttct gctgaactcc aacgccatgg acgtggtgct gcagcctagc 2220
cctgccctgt cttggagaag cacaggcggc atcctggatg tgtacatctt tctgggcccc 2280
gagcccaaga gcgtggtgca gcagtatctg gatgtcgtgg gctacccctt catgccccct 2340
tactggggcc tgggattcca cctgtgcaga tggggctact ccagcaccgc catcaccaga 2400
caggtggtgg aaaacatgac cagagcccac ttcccactgg atgtgcagtg gaacgacctg 2460
gactacatgg acagcagacg ggacttcacc ttcaacaagg acggcttccg ggacttcccc 2520
gccatggtgc aggaactgca tcagggcggc agacggtaca tgatgatcgt ggatcccgcc 2580
atcagctcct ctggccctgc cggctcttac agaccctacg acgagggcct gcggagaggc 2640
gtgttcatca ccaacgagac aggccagccc ctgatcggca aagtgtggcc tggcagcaca 2700
gccttccccg acttcaccaa tcctaccgcc ctggcttggt gggaggacat ggtggccgag 2760
ttccacgacc aggtgccctt cgacggcatg tggatcgaca tgaacgagcc cagcaacttc 2820
atccggggca gcgaggatgg ctgccccaac aacgaactgg aaaatccccc ttacgtgccc 2880
ggcgtcgtgg gcggaacact gcaggccgct acaatctgtg ccagcagcca ccagtttctg 2940
agcacccact acaacctgca caacctgtac ggcctgaccg aggccattgc cagccaccgc 3000
gctctcgtga aagccagagg cacacggccc ttcgtgatca gcagaagcac ctttgccggc 3060
cacggcagat acgccggaca ttggactggc gacgtgtggt cctcttggga gcagctggcc 3120
tctagcgtgc ccgagatcct gcagttcaat ctgctgggcg tgccactcgt gggcgccgat 3180
gtgtgtggct tcctgggcaa cacctccgag gaactgtgtg tgcggtggac acagctgggc 3240
gccttctacc ctttcatgag aaaccacaac agcctgctga gcctgcccca ggaaccctac 3300
agctttagcg agcctgcaca gcaggccatg cggaaggccc tgacactgag atacgctctg 3360
ctgccccacc tgtacaccct gtttcaccag gcccatgtgg ccggcgagac agtggccaga 3420
cctctgtttc tggaattccc caaggacagc agcacctgga ccgtggacca tcagctgctg 3480
tggggagagg ctctgctgat taccccagtg ctgcaggcag gcaaggccga agtgaccggc 3540
tactttcccc tgggcacttg gtacgacctg cagaccgtgc ctgtggaagc cctgggatct 3600
ctgcctccac ctcctgccgc tcctagagag cctgccattc actctgaggg ccagtgggtc 3660
acactgcctg cccccctgga taccatcaac gtgcacctga gggccggcta catcatacca 3720
ctgcagggac ctggcctgac caccaccgag tctagacagc agccaatggc cctggccgtg 3780
gccctgacca aaggcggaga agctaggggc gagctgttct gggacgatgg cgagagcctg 3840
gaagtgctgg aaagaggcgc ctatacccaa gtgatcttcc tggcccggaa caacaccatc 3900
gtgaacgagc tggtgcgcgt gacctctgaa ggcgctggac tgcagctgca gaaagtgacc 3960
gtgctgggag tggccacagc ccctcagcag gtgctgtcta atggcgtgcc cgtgtccaac 4020
ttcacctaca gccccgacac caaggtgctg gacatctgcg tgtcactgct gatgggagag 4080
cagtttctgg tgtcctggtg ctgactcgag agatctaccg gtgaattcac cgcgggttta 4140
aactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 4200
cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 4260
tctgagtagg tgtcattcta ttctgggggg tggggtgggg gctagctcta ga 4312
<210> 23
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> sp3
<400> 23
Met Leu Leu Leu Ser Ala Leu Leu Leu Gly Leu Ala Phe Gly Tyr Ser
1 5 10 15
<210> 24
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> sp4
<400> 24
Met Leu Leu Ser Phe Ala Leu Leu Leu Gly Leu Ala Leu Gly Tyr Ser
1 5 10 15
<210> 25
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> sp5
<400> 25
Met Leu Leu Glu His Ala Leu Leu Leu Gly Leu Ala His Gly Tyr Ser
1 5 10 15
<210> 26
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> sp7
<400> 26
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggc 54
<210> 27
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> sp6
<400> 27
atgcctccac ctagaacagg cagaggcctg ctgtggctgg gcctggtgct gtctagtgtg 60
tgtgtggccc tgggc 75
<210> 28
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> sp8
<400> 28
atggccagca gactgaccct gctgacactc cttctgctgc tgctggccgg cgatagagcc 60
agcagc 66
<210> 29
<211> 917
<212> PRT
<213> Artificial Sequence
<220>
<223> hGAA-delta-8
<400> 29
Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val Leu Glu Glu
1 5 10 15
Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly Pro Arg Asp
20 25 30
Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp
35 40 45
Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr
50 55 60
Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln
65 70 75 80
Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro
85 90 95
Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly
100 105 110
Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp
115 120 125
Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu
130 135 140
His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu
145 150 155 160
Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val
165 170 175
Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp
180 185 190
Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp
195 200 205
Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly
210 215 220
Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg
225 230 235 240
Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu
245 250 255
Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala
260 265 270
His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln
275 280 285
Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val
290 295 300
Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu
305 310 315 320
Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe
325 330 335
His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val
340 345 350
Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn
355 360 365
Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp
370 375 380
Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly
385 390 395 400
Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro
405 410 415
Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe
420 425 430
Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly
435 440 445
Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp
450 455 460
Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met
465 470 475 480
Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp
485 490 495
Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val
500 505 510
Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln
515 520 525
Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu
530 535 540
Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro
545 550 555 560
Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly
565 570 575
His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser
580 585 590
Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly
595 600 605
Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val
610 615 620
Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn
625 630 635 640
Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala
645 650 655
Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro
660 665 670
His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val
675 680 685
Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr
690 695 700
Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val
705 710 715 720
Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr
725 730 735
Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro
740 745 750
Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln
755 760 765
Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg
770 775 780
Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu
785 790 795 800
Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly
805 810 815
Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val
820 825 830
Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn
835 840 845
Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu
850 855 860
Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln
865 870 875 880
Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp
885 890 895
Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe
900 905 910
Leu Val Ser Trp Cys
915
<210> 30
<211> 883
<212> PRT
<213> Artificial Sequence
<220>
<223> hGAA-delta-42
<400> 30
Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro
1 5 10 15
Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu
20 25 30
Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu
35 40 45
Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr
50 55 60
Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr
65 70 75 80
Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu
85 90 95
Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe
100 105 110
Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr
115 120 125
Pro His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe
130 135 140
Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg
145 150 155 160
Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe
165 170 175
Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala
180 185 190
Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr
195 200 205
Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly
210 215 220
Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly
225 230 235 240
Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser
245 250 255
Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile
260 265 270
Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val
275 280 285
Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu
290 295 300
Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu
305 310 315 320
Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu
325 330 335
Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe
340 345 350
Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg
355 360 365
Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly
370 375 380
Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr
385 390 395 400
Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr
405 410 415
Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp
420 425 430
Met Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile
435 440 445
Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys
450 455 460
Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly
465 470 475 480
Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu
485 490 495
Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile
500 505 510
Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val
515 520 525
Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp
530 535 540
Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro
545 550 555 560
Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp
565 570 575
Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp
580 585 590
Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu
595 600 605
Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln
610 615 620
Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu
625 630 635 640
Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg
645 650 655
Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp
660 665 670
His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln
675 680 685
Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr
690 695 700
Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro
705 710 715 720
Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val
725 730 735
Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly
740 745 750
Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg
755 760 765
Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala
770 775 780
Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu
785 790 795 800
Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile
805 810 815
Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu
820 825 830
Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu
835 840 845
Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys
850 855 860
Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val
865 870 875 880
Ser Trp Cys
<210> 31
<211> 2778
<212> DNA
<213> hGAAwt w/o sp
<400> 31
gggcacatcc tactccatga tttcctgctg gttccccgag agctgagtgg ctcctcccca 60
gtcctggagg agactcaccc agctcaccag cagggagcca gcagaccagg gccccgggat 120
gcccaggcac accccgggcg gccgcgagca gtgcccacac agtgcgacgt cccccccaac 180
agccgcttcg attgcgcccc tgacaaggcc atcacccagg aacagtgcga ggcccgcggc 240
tgttgctaca tccctgcaaa gcaggggctg cagggagccc agatggggca gccctggtgc 300
ttcttcccac ccagctaccc cagctacaag ctggagaacc tgagctcctc tgaaatgggc 360
tacacggcca ccctgacccg taccaccccc accttcttcc ccaaggacat cctgaccctg 420
cggctggacg tgatgatgga gactgagaac cgcctccact tcacgatcaa agatccagct 480
aacaggcgct acgaggtgcc cttggagacc ccgcatgtcc acagccgggc accgtcccca 540
ctctacagcg tggagttctc cgaggagccc ttcggggtga tcgtgcgccg gcagctggac 600
ggccgcgtgc tgctgaacac gacggtggcg cccctgttct ttgcggacca gttccttcag 660
ctgtccacct cgctgccctc gcagtatatc acaggcctcg ccgagcacct cagtcccctg 720
atgctcagca ccagctggac caggatcacc ctgtggaacc gggaccttgc gcccacgccc 780
ggtgcgaacc tctacgggtc tcaccctttc tacctggcgc tggaggacgg cgggtcggca 840
cacggggtgt tcctgctaaa cagcaatgcc atggatgtgg tcctgcagcc gagccctgcc 900
cttagctgga ggtcgacagg tgggatcctg gatgtctaca tcttcctggg cccagagccc 960
aagagcgtgg tgcagcagta cctggacgtt gtgggatacc cgttcatgcc gccatactgg 1020
ggcctgggct tccacctgtg ccgctggggc tactcctcca ccgctatcac ccgccaggtg 1080
gtggagaaca tgaccagggc ccacttcccc ctggacgtcc agtggaacga cctggactac 1140
atggactccc ggagggactt cacgttcaac aaggatggct tccgggactt cccggccatg 1200
gtgcaggagc tgcaccaggg cggccggcgc tacatgatga tcgtggatcc tgccatcagc 1260
agctcgggcc ctgccgggag ctacaggccc tacgacgagg gtctgcggag gggggttttc 1320
atcaccaacg agaccggcca gccgctgatt gggaaggtat ggcccgggtc cactgccttc 1380
cccgacttca ccaaccccac agccctggcc tggtgggagg acatggtggc tgagttccat 1440
gaccaggtgc ccttcgacgg catgtggatt gacatgaacg agccttccaa cttcatcagg 1500
ggctctgagg acggctgccc caacaatgag ctggagaacc caccctacgt gcctggggtg 1560
gttgggggga ccctccaggc ggccaccatc tgtgcctcca gccaccagtt tctctccaca 1620
cactacaacc tgcacaacct ctacggcctg accgaagcca tcgcctccca cagggcgctg 1680
gtgaaggctc gggggacacg cccatttgtg atctcccgct cgacctttgc tggccacggc 1740
cgatacgccg gccactggac gggggacgtg tggagctcct gggagcagct cgcctcctcc 1800
gtgccagaaa tcctgcagtt taacctgctg ggggtgcctc tggtcggggc cgacgtctgc 1860
ggcttcctgg gcaacacctc agaggagctg tgtgtgcgct ggacccagct gggggccttc 1920
taccccttca tgcggaacca caacagcctg ctcagtctgc cccaggagcc gtacagcttc 1980
agcgagccgg cccagcaggc catgaggaag gccctcaccc tgcgctacgc actcctcccc 2040
cacctctaca cactgttcca ccaggcccac gtcgcggggg agaccgtggc ccggcccctc 2100
ttcctggagt tccccaagga ctctagcacc tggactgtgg accaccagct cctgtggggg 2160
gaggccctgc tcatcacccc agtgctccag gccgggaagg ccgaagtgac tggctacttc 2220
cccttgggca catggtacga cctgcagacg gtgccagtag aggcccttgg cagcctccca 2280
cccccacctg cagctccccg tgagccagcc atccacagcg aggggcagtg ggtgacgctg 2340
ccggcccccc tggacaccat caacgtccac ctccgggctg ggtacatcat ccccctgcag 2400
ggccctggcc tcacaaccac agagtcccgc cagcagccca tggccctggc tgtggccctg 2460
accaagggtg gggaggcccg aggggagctg ttctgggacg atggagagag cctggaagtg 2520
ctggagcgag gggcctacac acaggtcatc ttcctggcca ggaataacac gatcgtgaat 2580
gagctggtac gtgtgaccag tgagggagct ggcctgcagc tgcagaaggt gactgtcctg 2640
ggcgtggcca cggcgcccca gcaggtcctc tccaacggtg tccctgtctc caacttcacc 2700
tacagccccg acaccaaggt cctggacatc tgtgtctcgc tgttgatggg agagcagttt 2760
ctcgtcagct ggtgttag 2778
<210> 32
<211> 2754
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAco1-delta-8 w/o sp
<400> 32
ctactagtgc ccagagagct gagcggcagc tctcccgtgc tggaagaaac acaccctgcc 60
catcagcagg gcgcctctag acctggacct agagatgccc aggcccaccc cggcagacct 120
agagctgtgc ctacccagtg tgacgtgccc cccaacagca gattcgactg cgcccctgac 180
aaggccatca cccaggaaca gtgcgaggcc agaggctgct gctacatccc tgccaagcag 240
ggactgcagg gcgctcagat gggacagccc tggtgcttct tcccaccctc ctaccccagc 300
tacaagctgg aaaacctgag cagcagcgag atgggctaca ccgccaccct gaccagaacc 360
acccccacat tcttcccaaa ggacatcctg accctgcggc tggacgtgat gatggaaacc 420
gagaaccggc tgcacttcac catcaaggac cccgccaatc ggagatacga ggtgcccctg 480
gaaacccccc acgtgcactc tagagccccc agccctctgt acagcgtgga attcagcgag 540
gaacccttcg gcgtgatcgt gcggagacag ctggatggca gagtgctgct gaacaccacc 600
gtggcccctc tgttcttcgc cgaccagttc ctgcagctga gcaccagcct gcccagccag 660
tacatcacag gactggccga gcacctgagc cccctgatgc tgagcacatc ctggacccgg 720
atcaccctgt ggaacaggga tctggcccct acccctggcg ccaatctgta cggcagccac 780
cctttctacc tggccctgga agatggcgga tctgcccacg gagtgtttct gctgaactcc 840
aacgccatgg acgtggtgct gcagcctagc cctgccctgt cttggagaag cacaggcggc 900
atcctggatg tgtacatctt tctgggcccc gagcccaaga gcgtggtgca gcagtatctg 960
gatgtcgtgg gctacccctt catgccccct tactggggcc tgggattcca cctgtgcaga 1020
tggggctact ccagcaccgc catcaccaga caggtggtgg aaaacatgac cagagcccac 1080
ttcccactgg atgtgcagtg gaacgacctg gactacatgg acagcagacg ggacttcacc 1140
ttcaacaagg acggcttccg ggacttcccc gccatggtgc aggaactgca tcagggcggc 1200
agacggtaca tgatgatcgt ggatcccgcc atcagctcct ctggccctgc cggctcttac 1260
agaccctacg acgagggcct gcggagaggc gtgttcatca ccaacgagac aggccagccc 1320
ctgatcggca aagtgtggcc tggcagcaca gccttccccg acttcaccaa tcctaccgcc 1380
ctggcttggt gggaggacat ggtggccgag ttccacgacc aggtgccctt cgacggcatg 1440
tggatcgaca tgaacgagcc cagcaacttc atccggggca gcgaggatgg ctgccccaac 1500
aacgaactgg aaaatccccc ttacgtgccc ggcgtcgtgg gcggaacact gcaggccgct 1560
acaatctgtg ccagcagcca ccagtttctg agcacccact acaacctgca caacctgtac 1620
ggcctgaccg aggccattgc cagccaccgc gctctcgtga aagccagagg cacacggccc 1680
ttcgtgatca gcagaagcac ctttgccggc cacggcagat acgccggaca ttggactggc 1740
gacgtgtggt cctcttggga gcagctggcc tctagcgtgc ccgagatcct gcagttcaat 1800
ctgctgggcg tgccactcgt gggcgccgat gtgtgtggct tcctgggcaa cacctccgag 1860
gaactgtgtg tgcggtggac acagctgggc gccttctacc ctttcatgag aaaccacaac 1920
agcctgctga gcctgcccca ggaaccctac agctttagcg agcctgcaca gcaggccatg 1980
cggaaggccc tgacactgag atacgctctg ctgccccacc tgtacaccct gtttcaccag 2040
gcccatgtgg ccggcgagac agtggccaga cctctgtttc tggaattccc caaggacagc 2100
agcacctgga ccgtggacca tcagctgctg tggggagagg ctctgctgat taccccagtg 2160
ctgcaggcag gcaaggccga agtgaccggc tactttcccc tgggcacttg gtacgacctg 2220
cagaccgtgc ctgtggaagc cctgggatct ctgcctccac ctcctgccgc tcctagagag 2280
cctgccattc actctgaggg ccagtgggtc acactgcctg cccccctgga taccatcaac 2340
gtgcacctga gggccggcta catcatacca ctgcagggac ctggcctgac caccaccgag 2400
tctagacagc agccaatggc cctggccgtg gccctgacca aaggcggaga agctaggggc 2460
gagctgttct gggacgatgg cgagagcctg gaagtgctgg aaagaggcgc ctatacccaa 2520
gtgatcttcc tggcccggaa caacaccatc gtgaacgagc tggtgcgcgt gacctctgaa 2580
ggcgctggac tgcagctgca gaaagtgacc gtgctgggag tggccacagc ccctcagcag 2640
gtgctgtcta atggcgtgcc cgtgtccaac ttcacctaca gccccgacac caaggtgctg 2700
gacatctgcg tgtcactgct gatgggagag cagtttctgg tgtcctggtg ctga 2754
<210> 33
<211> 2652
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAco1-delta-42 w/o sp
<400> 33
gcccaccccg gcagacctag agctgtgcct acccagtgtg acgtgccccc caacagcaga 60
ttcgactgcg cccctgacaa ggccatcacc caggaacagt gcgaggccag aggctgctgc 120
tacatccctg ccaagcaggg actgcagggc gctcagatgg gacagccctg gtgcttcttc 180
ccaccctcct accccagcta caagctggaa aacctgagca gcagcgagat gggctacacc 240
gccaccctga ccagaaccac ccccacattc ttcccaaagg acatcctgac cctgcggctg 300
gacgtgatga tggaaaccga gaaccggctg cacttcacca tcaaggaccc cgccaatcgg 360
agatacgagg tgcccctgga aaccccccac gtgcactcta gagcccccag ccctctgtac 420
agcgtggaat tcagcgagga acccttcggc gtgatcgtgc ggagacagct ggatggcaga 480
gtgctgctga acaccaccgt ggcccctctg ttcttcgccg accagttcct gcagctgagc 540
accagcctgc ccagccagta catcacagga ctggccgagc acctgagccc cctgatgctg 600
agcacatcct ggacccggat caccctgtgg aacagggatc tggcccctac ccctggcgcc 660
aatctgtacg gcagccaccc tttctacctg gccctggaag atggcggatc tgcccacgga 720
gtgtttctgc tgaactccaa cgccatggac gtggtgctgc agcctagccc tgccctgtct 780
tggagaagca caggcggcat cctggatgtg tacatctttc tgggccccga gcccaagagc 840
gtggtgcagc agtatctgga tgtcgtgggc taccccttca tgccccctta ctggggcctg 900
ggattccacc tgtgcagatg gggctactcc agcaccgcca tcaccagaca ggtggtggaa 960
aacatgacca gagcccactt cccactggat gtgcagtgga acgacctgga ctacatggac 1020
agcagacggg acttcacctt caacaaggac ggcttccggg acttccccgc catggtgcag 1080
gaactgcatc agggcggcag acggtacatg atgatcgtgg atcccgccat cagctcctct 1140
ggccctgccg gctcttacag accctacgac gagggcctgc ggagaggcgt gttcatcacc 1200
aacgagacag gccagcccct gatcggcaaa gtgtggcctg gcagcacagc cttccccgac 1260
ttcaccaatc ctaccgccct ggcttggtgg gaggacatgg tggccgagtt ccacgaccag 1320
gtgcccttcg acggcatgtg gatcgacatg aacgagccca gcaacttcat ccggggcagc 1380
gaggatggct gccccaacaa cgaactggaa aatccccctt acgtgcccgg cgtcgtgggc 1440
ggaacactgc aggccgctac aatctgtgcc agcagccacc agtttctgag cacccactac 1500
aacctgcaca acctgtacgg cctgaccgag gccattgcca gccaccgcgc tctcgtgaaa 1560
gccagaggca cacggccctt cgtgatcagc agaagcacct ttgccggcca cggcagatac 1620
gccggacatt ggactggcga cgtgtggtcc tcttgggagc agctggcctc tagcgtgccc 1680
gagatcctgc agttcaatct gctgggcgtg ccactcgtgg gcgccgatgt gtgtggcttc 1740
ctgggcaaca cctccgagga actgtgtgtg cggtggacac agctgggcgc cttctaccct 1800
ttcatgagaa accacaacag cctgctgagc ctgccccagg aaccctacag ctttagcgag 1860
cctgcacagc aggccatgcg gaaggccctg acactgagat acgctctgct gccccacctg 1920
tacaccctgt ttcaccaggc ccatgtggcc ggcgagacag tggccagacc tctgtttctg 1980
gaattcccca aggacagcag cacctggacc gtggaccatc agctgctgtg gggagaggct 2040
ctgctgatta ccccagtgct gcaggcaggc aaggccgaag tgaccggcta ctttcccctg 2100
ggcacttggt acgacctgca gaccgtgcct gtggaagccc tgggatctct gcctccacct 2160
cctgccgctc ctagagagcc tgccattcac tctgagggcc agtgggtcac actgcctgcc 2220
cccctggata ccatcaacgt gcacctgagg gccggctaca tcataccact gcagggacct 2280
ggcctgacca ccaccgagtc tagacagcag ccaatggccc tggccgtggc cctgaccaaa 2340
ggcggagaag ctaggggcga gctgttctgg gacgatggcg agagcctgga agtgctggaa 2400
agaggcgcct atacccaagt gatcttcctg gcccggaaca acaccatcgt gaacgagctg 2460
gtgcgcgtga cctctgaagg cgctggactg cagctgcaga aagtgaccgt gctgggagtg 2520
gccacagccc ctcagcaggt gctgtctaat ggcgtgcccg tgtccaactt cacctacagc 2580
cccgacacca aggtgctgga catctgcgtg tcactgctga tgggagagca gtttctggtg 2640
tcctggtgct ga 2652
<210> 34
<211> 2754
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAco2-delta-8
<400> 34
ctgttggtgc ctagagagct gagcggatca tccccagtgc tggaggagac tcatcctgct 60
caccaacagg gagcttccag accaggaccg agagacgccc aagcccatcc tggtagacca 120
agagctgtgc ctacccaatg cgacgtgcca cccaactccc gattcgactg cgcgccagat 180
aaggctatta cccaagagca gtgtgaagcc agaggttgct gctacatccc agcgaagcaa 240
ggattgcaag gcgcccaaat gggacaacct tggtgtttct tccccccttc gtacccatca 300
tataaactcg aaaacctgtc ctcttcggaa atgggttata ctgccaccct caccagaact 360
actcctactt tcttcccgaa agacatcttg accttgaggc tggacgtgat gatggagact 420
gaaaaccggc tgcatttcac tatcaaagat cctgccaatc ggcgatacga ggtccctctg 480
gaaacccctc acgtgcactc acgggctcct tctccgcttt actccgtcga attctctgag 540
gaacccttcg gagtgatcgt tagacgccag ctggatggta gagtgctgtt gaacactact 600
gtggccccac ttttcttcgc tgaccagttt ctgcaactgt ccacttccct gccatcccag 660
tacattactg gactcgccga acacctgtcg ccactgatgc tctcgacctc ttggactaga 720
atcactttgt ggaacagaga cttggcccct actccgggag caaatctgta cggaagccac 780
cctttttacc tggcgctcga agatggcgga tccgctcacg gagtgttcct gctgaatagc 840
aacgcaatgg acgtggtgct gcaaccttcc cctgcactca gttggagaag taccgggggt 900
attctggacg tgtacatctt cctcggacca gaacccaaga gcgtggtgca gcaatatctg 960
gacgtggtcg gatacccttt tatgcctcct tactggggac tgggattcca cctttgccgt 1020
tggggctact catccaccgc cattaccaga caggtggtgg agaatatgac cagagcccac 1080
ttccctctcg acgtgcagtg gaacgatctg gactatatgg actcccggag agatttcacc 1140
ttcaacaagg acgggttccg cgattttccc gcgatggttc aagagctcca ccagggtggt 1200
cgaagatata tgatgatcgt cgacccagcc atttcgagca gcggacccgc tggatcttat 1260
agaccttacg acgaaggcct taggagagga gtgttcatca caaacgagac tggacagcct 1320
ttgatcggta aagtgtggcc tggatcaacc gcctttcctg actttaccaa tcccactgcc 1380
ttggcttggt gggaggacat ggtggccgaa ttccacgacc aagtcccctt tgatggaatg 1440
tggatcgata tgaacgaacc aagcaatttt atcagaggtt ccgaagacgg ttgccccaac 1500
aacgaactgg aaaaccctcc ttatgtgccc ggagtcgtgg gcggaacatt acaggccgcg 1560
actatttgcg ccagcagcca ccaattcctg tccactcact acaacctcca caacctttat 1620
ggattaaccg aagctattgc aagtcacagg gctctggtga aggctagagg gactaggccc 1680
tttgtgatct cccgatccac ctttgccgga cacgggagat acgccggtca ctggactggt 1740
gacgtgtgga gctcatggga acaactggcc tcctccgtgc cggaaatctt acagttcaac 1800
cttctgggtg tccctcttgt cggagcagac gtgtgtgggt ttcttggtaa cacctccgag 1860
gaactgtgtg tgcgctggac tcaactgggt gcattctacc cattcatgag aaaccacaac 1920
tccttgctgt ccctgccaca agagccctac tcgttcagcg agcctgcaca acaggctatg 1980
cggaaggcac tgaccctgag atacgccctg cttccacact tatacactct cttccatcaa 2040
gcgcatgtgg caggagaaac cgttgcaagg cctcttttcc ttgaattccc caaggattcc 2100
tcgacttgga cggtggatca tcagctgctg tggggagaag ctctgctgat tactccagtg 2160
ttgcaagccg gaaaagctga ggtgaccgga tactttccgc tgggaacctg gtacgacctc 2220
cagactgtcc ctgttgaagc ccttggatca ctgcctccgc ctccggcagc tccacgcgaa 2280
ccagctatac attccgaggg acagtgggtt acattaccag ctcctctgga cacaatcaac 2340
gtccacttaa gagctggcta cattatccct ctgcaaggac caggactgac tacgaccgag 2400
agcagacagc agccaatggc actggctgtg gctctgacca agggagggga agctagagga 2460
gaactcttct gggatgatgg ggagtccctt gaagtgctgg aaagaggcgc ttacactcaa 2520
gtcattttcc ttgcacggaa caacaccatt gtgaacgaat tggtgcgagt gaccagcgaa 2580
ggagctggac ttcaactgca gaaggtcact gtgctcggag tggctaccgc tcctcagcaa 2640
gtgctgtcga atggagtccc cgtgtcaaac tttacctact cccctgacac taaggtgctc 2700
gacatttgcg tgtccctcct gatgggagag cagttccttg tgtcctggtg ttga 2754
<210> 35
<211> 2652
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAco2-delta-42
<400> 35
gcccatcctg gtagaccaag agctgtgcct acccaatgcg acgtgccacc caactcccga 60
ttcgactgcg cgccagataa ggctattacc caagagcagt gtgaagccag aggttgctgc 120
tacatcccag cgaagcaagg attgcaaggc gcccaaatgg gacaaccttg gtgtttcttc 180
cccccttcgt acccatcata taaactcgaa aacctgtcct cttcggaaat gggttatact 240
gccaccctca ccagaactac tcctactttc ttcccgaaag acatcttgac cttgaggctg 300
gacgtgatga tggagactga aaaccggctg catttcacta tcaaagatcc tgccaatcgg 360
cgatacgagg tccctctgga aacccctcac gtgcactcac gggctccttc tccgctttac 420
tccgtcgaat tctctgagga acccttcgga gtgatcgtta gacgccagct ggatggtaga 480
gtgctgttga acactactgt ggccccactt ttcttcgctg accagtttct gcaactgtcc 540
acttccctgc catcccagta cattactgga ctcgccgaac acctgtcgcc actgatgctc 600
tcgacctctt ggactagaat cactttgtgg aacagagact tggcccctac tccgggagca 660
aatctgtacg gaagccaccc tttttacctg gcgctcgaag atggcggatc cgctcacgga 720
gtgttcctgc tgaatagcaa cgcaatggac gtggtgctgc aaccttcccc tgcactcagt 780
tggagaagta ccgggggtat tctggacgtg tacatcttcc tcggaccaga acccaagagc 840
gtggtgcagc aatatctgga cgtggtcgga taccctttta tgcctcctta ctggggactg 900
ggattccacc tttgccgttg gggctactca tccaccgcca ttaccagaca ggtggtggag 960
aatatgacca gagcccactt ccctctcgac gtgcagtgga acgatctgga ctatatggac 1020
tcccggagag atttcacctt caacaaggac gggttccgcg attttcccgc gatggttcaa 1080
gagctccacc agggtggtcg aagatatatg atgatcgtcg acccagccat ttcgagcagc 1140
ggacccgctg gatcttatag accttacgac gaaggcctta ggagaggagt gttcatcaca 1200
aacgagactg gacagccttt gatcggtaaa gtgtggcctg gatcaaccgc ctttcctgac 1260
tttaccaatc ccactgcctt ggcttggtgg gaggacatgg tggccgaatt ccacgaccaa 1320
gtcccctttg atggaatgtg gatcgatatg aacgaaccaa gcaattttat cagaggttcc 1380
gaagacggtt gccccaacaa cgaactggaa aaccctcctt atgtgcccgg agtcgtgggc 1440
ggaacattac aggccgcgac tatttgcgcc agcagccacc aattcctgtc cactcactac 1500
aacctccaca acctttatgg attaaccgaa gctattgcaa gtcacagggc tctggtgaag 1560
gctagaggga ctaggccctt tgtgatctcc cgatccacct ttgccggaca cgggagatac 1620
gccggtcact ggactggtga cgtgtggagc tcatgggaac aactggcctc ctccgtgccg 1680
gaaatcttac agttcaacct tctgggtgtc cctcttgtcg gagcagacgt gtgtgggttt 1740
cttggtaaca cctccgagga actgtgtgtg cgctggactc aactgggtgc attctaccca 1800
ttcatgagaa accacaactc cttgctgtcc ctgccacaag agccctactc gttcagcgag 1860
cctgcacaac aggctatgcg gaaggcactg accctgagat acgccctgct tccacactta 1920
tacactctct tccatcaagc gcatgtggca ggagaaaccg ttgcaaggcc tcttttcctt 1980
gaattcccca aggattcctc gacttggacg gtggatcatc agctgctgtg gggagaagct 2040
ctgctgatta ctccagtgtt gcaagccgga aaagctgagg tgaccggata ctttccgctg 2100
ggaacctggt acgacctcca gactgtccct gttgaagccc ttggatcact gcctccgcct 2160
ccggcagctc cacgcgaacc agctatacat tccgagggac agtgggttac attaccagct 2220
cctctggaca caatcaacgt ccacttaaga gctggctaca ttatccctct gcaaggacca 2280
ggactgacta cgaccgagag cagacagcag ccaatggcac tggctgtggc tctgaccaag 2340
ggaggggaag ctagaggaga actcttctgg gatgatgggg agtcccttga agtgctggaa 2400
agaggcgctt acactcaagt cattttcctt gcacggaaca acaccattgt gaacgaattg 2460
gtgcgagtga ccagcgaagg agctggactt caactgcaga aggtcactgt gctcggagtg 2520
gctaccgctc ctcagcaagt gctgtcgaat ggagtccccg tgtcaaactt tacctactcc 2580
cctgacacta aggtgctcga catttgcgtg tccctcctga tgggagagca gttccttgtg 2640
tcctggtgtt ga 2652
<210> 36
<211> 925
<212> PRT
<213> Artificial Sequence
<220>
<223> variant hGAAwt w/o sp
<400> 36
Gly His Ile Leu Leu His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser
1 5 10 15
Gly Ser Ser Pro Val Leu Glu Glu Thr His Pro Ala His Gln Gln Gly
20 25 30
Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro
35 40 45
Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp
50 55 60
Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly
65 70 75 80
Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly
85 90 95
Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu
100 105 110
Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr
115 120 125
Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val
130 135 140
Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala
145 150 155 160
Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro Arg Val His Ser Arg
165 170 175
Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly
180 185 190
Val Ile Val His Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr
195 200 205
Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser
210 215 220
Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu
225 230 235 240
Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu
245 250 255
Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu
260 265 270
Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser
275 280 285
Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg
290 295 300
Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro
305 310 315 320
Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met
325 330 335
Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser
340 345 350
Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala His
355 360 365
Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg
370 375 380
Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met
385 390 395 400
Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp
405 410 415
Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp
420 425 430
Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro
435 440 445
Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr
450 455 460
Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe His
465 470 475 480
Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser
485 490 495
Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu
500 505 510
Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala
515 520 525
Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu
530 535 540
His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu
545 550 555 560
Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe
565 570 575
Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser
580 585 590
Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn
595 600 605
Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly
610 615 620
Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe
625 630 635 640
Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu
645 650 655
Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu
660 665 670
Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln
675 680 685
Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe
690 695 700
Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly
705 710 715 720
Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val
725 730 735
Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro
740 745 750
Ile Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu
755 760 765
Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu
770 775 780
Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln
785 790 795 800
Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu
805 810 815
Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp
820 825 830
Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln
835 840 845
Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg
850 855 860
Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu
865 870 875 880
Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val
885 890 895
Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val
900 905 910
Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
915 920 925
<210> 37
<211> 952
<212> PRT
<213> homo sapiens
<400> 37
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro Arg Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val His Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940
Glu Gln Phe Leu Val Ser Trp Cys
945 950
<210> 38
<211> 952
<212> PRT
<213> homo sapiens
<400> 38
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940
Glu Gln Phe Leu Val Ser Trp Cys
945 950
<210> 39
<211> 957
<212> PRT
<213> homo sapiens
<400> 39
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Ala Arg Gly Pro Arg Val Leu Asp Ile Cys Val
930 935 940
Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
945 950 955
<210> 40
<211> 952
<212> PRT
<213> homo sapiens
<400> 40
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190
Val Pro Leu Glu Thr Pro Arg Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val His Arg
210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Leu Tyr Asp Glu Gly Leu Arg Arg
450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly
770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940
Glu Gln Phe Leu Val Ser Trp Cys
945 950
<210> 41
<211> 896
<212> PRT
<213> Artificial Sequence
<220>
<223> hGAA-delta-29
<400> 41
Gln Gln Gly Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro
1 5 10 15
Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser
20 25 30
Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu
35 40 45
Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala
50 55 60
Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr
65 70 75 80
Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu
85 90 95
Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg
100 105 110
Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys
115 120 125
Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val
130 135 140
His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu
145 150 155 160
Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu
165 170 175
Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu
180 185 190
Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu
195 200 205
Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn
210 215 220
Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro
225 230 235 240
Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu
245 250 255
Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu
260 265 270
Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly
275 280 285
Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr
290 295 300
Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp
305 310 315 320
Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr
325 330 335
Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met
340 345 350
Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe
355 360 365
Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met
370 375 380
Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg
385 390 395 400
Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr
405 410 415
Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro
420 425 430
Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala
435 440 445
Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn
450 455 460
Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn
465 470 475 480
Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu
485 490 495
Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His
500 505 510
Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His
515 520 525
Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg
530 535 540
Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp
545 550 555 560
Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu
565 570 575
Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly
580 585 590
Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu
595 600 605
Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu
610 615 620
Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg
625 630 635 640
Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu
645 650 655
Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe
660 665 670
Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu
675 680 685
Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys
690 695 700
Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln
705 710 715 720
Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala
725 730 735
Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro
740 745 750
Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile
755 760 765
Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro
770 775 780
Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu
785 790 795 800
Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala
805 810 815
Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu
820 825 830
Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val
835 840 845
Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly
850 855 860
Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp
865 870 875 880
Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
885 890 895
<210> 42
<211> 882
<212> PRT
<213> Artificial Sequence
<220>
<223> hGAA-delta-43
<400> 42
His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro
1 5 10 15
Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln
20 25 30
Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln
35 40 45
Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro
50 55 60
Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala
65 70 75 80
Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr
85 90 95
Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr
100 105 110
Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro
115 120 125
His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser
130 135 140
Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val
145 150 155 160
Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu
165 170 175
Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu
180 185 190
His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu
195 200 205
Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser
210 215 220
His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val
225 230 235 240
Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro
245 250 255
Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe
260 265 270
Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val
275 280 285
Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys
290 295 300
Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn
305 310 315 320
Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp
325 330 335
Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg
340 345 350
Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr
355 360 365
Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser
370 375 380
Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn
385 390 395 400
Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala
405 410 415
Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met
420 425 430
Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp
435 440 445
Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro
450 455 460
Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly
465 470 475 480
Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser
485 490 495
Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala
500 505 510
Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile
515 520 525
Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr
530 535 540
Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu
545 550 555 560
Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val
565 570 575
Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr
580 585 590
Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu
595 600 605
Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala
610 615 620
Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr
625 630 635 640
Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro
645 650 655
Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His
660 665 670
Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala
675 680 685
Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp
690 695 700
Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro
705 710 715 720
Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr
725 730 735
Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr
740 745 750
Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln
755 760 765
Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg
770 775 780
Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg
785 790 795 800
Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val
805 810 815
Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln
820 825 830
Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser
835 840 845
Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val
850 855 860
Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser
865 870 875 880
Trp Cys
<210> 43
<211> 878
<212> PRT
<213> Artificial Sequence
<220>
<223> hGAA-delta-47
<400> 43
Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe
1 5 10 15
Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg
20 25 30
Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met
35 40 45
Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu
50 55 60
Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg
65 70 75 80
Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp
85 90 95
Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro
100 105 110
Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val His Ser
115 120 125
Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe
130 135 140
Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr
145 150 155 160
Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr
165 170 175
Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro
180 185 190
Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp
195 200 205
Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr
210 215 220
Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn
225 230 235 240
Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp
245 250 255
Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu
260 265 270
Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe
275 280 285
Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr
290 295 300
Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala
305 310 315 320
His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser
325 330 335
Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala
340 345 350
Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val
355 360 365
Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr
370 375 380
Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln
385 390 395 400
Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe
405 410 415
Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe
420 425 430
His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro
435 440 445
Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu
450 455 460
Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala
465 470 475 480
Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn
485 490 495
Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala
500 505 510
Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr
515 520 525
Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp
530 535 540
Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe
545 550 555 560
Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu
565 570 575
Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala
580 585 590
Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln
595 600 605
Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala
610 615 620
Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His
625 630 635 640
Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu
645 650 655
Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp
660 665 670
Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu
675 680 685
Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val
690 695 700
Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg
705 710 715 720
Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro
725 730 735
Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu
740 745 750
Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala
755 760 765
Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe
770 775 780
Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr
785 790 795 800
Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val
805 810 815
Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val
820 825 830
Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro
835 840 845
Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys
850 855 860
Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
865 870 875
<210> 44
<211> 2754
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAwt-delta-8
<400> 44
ctgctggttc cccgagagct gagtggctcc tccccagtcc tggaggagac tcacccagct 60
caccagcagg gagccagcag accagggccc cgggatgccc aggcacaccc cgggcggccg 120
cgagcagtgc ccacacagtg cgacgtcccc cccaacagcc gcttcgattg cgcccctgac 180
aaggccatca cccaggaaca gtgcgaggcc cgcggctgtt gctacatccc tgcaaagcag 240
gggctgcagg gagcccagat ggggcagccc tggtgcttct tcccacccag ctaccccagc 300
tacaagctgg agaacctgag ctcctctgaa atgggctaca cggccaccct gacccgtacc 360
acccccacct tcttccccaa ggacatcctg accctgcggc tggacgtgat gatggagact 420
gagaaccgcc tccacttcac gatcaaagat ccagctaaca ggcgctacga ggtgcccttg 480
gagaccccgc atgtccacag ccgggcaccg tccccactct acagcgtgga gttctccgag 540
gagcccttcg gggtgatcgt gcgccggcag ctggacggcc gcgtgctgct gaacacgacg 600
gtggcgcccc tgttctttgc ggaccagttc cttcagctgt ccacctcgct gccctcgcag 660
tatatcacag gcctcgccga gcacctcagt cccctgatgc tcagcaccag ctggaccagg 720
atcaccctgt ggaaccggga ccttgcgccc acgcccggtg cgaacctcta cgggtctcac 780
cctttctacc tggcgctgga ggacggcggg tcggcacacg gggtgttcct gctaaacagc 840
aatgccatgg atgtggtcct gcagccgagc cctgccctta gctggaggtc gacaggtggg 900
atcctggatg tctacatctt cctgggccca gagcccaaga gcgtggtgca gcagtacctg 960
gacgttgtgg gatacccgtt catgccgcca tactggggcc tgggcttcca cctgtgccgc 1020
tggggctact cctccaccgc tatcacccgc caggtggtgg agaacatgac cagggcccac 1080
ttccccctgg acgtccagtg gaacgacctg gactacatgg actcccggag ggacttcacg 1140
ttcaacaagg atggcttccg ggacttcccg gccatggtgc aggagctgca ccagggcggc 1200
cggcgctaca tgatgatcgt ggatcctgcc atcagcagct cgggccctgc cgggagctac 1260
aggccctacg acgagggtct gcggaggggg gttttcatca ccaacgagac cggccagccg 1320
ctgattggga aggtatggcc cgggtccact gccttccccg acttcaccaa ccccacagcc 1380
ctggcctggt gggaggacat ggtggctgag ttccatgacc aggtgccctt cgacggcatg 1440
tggattgaca tgaacgagcc ttccaacttc atcaggggct ctgaggacgg ctgccccaac 1500
aatgagctgg agaacccacc ctacgtgcct ggggtggttg gggggaccct ccaggcggcc 1560
accatctgtg cctccagcca ccagtttctc tccacacact acaacctgca caacctctac 1620
ggcctgaccg aagccatcgc ctcccacagg gcgctggtga aggctcgggg gacacgccca 1680
tttgtgatct cccgctcgac ctttgctggc cacggccgat acgccggcca ctggacgggg 1740
gacgtgtgga gctcctggga gcagctcgcc tcctccgtgc cagaaatcct gcagtttaac 1800
ctgctggggg tgcctctggt cggggccgac gtctgcggct tcctgggcaa cacctcagag 1860
gagctgtgtg tgcgctggac ccagctgggg gccttctacc ccttcatgcg gaaccacaac 1920
agcctgctca gtctgcccca ggagccgtac agcttcagcg agccggccca gcaggccatg 1980
aggaaggccc tcaccctgcg ctacgcactc ctcccccacc tctacacact gttccaccag 2040
gcccacgtcg cgggggagac cgtggcccgg cccctcttcc tggagttccc caaggactct 2100
agcacctgga ctgtggacca ccagctcctg tggggggagg ccctgctcat caccccagtg 2160
ctccaggccg ggaaggccga agtgactggc tacttcccct tgggcacatg gtacgacctg 2220
cagacggtgc cagtagaggc ccttggcagc ctcccacccc cacctgcagc tccccgtgag 2280
ccagccatcc acagcgaggg gcagtgggtg acgctgccgg cccccctgga caccatcaac 2340
gtccacctcc gggctgggta catcatcccc ctgcagggcc ctggcctcac aaccacagag 2400
tcccgccagc agcccatggc cctggctgtg gccctgacca agggtgggga ggcccgaggg 2460
gagctgttct gggacgatgg agagagcctg gaagtgctgg agcgaggggc ctacacacag 2520
gtcatcttcc tggccaggaa taacacgatc gtgaatgagc tggtacgtgt gaccagtgag 2580
ggagctggcc tgcagctgca gaaggtgact gtcctgggcg tggccacggc gccccagcag 2640
gtcctctcca acggtgtccc tgtctccaac ttcacctaca gccccgacac caaggtcctg 2700
gacatctgtg tctcgctgtt gatgggagag cagtttctcg tcagctggtg ttag 2754
<210> 45
<211> 2691
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAwt-delta-29
<400> 45
cagcagggag ccagcagacc agggccccgg gatgcccagg cacaccccgg gcggccgcga 60
gcagtgccca cacagtgcga cgtccccccc aacagccgct tcgattgcgc ccctgacaag 120
gccatcaccc aggaacagtg cgaggcccgc ggctgttgct acatccctgc aaagcagggg 180
ctgcagggag cccagatggg gcagccctgg tgcttcttcc cacccagcta ccccagctac 240
aagctggaga acctgagctc ctctgaaatg ggctacacgg ccaccctgac ccgtaccacc 300
cccaccttct tccccaagga catcctgacc ctgcggctgg acgtgatgat ggagactgag 360
aaccgcctcc acttcacgat caaagatcca gctaacaggc gctacgaggt gcccttggag 420
accccgcatg tccacagccg ggcaccgtcc ccactctaca gcgtggagtt ctccgaggag 480
cccttcgggg tgatcgtgcg ccggcagctg gacggccgcg tgctgctgaa cacgacggtg 540
gcgcccctgt tctttgcgga ccagttcctt cagctgtcca cctcgctgcc ctcgcagtat 600
atcacaggcc tcgccgagca cctcagtccc ctgatgctca gcaccagctg gaccaggatc 660
accctgtgga accgggacct tgcgcccacg cccggtgcga acctctacgg gtctcaccct 720
ttctacctgg cgctggagga cggcgggtcg gcacacgggg tgttcctgct aaacagcaat 780
gccatggatg tggtcctgca gccgagccct gcccttagct ggaggtcgac aggtgggatc 840
ctggatgtct acatcttcct gggcccagag cccaagagcg tggtgcagca gtacctggac 900
gttgtgggat acccgttcat gccgccatac tggggcctgg gcttccacct gtgccgctgg 960
ggctactcct ccaccgctat cacccgccag gtggtggaga acatgaccag ggcccacttc 1020
cccctggacg tccagtggaa cgacctggac tacatggact cccggaggga cttcacgttc 1080
aacaaggatg gcttccggga cttcccggcc atggtgcagg agctgcacca gggcggccgg 1140
cgctacatga tgatcgtgga tcctgccatc agcagctcgg gccctgccgg gagctacagg 1200
ccctacgacg agggtctgcg gaggggggtt ttcatcacca acgagaccgg ccagccgctg 1260
attgggaagg tatggcccgg gtccactgcc ttccccgact tcaccaaccc cacagccctg 1320
gcctggtggg aggacatggt ggctgagttc catgaccagg tgcccttcga cggcatgtgg 1380
attgacatga acgagccttc caacttcatc aggggctctg aggacggctg ccccaacaat 1440
gagctggaga acccacccta cgtgcctggg gtggttgggg ggaccctcca ggcggccacc 1500
atctgtgcct ccagccacca gtttctctcc acacactaca acctgcacaa cctctacggc 1560
ctgaccgaag ccatcgcctc ccacagggcg ctggtgaagg ctcgggggac acgcccattt 1620
gtgatctccc gctcgacctt tgctggccac ggccgatacg ccggccactg gacgggggac 1680
gtgtggagct cctgggagca gctcgcctcc tccgtgccag aaatcctgca gtttaacctg 1740
ctgggggtgc ctctggtcgg ggccgacgtc tgcggcttcc tgggcaacac ctcagaggag 1800
ctgtgtgtgc gctggaccca gctgggggcc ttctacccct tcatgcggaa ccacaacagc 1860
ctgctcagtc tgccccagga gccgtacagc ttcagcgagc cggcccagca ggccatgagg 1920
aaggccctca ccctgcgcta cgcactcctc ccccacctct acacactgtt ccaccaggcc 1980
cacgtcgcgg gggagaccgt ggcccggccc ctcttcctgg agttccccaa ggactctagc 2040
acctggactg tggaccacca gctcctgtgg ggggaggccc tgctcatcac cccagtgctc 2100
caggccggga aggccgaagt gactggctac ttccccttgg gcacatggta cgacctgcag 2160
acggtgccag tagaggccct tggcagcctc ccacccccac ctgcagctcc ccgtgagcca 2220
gccatccaca gcgaggggca gtgggtgacg ctgccggccc ccctggacac catcaacgtc 2280
cacctccggg ctgggtacat catccccctg cagggccctg gcctcacaac cacagagtcc 2340
cgccagcagc ccatggccct ggctgtggcc ctgaccaagg gtggggaggc ccgaggggag 2400
ctgttctggg acgatggaga gagcctggaa gtgctggagc gaggggccta cacacaggtc 2460
atcttcctgg ccaggaataa cacgatcgtg aatgagctgg tacgtgtgac cagtgaggga 2520
gctggcctgc agctgcagaa ggtgactgtc ctgggcgtgg ccacggcgcc ccagcaggtc 2580
ctctccaacg gtgtccctgt ctccaacttc acctacagcc ccgacaccaa ggtcctggac 2640
atctgtgtct cgctgttgat gggagagcag tttctcgtca gctggtgtta g 2691
<210> 46
<211> 2691
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAco1-delta-29
<400> 46
cagcagggcg cctctagacc tggacctaga gatgcccagg cccaccccgg cagacctaga 60
gctgtgccta cccagtgtga cgtgcccccc aacagcagat tcgactgcgc ccctgacaag 120
gccatcaccc aggaacagtg cgaggccaga ggctgctgct acatccctgc caagcaggga 180
ctgcagggcg ctcagatggg acagccctgg tgcttcttcc caccctccta ccccagctac 240
aagctggaaa acctgagcag cagcgagatg ggctacaccg ccaccctgac cagaaccacc 300
cccacattct tcccaaagga catcctgacc ctgcggctgg acgtgatgat ggaaaccgag 360
aaccggctgc acttcaccat caaggacccc gccaatcgga gatacgaggt gcccctggaa 420
accccccacg tgcactctag agcccccagc cctctgtaca gcgtggaatt cagcgaggaa 480
cccttcggcg tgatcgtgcg gagacagctg gatggcagag tgctgctgaa caccaccgtg 540
gcccctctgt tcttcgccga ccagttcctg cagctgagca ccagcctgcc cagccagtac 600
atcacaggac tggccgagca cctgagcccc ctgatgctga gcacatcctg gacccggatc 660
accctgtgga acagggatct ggcccctacc cctggcgcca atctgtacgg cagccaccct 720
ttctacctgg ccctggaaga tggcggatct gcccacggag tgtttctgct gaactccaac 780
gccatggacg tggtgctgca gcctagccct gccctgtctt ggagaagcac aggcggcatc 840
ctggatgtgt acatctttct gggccccgag cccaagagcg tggtgcagca gtatctggat 900
gtcgtgggct accccttcat gcccccttac tggggcctgg gattccacct gtgcagatgg 960
ggctactcca gcaccgccat caccagacag gtggtggaaa acatgaccag agcccacttc 1020
ccactggatg tgcagtggaa cgacctggac tacatggaca gcagacggga cttcaccttc 1080
aacaaggacg gcttccggga cttccccgcc atggtgcagg aactgcatca gggcggcaga 1140
cggtacatga tgatcgtgga tcccgccatc agctcctctg gccctgccgg ctcttacaga 1200
ccctacgacg agggcctgcg gagaggcgtg ttcatcacca acgagacagg ccagcccctg 1260
atcggcaaag tgtggcctgg cagcacagcc ttccccgact tcaccaatcc taccgccctg 1320
gcttggtggg aggacatggt ggccgagttc cacgaccagg tgcccttcga cggcatgtgg 1380
atcgacatga acgagcccag caacttcatc cggggcagcg aggatggctg ccccaacaac 1440
gaactggaaa atccccctta cgtgcccggc gtcgtgggcg gaacactgca ggccgctaca 1500
atctgtgcca gcagccacca gtttctgagc acccactaca acctgcacaa cctgtacggc 1560
ctgaccgagg ccattgccag ccaccgcgct ctcgtgaaag ccagaggcac acggcccttc 1620
gtgatcagca gaagcacctt tgccggccac ggcagatacg ccggacattg gactggcgac 1680
gtgtggtcct cttgggagca gctggcctct agcgtgcccg agatcctgca gttcaatctg 1740
ctgggcgtgc cactcgtggg cgccgatgtg tgtggcttcc tgggcaacac ctccgaggaa 1800
ctgtgtgtgc ggtggacaca gctgggcgcc ttctaccctt tcatgagaaa ccacaacagc 1860
ctgctgagcc tgccccagga accctacagc tttagcgagc ctgcacagca ggccatgcgg 1920
aaggccctga cactgagata cgctctgctg ccccacctgt acaccctgtt tcaccaggcc 1980
catgtggccg gcgagacagt ggccagacct ctgtttctgg aattccccaa ggacagcagc 2040
acctggaccg tggaccatca gctgctgtgg ggagaggctc tgctgattac cccagtgctg 2100
caggcaggca aggccgaagt gaccggctac tttcccctgg gcacttggta cgacctgcag 2160
accgtgcctg tggaagccct gggatctctg cctccacctc ctgccgctcc tagagagcct 2220
gccattcact ctgagggcca gtgggtcaca ctgcctgccc ccctggatac catcaacgtg 2280
cacctgaggg ccggctacat cataccactg cagggacctg gcctgaccac caccgagtct 2340
agacagcagc caatggccct ggccgtggcc ctgaccaaag gcggagaagc taggggcgag 2400
ctgttctggg acgatggcga gagcctggaa gtgctggaaa gaggcgccta tacccaagtg 2460
atcttcctgg cccggaacaa caccatcgtg aacgagctgg tgcgcgtgac ctctgaaggc 2520
gctggactgc agctgcagaa agtgaccgtg ctgggagtgg ccacagcccc tcagcaggtg 2580
ctgtctaatg gcgtgcccgt gtccaacttc acctacagcc ccgacaccaa ggtgctggac 2640
atctgcgtgt cactgctgat gggagagcag tttctggtgt cctggtgctg a 2691
<210> 47
<211> 2691
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAco2-delta-29
<400> 47
caacagggag cttccagacc aggaccgaga gacgcccaag cccatcctgg tagaccaaga 60
gctgtgccta cccaatgcga cgtgccaccc aactcccgat tcgactgcgc gccagataag 120
gctattaccc aagagcagtg tgaagccaga ggttgctgct acatcccagc gaagcaagga 180
ttgcaaggcg cccaaatggg acaaccttgg tgtttcttcc ccccttcgta cccatcatat 240
aaactcgaaa acctgtcctc ttcggaaatg ggttatactg ccaccctcac cagaactact 300
cctactttct tcccgaaaga catcttgacc ttgaggctgg acgtgatgat ggagactgaa 360
aaccggctgc atttcactat caaagatcct gccaatcggc gatacgaggt ccctctggaa 420
acccctcacg tgcactcacg ggctccttct ccgctttact ccgtcgaatt ctctgaggaa 480
cccttcggag tgatcgttag acgccagctg gatggtagag tgctgttgaa cactactgtg 540
gccccacttt tcttcgctga ccagtttctg caactgtcca cttccctgcc atcccagtac 600
attactggac tcgccgaaca cctgtcgcca ctgatgctct cgacctcttg gactagaatc 660
actttgtgga acagagactt ggcccctact ccgggagcaa atctgtacgg aagccaccct 720
ttttacctgg cgctcgaaga tggcggatcc gctcacggag tgttcctgct gaatagcaac 780
gcaatggacg tggtgctgca accttcccct gcactcagtt ggagaagtac cgggggtatt 840
ctggacgtgt acatcttcct cggaccagaa cccaagagcg tggtgcagca atatctggac 900
gtggtcggat acccttttat gcctccttac tggggactgg gattccacct ttgccgttgg 960
ggctactcat ccaccgccat taccagacag gtggtggaga atatgaccag agcccacttc 1020
cctctcgacg tgcagtggaa cgatctggac tatatggact cccggagaga tttcaccttc 1080
aacaaggacg ggttccgcga ttttcccgcg atggttcaag agctccacca gggtggtcga 1140
agatatatga tgatcgtcga cccagccatt tcgagcagcg gacccgctgg atcttataga 1200
ccttacgacg aaggccttag gagaggagtg ttcatcacaa acgagactgg acagcctttg 1260
atcggtaaag tgtggcctgg atcaaccgcc tttcctgact ttaccaatcc cactgccttg 1320
gcttggtggg aggacatggt ggccgaattc cacgaccaag tcccctttga tggaatgtgg 1380
atcgatatga acgaaccaag caattttatc agaggttccg aagacggttg ccccaacaac 1440
gaactggaaa accctcctta tgtgcccgga gtcgtgggcg gaacattaca ggccgcgact 1500
atttgcgcca gcagccacca attcctgtcc actcactaca acctccacaa cctttatgga 1560
ttaaccgaag ctattgcaag tcacagggct ctggtgaagg ctagagggac taggcccttt 1620
gtgatctccc gatccacctt tgccggacac gggagatacg ccggtcactg gactggtgac 1680
gtgtggagct catgggaaca actggcctcc tccgtgccgg aaatcttaca gttcaacctt 1740
ctgggtgtcc ctcttgtcgg agcagacgtg tgtgggtttc ttggtaacac ctccgaggaa 1800
ctgtgtgtgc gctggactca actgggtgca ttctacccat tcatgagaaa ccacaactcc 1860
ttgctgtccc tgccacaaga gccctactcg ttcagcgagc ctgcacaaca ggctatgcgg 1920
aaggcactga ccctgagata cgccctgctt ccacacttat acactctctt ccatcaagcg 1980
catgtggcag gagaaaccgt tgcaaggcct cttttccttg aattccccaa ggattcctcg 2040
acttggacgg tggatcatca gctgctgtgg ggagaagctc tgctgattac tccagtgttg 2100
caagccggaa aagctgaggt gaccggatac tttccgctgg gaacctggta cgacctccag 2160
actgtccctg ttgaagccct tggatcactg cctccgcctc cggcagctcc acgcgaacca 2220
gctatacatt ccgagggaca gtgggttaca ttaccagctc ctctggacac aatcaacgtc 2280
cacttaagag ctggctacat tatccctctg caaggaccag gactgactac gaccgagagc 2340
agacagcagc caatggcact ggctgtggct ctgaccaagg gaggggaagc tagaggagaa 2400
ctcttctggg atgatgggga gtcccttgaa gtgctggaaa gaggcgctta cactcaagtc 2460
attttccttg cacggaacaa caccattgtg aacgaattgg tgcgagtgac cagcgaagga 2520
gctggacttc aactgcagaa ggtcactgtg ctcggagtgg ctaccgctcc tcagcaagtg 2580
ctgtcgaatg gagtccccgt gtcaaacttt acctactccc ctgacactaa ggtgctcgac 2640
atttgcgtgt ccctcctgat gggagagcag ttccttgtgt cctggtgttg a 2691
<210> 48
<211> 2652
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAwt-delta-42
<400> 48
gcacaccccg ggcggccgcg agcagtgccc acacagtgcg acgtcccccc caacagccgc 60
ttcgattgcg cccctgacaa ggccatcacc caggaacagt gcgaggcccg cggctgttgc 120
tacatccctg caaagcaggg gctgcaggga gcccagatgg ggcagccctg gtgcttcttc 180
ccacccagct accccagcta caagctggag aacctgagct cctctgaaat gggctacacg 240
gccaccctga cccgtaccac ccccaccttc ttccccaagg acatcctgac cctgcggctg 300
gacgtgatga tggagactga gaaccgcctc cacttcacga tcaaagatcc agctaacagg 360
cgctacgagg tgcccttgga gaccccgcat gtccacagcc gggcaccgtc cccactctac 420
agcgtggagt tctccgagga gcccttcggg gtgatcgtgc gccggcagct ggacggccgc 480
gtgctgctga acacgacggt ggcgcccctg ttctttgcgg accagttcct tcagctgtcc 540
acctcgctgc cctcgcagta tatcacaggc ctcgccgagc acctcagtcc cctgatgctc 600
agcaccagct ggaccaggat caccctgtgg aaccgggacc ttgcgcccac gcccggtgcg 660
aacctctacg ggtctcaccc tttctacctg gcgctggagg acggcgggtc ggcacacggg 720
gtgttcctgc taaacagcaa tgccatggat gtggtcctgc agccgagccc tgcccttagc 780
tggaggtcga caggtgggat cctggatgtc tacatcttcc tgggcccaga gcccaagagc 840
gtggtgcagc agtacctgga cgttgtggga tacccgttca tgccgccata ctggggcctg 900
ggcttccacc tgtgccgctg gggctactcc tccaccgcta tcacccgcca ggtggtggag 960
aacatgacca gggcccactt ccccctggac gtccagtgga acgacctgga ctacatggac 1020
tcccggaggg acttcacgtt caacaaggat ggcttccggg acttcccggc catggtgcag 1080
gagctgcacc agggcggccg gcgctacatg atgatcgtgg atcctgccat cagcagctcg 1140
ggccctgccg ggagctacag gccctacgac gagggtctgc ggaggggggt tttcatcacc 1200
aacgagaccg gccagccgct gattgggaag gtatggcccg ggtccactgc cttccccgac 1260
ttcaccaacc ccacagccct ggcctggtgg gaggacatgg tggctgagtt ccatgaccag 1320
gtgcccttcg acggcatgtg gattgacatg aacgagcctt ccaacttcat caggggctct 1380
gaggacggct gccccaacaa tgagctggag aacccaccct acgtgcctgg ggtggttggg 1440
gggaccctcc aggcggccac catctgtgcc tccagccacc agtttctctc cacacactac 1500
aacctgcaca acctctacgg cctgaccgaa gccatcgcct cccacagggc gctggtgaag 1560
gctcggggga cacgcccatt tgtgatctcc cgctcgacct ttgctggcca cggccgatac 1620
gccggccact ggacggggga cgtgtggagc tcctgggagc agctcgcctc ctccgtgcca 1680
gaaatcctgc agtttaacct gctgggggtg cctctggtcg gggccgacgt ctgcggcttc 1740
ctgggcaaca cctcagagga gctgtgtgtg cgctggaccc agctgggggc cttctacccc 1800
ttcatgcgga accacaacag cctgctcagt ctgccccagg agccgtacag cttcagcgag 1860
ccggcccagc aggccatgag gaaggccctc accctgcgct acgcactcct cccccacctc 1920
tacacactgt tccaccaggc ccacgtcgcg ggggagaccg tggcccggcc cctcttcctg 1980
gagttcccca aggactctag cacctggact gtggaccacc agctcctgtg gggggaggcc 2040
ctgctcatca ccccagtgct ccaggccggg aaggccgaag tgactggcta cttccccttg 2100
ggcacatggt acgacctgca gacggtgcca gtagaggccc ttggcagcct cccaccccca 2160
cctgcagctc cccgtgagcc agccatccac agcgaggggc agtgggtgac gctgccggcc 2220
cccctggaca ccatcaacgt ccacctccgg gctgggtaca tcatccccct gcagggccct 2280
ggcctcacaa ccacagagtc ccgccagcag cccatggccc tggctgtggc cctgaccaag 2340
ggtggggagg cccgagggga gctgttctgg gacgatggag agagcctgga agtgctggag 2400
cgaggggcct acacacaggt catcttcctg gccaggaata acacgatcgt gaatgagctg 2460
gtacgtgtga ccagtgaggg agctggcctg cagctgcaga aggtgactgt cctgggcgtg 2520
gccacggcgc cccagcaggt cctctccaac ggtgtccctg tctccaactt cacctacagc 2580
cccgacacca aggtcctgga catctgtgtc tcgctgttga tgggagagca gtttctcgtc 2640
agctggtgtt ag 2652
<210> 49
<211> 2649
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAwt-delta-43
<400> 49
caccccgggc ggccgcgagc agtgcccaca cagtgcgacg tcccccccaa cagccgcttc 60
gattgcgccc ctgacaaggc catcacccag gaacagtgcg aggcccgcgg ctgttgctac 120
atccctgcaa agcaggggct gcagggagcc cagatggggc agccctggtg cttcttccca 180
cccagctacc ccagctacaa gctggagaac ctgagctcct ctgaaatggg ctacacggcc 240
accctgaccc gtaccacccc caccttcttc cccaaggaca tcctgaccct gcggctggac 300
gtgatgatgg agactgagaa ccgcctccac ttcacgatca aagatccagc taacaggcgc 360
tacgaggtgc ccttggagac cccgcatgtc cacagccggg caccgtcccc actctacagc 420
gtggagttct ccgaggagcc cttcggggtg atcgtgcgcc ggcagctgga cggccgcgtg 480
ctgctgaaca cgacggtggc gcccctgttc tttgcggacc agttccttca gctgtccacc 540
tcgctgccct cgcagtatat cacaggcctc gccgagcacc tcagtcccct gatgctcagc 600
accagctgga ccaggatcac cctgtggaac cgggaccttg cgcccacgcc cggtgcgaac 660
ctctacgggt ctcacccttt ctacctggcg ctggaggacg gcgggtcggc acacggggtg 720
ttcctgctaa acagcaatgc catggatgtg gtcctgcagc cgagccctgc ccttagctgg 780
aggtcgacag gtgggatcct ggatgtctac atcttcctgg gcccagagcc caagagcgtg 840
gtgcagcagt acctggacgt tgtgggatac ccgttcatgc cgccatactg gggcctgggc 900
ttccacctgt gccgctgggg ctactcctcc accgctatca cccgccaggt ggtggagaac 960
atgaccaggg cccacttccc cctggacgtc cagtggaacg acctggacta catggactcc 1020
cggagggact tcacgttcaa caaggatggc ttccgggact tcccggccat ggtgcaggag 1080
ctgcaccagg gcggccggcg ctacatgatg atcgtggatc ctgccatcag cagctcgggc 1140
cctgccggga gctacaggcc ctacgacgag ggtctgcgga ggggggtttt catcaccaac 1200
gagaccggcc agccgctgat tgggaaggta tggcccgggt ccactgcctt ccccgacttc 1260
accaacccca cagccctggc ctggtgggag gacatggtgg ctgagttcca tgaccaggtg 1320
cccttcgacg gcatgtggat tgacatgaac gagccttcca acttcatcag gggctctgag 1380
gacggctgcc ccaacaatga gctggagaac ccaccctacg tgcctggggt ggttgggggg 1440
accctccagg cggccaccat ctgtgcctcc agccaccagt ttctctccac acactacaac 1500
ctgcacaacc tctacggcct gaccgaagcc atcgcctccc acagggcgct ggtgaaggct 1560
cgggggacac gcccatttgt gatctcccgc tcgacctttg ctggccacgg ccgatacgcc 1620
ggccactgga cgggggacgt gtggagctcc tgggagcagc tcgcctcctc cgtgccagaa 1680
atcctgcagt ttaacctgct gggggtgcct ctggtcgggg ccgacgtctg cggcttcctg 1740
ggcaacacct cagaggagct gtgtgtgcgc tggacccagc tgggggcctt ctaccccttc 1800
atgcggaacc acaacagcct gctcagtctg ccccaggagc cgtacagctt cagcgagccg 1860
gcccagcagg ccatgaggaa ggccctcacc ctgcgctacg cactcctccc ccacctctac 1920
acactgttcc accaggccca cgtcgcgggg gagaccgtgg cccggcccct cttcctggag 1980
ttccccaagg actctagcac ctggactgtg gaccaccagc tcctgtgggg ggaggccctg 2040
ctcatcaccc cagtgctcca ggccgggaag gccgaagtga ctggctactt ccccttgggc 2100
acatggtacg acctgcagac ggtgccagta gaggcccttg gcagcctccc acccccacct 2160
gcagctcccc gtgagccagc catccacagc gaggggcagt gggtgacgct gccggccccc 2220
ctggacacca tcaacgtcca cctccgggct gggtacatca tccccctgca gggccctggc 2280
ctcacaacca cagagtcccg ccagcagccc atggccctgg ctgtggccct gaccaagggt 2340
ggggaggccc gaggggagct gttctgggac gatggagaga gcctggaagt gctggagcga 2400
ggggcctaca cacaggtcat cttcctggcc aggaataaca cgatcgtgaa tgagctggta 2460
cgtgtgacca gtgagggagc tggcctgcag ctgcagaagg tgactgtcct gggcgtggcc 2520
acggcgcccc agcaggtcct ctccaacggt gtccctgtct ccaacttcac ctacagcccc 2580
gacaccaagg tcctggacat ctgtgtctcg ctgttgatgg gagagcagtt tctcgtcagc 2640
tggtgttag 2649
<210> 50
<211> 2649
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAco1-delta-43
<400> 50
caccccggca gacctagagc tgtgcctacc cagtgtgacg tgccccccaa cagcagattc 60
gactgcgccc ctgacaaggc catcacccag gaacagtgcg aggccagagg ctgctgctac 120
atccctgcca agcagggact gcagggcgct cagatgggac agccctggtg cttcttccca 180
ccctcctacc ccagctacaa gctggaaaac ctgagcagca gcgagatggg ctacaccgcc 240
accctgacca gaaccacccc cacattcttc ccaaaggaca tcctgaccct gcggctggac 300
gtgatgatgg aaaccgagaa ccggctgcac ttcaccatca aggaccccgc caatcggaga 360
tacgaggtgc ccctggaaac cccccacgtg cactctagag cccccagccc tctgtacagc 420
gtggaattca gcgaggaacc cttcggcgtg atcgtgcgga gacagctgga tggcagagtg 480
ctgctgaaca ccaccgtggc ccctctgttc ttcgccgacc agttcctgca gctgagcacc 540
agcctgccca gccagtacat cacaggactg gccgagcacc tgagccccct gatgctgagc 600
acatcctgga cccggatcac cctgtggaac agggatctgg cccctacccc tggcgccaat 660
ctgtacggca gccacccttt ctacctggcc ctggaagatg gcggatctgc ccacggagtg 720
tttctgctga actccaacgc catggacgtg gtgctgcagc ctagccctgc cctgtcttgg 780
agaagcacag gcggcatcct ggatgtgtac atctttctgg gccccgagcc caagagcgtg 840
gtgcagcagt atctggatgt cgtgggctac cccttcatgc ccccttactg gggcctggga 900
ttccacctgt gcagatgggg ctactccagc accgccatca ccagacaggt ggtggaaaac 960
atgaccagag cccacttccc actggatgtg cagtggaacg acctggacta catggacagc 1020
agacgggact tcaccttcaa caaggacggc ttccgggact tccccgccat ggtgcaggaa 1080
ctgcatcagg gcggcagacg gtacatgatg atcgtggatc ccgccatcag ctcctctggc 1140
cctgccggct cttacagacc ctacgacgag ggcctgcgga gaggcgtgtt catcaccaac 1200
gagacaggcc agcccctgat cggcaaagtg tggcctggca gcacagcctt ccccgacttc 1260
accaatccta ccgccctggc ttggtgggag gacatggtgg ccgagttcca cgaccaggtg 1320
cccttcgacg gcatgtggat cgacatgaac gagcccagca acttcatccg gggcagcgag 1380
gatggctgcc ccaacaacga actggaaaat cccccttacg tgcccggcgt cgtgggcgga 1440
acactgcagg ccgctacaat ctgtgccagc agccaccagt ttctgagcac ccactacaac 1500
ctgcacaacc tgtacggcct gaccgaggcc attgccagcc accgcgctct cgtgaaagcc 1560
agaggcacac ggcccttcgt gatcagcaga agcacctttg ccggccacgg cagatacgcc 1620
ggacattgga ctggcgacgt gtggtcctct tgggagcagc tggcctctag cgtgcccgag 1680
atcctgcagt tcaatctgct gggcgtgcca ctcgtgggcg ccgatgtgtg tggcttcctg 1740
ggcaacacct ccgaggaact gtgtgtgcgg tggacacagc tgggcgcctt ctaccctttc 1800
atgagaaacc acaacagcct gctgagcctg ccccaggaac cctacagctt tagcgagcct 1860
gcacagcagg ccatgcggaa ggccctgaca ctgagatacg ctctgctgcc ccacctgtac 1920
accctgtttc accaggccca tgtggccggc gagacagtgg ccagacctct gtttctggaa 1980
ttccccaagg acagcagcac ctggaccgtg gaccatcagc tgctgtgggg agaggctctg 2040
ctgattaccc cagtgctgca ggcaggcaag gccgaagtga ccggctactt tcccctgggc 2100
acttggtacg acctgcagac cgtgcctgtg gaagccctgg gatctctgcc tccacctcct 2160
gccgctccta gagagcctgc cattcactct gagggccagt gggtcacact gcctgccccc 2220
ctggatacca tcaacgtgca cctgagggcc ggctacatca taccactgca gggacctggc 2280
ctgaccacca ccgagtctag acagcagcca atggccctgg ccgtggccct gaccaaaggc 2340
ggagaagcta ggggcgagct gttctgggac gatggcgaga gcctggaagt gctggaaaga 2400
ggcgcctata cccaagtgat cttcctggcc cggaacaaca ccatcgtgaa cgagctggtg 2460
cgcgtgacct ctgaaggcgc tggactgcag ctgcagaaag tgaccgtgct gggagtggcc 2520
acagcccctc agcaggtgct gtctaatggc gtgcccgtgt ccaacttcac ctacagcccc 2580
gacaccaagg tgctggacat ctgcgtgtca ctgctgatgg gagagcagtt tctggtgtcc 2640
tggtgctga 2649
<210> 51
<211> 2649
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAco2-delta-43
<400> 51
catcctggta gaccaagagc tgtgcctacc caatgcgacg tgccacccaa ctcccgattc 60
gactgcgcgc cagataaggc tattacccaa gagcagtgtg aagccagagg ttgctgctac 120
atcccagcga agcaaggatt gcaaggcgcc caaatgggac aaccttggtg tttcttcccc 180
ccttcgtacc catcatataa actcgaaaac ctgtcctctt cggaaatggg ttatactgcc 240
accctcacca gaactactcc tactttcttc ccgaaagaca tcttgacctt gaggctggac 300
gtgatgatgg agactgaaaa ccggctgcat ttcactatca aagatcctgc caatcggcga 360
tacgaggtcc ctctggaaac ccctcacgtg cactcacggg ctccttctcc gctttactcc 420
gtcgaattct ctgaggaacc cttcggagtg atcgttagac gccagctgga tggtagagtg 480
ctgttgaaca ctactgtggc cccacttttc ttcgctgacc agtttctgca actgtccact 540
tccctgccat cccagtacat tactggactc gccgaacacc tgtcgccact gatgctctcg 600
acctcttgga ctagaatcac tttgtggaac agagacttgg cccctactcc gggagcaaat 660
ctgtacggaa gccacccttt ttacctggcg ctcgaagatg gcggatccgc tcacggagtg 720
ttcctgctga atagcaacgc aatggacgtg gtgctgcaac cttcccctgc actcagttgg 780
agaagtaccg ggggtattct ggacgtgtac atcttcctcg gaccagaacc caagagcgtg 840
gtgcagcaat atctggacgt ggtcggatac ccttttatgc ctccttactg gggactggga 900
ttccaccttt gccgttgggg ctactcatcc accgccatta ccagacaggt ggtggagaat 960
atgaccagag cccacttccc tctcgacgtg cagtggaacg atctggacta tatggactcc 1020
cggagagatt tcaccttcaa caaggacggg ttccgcgatt ttcccgcgat ggttcaagag 1080
ctccaccagg gtggtcgaag atatatgatg atcgtcgacc cagccatttc gagcagcgga 1140
cccgctggat cttatagacc ttacgacgaa ggccttagga gaggagtgtt catcacaaac 1200
gagactggac agcctttgat cggtaaagtg tggcctggat caaccgcctt tcctgacttt 1260
accaatccca ctgccttggc ttggtgggag gacatggtgg ccgaattcca cgaccaagtc 1320
ccctttgatg gaatgtggat cgatatgaac gaaccaagca attttatcag aggttccgaa 1380
gacggttgcc ccaacaacga actggaaaac cctccttatg tgcccggagt cgtgggcgga 1440
acattacagg ccgcgactat ttgcgccagc agccaccaat tcctgtccac tcactacaac 1500
ctccacaacc tttatggatt aaccgaagct attgcaagtc acagggctct ggtgaaggct 1560
agagggacta ggccctttgt gatctcccga tccacctttg ccggacacgg gagatacgcc 1620
ggtcactgga ctggtgacgt gtggagctca tgggaacaac tggcctcctc cgtgccggaa 1680
atcttacagt tcaaccttct gggtgtccct cttgtcggag cagacgtgtg tgggtttctt 1740
ggtaacacct ccgaggaact gtgtgtgcgc tggactcaac tgggtgcatt ctacccattc 1800
atgagaaacc acaactcctt gctgtccctg ccacaagagc cctactcgtt cagcgagcct 1860
gcacaacagg ctatgcggaa ggcactgacc ctgagatacg ccctgcttcc acacttatac 1920
actctcttcc atcaagcgca tgtggcagga gaaaccgttg caaggcctct tttccttgaa 1980
ttccccaagg attcctcgac ttggacggtg gatcatcagc tgctgtgggg agaagctctg 2040
ctgattactc cagtgttgca agccggaaaa gctgaggtga ccggatactt tccgctggga 2100
acctggtacg acctccagac tgtccctgtt gaagcccttg gatcactgcc tccgcctccg 2160
gcagctccac gcgaaccagc tatacattcc gagggacagt gggttacatt accagctcct 2220
ctggacacaa tcaacgtcca cttaagagct ggctacatta tccctctgca aggaccagga 2280
ctgactacga ccgagagcag acagcagcca atggcactgg ctgtggctct gaccaaggga 2340
ggggaagcta gaggagaact cttctgggat gatggggagt cccttgaagt gctggaaaga 2400
ggcgcttaca ctcaagtcat tttccttgca cggaacaaca ccattgtgaa cgaattggtg 2460
cgagtgacca gcgaaggagc tggacttcaa ctgcagaagg tcactgtgct cggagtggct 2520
accgctcctc agcaagtgct gtcgaatgga gtccccgtgt caaactttac ctactcccct 2580
gacactaagg tgctcgacat ttgcgtgtcc ctcctgatgg gagagcagtt ccttgtgtcc 2640
tggtgttga 2649
<210> 52
<211> 2637
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAwt-delta-47
<400> 52
ccgcgagcag tgcccacaca gtgcgacgtc ccccccaaca gccgcttcga ttgcgcccct 60
gacaaggcca tcacccagga acagtgcgag gcccgcggct gttgctacat ccctgcaaag 120
caggggctgc agggagccca gatggggcag ccctggtgct tcttcccacc cagctacccc 180
agctacaagc tggagaacct gagctcctct gaaatgggct acacggccac cctgacccgt 240
accaccccca ccttcttccc caaggacatc ctgaccctgc ggctggacgt gatgatggag 300
actgagaacc gcctccactt cacgatcaaa gatccagcta acaggcgcta cgaggtgccc 360
ttggagaccc cgcatgtcca cagccgggca ccgtccccac tctacagcgt ggagttctcc 420
gaggagccct tcggggtgat cgtgcgccgg cagctggacg gccgcgtgct gctgaacacg 480
acggtggcgc ccctgttctt tgcggaccag ttccttcagc tgtccacctc gctgccctcg 540
cagtatatca caggcctcgc cgagcacctc agtcccctga tgctcagcac cagctggacc 600
aggatcaccc tgtggaaccg ggaccttgcg cccacgcccg gtgcgaacct ctacgggtct 660
caccctttct acctggcgct ggaggacggc gggtcggcac acggggtgtt cctgctaaac 720
agcaatgcca tggatgtggt cctgcagccg agccctgccc ttagctggag gtcgacaggt 780
gggatcctgg atgtctacat cttcctgggc ccagagccca agagcgtggt gcagcagtac 840
ctggacgttg tgggataccc gttcatgccg ccatactggg gcctgggctt ccacctgtgc 900
cgctggggct actcctccac cgctatcacc cgccaggtgg tggagaacat gaccagggcc 960
cacttccccc tggacgtcca gtggaacgac ctggactaca tggactcccg gagggacttc 1020
acgttcaaca aggatggctt ccgggacttc ccggccatgg tgcaggagct gcaccagggc 1080
ggccggcgct acatgatgat cgtggatcct gccatcagca gctcgggccc tgccgggagc 1140
tacaggccct acgacgaggg tctgcggagg ggggttttca tcaccaacga gaccggccag 1200
ccgctgattg ggaaggtatg gcccgggtcc actgccttcc ccgacttcac caaccccaca 1260
gccctggcct ggtgggagga catggtggct gagttccatg accaggtgcc cttcgacggc 1320
atgtggattg acatgaacga gccttccaac ttcatcaggg gctctgagga cggctgcccc 1380
aacaatgagc tggagaaccc accctacgtg cctggggtgg ttggggggac cctccaggcg 1440
gccaccatct gtgcctccag ccaccagttt ctctccacac actacaacct gcacaacctc 1500
tacggcctga ccgaagccat cgcctcccac agggcgctgg tgaaggctcg ggggacacgc 1560
ccatttgtga tctcccgctc gacctttgct ggccacggcc gatacgccgg ccactggacg 1620
ggggacgtgt ggagctcctg ggagcagctc gcctcctccg tgccagaaat cctgcagttt 1680
aacctgctgg gggtgcctct ggtcggggcc gacgtctgcg gcttcctggg caacacctca 1740
gaggagctgt gtgtgcgctg gacccagctg ggggccttct accccttcat gcggaaccac 1800
aacagcctgc tcagtctgcc ccaggagccg tacagcttca gcgagccggc ccagcaggcc 1860
atgaggaagg ccctcaccct gcgctacgca ctcctccccc acctctacac actgttccac 1920
caggcccacg tcgcggggga gaccgtggcc cggcccctct tcctggagtt ccccaaggac 1980
tctagcacct ggactgtgga ccaccagctc ctgtgggggg aggccctgct catcacccca 2040
gtgctccagg ccgggaaggc cgaagtgact ggctacttcc ccttgggcac atggtacgac 2100
ctgcagacgg tgccagtaga ggcccttggc agcctcccac ccccacctgc agctccccgt 2160
gagccagcca tccacagcga ggggcagtgg gtgacgctgc cggcccccct ggacaccatc 2220
aacgtccacc tccgggctgg gtacatcatc cccctgcagg gccctggcct cacaaccaca 2280
gagtcccgcc agcagcccat ggccctggct gtggccctga ccaagggtgg ggaggcccga 2340
ggggagctgt tctgggacga tggagagagc ctggaagtgc tggagcgagg ggcctacaca 2400
caggtcatct tcctggccag gaataacacg atcgtgaatg agctggtacg tgtgaccagt 2460
gagggagctg gcctgcagct gcagaaggtg actgtcctgg gcgtggccac ggcgccccag 2520
caggtcctct ccaacggtgt ccctgtctcc aacttcacct acagccccga caccaaggtc 2580
ctggacatct gtgtctcgct gttgatggga gagcagtttc tcgtcagctg gtgttag 2637
<210> 53
<211> 2637
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAco1-delta-47
<400> 53
cctagagctg tgcctaccca gtgtgacgtg ccccccaaca gcagattcga ctgcgcccct 60
gacaaggcca tcacccagga acagtgcgag gccagaggct gctgctacat ccctgccaag 120
cagggactgc agggcgctca gatgggacag ccctggtgct tcttcccacc ctcctacccc 180
agctacaagc tggaaaacct gagcagcagc gagatgggct acaccgccac cctgaccaga 240
accaccccca cattcttccc aaaggacatc ctgaccctgc ggctggacgt gatgatggaa 300
accgagaacc ggctgcactt caccatcaag gaccccgcca atcggagata cgaggtgccc 360
ctggaaaccc cccacgtgca ctctagagcc cccagccctc tgtacagcgt ggaattcagc 420
gaggaaccct tcggcgtgat cgtgcggaga cagctggatg gcagagtgct gctgaacacc 480
accgtggccc ctctgttctt cgccgaccag ttcctgcagc tgagcaccag cctgcccagc 540
cagtacatca caggactggc cgagcacctg agccccctga tgctgagcac atcctggacc 600
cggatcaccc tgtggaacag ggatctggcc cctacccctg gcgccaatct gtacggcagc 660
caccctttct acctggccct ggaagatggc ggatctgccc acggagtgtt tctgctgaac 720
tccaacgcca tggacgtggt gctgcagcct agccctgccc tgtcttggag aagcacaggc 780
ggcatcctgg atgtgtacat ctttctgggc cccgagccca agagcgtggt gcagcagtat 840
ctggatgtcg tgggctaccc cttcatgccc ccttactggg gcctgggatt ccacctgtgc 900
agatggggct actccagcac cgccatcacc agacaggtgg tggaaaacat gaccagagcc 960
cacttcccac tggatgtgca gtggaacgac ctggactaca tggacagcag acgggacttc 1020
accttcaaca aggacggctt ccgggacttc cccgccatgg tgcaggaact gcatcagggc 1080
ggcagacggt acatgatgat cgtggatccc gccatcagct cctctggccc tgccggctct 1140
tacagaccct acgacgaggg cctgcggaga ggcgtgttca tcaccaacga gacaggccag 1200
cccctgatcg gcaaagtgtg gcctggcagc acagccttcc ccgacttcac caatcctacc 1260
gccctggctt ggtgggagga catggtggcc gagttccacg accaggtgcc cttcgacggc 1320
atgtggatcg acatgaacga gcccagcaac ttcatccggg gcagcgagga tggctgcccc 1380
aacaacgaac tggaaaatcc cccttacgtg cccggcgtcg tgggcggaac actgcaggcc 1440
gctacaatct gtgccagcag ccaccagttt ctgagcaccc actacaacct gcacaacctg 1500
tacggcctga ccgaggccat tgccagccac cgcgctctcg tgaaagccag aggcacacgg 1560
cccttcgtga tcagcagaag cacctttgcc ggccacggca gatacgccgg acattggact 1620
ggcgacgtgt ggtcctcttg ggagcagctg gcctctagcg tgcccgagat cctgcagttc 1680
aatctgctgg gcgtgccact cgtgggcgcc gatgtgtgtg gcttcctggg caacacctcc 1740
gaggaactgt gtgtgcggtg gacacagctg ggcgccttct accctttcat gagaaaccac 1800
aacagcctgc tgagcctgcc ccaggaaccc tacagcttta gcgagcctgc acagcaggcc 1860
atgcggaagg ccctgacact gagatacgct ctgctgcccc acctgtacac cctgtttcac 1920
caggcccatg tggccggcga gacagtggcc agacctctgt ttctggaatt ccccaaggac 1980
agcagcacct ggaccgtgga ccatcagctg ctgtggggag aggctctgct gattacccca 2040
gtgctgcagg caggcaaggc cgaagtgacc ggctactttc ccctgggcac ttggtacgac 2100
ctgcagaccg tgcctgtgga agccctggga tctctgcctc cacctcctgc cgctcctaga 2160
gagcctgcca ttcactctga gggccagtgg gtcacactgc ctgcccccct ggataccatc 2220
aacgtgcacc tgagggccgg ctacatcata ccactgcagg gacctggcct gaccaccacc 2280
gagtctagac agcagccaat ggccctggcc gtggccctga ccaaaggcgg agaagctagg 2340
ggcgagctgt tctgggacga tggcgagagc ctggaagtgc tggaaagagg cgcctatacc 2400
caagtgatct tcctggcccg gaacaacacc atcgtgaacg agctggtgcg cgtgacctct 2460
gaaggcgctg gactgcagct gcagaaagtg accgtgctgg gagtggccac agcccctcag 2520
caggtgctgt ctaatggcgt gcccgtgtcc aacttcacct acagccccga caccaaggtg 2580
ctggacatct gcgtgtcact gctgatggga gagcagtttc tggtgtcctg gtgctga 2637
<210> 54
<211> 2637
<212> DNA
<213> Artificial Sequence
<220>
<223> hGAAco2-delta-47
<400> 54
ccaagagctg tgcctaccca atgcgacgtg ccacccaact cccgattcga ctgcgcgcca 60
gataaggcta ttacccaaga gcagtgtgaa gccagaggtt gctgctacat cccagcgaag 120
caaggattgc aaggcgccca aatgggacaa ccttggtgtt tcttcccccc ttcgtaccca 180
tcatataaac tcgaaaacct gtcctcttcg gaaatgggtt atactgccac cctcaccaga 240
actactccta ctttcttccc gaaagacatc ttgaccttga ggctggacgt gatgatggag 300
actgaaaacc ggctgcattt cactatcaaa gatcctgcca atcggcgata cgaggtccct 360
ctggaaaccc ctcacgtgca ctcacgggct ccttctccgc tttactccgt cgaattctct 420
gaggaaccct tcggagtgat cgttagacgc cagctggatg gtagagtgct gttgaacact 480
actgtggccc cacttttctt cgctgaccag tttctgcaac tgtccacttc cctgccatcc 540
cagtacatta ctggactcgc cgaacacctg tcgccactga tgctctcgac ctcttggact 600
agaatcactt tgtggaacag agacttggcc cctactccgg gagcaaatct gtacggaagc 660
cacccttttt acctggcgct cgaagatggc ggatccgctc acggagtgtt cctgctgaat 720
agcaacgcaa tggacgtggt gctgcaacct tcccctgcac tcagttggag aagtaccggg 780
ggtattctgg acgtgtacat cttcctcgga ccagaaccca agagcgtggt gcagcaatat 840
ctggacgtgg tcggataccc ttttatgcct ccttactggg gactgggatt ccacctttgc 900
cgttggggct actcatccac cgccattacc agacaggtgg tggagaatat gaccagagcc 960
cacttccctc tcgacgtgca gtggaacgat ctggactata tggactcccg gagagatttc 1020
accttcaaca aggacgggtt ccgcgatttt cccgcgatgg ttcaagagct ccaccagggt 1080
ggtcgaagat atatgatgat cgtcgaccca gccatttcga gcagcggacc cgctggatct 1140
tatagacctt acgacgaagg ccttaggaga ggagtgttca tcacaaacga gactggacag 1200
cctttgatcg gtaaagtgtg gcctggatca accgcctttc ctgactttac caatcccact 1260
gccttggctt ggtgggagga catggtggcc gaattccacg accaagtccc ctttgatgga 1320
atgtggatcg atatgaacga accaagcaat tttatcagag gttccgaaga cggttgcccc 1380
aacaacgaac tggaaaaccc tccttatgtg cccggagtcg tgggcggaac attacaggcc 1440
gcgactattt gcgccagcag ccaccaattc ctgtccactc actacaacct ccacaacctt 1500
tatggattaa ccgaagctat tgcaagtcac agggctctgg tgaaggctag agggactagg 1560
ccctttgtga tctcccgatc cacctttgcc ggacacggga gatacgccgg tcactggact 1620
ggtgacgtgt ggagctcatg ggaacaactg gcctcctccg tgccggaaat cttacagttc 1680
aaccttctgg gtgtccctct tgtcggagca gacgtgtgtg ggtttcttgg taacacctcc 1740
gaggaactgt gtgtgcgctg gactcaactg ggtgcattct acccattcat gagaaaccac 1800
aactccttgc tgtccctgcc acaagagccc tactcgttca gcgagcctgc acaacaggct 1860
atgcggaagg cactgaccct gagatacgcc ctgcttccac acttatacac tctcttccat 1920
caagcgcatg tggcaggaga aaccgttgca aggcctcttt tccttgaatt ccccaaggat 1980
tcctcgactt ggacggtgga tcatcagctg ctgtggggag aagctctgct gattactcca 2040
gtgttgcaag ccggaaaagc tgaggtgacc ggatactttc cgctgggaac ctggtacgac 2100
ctccagactg tccctgttga agcccttgga tcactgcctc cgcctccggc agctccacgc 2160
gaaccagcta tacattccga gggacagtgg gttacattac cagctcctct ggacacaatc 2220
aacgtccact taagagctgg ctacattatc cctctgcaag gaccaggact gactacgacc 2280
gagagcagac agcagccaat ggcactggct gtggctctga ccaagggagg ggaagctaga 2340
ggagaactct tctgggatga tggggagtcc cttgaagtgc tggaaagagg cgcttacact 2400
caagtcattt tccttgcacg gaacaacacc attgtgaacg aattggtgcg agtgaccagc 2460
gaaggagctg gacttcaact gcagaaggtc actgtgctcg gagtggctac cgctcctcag 2520
caagtgctgt cgaatggagt ccccgtgtca aactttacct actcccctga cactaaggtg 2580
ctcgacattt gcgtgtccct cctgatggga gagcagttcc ttgtgtcctg gtgttga 2637
Claims (16)
- 신호 펩티드 모이어티 및 기능성 GAA 모이어티, 특히 부모 GAA의 절두 형태에 상응하는 GAA 모이어티를 포함하는, 기능성 키메라 GAA 단백질을 코딩하는 핵산 분자로서, 신호 펩티드 모이어티는 SEQ ID NO: 2 내지 4, 바람직하게 SEQ ID NO: 2로 이루어진 군에서 선택되는 아미노산 서열을 갖는 것인 핵산 분자.
- 제1항에 있어서, 상기 GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 1 내지 75개의 연속되는 아미노산이 절두되고, 상기 GAA 모이어티는 특히 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 6, 7, 8, 9, 10, 40, 41, 42, 43, 44, 45 또는 46개의 연속되는 아미노산이 절두되고, 특히 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 8, 42 또는 43개의 연속되는 아미노산이 절두된 것인 핵산 분자.
- 제1항 또는 제2항에 있어서, 상기 GAA 모이어티는 부모 GAA와 비교하여 이의 N-말단부에서 8개의 연속되는 아미노산이 절두된 것인 핵산 분자.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 부모 GAA는 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5로 표시된 인간 GAA 폴리펩티드인 핵산 분자.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 생체 내에서 키메라 GAA의 발현을 개선시키고/시키거나 이에 대한 면역 관용을 개선시키도록 최적화된 뉴클레오티드 서열, 특히 SEQ ID NO: 13 또는 14로 표시된 뉴클레오티드 서열인 핵산 분자.
- 제1항 내지 제6항 중 어느 한 항에 따른 핵산 분자를 포함하는 핵산 구성체로서, 프로모터, 예컨대 바람직하게 알파-1 항트립신 프로모터 (hAAT), 트랜스타이레틴 프로모터, 알부민 프로모터 및 타이록신-결합 글로불린 (TBG) 프로모터로 이루어진 군에서 선택되는 간-특이적 프로모터에 작동적으로 연결된 상기 핵산 분자를 포함하는 발현 카세트이고, 상기 핵산 구성체는 임의로 인트론, 특히 인간 베타 글로빈 b2 (또는 HBB2) 인트론, FIX 인트론, 닭 베타-글로빈 인트론 및 SV40 인트론으로 이루어진 군에서 선택되는 인트론을 더 포함하고, 상기 인트론은 임의로 변형된 인트론 예컨대 SEQ ID NO: 7의 변형된 HBB2 인트론, SEQ ID NO: 9의 변형된 FIX 인트론, 또는 SEQ ID NO: 11의 변형된 닭 베타-글로빈 인트론인 핵산 구성체.
- 제7항에 있어서, 바람직하게 순서대로, 인핸서; 인트론; 프로모터, 특히 간-특이적 프로모터; 키메라 GAA 폴리펩티드를 코딩하는 핵산 서열; 및 폴리아데닐화 신호를 포함하는 핵산 구성체로서, 구성체는 바람직하게, 순서대로, ApoE 제어 영역; HBB2 인트론, 특히 변형된 HBB2 인트론; hAAT 프로모터; 키메라 GAA 폴리펩티드를 코딩하는 핵산 서열; 및 소 성장 호르몬 폴리아데닐화 신호를 포함하고, 상기 핵산 구성체는 보다 특히 SEQ ID NO: 20, 21 또는 22의 뉴클레오티드 서열 또는 제6항에 표시된 조합 중 어느 하나로부터 생성되는 뉴클레오티드 서열을 포함하는 것인 핵산 구성체.
- 제1항 내지 제8항 중 어느 한 항에 따른 핵산 분자 또는 핵산 구성체를 포함하는 벡터로서, 바이러스 벡터, 바람직하게 레트로바이러스 벡터, 예컨대 렌티바이러스 벡터, 또는 AAV 벡터, 예컨대 단일-가닥 또는 이중-가닥 자기-상보성 AAV 벡터, 바람직하게 AAV-유래 캡시드, 예컨대 AAV1, AAV2, 변이체 AAV2, AAV3, 변이체 AAV3, AAV3B, 변이체 AAV3B, AAV4, AAV5, AAV6, 변이체 AAV6, AAV7, AAV8, AAV9, AAV10 예컨대 AAVcy10 및 AAVrh10, AAVrh74, AAVdj, AAV-Anc80, AAV-LK03, AAV2i8, 및 돼지 AAV, 예컨대 AAVpo4 및 AAVpo6 캡시드를 갖거나 또는 키메라 캡시드를 갖는 AAV 벡터이고, AAV 벡터는 보다 특히 AAV8, AAV9, AAVrh74 또는 AAV2i8 캡시드, 특히 AAV8, AAV9 또는 AAVrh74 캡시드, 보다 특히 AAV8 캡시드를 갖는 것인 벡터.
- 제1항 내지 제6항 중 어느 한 항의 핵산 분자, 제7항 또는 제8항의 핵산 구성체 또는 제9항의 벡터로 형질전환된 세포로서, 세포는 특히 간 세포 또는 근육 세포인 세포.
- 신호 펩티드 모이어티 및 기능성 GAA 모이어티를 포함하는 키메라 GAA 폴리펩티드로서, 신호 펩티드 모이어티는 SEQ ID NO: 2 내지 4로 이루어진 군에서 선택되고, 특히 GAA 모이어티는 부모 GAA 폴리펩티드의 절두 형태, 예컨대 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 1 내지 75개의 연속되는 아미노산이 결실되고, 특히 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 6, 7, 8, 9, 10, 20, 27, 28, 29, 30, 31, 41, 42, 43, 44, 45 또는 45개, 보다 특히 6, 7, 8, 9, 10, 20, 41, 42, 43 또는 44개의 연속되는 아미노산이 결실된 GAA 모이어티이고, GAA 모이어티는 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5의 인간 GAA 단백질의 절두 형태인 키메라 GAA 폴리펩티드.
- 제11항에 있어서, GAA 모이어티는 부모 GAA 폴리펩티드와 비교하여 이의 N-말단부에서 8, 29, 42 또는 43개의 연속되는 아미노산이 절두되고, 보다 특히 부모 GAA 폴리펩티드와 비교하여, 특히 SEQ ID NO: 5 또는 SEQ ID NO: 36, 특히 SEQ ID NO: 5의 인간 GAA 단백질과 비교하여, 이의 N-말단부에서 8개 또는 42개, 특히 8개의 연속되는 아미노산이 절두된 것인 키메라 GAA 폴리펩티드.
- 약학적으로 허용가능한 담체에, 제1항 내지 제6항 중 어느 한 항의 핵산 서열, 제7항 또는 제8항의 핵산 구성체, 제9항의 벡터, 제10항에 따른 세포, 또는 제11항 내지 제13항 중 어느 한 항에 따른 키메라 폴리펩티드를 포함하는 약학 조성물.
- 약물로서 사용을 위한, 제1항 내지 제6항 중 어느 한 항의 핵산 서열, 제7항 또는 제8항의 핵산 구성체, 제9항의 벡터, 제10항에 따른 세포, 또는 제11항 내지 제13항 중 어느 한 항에 따른 키메라 폴리펩티드.
- 당원 축적병, 예컨대 GSDI (폰 기에르케병), GSDII (폼페 병), GSDIII (코리병), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII 및 심장의 치명적인 선천성 당원 축적병, 보다 특히 GSDI, GSDII 또는 GSDIII, 보다 더 특히 GSDII 및 GSDIII, 및 가장 특히 GSDII를 치료하기 위한 방법에서 사용을 위한, 제1항 내지 제6항 중 어느 한 항의 핵산 서열, 제7항 또는 제8항의 핵산 구성체, 제9항의 벡터, 제10항에 따른 세포, 또는 제11항 내지 제13항 중 어느 한 항에 따른 키메라 폴리펩티드.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16306149.2A EP3293203A1 (en) | 2016-09-12 | 2016-09-12 | Acid-alpha glucosidase variants and uses thereof |
EP16306149.2 | 2016-09-12 | ||
PCT/EP2017/072945 WO2018046775A1 (en) | 2016-09-12 | 2017-09-12 | Acid-alpha glucosidase variants and uses thereof |
KR1020197010349A KR20190056388A (ko) | 2016-09-12 | 2017-09-12 | 산-알파 글루코시다제 변이체 및 이의 용도 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197010349A Division KR20190056388A (ko) | 2016-09-12 | 2017-09-12 | 산-알파 글루코시다제 변이체 및 이의 용도 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230049763A true KR20230049763A (ko) | 2023-04-13 |
Family
ID=56990394
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197010349A KR20190056388A (ko) | 2016-09-12 | 2017-09-12 | 산-알파 글루코시다제 변이체 및 이의 용도 |
KR1020237011129A KR20230049763A (ko) | 2016-09-12 | 2017-09-12 | 산-알파 글루코시다제 변이체 및 이의 용도 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197010349A KR20190056388A (ko) | 2016-09-12 | 2017-09-12 | 산-알파 글루코시다제 변이체 및 이의 용도 |
Country Status (20)
Country | Link |
---|---|
US (3) | US20190390224A1 (ko) |
EP (3) | EP3293203A1 (ko) |
JP (2) | JP2019533991A (ko) |
KR (2) | KR20190056388A (ko) |
CN (2) | CN109843930B (ko) |
AU (1) | AU2017322377B2 (ko) |
BR (1) | BR112019004783A2 (ko) |
CA (1) | CA3036368A1 (ko) |
CL (1) | CL2019000610A1 (ko) |
CO (1) | CO2019002248A2 (ko) |
DK (1) | DK3510049T3 (ko) |
ES (1) | ES2970293T3 (ko) |
FI (1) | FI3510049T3 (ko) |
IL (2) | IL302354B1 (ko) |
MX (1) | MX2019002841A (ko) |
PE (1) | PE20190802A1 (ko) |
PH (1) | PH12019500376A1 (ko) |
PT (1) | PT3510049T (ko) |
SG (1) | SG11201901430WA (ko) |
WO (1) | WO2018046775A1 (ko) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201508026D0 (en) | 2015-05-11 | 2015-06-24 | Ucl Business Plc | Capsid |
EP3293259A1 (en) | 2016-09-12 | 2018-03-14 | Genethon | Acid-alpha glucosidase variants and uses thereof |
MX2019002842A (es) | 2016-09-12 | 2019-08-29 | Genethon | Variantes de alfa-glucosidasa acida y usos de las mismas. |
BR112019025888A2 (pt) | 2017-06-07 | 2020-06-30 | Regeneron Pharmaceuticals, Inc. | polinucleotídeo que codifica uma proteína terapêutica multidomínio, vetor de terapia gênica, proteína terapêutica multidomínio recombinante, método de expressão, métodos para reduzir o acúmulo de glicogênio em um tecido em um paciente em necessidade, para reduzir o acúmulo de glicogênio em um tecido em um paciente em necessidade epara tratar a deficiência enzimática em um paciente em necessidade e/ou tolerar o paciente à enzima para a qual é deficiente, anticorpo anti-cd63 ou fragmento de ligação a antígeno, e, composição farmacêutica |
BR112020023393A2 (pt) * | 2018-05-16 | 2021-02-09 | Spark Therapeutics, Inc. | cassetes de expressão de a-glicosidase ácida otimizados por códon e métodos de uso dos mesmos |
US20220162640A1 (en) | 2019-04-08 | 2022-05-26 | Genethon | Hybrid promoters for muscle expression |
EP3996696A1 (en) | 2019-07-09 | 2022-05-18 | Genethon | Treatment of glycogen storage disease (gsd) |
WO2021078834A1 (en) | 2019-10-22 | 2021-04-29 | Genethon | Chimeric acid-alpha glucosidase polypeptides and uses thereof |
CA3151442A1 (en) | 2019-10-22 | 2021-04-29 | Pasqualina COLELLA | Sortilin receptor ligand based chimeric polypeptides and uses thereof |
US11970722B2 (en) * | 2019-12-20 | 2024-04-30 | Codexis, Inc. | Engineered acid alpha-glucosidase variants |
CA3226119A1 (en) | 2021-08-04 | 2023-02-09 | Giuseppe RONZITTI | Hybrid promoters for gene expression in muscles and in the cns |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6858425B1 (en) | 1998-12-04 | 2005-02-22 | Genzyme Corporation | Human acid alpha glucosidase gene and bovine alpha-S1 casein gene sequences |
AU3113700A (en) | 1998-12-07 | 2000-06-26 | Genzyme Corporation | Treatment of pompe's disease |
US7629309B2 (en) * | 2002-05-29 | 2009-12-08 | Zystor Therapeutics, Inc. | Targeted therapeutic proteins |
ES2371913T3 (es) | 2003-01-22 | 2012-01-11 | Duke University | Constructos mejorados para expresar polipéptidos lisosomales. |
US20050244400A1 (en) * | 2004-02-10 | 2005-11-03 | Zystor Therapeutics, Inc. | Acid alpha-glucosidase and fragments thereof |
DK1751275T3 (da) | 2004-06-01 | 2017-11-27 | Avigen Inc | Sammensætninger og fremgangsmåder til forebyggelse af aggregering af aav-vektorer |
ES2545612T3 (es) * | 2004-06-29 | 2015-09-14 | Novozymes Inc. | Polipéptidos que tienen actividad de alfa-glucosidasa y polinucleótidos que los codifican |
PT2318037E (pt) | 2008-07-08 | 2015-05-20 | Univ Duke | Método de tratamento da doença de armazenamento de glicogénio |
AU2010366066B2 (en) * | 2010-12-22 | 2016-01-14 | Fondazione Telethon | Therapeutic strategies to treat CNS pathology in mucopolysaccharidoses |
KR20140037082A (ko) | 2011-04-22 | 2014-03-26 | 겐자임 코포레이션 | 가속 가공으로 변형된 산 알파 글루코시다제 |
WO2013013017A2 (en) * | 2011-07-21 | 2013-01-24 | Alnylam Pharmaceuticals, Inc. | Compositions and methods for modifying the glycosylation of lysosomal storage disorder therapeutics |
WO2013177533A1 (en) * | 2012-05-25 | 2013-11-28 | California Institute Of Technology | Expression of secreted and cell-surface polypeptides |
IL297919A (en) | 2013-07-22 | 2023-01-01 | Childrens Hospital Philadelphia | Modified Aav and preparations, methods and uses for gene transfer to cells, organs and tissues |
EP3134530B1 (en) | 2014-04-25 | 2019-06-12 | Genethon | Treatment of hyperbilirubinemia |
CA2989294A1 (en) * | 2014-06-13 | 2015-12-17 | Valerion Therapeutics, Llc | Methods and compositions for treatment of glycogen storage diseases and glycogen metabolism disorders |
US10781459B2 (en) | 2014-06-20 | 2020-09-22 | University Of Florida Research Foundation, Incorporated | Methods of packaging multiple adeno-associated virus vectors |
US10556015B2 (en) * | 2014-10-24 | 2020-02-11 | Criteo S.A. | Lysosomal targeting of enzymes, and uses thereof |
-
2016
- 2016-09-12 EP EP16306149.2A patent/EP3293203A1/en not_active Withdrawn
-
2017
- 2017-09-12 WO PCT/EP2017/072945 patent/WO2018046775A1/en active Application Filing
- 2017-09-12 EP EP23208091.1A patent/EP4361178A2/en active Pending
- 2017-09-12 PT PT177680824T patent/PT3510049T/pt unknown
- 2017-09-12 JP JP2019513381A patent/JP2019533991A/ja active Pending
- 2017-09-12 EP EP17768082.4A patent/EP3510049B8/en active Active
- 2017-09-12 PE PE2019000499A patent/PE20190802A1/es unknown
- 2017-09-12 KR KR1020197010349A patent/KR20190056388A/ko not_active Application Discontinuation
- 2017-09-12 BR BR112019004783A patent/BR112019004783A2/pt unknown
- 2017-09-12 ES ES17768082T patent/ES2970293T3/es active Active
- 2017-09-12 US US16/332,376 patent/US20190390224A1/en not_active Abandoned
- 2017-09-12 AU AU2017322377A patent/AU2017322377B2/en active Active
- 2017-09-12 DK DK17768082.4T patent/DK3510049T3/da active
- 2017-09-12 IL IL302354A patent/IL302354B1/en unknown
- 2017-09-12 IL IL265170A patent/IL265170B2/en unknown
- 2017-09-12 CN CN201780054962.7A patent/CN109843930B/zh active Active
- 2017-09-12 CA CA3036368A patent/CA3036368A1/en active Pending
- 2017-09-12 CN CN202311345155.4A patent/CN117512014A/zh active Pending
- 2017-09-12 SG SG11201901430WA patent/SG11201901430WA/en unknown
- 2017-09-12 FI FIEP17768082.4T patent/FI3510049T3/fi active
- 2017-09-12 MX MX2019002841A patent/MX2019002841A/es unknown
- 2017-09-12 KR KR1020237011129A patent/KR20230049763A/ko not_active Application Discontinuation
-
2019
- 2019-02-21 PH PH12019500376A patent/PH12019500376A1/en unknown
- 2019-03-11 CL CL2019000610A patent/CL2019000610A1/es unknown
- 2019-03-12 CO CONC2019/0002248A patent/CO2019002248A2/es unknown
-
2020
- 2020-10-16 US US17/072,065 patent/US20210040503A1/en not_active Abandoned
-
2022
- 2022-09-22 JP JP2022151296A patent/JP2022180543A/ja active Pending
- 2022-11-23 US US18/058,283 patent/US20240043867A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102617502B1 (ko) | 산-알파 글루코시다제 변이체 및 이의 용도 | |
CN109843930B (zh) | 酸性α-葡萄糖苷酶变体及其用途 | |
CN109790528B (zh) | 酸性α-葡萄糖苷酶变体及其用途 | |
AU2021261832A1 (en) | Adeno-associated virus Factor VIII vectors, associated viral particles and therapeutic formulations comprising the same | |
CN112424345A (zh) | Aav载体在青少年对象中的稳定表达 | |
CN113316639A (zh) | 用于治疗庞贝氏病的治疗性腺相关病毒 | |
CN110914419A (zh) | 糖原贮积病iii的治疗 | |
KR20210053902A (ko) | 글리코겐 저장 질환 iii 의 치료를 위한 미니-gde | |
CN114555808A (zh) | 嵌合多肽及其用途 | |
EP3293260A1 (en) | Acid-alpha glucosidase variants and uses thereof | |
RU2780329C2 (ru) | Варианты кислой альфа-глюкозидазы и их использование | |
RU2780410C2 (ru) | Варианты кислой альфа-глюкозидазы и их использование | |
RU2792432C2 (ru) | Стабильная экспрессия векторов на основе аденоассоциированного вируса у несовершеннолетних пациентов | |
KR20230029624A (ko) | 유전자 치료를 위한 글루코스-6-포스파타제(G6Pase-a)를 코딩하는 벡터 | |
WO2021078834A1 (en) | Chimeric acid-alpha glucosidase polypeptides and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal |