RU2780410C2 - Variants of acid alpha-glucosidase and their use - Google Patents
Variants of acid alpha-glucosidase and their use Download PDFInfo
- Publication number
- RU2780410C2 RU2780410C2 RU2019110773A RU2019110773A RU2780410C2 RU 2780410 C2 RU2780410 C2 RU 2780410C2 RU 2019110773 A RU2019110773 A RU 2019110773A RU 2019110773 A RU2019110773 A RU 2019110773A RU 2780410 C2 RU2780410 C2 RU 2780410C2
- Authority
- RU
- Russia
- Prior art keywords
- seq
- leu
- gaa
- pro
- gly
- Prior art date
Links
- 102100008175 MGAM Human genes 0.000 title claims description 4
- 108010028144 alpha-Glucosidases Proteins 0.000 title claims description 4
- 239000002253 acid Substances 0.000 title description 5
- 229920001184 polypeptide Polymers 0.000 claims abstract description 281
- 241000282414 Homo sapiens Species 0.000 claims abstract description 54
- 230000014509 gene expression Effects 0.000 claims abstract description 53
- 206010053185 Glycogen storage disease type II Diseases 0.000 claims abstract description 50
- 201000004502 glycogen storage disease II Diseases 0.000 claims abstract description 48
- 239000003814 drug Substances 0.000 claims abstract description 10
- 230000001900 immune effect Effects 0.000 claims abstract description 9
- 241000432074 Adeno-associated virus Species 0.000 claims abstract description 3
- 150000007523 nucleic acids Chemical class 0.000 claims description 159
- 108020004707 nucleic acids Proteins 0.000 claims description 142
- 210000004027 cells Anatomy 0.000 claims description 107
- 102000004169 proteins and genes Human genes 0.000 claims description 101
- 108090000623 proteins and genes Proteins 0.000 claims description 101
- 229920001850 Nucleic acid sequence Polymers 0.000 claims description 98
- 229920002459 Intron Polymers 0.000 claims description 88
- 210000000234 Capsid Anatomy 0.000 claims description 68
- 210000004185 Liver Anatomy 0.000 claims description 59
- 150000001413 amino acids Chemical class 0.000 claims description 54
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 51
- 230000002708 enhancing Effects 0.000 claims description 24
- 108091006028 chimera Proteins 0.000 claims description 23
- 239000003623 enhancer Substances 0.000 claims description 18
- 102100019126 HBB Human genes 0.000 claims description 16
- 108091005902 Hemoglobin subunit beta Proteins 0.000 claims description 16
- 241000287828 Gallus gallus Species 0.000 claims description 15
- 230000000875 corresponding Effects 0.000 claims description 14
- 230000001402 polyadenylating Effects 0.000 claims description 14
- 239000008194 pharmaceutical composition Substances 0.000 claims description 12
- 229940024142 alpha 1-Antitrypsin Drugs 0.000 claims description 11
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 claims description 11
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 claims description 11
- 102000013918 Apolipoproteins E Human genes 0.000 claims description 10
- 108010025628 Apolipoproteins E Proteins 0.000 claims description 10
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 8
- 239000002773 nucleotide Substances 0.000 claims description 8
- 125000003729 nucleotide group Chemical group 0.000 claims description 8
- 210000000663 muscle cells Anatomy 0.000 claims description 7
- OZAIFHULBGXAKX-UHFFFAOYSA-N precursor Substances N#CC(C)(C)N=NC(C)(C)C#N OZAIFHULBGXAKX-UHFFFAOYSA-N 0.000 claims description 7
- 102100001249 ALB Human genes 0.000 claims description 6
- 239000003937 drug carrier Substances 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 101710027066 ALB Proteins 0.000 claims description 5
- 229940050528 albumin Drugs 0.000 claims description 5
- 108010006025 bovine growth hormone Proteins 0.000 claims description 5
- 201000005505 measles Diseases 0.000 claims description 5
- 102000007584 Prealbumin Human genes 0.000 claims description 4
- 108010071690 Prealbumin Proteins 0.000 claims description 4
- 241000282898 Sus scrofa Species 0.000 claims description 2
- XUIIKFGFIJCVMT-LBPRGKRZSA-N L-thyroxine zwitterion Chemical compound IC1=CC(C[C@H]([NH3+])C([O-])=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-LBPRGKRZSA-N 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 48
- 101710010383 GAA Proteins 0.000 abstract description 42
- 102100008255 GAA Human genes 0.000 abstract description 42
- 229940096919 Glycogen Drugs 0.000 abstract description 33
- 229920002527 Glycogen Polymers 0.000 abstract description 33
- BYSGBSNPRWKUQH-UJDJLXLFSA-N Glycogen Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OC[C@@H]1[C@@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](O)[C@@H](O[C@@H]2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)O1 BYSGBSNPRWKUQH-UJDJLXLFSA-N 0.000 abstract description 33
- 206010053250 Glycogen storage disease type III Diseases 0.000 abstract description 23
- 230000028327 secretion Effects 0.000 abstract description 23
- 230000001976 improved Effects 0.000 abstract description 9
- 230000001225 therapeutic Effects 0.000 abstract description 9
- 238000009825 accumulation Methods 0.000 abstract description 7
- 230000001939 inductive effect Effects 0.000 abstract description 4
- 101000525742 GAA Proteins 0.000 abstract description 3
- 102000027592 human GAA protein Human genes 0.000 abstract description 3
- 230000001575 pathological Effects 0.000 abstract description 2
- 239000000126 substance Substances 0.000 abstract 1
- JYOAXOMPIXKMKK-UHFFFAOYSA-N Leucyl-Glutamine Chemical compound CC(C)CC(N)C(=O)NC(C(O)=O)CCC(N)=O JYOAXOMPIXKMKK-UHFFFAOYSA-N 0.000 description 70
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 68
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 60
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 60
- 108010087924 alanylproline Proteins 0.000 description 60
- 108010061238 threonyl-glycine Proteins 0.000 description 59
- DRCKHKZYDLJYFQ-UHFFFAOYSA-N Isoleucyl-Threonine Chemical compound CCC(C)C(N)C(=O)NC(C(C)O)C(O)=O DRCKHKZYDLJYFQ-UHFFFAOYSA-N 0.000 description 55
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 55
- 108010078144 glutaminyl-glycine Proteins 0.000 description 53
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 51
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 51
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 50
- WBAXJMCUFIXCNI-WDSKDSINSA-N Ser-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WBAXJMCUFIXCNI-WDSKDSINSA-N 0.000 description 50
- 108010029020 prolylglycine Proteins 0.000 description 50
- 108010037850 glycylvaline Proteins 0.000 description 49
- 239000000203 mixture Substances 0.000 description 47
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 45
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 45
- 108010060035 arginylproline Proteins 0.000 description 45
- 108010090894 prolylleucine Proteins 0.000 description 44
- 108010026333 seryl-proline Proteins 0.000 description 44
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 43
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 43
- 229920003013 deoxyribonucleic acid Polymers 0.000 description 43
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 40
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 39
- 108010025306 histidylleucine Proteins 0.000 description 39
- 108010057821 leucylproline Proteins 0.000 description 39
- XUUXCWCKKCZEAW-YFKPBYRVSA-N 2-[[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 38
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 38
- 238000006467 substitution reaction Methods 0.000 description 38
- 241000880493 Leptailurus serval Species 0.000 description 36
- 108010070944 alanylhistidine Proteins 0.000 description 36
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 35
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 33
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 33
- 108010049041 glutamylalanine Proteins 0.000 description 33
- 108010048818 seryl-histidine Proteins 0.000 description 33
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 32
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 31
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 31
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 31
- 108010050848 glycylleucine Proteins 0.000 description 31
- XXDVDTMEVBYRPK-XPUUQOCRSA-N Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O XXDVDTMEVBYRPK-XPUUQOCRSA-N 0.000 description 30
- 108010044940 alanylglutamine Proteins 0.000 description 30
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 29
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 29
- VPZXBVLAVMBEQI-VKHMYHEASA-N gly ala Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 29
- STKYPAFSDFAEPH-LURJTMIESA-N gly-val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 29
- 108010005942 methionylglycine Proteins 0.000 description 29
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 28
- 208000007345 Glycogen Storage Disease Diseases 0.000 description 28
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 28
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 28
- 108010092114 histidylphenylalanine Proteins 0.000 description 28
- 108010031719 prolyl-serine Proteins 0.000 description 28
- HXWUJJADFMXNKA-UHFFFAOYSA-N Asparaginyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(N)=O HXWUJJADFMXNKA-UHFFFAOYSA-N 0.000 description 27
- 229920001405 Coding region Polymers 0.000 description 27
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 27
- 108010079364 N-glycylalanine Proteins 0.000 description 27
- 210000001519 tissues Anatomy 0.000 description 27
- 108010038745 tryptophylglycine Proteins 0.000 description 27
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 26
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 26
- RZEQTVHJZCIUBT-UHFFFAOYSA-N Serinyl-Arginine Chemical compound OCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-UHFFFAOYSA-N 0.000 description 26
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 26
- 108010089804 glycyl-threonine Proteins 0.000 description 26
- 108010053725 prolylvaline Proteins 0.000 description 26
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 25
- CKHWEVXPLJBEOZ-UHFFFAOYSA-N Threoninyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)C(C)O CKHWEVXPLJBEOZ-UHFFFAOYSA-N 0.000 description 25
- GVRKWABULJAONN-UHFFFAOYSA-N Valyl-Threonine Chemical compound CC(C)C(N)C(=O)NC(C(C)O)C(O)=O GVRKWABULJAONN-UHFFFAOYSA-N 0.000 description 25
- 108010047495 alanylglycine Proteins 0.000 description 25
- 108010008355 arginyl-glutamine Proteins 0.000 description 25
- 108010079317 prolyl-tyrosine Proteins 0.000 description 25
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 24
- VYZAGTDAHUIRQA-WHFBIAKZSA-N L-alanyl-L-glutamic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O VYZAGTDAHUIRQA-WHFBIAKZSA-N 0.000 description 24
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 24
- YBRHKUNWEYBZGT-UHFFFAOYSA-N Tryptophyl-Threonine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(C(O)C)C(O)=O)=CNC2=C1 YBRHKUNWEYBZGT-UHFFFAOYSA-N 0.000 description 24
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 24
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 24
- 108010077245 asparaginyl-proline Proteins 0.000 description 24
- 108010087823 glycyltyrosine Proteins 0.000 description 24
- 108010036413 histidylglycine Proteins 0.000 description 24
- 108010018006 histidylserine Proteins 0.000 description 24
- 108010027338 isoleucylcysteine Proteins 0.000 description 24
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 23
- NPDLYUOYAGBHFB-UHFFFAOYSA-N Asparaginyl-Arginine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N NPDLYUOYAGBHFB-UHFFFAOYSA-N 0.000 description 23
- LOJYQMFIIJVETK-WDSKDSINSA-N Gln-Gln Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LOJYQMFIIJVETK-WDSKDSINSA-N 0.000 description 23
- ARPVSMCNIDAQBO-UHFFFAOYSA-N Glutaminyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CCC(N)=O ARPVSMCNIDAQBO-UHFFFAOYSA-N 0.000 description 23
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 23
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 23
- ZSXJENBJGRHKIG-UHFFFAOYSA-N Tyrosyl-Serine Chemical compound OCC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UHFFFAOYSA-N 0.000 description 23
- 108010047857 aspartylglycine Proteins 0.000 description 23
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 23
- 108010085203 methionylmethionine Proteins 0.000 description 23
- 108010073101 phenylalanylleucine Proteins 0.000 description 23
- 108010051242 phenylalanylserine Proteins 0.000 description 23
- 108010020532 tyrosyl-proline Proteins 0.000 description 23
- IOUPEELXVYPCPG-UHFFFAOYSA-N val-gly Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 23
- JSZMKEYEVLDPDO-ACZMJKKPSA-N (2R)-2-[[(2S,3S)-2-amino-3-methylpentanoyl]amino]-3-sulfanylpropanoic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CS)C(O)=O JSZMKEYEVLDPDO-ACZMJKKPSA-N 0.000 description 22
- PMGDADKJMCOXHX-BQBZGAKWSA-N Arg-Gln Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PMGDADKJMCOXHX-BQBZGAKWSA-N 0.000 description 22
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 22
- PNMUAGGSDZXTHX-BYPYZUCNSA-N Gly-Gln Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(N)=O PNMUAGGSDZXTHX-BYPYZUCNSA-N 0.000 description 22
- TWVKGYNQQAUNRN-ACZMJKKPSA-N Ile-Ser Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O TWVKGYNQQAUNRN-ACZMJKKPSA-N 0.000 description 22
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 22
- OHUXOEXBXPZKPT-STQMWFEESA-N Phe-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 OHUXOEXBXPZKPT-STQMWFEESA-N 0.000 description 22
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 22
- LZLREEUGSYITMX-UHFFFAOYSA-N Serinyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CO)N)C(O)=O)=CNC2=C1 LZLREEUGSYITMX-UHFFFAOYSA-N 0.000 description 22
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 22
- 108010093581 aspartyl-proline Proteins 0.000 description 22
- 230000003612 virological Effects 0.000 description 22
- VNYDHJARLHNEGA-RYUDHWBXSA-N (2S)-1-[(2S)-2-azaniumyl-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carboxylate Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 21
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 21
- RDIKFPRVLJLMER-BQBZGAKWSA-N Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)N RDIKFPRVLJLMER-BQBZGAKWSA-N 0.000 description 21
- VHLZDSUANXBJHW-UHFFFAOYSA-N Glutaminyl-Phenylalanine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 VHLZDSUANXBJHW-UHFFFAOYSA-N 0.000 description 21
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 21
- YZMPDHTZJJCGEI-BQBZGAKWSA-N Ser-His Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 YZMPDHTZJJCGEI-BQBZGAKWSA-N 0.000 description 21
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 21
- PWIQCLSQVQBOQV-AAEUAGOBSA-N Trp-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 PWIQCLSQVQBOQV-AAEUAGOBSA-N 0.000 description 21
- 108010068380 arginylarginine Proteins 0.000 description 21
- LQJAALCCPOTJGB-YUMQZZPRSA-N (2S)-1-[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carboxylic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 20
- BTBUEVAGZCKULD-XPUUQOCRSA-N (2S)-2-[[2-[[(2S)-2-aminopropanoyl]amino]acetyl]amino]-3-(1H-imidazol-5-yl)propanoic acid Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 20
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 20
- UKGGPJNBONZZCM-WDSKDSINSA-N Aspartyl-L-proline Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 20
- NTQDELBZOMWXRS-UHFFFAOYSA-N Aspartyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(O)=O NTQDELBZOMWXRS-UHFFFAOYSA-N 0.000 description 20
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 20
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 20
- WMDZARSFSMZOQO-DRZSPHRISA-N Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WMDZARSFSMZOQO-DRZSPHRISA-N 0.000 description 20
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 20
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 20
- 201000010099 disease Diseases 0.000 description 20
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 19
- 101700071556 HBB Proteins 0.000 description 19
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 19
- 108010066427 N-valyltryptophan Proteins 0.000 description 19
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 19
- MFEVVAXTBZELLL-UHFFFAOYSA-N Tyrosyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-UHFFFAOYSA-N 0.000 description 19
- STTYIMSDIYISRG-WDSKDSINSA-N Val-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(O)=O STTYIMSDIYISRG-WDSKDSINSA-N 0.000 description 19
- 101700055085 hbb2 Proteins 0.000 description 19
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 19
- 108010004914 prolylarginine Proteins 0.000 description 19
- SITWEMZOJNKJCH-UHFFFAOYSA-N Alanyl-Arginine Chemical compound CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 18
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 18
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 18
- 108020004705 Codon Proteins 0.000 description 18
- OWOFCNWTMWOOJJ-WDSKDSINSA-N Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OWOFCNWTMWOOJJ-WDSKDSINSA-N 0.000 description 18
- QTZXSYBVOSXBEJ-WDSKDSINSA-N Met-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O QTZXSYBVOSXBEJ-WDSKDSINSA-N 0.000 description 18
- PYOHODCEOHCZBM-RYUDHWBXSA-N Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 PYOHODCEOHCZBM-RYUDHWBXSA-N 0.000 description 18
- GVUVRRPYYDHHGK-UHFFFAOYSA-N Prolyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C1CCCN1 GVUVRRPYYDHHGK-UHFFFAOYSA-N 0.000 description 18
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfizole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 18
- BWUHENPAEMNGQJ-ZDLURKLDSA-N Thr-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O BWUHENPAEMNGQJ-ZDLURKLDSA-N 0.000 description 18
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 17
- VBKIFHUVGLOJKT-UHFFFAOYSA-N Asparaginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(N)=O VBKIFHUVGLOJKT-UHFFFAOYSA-N 0.000 description 17
- MRVYVEQPNDSWLH-UHFFFAOYSA-N Glutaminyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CCC(N)=O MRVYVEQPNDSWLH-UHFFFAOYSA-N 0.000 description 17
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 17
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 17
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 17
- QJKMCQRFHJRIPU-XDTLVQLUSA-N Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QJKMCQRFHJRIPU-XDTLVQLUSA-N 0.000 description 17
- QZOSVNLXLSNHQK-UHFFFAOYSA-N Tyrosyl-Aspartate Chemical compound OC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UHFFFAOYSA-N 0.000 description 17
- XTWSWDJMIKUJDQ-RYUDHWBXSA-N Arg-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XTWSWDJMIKUJDQ-RYUDHWBXSA-N 0.000 description 16
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 16
- XIPZDANNDPMZGQ-UHFFFAOYSA-N Glutaminyl-Cysteine Chemical compound NC(=O)CCC(N)C(=O)NC(CS)C(O)=O XIPZDANNDPMZGQ-UHFFFAOYSA-N 0.000 description 16
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 16
- BQVUABVGYYSDCJ-ZFWWWQNUSA-N Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-ZFWWWQNUSA-N 0.000 description 16
- OIDKVWTWGDWMHY-RYUDHWBXSA-N Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 OIDKVWTWGDWMHY-RYUDHWBXSA-N 0.000 description 16
- LDEBVRIURYMKQS-UHFFFAOYSA-N Serinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CO LDEBVRIURYMKQS-UHFFFAOYSA-N 0.000 description 16
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 16
- 108010085325 histidylproline Proteins 0.000 description 16
- 239000007924 injection Substances 0.000 description 16
- 108010077112 prolyl-proline Proteins 0.000 description 16
- FAQVCWVVIYYWRR-WHFBIAKZSA-N (2S)-2-[[(2S)-2,5-diamino-5-oxopentanoyl]amino]propanoic acid Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O FAQVCWVVIYYWRR-WHFBIAKZSA-N 0.000 description 15
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 15
- HIZYETOZLYFUFF-BQBZGAKWSA-N Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O HIZYETOZLYFUFF-BQBZGAKWSA-N 0.000 description 15
- UQTNIFUCMBFWEJ-UHFFFAOYSA-N Threoninyl-Asparagine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-UHFFFAOYSA-N 0.000 description 15
- 238000002347 injection Methods 0.000 description 15
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 15
- SITLTJHOQZFJGG-XPUUQOCRSA-N α-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 15
- NJMYZEJORPYOTO-UHFFFAOYSA-N γ-glutamyl-Proline Chemical compound NC(=O)CCC(N)C(=O)N1CCCC1C(O)=O NJMYZEJORPYOTO-UHFFFAOYSA-N 0.000 description 15
- RFCVXVPWSPOMFJ-UHFFFAOYSA-N 2-[(2-azaniumyl-3-phenylpropanoyl)amino]-4-methylpentanoate Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 RFCVXVPWSPOMFJ-UHFFFAOYSA-N 0.000 description 14
- MGHKSHCBDXNTHX-UHFFFAOYSA-N 4-amino-5-[(4-amino-1-carboxy-4-oxobutyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CCC(N)=O)C(O)=O MGHKSHCBDXNTHX-UHFFFAOYSA-N 0.000 description 14
- 108010076282 Factor IX Proteins 0.000 description 14
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 14
- DVCSNHXRZUVYAM-BQBZGAKWSA-N Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 14
- JWBLQDDHSDGEGR-DRZSPHRISA-N Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWBLQDDHSDGEGR-DRZSPHRISA-N 0.000 description 14
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 14
- BNQVUHQWZGTIBX-IUCAKERBSA-N Val-His Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CN=CN1 BNQVUHQWZGTIBX-IUCAKERBSA-N 0.000 description 14
- WPSXZFTVLIAPCN-UHFFFAOYSA-N Valyl-Cysteine Chemical compound CC(C)C(N)C(=O)NC(CS)C(O)=O WPSXZFTVLIAPCN-UHFFFAOYSA-N 0.000 description 14
- 229960004222 factor IX Drugs 0.000 description 14
- KGNSGRRALVIRGR-UHFFFAOYSA-N gln-tyr Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 KGNSGRRALVIRGR-UHFFFAOYSA-N 0.000 description 14
- 108010010147 glycylglutamine Proteins 0.000 description 14
- 108010077515 glycylproline Proteins 0.000 description 14
- GJSURZIOUXUGAL-UHFFFAOYSA-N 2-((2,6-Dichlorophenyl)imino)imidazolidine Chemical compound ClC1=CC=CC(Cl)=C1NC1=NCCN1 GJSURZIOUXUGAL-UHFFFAOYSA-N 0.000 description 13
- TUTIHHSZKFBMHM-UHFFFAOYSA-N 4-amino-5-[(3-amino-1-carboxy-3-oxopropyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O TUTIHHSZKFBMHM-UHFFFAOYSA-N 0.000 description 13
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 13
- 102100006624 F9 Human genes 0.000 description 13
- 210000003205 Muscles Anatomy 0.000 description 13
- KAFKKRJQHOECGW-JCOFBHIZSA-N Thr-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(O)=O)=CNC2=C1 KAFKKRJQHOECGW-JCOFBHIZSA-N 0.000 description 13
- 108010015792 glycyllysine Proteins 0.000 description 13
- 108010017391 lysylvaline Proteins 0.000 description 13
- SBVPYBFMIGDIDX-SRVKXCTJSA-N (2S)-1-[(2S)-1-[(2S)-pyrrolidin-1-ium-2-carbonyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylate Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 12
- LZDNBBYBDGBADK-KBPBESRZSA-N (2S)-2-[[(2S)-2-amino-3-methylbutanoyl]amino]-3-(1H-indol-3-yl)propanoic acid Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-KBPBESRZSA-N 0.000 description 12
- WUGMRIBZSVSJNP-UFBFGSQYSA-N Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UFBFGSQYSA-N 0.000 description 12
- JSLGXODUIAFWCF-UHFFFAOYSA-N Arginyl-Asparagine Chemical compound NC(N)=NCCCC(N)C(=O)NC(CC(N)=O)C(O)=O JSLGXODUIAFWCF-UHFFFAOYSA-N 0.000 description 12
- OMSMPWHEGLNQOD-UHFFFAOYSA-N Asparaginyl-Phenylalanine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UHFFFAOYSA-N 0.000 description 12
- HAYVTMHUNMMXCV-UHFFFAOYSA-N Cysteinyl-Alanine Chemical compound OC(=O)C(C)NC(=O)C(N)CS HAYVTMHUNMMXCV-UHFFFAOYSA-N 0.000 description 12
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 12
- HZYHBDVRCBDJJV-HAFWLYHUSA-N Ile-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O HZYHBDVRCBDJJV-HAFWLYHUSA-N 0.000 description 12
- UCGDDTHMMVWVMV-FSPLSTOPSA-N Ile-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(O)=O UCGDDTHMMVWVMV-FSPLSTOPSA-N 0.000 description 12
- QNBYCZTZNOVDMI-HGNGGELXSA-N Ile-His Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QNBYCZTZNOVDMI-HGNGGELXSA-N 0.000 description 12
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 12
- 241001465754 Metazoa Species 0.000 description 12
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 12
- GKZIWHRNKRBEOH-HOTGVXAUSA-N Phe-Phe Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)C1=CC=CC=C1 GKZIWHRNKRBEOH-HOTGVXAUSA-N 0.000 description 12
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 12
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 12
- WXVIGTAUZBUDPZ-DTLFHODZSA-N Thr-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 WXVIGTAUZBUDPZ-DTLFHODZSA-N 0.000 description 12
- DXYQIGZZWYBXSD-UHFFFAOYSA-N Tryptophyl-Proline Chemical compound C=1NC2=CC=CC=C2C=1CC(N)C(=O)N1CCCC1C(O)=O DXYQIGZZWYBXSD-UHFFFAOYSA-N 0.000 description 12
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 12
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 12
- 108010092854 aspartyllysine Proteins 0.000 description 12
- 108010004073 cysteinylcysteine Proteins 0.000 description 12
- 108010054813 diprotin B Proteins 0.000 description 12
- 108010079547 glutamylmethionine Proteins 0.000 description 12
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 12
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 12
- 108010070643 prolylglutamic acid Proteins 0.000 description 12
- 108010045269 tryptophyltryptophan Proteins 0.000 description 12
- 108010044292 tryptophyltyrosine Proteins 0.000 description 12
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 12
- OABOXRPGTFRBFZ-IMJSIDKUSA-N (2R)-2-[[(2R)-2-amino-3-sulfanylpropanoyl]amino]-3-sulfanylpropanoic acid Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(O)=O OABOXRPGTFRBFZ-IMJSIDKUSA-N 0.000 description 11
- CQGSYZCULZMEDE-SRVKXCTJSA-N (2S)-1-[(2S)-5-amino-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-5-oxopentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 11
- NIZKGBJVCMRDKO-KWQFWETISA-N (2S)-2-[[2-[[(2S)-2-aminopropanoyl]amino]acetyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 11
- FSHURBQASBLAPO-WDSKDSINSA-N Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)N FSHURBQASBLAPO-WDSKDSINSA-N 0.000 description 11
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 11
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 11
- IQTUDDBANZYMAR-UHFFFAOYSA-N Asparaginyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CC(N)=O IQTUDDBANZYMAR-UHFFFAOYSA-N 0.000 description 11
- DYDKXJWQCIVTMR-UHFFFAOYSA-N Aspartyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CC(O)=O DYDKXJWQCIVTMR-UHFFFAOYSA-N 0.000 description 11
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 11
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 11
- BCVIOZZGJNOEQS-XKNYDFJKSA-N Ile-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)[C@@H](C)CC BCVIOZZGJNOEQS-XKNYDFJKSA-N 0.000 description 11
- WKXVAXOSIPTXEC-UHFFFAOYSA-N Isoleucyl-Aspartate Chemical compound CCC(C)C(N)C(=O)NC(C(O)=O)CC(O)=O WKXVAXOSIPTXEC-UHFFFAOYSA-N 0.000 description 11
- UASDAHIAHBRZQV-YUMQZZPRSA-N Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N UASDAHIAHBRZQV-YUMQZZPRSA-N 0.000 description 11
- JMEWFDUAFKVAAT-UHFFFAOYSA-N Methionyl-Asparagine Chemical compound CSCCC(N)C(=O)NC(C(O)=O)CC(N)=O JMEWFDUAFKVAAT-UHFFFAOYSA-N 0.000 description 11
- SHAQGFGGJSLLHE-BQBZGAKWSA-N Pro-Gln Chemical compound NC(=O)CC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 SHAQGFGGJSLLHE-BQBZGAKWSA-N 0.000 description 11
- LUMXICQAOKVQOB-UHFFFAOYSA-N Threoninyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)C(C)O LUMXICQAOKVQOB-UHFFFAOYSA-N 0.000 description 11
- ONWMQORSVZYVNH-UHFFFAOYSA-N Tyrosyl-Asparagine Chemical compound NC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ONWMQORSVZYVNH-UHFFFAOYSA-N 0.000 description 11
- IBIDRSSEHFLGSD-YUMQZZPRSA-N Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-YUMQZZPRSA-N 0.000 description 11
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 11
- VEYJKJORLPYVLO-RYUDHWBXSA-N Val-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VEYJKJORLPYVLO-RYUDHWBXSA-N 0.000 description 11
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 11
- 108010060199 cysteinylproline Proteins 0.000 description 11
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 11
- 108010078274 isoleucylvaline Proteins 0.000 description 11
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 11
- 239000002609 media Substances 0.000 description 11
- 108010034507 methionyltryptophan Proteins 0.000 description 11
- RZVAJINKPMORJF-UHFFFAOYSA-N p-acetaminophenol Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 11
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 11
- 238000007619 statistical method Methods 0.000 description 11
- 108010051110 tyrosyl-lysine Proteins 0.000 description 11
- NVMMUAUTQCWYHD-ABHRYQDASA-N (2S)-1-[(2S)-1-[(2S)-2-[[(2S)-2-amino-3-carboxypropanoyl]amino]-3-methylbutanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 NVMMUAUTQCWYHD-ABHRYQDASA-N 0.000 description 10
- YFBBUHJJUXXZOF-UWVGGRQHSA-N (2S)-1-[2-[[(2S)-2-azaniumyl-4-methylpentanoyl]amino]acetyl]pyrrolidine-2-carboxylate Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 10
- LSXGADJXBDFXQU-DLOVCJGASA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-3-phenylpropanoyl]amino]propanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 10
- QLQHWWCSCLZUMA-KKUMJFAQSA-N (3S)-3-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-[[(1S)-1-carboxy-2-(4-hydroxyphenyl)ethyl]amino]-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 10
- PQBHGSGQZSOLIR-RYUDHWBXSA-N Arg-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PQBHGSGQZSOLIR-RYUDHWBXSA-N 0.000 description 10
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 10
- GSMPSRPMQQDRIB-WHFBIAKZSA-N Asp-Gln Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O GSMPSRPMQQDRIB-WHFBIAKZSA-N 0.000 description 10
- ZSRSLWKGWFFVCM-WDSKDSINSA-N Cys-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O ZSRSLWKGWFFVCM-WDSKDSINSA-N 0.000 description 10
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 10
- WSDOHRLQDGAOGU-UHFFFAOYSA-N Histidinyl-Asparagine Chemical compound NC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 WSDOHRLQDGAOGU-UHFFFAOYSA-N 0.000 description 10
- CTCFZNBRZBNKAX-UHFFFAOYSA-N Histidinyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 CTCFZNBRZBNKAX-UHFFFAOYSA-N 0.000 description 10
- UWBDLNOCIDGPQE-UHFFFAOYSA-N Isoleucyl-Lysine Chemical compound CCC(C)C(N)C(=O)NC(C(O)=O)CCCCN UWBDLNOCIDGPQE-UHFFFAOYSA-N 0.000 description 10
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 10
- GJNDXQBALKCYSZ-RYUDHWBXSA-N Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 GJNDXQBALKCYSZ-RYUDHWBXSA-N 0.000 description 10
- 108010013835 arginine glutamate Proteins 0.000 description 10
- 108010062796 arginyllysine Proteins 0.000 description 10
- 108010036533 arginylvaline Proteins 0.000 description 10
- 108010038633 aspartylglutamate Proteins 0.000 description 10
- KZNQNBZMBZJQJO-YFKPBYRVSA-N gly pro Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 10
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 10
- 108010091871 leucylmethionine Proteins 0.000 description 10
- ZQFAGNFSIZZYBA-UHFFFAOYSA-N γ-glutamyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CCC(N)=O)N)C(O)=O)=CNC2=C1 ZQFAGNFSIZZYBA-UHFFFAOYSA-N 0.000 description 10
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 9
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 9
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 9
- NIKBMHGRNAPJFW-UHFFFAOYSA-N Histidinyl-Arginine Chemical compound NC(=N)NCCCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 NIKBMHGRNAPJFW-UHFFFAOYSA-N 0.000 description 9
- NTISAKGPIGTIJJ-IUCAKERBSA-N Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C NTISAKGPIGTIJJ-IUCAKERBSA-N 0.000 description 9
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 9
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 9
- JMCOUWKXLXDERB-WMZOPIPTSA-N Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 JMCOUWKXLXDERB-WMZOPIPTSA-N 0.000 description 9
- UJTZHGHXJKIAOS-WHFBIAKZSA-N Ser-Gln Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O UJTZHGHXJKIAOS-WHFBIAKZSA-N 0.000 description 9
- 210000002966 Serum Anatomy 0.000 description 9
- WCRFXRIWBFRZBR-GGVZMXCHSA-N Thr-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WCRFXRIWBFRZBR-GGVZMXCHSA-N 0.000 description 9
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 9
- BMPPMAOOKQJYIP-WMZOPIPTSA-N Tyr-Trp Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C([O-])=O)C1=CC=C(O)C=C1 BMPPMAOOKQJYIP-WMZOPIPTSA-N 0.000 description 9
- YSGSDAIMSCVPHG-YUMQZZPRSA-N Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)C(C)C YSGSDAIMSCVPHG-YUMQZZPRSA-N 0.000 description 9
- 108010016616 cysteinylglycine Proteins 0.000 description 9
- 238000001415 gene therapy Methods 0.000 description 9
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine zwitterion Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 9
- 108010010679 lysyl-valyl-leucyl-aspartic acid Proteins 0.000 description 9
- 108010084572 phenylalanyl-valine Proteins 0.000 description 9
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 9
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 9
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 9
- SJUXYGVRSGTPMC-UHFFFAOYSA-N Asparaginyl-Alanine Chemical compound OC(=O)C(C)NC(=O)C(N)CC(N)=O SJUXYGVRSGTPMC-UHFFFAOYSA-N 0.000 description 8
- QJMCHPGWFZZRID-UHFFFAOYSA-N Asparaginyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC(N)=O QJMCHPGWFZZRID-UHFFFAOYSA-N 0.000 description 8
- BSWHERGFUNMWGS-UHFFFAOYSA-N Aspartyl-Isoleucine Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 8
- ZVDPYSVOZFINEE-UHFFFAOYSA-N Aspartyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(O)=O ZVDPYSVOZFINEE-UHFFFAOYSA-N 0.000 description 8
- 210000004369 Blood Anatomy 0.000 description 8
- XZFYRXDAULDNFX-UHFFFAOYSA-N Cysteinyl-Phenylalanine Chemical compound SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 8
- SXGAGTVDWKQYCX-BQBZGAKWSA-N Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SXGAGTVDWKQYCX-BQBZGAKWSA-N 0.000 description 8
- ZYTPOUNUXRBYGW-YUMQZZPRSA-N Met-Met Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCSC ZYTPOUNUXRBYGW-YUMQZZPRSA-N 0.000 description 8
- UEKYKRQIAQHOOZ-KBPBESRZSA-N Pro-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)[O-])C(=O)[C@@H]1CCC[NH2+]1 UEKYKRQIAQHOOZ-KBPBESRZSA-N 0.000 description 8
- PPQRSMGDOHLTBE-UWVGGRQHSA-N Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PPQRSMGDOHLTBE-UWVGGRQHSA-N 0.000 description 8
- UYKREHOKELZSPB-JTQLQIEISA-N Trp-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(O)=O)=CNC2=C1 UYKREHOKELZSPB-JTQLQIEISA-N 0.000 description 8
- GRQCSEWEPIHLBI-UHFFFAOYSA-N Tryptophyl-Asparagine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CC(N)=O)C(O)=O)=CNC2=C1 GRQCSEWEPIHLBI-UHFFFAOYSA-N 0.000 description 8
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 8
- 108090001123 antibodies Proteins 0.000 description 8
- 102000004965 antibodies Human genes 0.000 description 8
- 239000008280 blood Substances 0.000 description 8
- 238000010172 mouse model Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- QLROSWPKSBORFJ-BQBZGAKWSA-N pro glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 8
- 102000004196 processed proteins & peptides Human genes 0.000 description 8
- 108090000765 processed proteins & peptides Proteins 0.000 description 8
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- WQZGKKKJIJFFOK-VFUOTHLCSA-N β-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 8
- SIGGQAHUPUBWNF-UHFFFAOYSA-N γ-glutamyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CCC(N)=O SIGGQAHUPUBWNF-UHFFFAOYSA-N 0.000 description 8
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N (2S)-1-[(2S)-1-[(2S)-2-amino-3-phenylpropanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 7
- HIIJOGIBQXHFKE-HHKYUTTNSA-N (2S)-1-[(2S)-2-[[(2S,3R)-2-[[(2S)-2-aminopropanoyl]amino]-3-hydroxybutanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O HIIJOGIBQXHFKE-HHKYUTTNSA-N 0.000 description 7
- KYPMKDGKAYQCHO-RYUDHWBXSA-N (2S)-2-[[(2S)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]-4-methylsulfanylbutanoic acid Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KYPMKDGKAYQCHO-RYUDHWBXSA-N 0.000 description 7
- OELDIVRKHTYFNG-UHFFFAOYSA-N Cysteinyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CS OELDIVRKHTYFNG-UHFFFAOYSA-N 0.000 description 7
- 241000701022 Cytomegalovirus Species 0.000 description 7
- WQZGKKKJIJFFOK-GASJEMHNSA-N D-Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 7
- 102000017475 Glycogen debranching enzyme Human genes 0.000 description 7
- 108050005567 Glycogen debranching enzyme Proteins 0.000 description 7
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 7
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 7
- MDCTVRUPVLZSPG-BQBZGAKWSA-N His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 MDCTVRUPVLZSPG-BQBZGAKWSA-N 0.000 description 7
- KRBMQYPTDYSENE-BQBZGAKWSA-N His-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 KRBMQYPTDYSENE-BQBZGAKWSA-N 0.000 description 7
- BCXBIONYYJCSDF-CIUDSAMLSA-N Ile-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O BCXBIONYYJCSDF-CIUDSAMLSA-N 0.000 description 7
- KFKWRHQBZQICHA-STQMWFEESA-N Leu-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 7
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 7
- XYVRXLDSCKEYES-JSGCOSHPSA-N Met-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 XYVRXLDSCKEYES-JSGCOSHPSA-N 0.000 description 7
- 229920000978 Start codon Polymers 0.000 description 7
- LWFWZRANSFAJDR-JSGCOSHPSA-N Trp-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 LWFWZRANSFAJDR-JSGCOSHPSA-N 0.000 description 7
- 238000000540 analysis of variance Methods 0.000 description 7
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 7
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 7
- 239000008103 glucose Substances 0.000 description 7
- 239000005090 green fluorescent protein Substances 0.000 description 7
- 238000003780 insertion Methods 0.000 description 7
- 108010064235 lysylglycine Proteins 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 238000001262 western blot Methods 0.000 description 7
- NBTGEURICRTMGL-WHFBIAKZSA-N (2S)-2-[[2-[[(2S)-2-aminopropanoyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 6
- QXRNAOYBCYVZCD-BQBZGAKWSA-N (2S)-6-amino-2-[[(2S)-2-aminopropanoyl]amino]hexanoic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN QXRNAOYBCYVZCD-BQBZGAKWSA-N 0.000 description 6
- AAKRWBIIGKPOKQ-ONGXEEELSA-N 2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 6
- YOKVEHGYYQEQOP-QWRGUYRKSA-N 2-[[(2S)-2-[[(2S)-2-azaniumyl-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]acetate Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 6
- XAEWTDMGFGHWFK-IMJSIDKUSA-N Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O XAEWTDMGFGHWFK-IMJSIDKUSA-N 0.000 description 6
- BNODVYXZAAXSHW-UHFFFAOYSA-N Arginyl-Histidine Chemical compound NC(=N)NCCCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 BNODVYXZAAXSHW-UHFFFAOYSA-N 0.000 description 6
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 6
- 102000004040 Capsid Proteins Human genes 0.000 description 6
- 108090000565 Capsid Proteins Proteins 0.000 description 6
- 206010010356 Congenital anomaly Diseases 0.000 description 6
- YXQDRIRSAHTJKM-IMJSIDKUSA-N Cys-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YXQDRIRSAHTJKM-IMJSIDKUSA-N 0.000 description 6
- 102100000789 DES Human genes 0.000 description 6
- 108010044052 Desmin Proteins 0.000 description 6
- CLSDNFWKGFJIBZ-UHFFFAOYSA-N Glutaminyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CCC(N)=O CLSDNFWKGFJIBZ-UHFFFAOYSA-N 0.000 description 6
- 208000006562 Glycogen Storage Disease Type VII Diseases 0.000 description 6
- 241000332595 Grouper sleepy disease iridovirus Species 0.000 description 6
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 6
- 241000282412 Homo Species 0.000 description 6
- OAPNERBWQWUPTI-YUMQZZPRSA-N Lys-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O OAPNERBWQWUPTI-YUMQZZPRSA-N 0.000 description 6
- 102100005424 SERPINA7 Human genes 0.000 description 6
- SMDQRGAERNMJJF-UHFFFAOYSA-N Tryptophyl-Cysteine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CS)C(O)=O)=CNC2=C1 SMDQRGAERNMJJF-UHFFFAOYSA-N 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 238000002641 enzyme replacement therapy Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 230000001665 lethal Effects 0.000 description 6
- 231100000518 lethal Toxicity 0.000 description 6
- 239000006166 lysate Substances 0.000 description 6
- 230000002829 reduced Effects 0.000 description 6
- 230000001177 retroviral Effects 0.000 description 6
- RXGLHDWAZQECBI-SRVKXCTJSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 5
- IAJFFZORSWOZPQ-SRVKXCTJSA-N (2S)-4-amino-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 5
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 5
- FFMIYIMKQIMDPK-BQBZGAKWSA-N Asn-His Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 FFMIYIMKQIMDPK-BQBZGAKWSA-N 0.000 description 5
- HSPSXROIMXIJQW-BQBZGAKWSA-N Asp-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 HSPSXROIMXIJQW-BQBZGAKWSA-N 0.000 description 5
- CPMKYMGGYUFOHS-FSPLSTOPSA-N Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O CPMKYMGGYUFOHS-FSPLSTOPSA-N 0.000 description 5
- 241000282693 Cercopithecidae Species 0.000 description 5
- PFMUCCYYAAFKTH-YFKPBYRVSA-N Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CN PFMUCCYYAAFKTH-YFKPBYRVSA-N 0.000 description 5
- 206010073071 Hepatocellular carcinoma Diseases 0.000 description 5
- JHKXZYLNVJRAAJ-WDSKDSINSA-N Met-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(O)=O JHKXZYLNVJRAAJ-WDSKDSINSA-N 0.000 description 5
- OGGRSJFVXREKOR-CIUDSAMLSA-N Met-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCSC OGGRSJFVXREKOR-CIUDSAMLSA-N 0.000 description 5
- DZMGFGQBRYWJOR-YUMQZZPRSA-N Met-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O DZMGFGQBRYWJOR-YUMQZZPRSA-N 0.000 description 5
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 5
- FSXRLASFHBWESK-HOTGVXAUSA-N Phe-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 FSXRLASFHBWESK-HOTGVXAUSA-N 0.000 description 5
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 239000000969 carrier Substances 0.000 description 5
- 230000028993 immune response Effects 0.000 description 5
- 230000001965 increased Effects 0.000 description 5
- 230000003834 intracellular Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000002463 transducing Effects 0.000 description 5
- 108010084932 tryptophyl-proline Proteins 0.000 description 5
- CXRCVCURMBFFOL-FXQIFTODSA-N (2S)-1-[(2S)-2-[[(2S)-2-azaniumylpropanoyl]amino]propanoyl]pyrrolidine-2-carboxylate Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 4
- OCYROESYHWUPBP-VGMNWLOBSA-N (2S,3R)-3-methyl-2-[[(2S)-pyrrolidin-1-ium-2-carbonyl]amino]pentanoate Chemical compound CC[C@@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 OCYROESYHWUPBP-VGMNWLOBSA-N 0.000 description 4
- XMPXVJIDADUOQB-RCOVLWMOSA-N (2S,3S)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]-3-methylpentanoate Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 4
- 108010051330 Arg-Pro-Gly-Pro Proteins 0.000 description 4
- XNSKSTRGQIPTSE-UHFFFAOYSA-N Arginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCCNC(N)=N XNSKSTRGQIPTSE-UHFFFAOYSA-N 0.000 description 4
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 4
- RGTVXXNMOGHRAY-UHFFFAOYSA-N Cysteinyl-Arginine Chemical compound SCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RGTVXXNMOGHRAY-UHFFFAOYSA-N 0.000 description 4
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 4
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 4
- 102100011960 MIR7-3HG Human genes 0.000 description 4
- 101710008473 MIR7-3HG Proteins 0.000 description 4
- 101710037987 SERPINA7 Proteins 0.000 description 4
- YKRQRPFODDJQTC-UHFFFAOYSA-N Threoninyl-Lysine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CCCCN YKRQRPFODDJQTC-UHFFFAOYSA-N 0.000 description 4
- TYYLDKGBCJGJGW-WMZOPIPTSA-N Trp-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 TYYLDKGBCJGJGW-WMZOPIPTSA-N 0.000 description 4
- PNVLWFYAPWAQMU-CIUDSAMLSA-N Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)C(C)C PNVLWFYAPWAQMU-CIUDSAMLSA-N 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 230000002068 genetic Effects 0.000 description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 4
- 239000001963 growth media Substances 0.000 description 4
- 238000001990 intravenous administration Methods 0.000 description 4
- 230000002503 metabolic Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000006011 modification reaction Methods 0.000 description 4
- 230000000750 progressive Effects 0.000 description 4
- 108010015796 prolylisoleucine Proteins 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- SNFUTDLOCQQRQD-UHFFFAOYSA-N 2-[(2-amino-4-carboxybutanoyl)amino]-3-methylpentanoic acid Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SNFUTDLOCQQRQD-UHFFFAOYSA-N 0.000 description 3
- FPTXMUIBLMGTQH-ONGXEEELSA-N 2-[[(2S)-2-[[(2S)-2-amino-3-phenylpropanoyl]amino]propanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 3
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 3
- 102100001888 CTRB1 Human genes 0.000 description 3
- 101700014591 CTRB1 Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 102000008100 Human Serum Albumin Human genes 0.000 description 3
- 108091006822 Human Serum Albumin Proteins 0.000 description 3
- JWBXCSQZLLIOCI-GUBZILKMSA-N Ile-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C JWBXCSQZLLIOCI-GUBZILKMSA-N 0.000 description 3
- 108020004391 Introns Proteins 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- 210000003712 Lysosomes Anatomy 0.000 description 3
- 241000282567 Macaca fascicularis Species 0.000 description 3
- 210000004379 Membranes Anatomy 0.000 description 3
- 108020004999 Messenger RNA Proteins 0.000 description 3
- 241000286209 Phasianidae Species 0.000 description 3
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 3
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 3
- 238000010162 Tukey test Methods 0.000 description 3
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 3
- 238000004164 analytical calibration Methods 0.000 description 3
- 238000011088 calibration curve Methods 0.000 description 3
- 238000001952 enzyme assay Methods 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 230000002440 hepatic Effects 0.000 description 3
- 230000004301 light adaptation Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000001868 lysosomic Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 229920002106 messenger RNA Polymers 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 229920001542 oligosaccharide Polymers 0.000 description 3
- 150000002482 oligosaccharides Polymers 0.000 description 3
- 238000001543 one-way ANOVA Methods 0.000 description 3
- FAPWRFPIFSIZLT-UHFFFAOYSA-M sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- BQSLGJHIAGOZCD-CIUDSAMLSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]propanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- XMAUFHMAAVTODF-STQMWFEESA-N (2S)-2-[[(2S)-2-amino-3-(1H-imidazol-5-yl)propanoyl]amino]-3-phenylpropanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XMAUFHMAAVTODF-STQMWFEESA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N 4-amino-5-[(1-carboxy-2-phenylethyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 101700033661 ACTB Proteins 0.000 description 2
- 102100011550 ACTB Human genes 0.000 description 2
- 101710032514 ACTI Proteins 0.000 description 2
- 229960000643 Adenine Drugs 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Natural products NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 101710027538 Aper1 Proteins 0.000 description 2
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 210000000349 Chromosomes Anatomy 0.000 description 2
- 229920002839 Cis-regulatory element Polymers 0.000 description 2
- MTCFGRXMJLQNBG-UWTATZPHSA-N D-serine Chemical compound OC[C@@H](N)C(O)=O MTCFGRXMJLQNBG-UWTATZPHSA-N 0.000 description 2
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 2
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 2
- 210000003958 Hematopoietic Stem Cells Anatomy 0.000 description 2
- 210000003494 Hepatocytes Anatomy 0.000 description 2
- BBIXOODYWPFNDT-CIUDSAMLSA-N Ile-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O BBIXOODYWPFNDT-CIUDSAMLSA-N 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- GUBGYTABKSRVRQ-UUNJERMWSA-N Lactose Natural products O([C@@H]1[C@H](O)[C@H](O)[C@H](O)O[C@@H]1CO)[C@H]1[C@@H](O)[C@@H](O)[C@H](O)[C@H](CO)O1 GUBGYTABKSRVRQ-UUNJERMWSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 241000282553 Macaca Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- BJFJQOMZCSHBMY-YUMQZZPRSA-N Met-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O BJFJQOMZCSHBMY-YUMQZZPRSA-N 0.000 description 2
- BEPSGCXDIVACBU-UHFFFAOYSA-N Prolyl-Histidine Chemical compound C1CCNC1C(=O)NC(C(=O)O)CC1=CN=CN1 BEPSGCXDIVACBU-UHFFFAOYSA-N 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 108010000259 Thyroxine-Binding Globulin Proteins 0.000 description 2
- LCPVBXOHXMBLFW-JSGCOSHPSA-N Trp-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)=CNC2=C1 LCPVBXOHXMBLFW-JSGCOSHPSA-N 0.000 description 2
- 210000003462 Veins Anatomy 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 230000001388 anti-tubulin Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000001413 cellular Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 229940079593 drugs Drugs 0.000 description 2
- 230000002255 enzymatic Effects 0.000 description 2
- 230000000925 erythroid Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000002349 favourable Effects 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 150000004676 glycans Polymers 0.000 description 2
- 235000011187 glycerol Nutrition 0.000 description 2
- 230000003899 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 230000003301 hydrolyzing Effects 0.000 description 2
- 230000001506 immunosuppresive Effects 0.000 description 2
- 239000007943 implant Substances 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- 230000000670 limiting Effects 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 101700009216 malA Proteins 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000000737 periodic Effects 0.000 description 2
- 230000002093 peripheral Effects 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 150000004804 polysaccharides Polymers 0.000 description 2
- 230000003389 potentiating Effects 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- DNIAPMSPPWPWGF-UHFFFAOYSA-N propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 230000001105 regulatory Effects 0.000 description 2
- 230000000717 retained Effects 0.000 description 2
- -1 serum Substances 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L sodium carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- DOFAQXCYFQKSHT-SRVKXCTJSA-N (2S)-1-[(2S)-1-[(2S)-2-amino-3-methylbutanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- DSTWKJOBKSMVCV-UWVGGRQHSA-N (2S)-2-[[(2R)-2-amino-3-sulfanylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DSTWKJOBKSMVCV-UWVGGRQHSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- UEXCHCYDPAIVDE-SRVKXCTJSA-N (3S)-3-[[(2S)-2-amino-3-phenylpropanoyl]amino]-4-[[(1R)-1-carboxy-2-sulfanylethyl]amino]-4-oxobutanoic acid Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEXCHCYDPAIVDE-SRVKXCTJSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N (3S)-3-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-(carboxymethylamino)-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- 229920000160 (ribonucleotides)n+m Polymers 0.000 description 1
- KTGFOCFYOZQVRJ-UHFFFAOYSA-N 2-[(2-amino-3-methylpentanoyl)amino]pentanedioic acid Chemical compound CCC(C)C(N)C(=O)NC(C(O)=O)CCC(O)=O KTGFOCFYOZQVRJ-UHFFFAOYSA-N 0.000 description 1
- BUXAPSQPMALTOY-UHFFFAOYSA-N 2-[(2-amino-3-sulfanylpropanoyl)amino]pentanedioic acid Chemical compound SCC(N)C(=O)NC(C(O)=O)CCC(O)=O BUXAPSQPMALTOY-UHFFFAOYSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N 2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]propanoyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- YQEMORVAKMFKLG-UHFFFAOYSA-N 2-stearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC(CO)CO YQEMORVAKMFKLG-UHFFFAOYSA-N 0.000 description 1
- HKTRDWYCAUTRRL-UHFFFAOYSA-N 4-amino-5-[[1-carboxy-2-(1H-imidazol-5-yl)ethyl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 HKTRDWYCAUTRRL-UHFFFAOYSA-N 0.000 description 1
- 102100001085 APOB Human genes 0.000 description 1
- 101700065507 APOB Proteins 0.000 description 1
- 101000447413 APOE Proteins 0.000 description 1
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 241000272814 Anser sp. Species 0.000 description 1
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 1
- FKBFDTRILNZGAI-UHFFFAOYSA-N Aspartyl-Cysteine Chemical compound OC(=O)CC(N)C(=O)NC(CS)C(O)=O FKBFDTRILNZGAI-UHFFFAOYSA-N 0.000 description 1
- 238000000035 BCA protein assay Methods 0.000 description 1
- 101710010423 BN863_22000 Proteins 0.000 description 1
- 230000037177 Biodistribution Effects 0.000 description 1
- 210000004958 Brain cells Anatomy 0.000 description 1
- 229920000033 CRISPR Polymers 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 102100001889 CTRB2 Human genes 0.000 description 1
- 101700041622 CTRB2 Proteins 0.000 description 1
- YQEZLKZALYSWHR-UHFFFAOYSA-N Calypsol Chemical compound C=1C=CC=C(Cl)C=1C1(NC)CCCCC1=O YQEZLKZALYSWHR-UHFFFAOYSA-N 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 208000005846 Cardiomyopathy Diseases 0.000 description 1
- 230000037250 Clearance Effects 0.000 description 1
- 102000013831 Coagulation factor IX Human genes 0.000 description 1
- 229920002676 Complementary DNA Polymers 0.000 description 1
- FBPFZTCFMRRESA-KAZBKCHUSA-N D-Mannitol Natural products OC[C@@H](O)[C@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KAZBKCHUSA-N 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N D-sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- HRLIOXLXPOHXTA-NSHDSACASA-N Dexmedetomidine Chemical compound C1([C@@H](C)C=2C(=C(C)C=CC=2)C)=CN=C[N]1 HRLIOXLXPOHXTA-NSHDSACASA-N 0.000 description 1
- 101700059163 EIF3J Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 210000002351 Embryonic Muscle Cell Anatomy 0.000 description 1
- 210000002472 Endoplasmic Reticulum Anatomy 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 210000003743 Erythrocytes Anatomy 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 210000003191 Femoral Vein Anatomy 0.000 description 1
- 101700038429 GAA1 Proteins 0.000 description 1
- 102100008842 GH1 Human genes 0.000 description 1
- 101710028122 GLA1 Proteins 0.000 description 1
- 101710028121 GLU1 Proteins 0.000 description 1
- 102100018493 GPAA1 Human genes 0.000 description 1
- 101700046067 GPAA1 Proteins 0.000 description 1
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 1
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 1
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- FBTYOQIYBULKEH-ZFWWWQNUSA-N His-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CNC=N1 FBTYOQIYBULKEH-ZFWWWQNUSA-N 0.000 description 1
- HTOOKGDPMXSJSY-STQMWFEESA-N His-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 HTOOKGDPMXSJSY-STQMWFEESA-N 0.000 description 1
- 241000484121 Human parvovirus Species 0.000 description 1
- HSHNITRMYYLLCV-UHFFFAOYSA-N Hymecromone Chemical compound C1=C(O)C=CC2=C1OC(=O)C=C2C HSHNITRMYYLLCV-UHFFFAOYSA-N 0.000 description 1
- 101700035985 IDS Proteins 0.000 description 1
- 102100008356 IDS Human genes 0.000 description 1
- 210000004347 Intestinal Mucosa Anatomy 0.000 description 1
- ZUKPVRWZDMRIEO-VKHMYHEASA-N L-cysteinylglycine zwitterion Chemical compound SC[C@H]([NH3+])C(=O)NCC([O-])=O ZUKPVRWZDMRIEO-VKHMYHEASA-N 0.000 description 1
- 125000002707 L-tryptophyl group Chemical group [H]C1=C([H])C([H])=C2C(C([C@](N([H])[H])(C(=O)[*])[H])([H])[H])=C([H])N([H])C2=C1[H] 0.000 description 1
- 241000283953 Lagomorpha Species 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 1
- LHSGPCFBGJHPCY-STQMWFEESA-N Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-STQMWFEESA-N 0.000 description 1
- 206010024579 Lysosomal storage disease Diseases 0.000 description 1
- ZLNQQNXFFQJAID-UHFFFAOYSA-L Magnesium carbonate Chemical compound [Mg+2].[O-]C([O-])=O ZLNQQNXFFQJAID-UHFFFAOYSA-L 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- KAKJTZWHIUWTTD-VQVTYTSYSA-N Met-Thr Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)O)C([O-])=O KAKJTZWHIUWTTD-VQVTYTSYSA-N 0.000 description 1
- 206010068836 Metabolic myopathy Diseases 0.000 description 1
- 210000004080 Milk Anatomy 0.000 description 1
- 210000002200 Mouth Mucosa Anatomy 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 206010028289 Muscle atrophy Diseases 0.000 description 1
- 210000002027 Muscle, Skeletal Anatomy 0.000 description 1
- 210000004165 Myocardium Anatomy 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 108010061543 Neutralizing Antibodies Proteins 0.000 description 1
- 210000004940 Nucleus Anatomy 0.000 description 1
- 241000283898 Ovis Species 0.000 description 1
- 240000007019 Oxalis corniculata Species 0.000 description 1
- 102100019197 PPP1R12C Human genes 0.000 description 1
- 101710002259 PPP1R12C Proteins 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 229960001412 Pentobarbital Drugs 0.000 description 1
- WEXRUCMBJFQVBZ-UHFFFAOYSA-N Pentobarbital Chemical compound CCCC(C)C1(CC)C(=O)NC(=O)NC1=O WEXRUCMBJFQVBZ-UHFFFAOYSA-N 0.000 description 1
- IEHDJWSAXBGJIP-RYUDHWBXSA-N Phe-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 IEHDJWSAXBGJIP-RYUDHWBXSA-N 0.000 description 1
- 210000002381 Plasma Anatomy 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 210000003019 Respiratory Muscles Anatomy 0.000 description 1
- 239000008156 Ringer's lactate solution Substances 0.000 description 1
- CVHZOJJKTDOEJC-UHFFFAOYSA-N Saccharin Chemical compound C1=CC=C2C(=O)NS(=O)(=O)C2=C1 CVHZOJJKTDOEJC-UHFFFAOYSA-N 0.000 description 1
- 210000003752 Saphenous Vein Anatomy 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- RYYKJJJTJZKILX-UHFFFAOYSA-M Sodium stearate Chemical compound [Na+].CCCCCCCCCCCCCCCCCC([O-])=O RYYKJJJTJZKILX-UHFFFAOYSA-M 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- CZMRCDWAGMRECN-GDQSFJPYSA-N Sucrose Natural products O([C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](CO)O1)[C@@]1(CO)[C@H](O)[C@@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-GDQSFJPYSA-N 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 230000036335 Tissue distribution Effects 0.000 description 1
- PEEAINPHPNDNGE-JQWIXIFHSA-N Trp-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 PEEAINPHPNDNGE-JQWIXIFHSA-N 0.000 description 1
- NNJVILVZKWQKPM-UHFFFAOYSA-N Xylocaine Chemical compound CCN(CC)CC(=O)NC1=C(C)C=CC=C1C NNJVILVZKWQKPM-UHFFFAOYSA-N 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000000240 adjuvant Effects 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 230000001058 adult Effects 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 102000003966 alpha-1-microglobulin Human genes 0.000 description 1
- 101800001761 alpha-1-microglobulin Proteins 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- UIIMBOGNXHQVGW-UHFFFAOYSA-M buffer Substances [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 1
- ZEWYCNBZMPELPF-UHFFFAOYSA-J calcium;potassium;sodium;2-hydroxypropanoic acid;sodium;tetrachloride Chemical compound [Na].[Na+].[Cl-].[Cl-].[Cl-].[Cl-].[K+].[Ca+2].CC(O)C(O)=O ZEWYCNBZMPELPF-UHFFFAOYSA-J 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 201000008031 cardiomyopathy Diseases 0.000 description 1
- 239000006143 cell culture media Substances 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000035512 clearance Effects 0.000 description 1
- 229940105774 coagulation factor IX Drugs 0.000 description 1
- 230000000295 complement Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000012050 conventional carrier Substances 0.000 description 1
- 230000002596 correlated Effects 0.000 description 1
- 230000001809 detectable Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 229960004253 dexmedetomidine Drugs 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 201000009910 diseases by infectious agent Diseases 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N edta Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000007824 enzymatic assay Methods 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000007478 fluorogenic assay Methods 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 102000034547 human ApoE protein Human genes 0.000 description 1
- 102000016853 human apolipoprotein C-I Human genes 0.000 description 1
- 108091004148 human apolipoprotein C-I Proteins 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 230000000366 juvenile Effects 0.000 description 1
- 229960003299 ketamine Drugs 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 229960004194 lidocaine Drugs 0.000 description 1
- 239000003589 local anesthetic agent Substances 0.000 description 1
- 230000002132 lysosomal Effects 0.000 description 1
- 239000001095 magnesium carbonate Substances 0.000 description 1
- 239000011776 magnesium carbonate Substances 0.000 description 1
- 229910000021 magnesium carbonate Inorganic materials 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000001071 malnutrition Effects 0.000 description 1
- 235000000824 malnutrition Nutrition 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000003094 microcapsule Substances 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 230000003278 mimic Effects 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 210000000056 organs Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 239000006179 pH buffering agent Substances 0.000 description 1
- 230000001717 pathogenic Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 239000000546 pharmaceutic aid Substances 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000000865 phosphorylative Effects 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 229920001993 poloxamer 188 Polymers 0.000 description 1
- 229920000023 polynucleotide Polymers 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 238000010149 post-hoc-test Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000001737 promoting Effects 0.000 description 1
- 230000018883 protein targeting Effects 0.000 description 1
- 230000002797 proteolythic Effects 0.000 description 1
- 230000010837 receptor-mediated endocytosis Effects 0.000 description 1
- 230000003362 replicative Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003248 secreting Effects 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 239000001187 sodium carbonate Substances 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 101710036816 sta-2 Proteins 0.000 description 1
- 229910001220 stainless steel Inorganic materials 0.000 description 1
- 239000010935 stainless steel Substances 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002459 sustained Effects 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 230000003313 weakening Effects 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
Images
Abstract
Description
Настоящее изобретение относится к вариантам кислой α-глюкозидазы и их применению.The present invention relates to variants of acid α-glucosidase and their use.
Болезнь Помпе, также известная как болезнь накопления гликогена (GSD) II типа и недостаточность кислой мальтазы, представляет собой аутосомно-рецессивную метаболическую миопатию, обусловленную недостаточностью лизосомного фермента кислой α-глюкозидазы (GAA). GAA представляет собой экзо-1,4 и 1,6-α-глюкозидазу, которая гидролизует гликоген до глюкозы в лизосоме. Недостаточность GAA ведет к накоплению гликогена в лизосомах и вызывает нарастающее повреждение дыхательных, сердечных и скелетных мышц. Заболевание варьирует от быстро прогрессирующего детского течения, которое обычно фатально к возрасту в 1-2 года, до более медленно прогрессирующего и гетерогенного течения, которое обуславливает значимую распространенность болезни и раннюю смертность у детей и взрослых. Hirschhorn RR, The Metabolic and Molecular Bases of Inherited Disease, 3: 3389-3420 (2001, McGraw-Hill); Van der Ploeg and Reuser, Lancet 372: 1342-1351 (2008).Pompe disease, also known as glycogen storage disease (GSD) type II and acid maltase deficiency, is an autosomal recessive metabolic myopathy caused by deficiency of the lysosomal acid α-glucosidase enzyme (GAA). GAA is an exo-1,4 and 1,6-α-glucosidase that hydrolyzes glycogen to glucose in the lysosome. GAA deficiency leads to the accumulation of glycogen in lysosomes and causes progressive damage to the respiratory, cardiac and skeletal muscles. The disease ranges from a rapidly progressive childhood course, which is usually fatal by 1–2 years of age, to a more slowly progressive and heterogeneous course, which is associated with significant disease prevalence and early mortality in children and adults. Hirschhorn RR, The Metabolic and Molecular Bases of Inherited Disease, 3: 3389-3420 (2001, McGraw-Hill); Van der Ploeg and Reuser, Lancet 372: 1342-1351 (2008).
Существующая терапия человека для лечения болезни Помпе включает введение рекомбинантной GAA человека, которое иначе называют ферментозаместительной терапией (ERT). Продемонстрирован ERT эффект при тяжелой детской GSDII. Однако польза ферментативной терапии ограничена необходимостью частых инфузий и развитием ингибиторных антител против рекомбинантной hGAA (Amalfitano, A., et al. (2001) Genet. In Med. 3:132-138). Кроме того, ERT не обеспечивает эффективную коррекцию во всем организме, вероятно, из-за комбинации плохого биораспределения белка после доставки в периферическую вену, отсутствия захвата из некоторых тканей и высокой иммуногенности.Current human therapy for the treatment of Pompe disease involves the administration of recombinant human GAA, otherwise referred to as enzyme replacement therapy (ERT). An ERT effect has been demonstrated in severe pediatric GSDII. However, the benefit of enzyme therapy is limited by the need for frequent infusions and the development of inhibitory antibodies against recombinant hGAA (Amalfitano, A., et al. (2001) Genet. In Med. 3:132-138). In addition, ERT does not provide effective whole-body correction, likely due to a combination of poor protein biodistribution after delivery to a peripheral vein, lack of uptake from some tissues, and high immunogenicity.
В качестве альтернативы или вспомогательного средства для ERT исследовали выполнимость подходов генной терапии для того, чтобы лечить GSDII (Amalfitano, A., et al. (1999) Proc. Natl. Acad. Sci. USA 96:8861-8866, Ding, E., et al. (2002) Mol. Ther. 5:436-446, Fraites, T. J., et al. (2002) Mol. Ther. 5:571-578, Tsujino, S., et al. (1998) Hum. Gene Ther. 9:1609-1616). Однако направленный в мышцы перенос генов для того, чтобы корректировать генетический дефект, столкнулся с ограничением системной природой заболевания и тем фактом, что экспрессия трансгена в мышцах обычно бывает более иммуногенной по сравнению с другими тканями.As an alternative or adjunct to ERT, the feasibility of gene therapy approaches to treat GSDII has been investigated (Amalfitano, A., et al. (1999) Proc. Natl. Acad. Sci. USA 96:8861-8866, Ding, E. (2002) Mol Ther 5:436-446, Fraites, T. J., et al (2002) Mol Ther 5:571-578, Tsujino, S., et al (1998) Hum. Gene Ther 9:1609-1616). However, muscle-targeted gene transfer to correct a genetic defect has run into limitations due to the systemic nature of the disease and the fact that transgene expression in muscle tends to be more immunogenic than in other tissues.
Doerfler et al., 2016 описывают комбинированное введение двух конструкций, кодирующих GAA человека с оптимизацией кодонов, одна под управлением специфического промотора печени и другая под управлением специфического промотора мышц. Управляемую специфическим промотором печени экспрессию GAA используют для содействия иммунологической толерантности к GAA в модели на Gaa-/- мышах, тогда как управляемая специфическим промотором мышц экспрессия GAA обеспечивает экспрессию терапевтического белка в части тканей, на которые направлена терапия. Однако эта стратегия не является полностью удовлетворительной в том отношении, что она требует использования нескольких конструкций и не ведет к экспрессии GAA по всему организму.Doerfler et al., 2016 describe the combined administration of two constructs encoding human GAA with codon optimization, one driven by a specific liver promoter and the other driven by a specific muscle promoter. Liver-specific promoter-driven GAA expression is used to promote immunological tolerance to GAA in a Gaa-/- mouse model, while muscle-specific promoter-driven GAA expression mediates the expression of the therapeutic protein in the part of tissues targeted for therapy. However, this strategy is not entirely satisfactory in that it requires the use of multiple constructs and does not result in GAA expression throughout the body.
В прошлом предложены модифицированные белки GAA для усовершенствования лечения лизосомной болезни накопления. В частности, в заявке WO2004064750 и Sun et al. 2006 раскрыт химерный полипептид GAA, содержащий сигнальный пептид, функционально связанный с GAA, в качестве способа усиления направленности белка в секреторный путь.In the past, modified GAA proteins have been proposed to improve the treatment of lysosomal storage disease. In particular, WO2004064750 and Sun et al. 2006 disclosed a chimeric GAA polypeptide containing a signal peptide operably linked to GAA as a way to enhance protein targeting into the secretory pathway.
Однако терапия, доступная пациенту, не является полностью удовлетворительной, и в данной области все еще необходимы усовершенствованные полипептиды GAA и продуцирование GAA. В частности, все еще существует потребность в долгосрочном эффекте лечения с использованием GAA, продуцировании GAA на высоком уровне, усовершенствованной иммунологической толерантности к получаемому полипептиду GAA и усовершенствованном захвате GAA клетками и тканями, нуждающимися в нем. Кроме того, в WO2004064750 и Sun et al., 2006, раскрыто распределение химерного полипептида GAA в тканях, которое не является полностью удовлетворительным. Следовательно, все еще существует потребность в полипептиде GAA, который будет полностью терапевтическим, допуская коррекцию накопления гликогена в большинстве, если не во всех, тканей, представляющих интерес.However, the therapy available to the patient is not entirely satisfactory and improved GAA polypeptides and GAA production are still needed in the art. In particular, there is still a need for a long-term effect of GAA treatment, high levels of GAA production, improved immunological tolerance to the resulting GAA polypeptide, and improved uptake of GAA by cells and tissues in need of it. In addition, in WO2004064750 and Sun et al., 2006, tissue distribution of a chimeric GAA polypeptide is disclosed, which is not entirely satisfactory. Therefore, there is still a need for a GAA polypeptide that will be fully therapeutic, allowing for the correction of glycogen storage in most, if not all, tissues of interest.
СУЩНОСТЬ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION
Настоящее изобретение относится к вариантам GAA, которые экспрессируют и секретируют на более высоких уровнях по сравнению с белком GAA дикого типа и которые обеспечивают усовершенствованную коррекцию патологического накопления гликогена по всему организму и ведут к индукции иммунологической толерантности к GAA.The present invention relates to GAA variants that express and secrete at higher levels than wild-type GAA protein and which provide improved correction of pathological glycogen accumulation throughout the body and lead to the induction of immunological tolerance to GAA.
По одному из аспектов, изобретение относится к усеченному полипептиду GAA, который содержит делецию по меньшей мере одной аминокислоты с N-конца родительского полипептида GAA, где родительский полипептид соответствует форме предшественника полипептида GAA, свободного от его сигнального пептида. В конкретном варианте осуществления указанный усеченный полипептид GAA имеет по меньшей мере 2, в частности, по меньшей мере 2, в частности, по меньшей мере 3, в частности, по меньшей мере 4, в частности, по меньшей мере 5, в частности, по меньшей мере 6, в частности, по меньшей мере 7, в частности, по меньшей мере 8 последовательных аминокислот, на его N-конце, по сравнению с родительским полипептидом GAA. В другом варианте осуществления указанный усеченный полипептид GAA имеет самое большее 75, в частности самое большее 70, в частности самое большее 60, в частности самое большее 55, в частности самое большее 50, в частности самое большее 47, в частности самое большее 46, в частности самое большее 45, в частности самое большее 44, в частности самое большее 43 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA. В дополнительном конкретном варианте осуществления, указанный усеченный полипептид GAA имеет самое большее 47, в частности самое большее 46, в частности самое большее 45, в частности самое большее 44, в частности самое большее 43 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA. В другом конкретном варианте осуществления указанный усеченный полипептид GAA имеет от 1 до 75, в частности, от 1 до 47, в частности, от 1 до 46, в частности, от 1 до 45, в частности, от 1 до 44, в частности, от 1 до 43 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA. В другом варианте осуществления указанный усеченный полипептид GAA имеет от 2 до 43, в частности, от 3 до 43, в частности, от 4 до 43, в частности, от 5 до 43, в частности, от 6 до 43, в частности, от 7 до 43, в частности, от 8 до 43 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA. В более конкретном варианте осуществления, указанный усеченный полипептид GAA имеет 6, 7, 8, 9, 10, 27, 28, 29, 30, 31, 40, 41, 42, 43, 44, 45, 46 или 47 последовательных аминокислот, удаленных на его N-конце, по сравнению с родительским полипептидом GAA, в частности, 7, 8, 9, 28, 29, 30, 41, 42, 43 или 44, более конкретно 8, 29, 42 или 43 последовательных аминокислот, усеченных на его N-конце, по сравнению с родительским полипептидом GAA. В дополнительном конкретном варианте осуществления, родительский полипептид представляет собой GAA человека (hGAA), в частности hGAA, имеющий аминокислотную последовательность, приведенную в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1.In one aspect, the invention relates to a truncated GAA polypeptide that contains a deletion of at least one amino acid from the N-terminus of the parent GAA polypeptide, where the parent polypeptide corresponds to the form of the GAA polypeptide precursor free from its signal peptide. In a particular embodiment, said truncated GAA polypeptide has at least 2, in particular at least 2, in particular at least 3, in particular at least 4, in particular at least 5, in particular at least 6, in particular at least 7, in particular at least 8 consecutive amino acids, at its N-terminus, compared to the parent GAA polypeptide. In another embodiment, said truncated GAA polypeptide has at most 75, in particular at most 70, in particular at most 60, in particular at most 55, in particular at most 50, in particular at most 47, in particular at most 46, in in particular at most 45, in particular at most 44, in particular at most 43 consecutive amino acids deleted at its N-terminus, compared to the parent GAA polypeptide. In a further specific embodiment, said truncated GAA polypeptide has at most 47, in particular at most 46, in particular at most 45, in particular at most 44, in particular at most 43 consecutive amino acids deleted at its N-terminus, compared with the parent GAA polypeptide. In another specific embodiment, said truncated GAA polypeptide has from 1 to 75, in particular from 1 to 47, in particular from 1 to 46, in particular from 1 to 45, in particular from 1 to 44, in particular, 1 to 43 consecutive amino acids deleted at its N-terminus compared to the parent GAA polypeptide. In another embodiment, said truncated GAA polypeptide has from 2 to 43, in particular from 3 to 43, in particular from 4 to 43, in particular from 5 to 43, in particular from 6 to 43, in particular from 7 to 43, in particular 8 to 43 consecutive amino acids deleted at its N-terminus, compared to the parent GAA polypeptide. In a more specific embodiment, said truncated GAA polypeptide has 6, 7, 8, 9, 10, 27, 28, 29, 30, 31, 40, 41, 42, 43, 44, 45, 46, or 47 consecutive amino acids deleted at its N-terminus, compared to the parent GAA polypeptide, in particular 7, 8, 9, 28, 29, 30, 41, 42, 43 or 44, more specifically 8, 29, 42 or 43 consecutive amino acids truncated by its N-terminus, compared to the parent GAA polypeptide. In a further specific embodiment, the parent polypeptide is human GAA (hGAA), in particular hGAA, having the amino acid sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1.
В конкретном варианте осуществления усеченный полипептид GAA по изобретению имеет последовательность, приведенную в SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 34 и SEQ ID NO: 35.In a specific embodiment, the truncated GAA polypeptide of the invention has the sequence shown in SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 34, and SEQ ID NO: 35.
Кроме того, усеченный полипептид GAA по изобретению дополнительно может содержать сигнальный пептид, слитый с его N-концом, в частности сигнальный пептид, выбранный в группе, состоящей из SEQ ID NO: с 3 до 7, в частности сигнальный пептид из SEQ ID NO: 3.In addition, the truncated GAA polypeptide of the invention may further comprise a signal peptide fused to its N-terminus, in particular a signal peptide selected from the group consisting of SEQ ID NO: 3 to 7, in particular a signal peptide from SEQ ID NO: 3.
В другом аспекте изобретение относится к молекуле нуклеиновой кислоты, кодирующей усеченный полипептид GAA, как описано выше, необязательно слитый с сигнальным пептидом через его N-конец. В некоторых вариантах осуществления молекула нуклеиновой кислоты имеет нуклеотидную последовательность, оптимизированную для того, чтобы усовершенствовать экспрессию и/или усовершенствовать иммунологическую толерантность для усеченного полипептида GAA in vivo, в частности у человеческого субъекта.In another aspect, the invention relates to a nucleic acid molecule encoding a truncated GAA polypeptide as described above, optionally fused to a signal peptide through its N-terminus. In some embodiments, the nucleic acid molecule has a nucleotide sequence optimized to improve expression and/or improve immunological tolerance for the truncated GAA polypeptide in vivo, particularly in a human subject.
В еще одном аспекте изобретение относится к конструкции нуклеиновой кислоты, которая содержит молекулу нуклеиновой кислоты по изобретению, функционально связанную с одной или несколькими регуляторными последовательностями, таким как промотор, интрон, сигнал полиаденилирования и/или энхансер (например, цис-регуляторный модуль, или CRM). В конкретном варианте осуществления промотор представляет собой специфический промотор печени, предпочтительно выбранный в группе, состоящей из промотора α-1-антитрипсина (hAAT), промотора транстиретина, промотора альбумина и промотора тироксинсвязывающего глобулина (TBG). В другом конкретном варианте осуществления промотор представляет собой специфически промотор мышц, такой как промоторы Spc5-12, MCK и десмина. В другом варианте осуществления промотор представляет собой универсальный промотор, такой как промоторы CMV, CAG и PGK. Конструкция нуклеиновой кислоты дополнительно может необязательно содержать интрон, в частности интрон, выбранный в группе, состоящей из интрона β-глобина b2 человека (или HBB2), интрона FIX, интрона β-глобина курицы и интрона SV40, где указанный интрон необязательно представляет собой модифицированный интрон, такой как модифицированный интрон HBB2 из SEQ ID NO: 17, модифицированный интрон FIX из SEQ ID NO: 19 или модифицированный интрон β-глобина курицы из SEQ ID NO: 21. В конкретном варианте осуществления конструкции нуклеиновой кислоты по изобретению указанная конструкция содержит, предпочтительно в этом порядке: энхансер; интрон; промотор, в частности специфический промотор печени; последовательность нуклеиновой кислоты, кодирующую белок GAA; и сигнал полиаденилирования, конструкция содержит, предпочтительно в этом порядке: управляющую область ApoE; интрон HBB2, в частности, модифицированный интрон HBB2; промотор hAAT; последовательность нуклеиновой кислоты, кодирующую усеченный полипептид GAA; и сигнал полиаденилирования бычьего гормона роста. В конкретных вариантах осуществления указанная конструкция нуклеиновой кислоты более конкретно содержит нуклеотидную последовательность из любой одной из SEQ ID NO: с 22 до 26.In yet another aspect, the invention relates to a nucleic acid construct that comprises a nucleic acid molecule of the invention operably linked to one or more regulatory sequences such as a promoter, intron, polyadenylation signal, and/or enhancer (e.g., a cis-regulatory module, or CRM ). In a specific embodiment, the promoter is a specific liver promoter, preferably selected from the group consisting of the α-1-antitrypsin (hAAT) promoter, transthyretin promoter, albumin promoter, and thyroxin-binding globulin (TBG) promoter. In another specific embodiment, the promoter is a specific muscle promoter such as the Spc5-12, MCK and desmin promoters. In another embodiment, the promoter is a general purpose promoter such as the CMV, CAG and PGK promoters. The nucleic acid construct may optionally further comprise an intron, in particular an intron selected from the group consisting of a human β-globin b2 (or HBB2) intron, a FIX intron, a chicken β-globin intron, and an SV40 intron, wherein said intron is optionally a modified intron. , such as the modified HBB2 intron of SEQ ID NO: 17, the modified FIX intron of SEQ ID NO: 19, or the modified chicken β-globin intron of SEQ ID NO: 21. In a particular embodiment of the nucleic acid construct of the invention, said construct preferably contains in this order: enhancer; intron; a promoter, in particular a specific liver promoter; a nucleic acid sequence encoding a GAA protein; and a polyadenylation signal, the construct contains, preferably in this order: an ApoE control region; an HBB2 intron, in particular a modified HBB2 intron; hAAT promoter; a nucleic acid sequence encoding a truncated GAA polypeptide; and a bovine growth hormone polyadenylation signal. In specific embodiments, said nucleic acid construct more specifically comprises a nucleotide sequence from any one of SEQ ID NOs: 22 to 26.
В другом аспекте изобретение относится к вектору, содержащему молекулу нуклеиновой кислоты или конструкцию нуклеиновой кислоты, раскрытые в настоящем описании. Вектор по изобретению в частности может представлять собой вирусный вектор, предпочтительно ретровирусный вектор, такой как лентивирусный вектор, или AAV вектор. Предпочтительно, вектор представляет собой одноцепочечный или двухцепочечный самокомплементарный AAV вектор, предпочтительно AAV вектор с происходящим из AAV капсидом, например, капсидом из AAV1, AAV2, варианта AAV2, AAV3, варианта AAV3, AAV3B, варианта AAV3B, AAV4, AAV5, AAV6, варианта AAV6, AAV7, AAV8, AAV9, AAV10, такого как AAVcy10 и AAVrh10, AAVrh74, AAVdj, AAV-Anc80, AAV-LK03, AAV2i8, AAV свиньи, таким как капсид AAVpo4 и AAVpo6, или с химерным капсидом. В конкретном варианте осуществления вектор представляет собой AAV вектор с капсидом AAV8, AAV9, AAVrh74 или AAV2i8, в частности капсидом AAV8, AAV9 или AAVrh74, более конкретно капсидом AAV8.In another aspect, the invention relates to a vector containing a nucleic acid molecule or a nucleic acid construct as disclosed herein. The vector of the invention may in particular be a viral vector, preferably a retroviral vector such as a lentiviral vector, or an AAV vector. Preferably, the vector is a single- or double-stranded self-complementary AAV vector, preferably an AAV vector with an AAV-derived capsid, e.g., a capsid from AAV1, AAV2, AAV2 variant, AAV3, AAV3 variant, AAV3B, AAV3B variant, AAV4, AAV5, AAV6, AAV6 variant , AAV7, AAV8, AAV9, AAV10 such as AAVcy10 and AAVrh10, AAVrh74, AAVdj, AAV-Anc80, AAV-LK03, AAV2i8, porcine AAV such as AAVpo4 and AAVpo6 capsid, or with a chimeric capsid. In a specific embodiment, the vector is an AAV vector with an AAV8, AAV9, AAVrh74 or AAV2i8 capsid, in particular an AAV8, AAV9 or AAVrh74 capsid, more specifically an AAV8 capsid.
В еще одном аспекте изобретение относится к клетке, трансформированной молекулой нуклеиновой кислоты, конструкцией нуклеиновой кислоты или вектором по изобретению. Более конкретно, клетка представляет собой клетку печени или клетку мышцы.In yet another aspect, the invention relates to a cell transformed with a nucleic acid molecule, a nucleic acid construct, or a vector of the invention. More specifically, the cell is a liver cell or a muscle cell.
В конкретном аспекте, изобретение относится к фармацевтической композиции, которая содержит, в фармацевтически приемлемом носителе, усеченный полипептид GAA, молекулу нуклеиновой кислоты, конструкцию нуклеиновой кислоты, вектор или клетку по изобретению.In a particular aspect, the invention relates to a pharmaceutical composition which comprises, in a pharmaceutically acceptable carrier, a truncated GAA polypeptide, nucleic acid molecule, nucleic acid construct, vector or cell of the invention.
Изобретение дополнительно относится к усеченному полипептиду GAA, молекуле нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектору или клетке по изобретению для применения в качестве лекарственного средства.The invention further relates to a truncated GAA polypeptide, nucleic acid molecule, nucleic acid construct, vector or cell of the invention for use as a drug.
Изобретение дополнительно предусматривает усеченный полипептид GAA, молекулу нуклеиновой кислоты, конструкцию нуклеиновой кислоты, вектор или клетку по изобретению для применения в способе лечения болезни накопления гликогена. В конкретном варианте осуществления болезнь накопления гликогена представляет собой GSDI, GSDII, GSDIII, GSDIV, GSDV, GSDVI, GSDVII, GSDVIII или летальную врожденную болезнь накопления гликогена в сердце. В более конкретном варианте осуществления, болезнь накопления гликогена выбирают в группе, состоящей из GSDI, GSDII и GSDIII, более конкретно в группе, состоящей из GSDII и GSDIII. В даже более конкретном варианте осуществления болезнь накопления гликогена представляет собой GSDII.The invention further provides a truncated GAA polypeptide, nucleic acid molecule, nucleic acid construct, vector or cell of the invention for use in a method of treating glycogen storage disease. In a specific embodiment, the glycogen storage disease is GSDI, GSDII, GSDIII, GSDIV, GSDV, GSDVI, GSDVII, GSDVIII, or lethal congenital heart glycogen storage disease. In a more specific embodiment, the glycogen storage disease is selected from the group consisting of GSDI, GSDII and GSDIII, more specifically from the group consisting of GSDII and GSDIII. In an even more specific embodiment, the glycogen storage disease is GSDII.
ОПИСАНИЕ ЧЕРТЕЖЕЙDESCRIPTION OF THE DRAWINGS
Фиг. 1. Делеция частей hGAA увеличивает ее секрецию in vitro. Часть A. Клетки гепатомы человека (Huh7) трансфицировали с использованием LipofectamineTM и контрольной плазмиды, экспрессирующей зеленый флуоресцентный белок (GFP), или плазмид, экспрессирующих hGAA дикого типа (hGAA) или последовательность hGAA, оптимизированную в соответствии с двумя различными алгоритмами (hGAAco1 и co2, соответственно). Различные конструкции hGAA содержали сигнальный пептид дикого типа или сигнальный пептид α-1-антитрипсина человека (sp2). Усеченную hGAA получали посредством делеции 8 аминокислот после сигнального пептида (Δ8). Через 48 часов после трансфекции, активность hGAA в средах для культивирования измеряли посредством флуорогенного ферментативного анализа и активность GAA оценивали по калибровочной кривой продукта реакции, как указано в Материалах и способах. График гистограммы показывает усредненное±SE для уровней секретируемой hGAA, происходящих из трех различных экспериментов. Статистический анализ выполняли посредством парного критерия Стьюдента, на гистограмме приведены полученные p-значения (*=p<0,05, как указано). Часть B. Клетки гепатомы человека (Huh7) трансфицировали с использованием липофектамина и контрольной плазмиды, экспрессирующей GFP, или плазмид, экспрессирующих hGAAco1 с сигнальным пептидом дикого типа или сигнального пептида химотрипсиногена B1 (sp7). Белок hGAA усекали посредством удаления 8 или 42 аминокислот после сигнального пептида (Δ8 и Δ42, соответственно). Через 48 часов после трансфекции, активность hGAA в средах для культивирования измеряли посредством флуорогенного ферментативного анализа, как указано выше. График гистограммы показывает усредненное±SE для уровней секретируемой hGAA, происходящих из трех различных экспериментов. Статистический анализ выполняли посредством ANOVA (*=p<0,05, как указано).Fig. 1. Deletion of parts of hGAA increases its secretion in vitro. Part A. Human hepatoma (Huh7) cells were transfected using Lipofectamine TM and a green fluorescent protein (GFP) expression control plasmid or plasmids expressing wild-type hGAA (hGAA) or an hGAA sequence optimized according to two different algorithms (hGAAco1 and co2, respectively). Various hGAA constructs contained a wild-type signal peptide or a human α-1-antitrypsin (sp2) signal peptide. Truncated hGAA was obtained by deleting 8 amino acids after the signal peptide (Δ8). 48 hours after transfection, hGAA activity in culture media was measured by fluorogenic enzyme assay and GAA activity was assessed from the reaction product calibration curve as described in Materials and Methods. The histogram plot shows the mean±SE for secreted hGAA levels from three different experiments. Statistical analysis was performed by paired Student's t-test, the histogram shows the resulting p-values (*=p<0.05, as indicated). Part B. Human hepatoma (Huh7) cells were transfected using lipofectamine and a GFP expression control plasmid or hGAAco1 expression plasmids with a wild-type or chymotrypsinogen B1 (sp7) signal peptide. The hGAA protein was truncated by removing 8 or 42 amino acids after the signal peptide (Δ8 and Δ42, respectively). 48 hours after transfection, hGAA activity in culture media was measured by fluorogenic enzyme assay as above. The histogram plot shows the mean±SE for secreted hGAA levels from three different experiments. Statistical analysis was performed by ANOVA (*=p<0.05 as indicated).
Фиг. 2. Делеция частей hGAA увеличивает ее секрецию в кровоток в модели болезни Помпе на мышах. В возрасте 3 месяцев GAA-/- мышам (n=4-5 мышей/группа) внутривенно инъецировали PBS или 2E12 вг/кг AAV8 векторов, экспрессирующих hGAA с оптимизированной последовательностью (hGAAco1) под транскрипционным управлением специфического промотора печени. Сигнальный пептид дикого типа из hGAA заменяли на сигнальный пептид химотрипсиногена B1 (sp7), а последовательность hGAA использовали в качестве полноразмерной нативной последовательности или усеченной посредством удаления 8 или 42 аминокислот после сигнального пептида (Δ8 и Δ42, соответственно). Через один месяц после инъекции у мышей брали кровь и измеряли активность hGAA с использованием флуорогенного анализа в сыворотке. Статистический анализ осуществляли посредством ANOVA (*=p<0,05, как указано).Fig. 2. Deletion of portions of hGAA increases its secretion into the bloodstream in a mouse model of Pompe disease. At 3 months of age, GAA −/− mice (n=4-5 mice/group) were intravenously injected with PBS or 2E12 vg/kg AAV8 vectors expressing sequence optimized hGAA (hGAAco1) under the transcriptional control of a specific liver promoter. The wild-type signal peptide from hGAA was replaced with the signal peptide of chymotrypsinogen B1 (sp7), and the hGAA sequence was used as the full-length native sequence or truncated by deleting 8 or 42 amino acids after the signal peptide (Δ8 and Δ42, respectively). One month after injection, mice were bled and hGAA activity was measured using a serum fluorogenic assay. Statistical analysis was performed by ANOVA (*=p<0.05 as indicated).
Фиг. 3. Сигнальные пептиды усиливают секрецию hGAA. Клетки гепатомы человека (Huh7) трансфицировали с использованием LipofectamineTM и контрольной плазмиды (GFP), плазмиды, экспрессирующей hGAA дикого типа (обозначено как sp1), или плазмид, экспрессирующих Δ8 hGAA (hGAAco) с оптимизированной последовательностью, слитую с сигнальными пептидами 6-8 (sp6-8). Через 48 часов после трансфекции активность hGAA в средах для культивирования измеряли посредством флуорогенного ферментативного анализа, и активность GAA оценивали по калибровочной кривой для 4-метилумбеллиферона. График гистограммы показывает усредненное±SE для уровней секретируемой hGAA, происходящих из трех различных экспериментов. Статистический анализ выполняли посредством ANOVA (*=p<0,05 в сравнении с клетками с имитированной трансфекцией).Fig. 3. Signal peptides enhance hGAA secretion. Human hepatoma (Huh7) cells were transfected with Lipofectamine TM and a control plasmid (GFP), wild type hGAA expression plasmid (designated as sp1), or sequence optimized Δ8 hGAA (hGAAco) expression plasmid fused with signal peptides 6-8 (sp6-8). 48 hours after transfection, hGAA activity in culture media was measured by fluorogenic enzyme assay, and GAA activity was assessed from a calibration curve for 4-methylumbelliferone. The histogram plot shows the mean±SE for secreted hGAA levels from three different experiments. Statistical analysis was performed by ANOVA (*=p<0.05 vs. mimic transfected cells).
Фиг. 4. Усеченная Δ8 hGAA эффективно корректирует накопление гликогена в модели болезни Помпе на мышах. В возрасте 4 месяцев мышам дикого типа (WT) и GAA-/- мышам (n=4-5 мышей/группа) внутривенно инъецировали PBS или 6E11 вг/кг AAV8 векторов, экспрессирующих Δ8 hGAA (hGAAco) с оптимизированной последовательностью под транскрипционным управлением промотора α-1-антитрипсина человека и слитую с сигнальным пептидом 1, 2, 7 и 8 (sp1, 2, 7, 8). Часть A. Гистограмма показывает активность hGAA, измеряемую посредством флуорогенного анализа в крови через 3 месяца после инъекции векторов. Статистический анализ выполняли посредством ANOVA, на гистограмме приведены полученные p-значения в сравнении с GAA-/- животными, которых лечили PBS (*=p<0,05). Часть B-D. Биохимическая коррекция содержания гликогена в сердце, диафрагме и квадрицепсе. В возрасте 4 месяцев GAA-/- мышей лечили как описано выше. Через 3 месяца после инъекций мышей умерщвляли и оценивали содержание гликогена. Гистограммы показывают содержание гликогена, выражаемое в виде глюкозы, высвобождаемой после ферментативного расщепления гликогена, измеряемого в сердце (часть B), диафрагме (часть C) и квадрицепсе (часть D). Статистический анализ выполняли посредством ANOVA (*=p<0,05 в сравнении с GAA-/- мышами, которым инъецировали PBS).Fig. 4. Truncated Δ8 hGAA effectively corrects glycogen storage in a mouse model of Pompe disease. At 4 months of age, wild-type (WT) and GAA-/- mice (n=4-5 mice/group) were intravenously injected with PBS or 6E11 vg/kg AAV8 vectors expressing Δ8 hGAA (hGAAco) with an optimized sequence under transcriptional control of the promoter human α-1 antitrypsin and fused to signal
Фиг. 5. Высоко секретируемая hGAA снижает гуморальный ответ в модели болезни Помпе на мышах. В возрасте 4 месяцев GAA-/- мышам внутривенно инъецировали PBS или две различные дозы (5E11 или 2E12 вг/кг) AAV8 векторов, содержащих оптимизированную последовательность под транскрипционным управлением промотора α-1-антитрипсина человека, которые кодируют Δ8 hGAA, слитой с сигнальным пептидом 1 (co), сигнальным пептидом 2 (sp2-Δ8-co), сигнальным пептидом 7 (sp7-Δ8-co) или сигнальным пептидом 8 (sp8-Δ8-co). Через 1 месяц после инъекций, сыворотки анализировали на присутствие антител против hGAA посредством ELISA. Количественное определение выполняли с использованием очищенного IgG мыши в качестве стандарта. Статистический анализ выполняли посредством ANOVA с использованием апостериорного критерия Даннета (*=p<0,01).Fig. 5. Highly secreted hGAA reduces the humoral response in a mouse model of Pompe disease. At 4 months of age, GAA-/- mice were intravenously injected with PBS or two different doses (5E11 or 2E12 vg/kg) of AAV8 vectors containing an optimized sequence under the transcriptional control of the human α-1-antitrypsin promoter, which encode Δ8 hGAA fused to a signal peptide 1 (co), signal peptide 2 (sp2-Δ8-co), signal peptide 7 (sp7-Δ8-co), or signal peptide 8 (sp8-Δ8-co). 1 month after injection, sera were analyzed for the presence of anti-hGAA antibodies by ELISA. Quantitation was performed using purified mouse IgG as a standard. Statistical analysis was performed by ANOVA using Dunnett's post hoc test (*=p<0.01).
Фиг. 6. Инъекция AAV8-hAAT-sp7-Δ8-hGAAco1 ведет к эффективной секреции hGAA в крови и захвату в мышце у NHP. Двум обезьянам Macaca fascicularis в сутки 0 инъецировали 2E12 вг/кг AAV8-hAAT-sp7-Δ8-hGAAco1. Часть A. Выполняли вестерн-блоттинг hGAA в сыворотке от двух обезьян, которую получали за 12 суток до и через 30 суток после введения вектора. Слева показаны положения полос маркера молекулярной массы, идущего параллельно с образцами. Часть B. Через 3 месяца после инъекции вектора обезьян умерщвляли и собирали ткани для биохимической оценки захвата hGAA. Вестерн-блоттинг hGAA осуществляли в экстрактах тканей, полученных из бицепса и диафрагмы. Антитело против тубулина использовали в качестве контроля загрузки. Слева показаны положения полос маркера молекулярной массы, идущего параллельно с образцами.Fig. 6. Injection of AAV8-hAAT-sp7-Δ8-hGAAco1 leads to efficient secretion of hGAA in blood and uptake in muscle by NHP. Two Macaca fascicularis monkeys on
Фиг. 7. Биохимическая коррекция содержания гликогена в печени GDE-/- животных, которым инъецировали экспрессирующий hGAA вектор. В возрасте 3 месяцев мышам дикого типа (WT) или GDE-/- мышам внутривенно инъецировали PBS или AAV8 векторы, экспрессирующие hGAA с оптимизированными кодонами под транскрипционным управлением промотора α-1-антитрипсина человека и слитую с сигнальным пептидом 7 (AAV8-hAAT-sp7-Δ8-hGAAco1) в дозе 1E11 или 1E12 вг/мышь. График гистограммы показывает содержание гликогена, выражаемое в виде глюкозы, высвобождаемой после ферментативного расщепления гликогена, измеряемого в печени. Статистический анализ осуществляли посредством ANOVA (*=p<0,05 в сравнении с GDE-/- мышами, которым инъецировали PBS, =p<0,05 в сравнении с животными WT, которым инъецировали PBS).Fig. 7. Biochemical correction of liver glycogen content in GDE-/- animals injected with an hGAA-expressing vector. At 3 months of age, wild-type (WT) or GDE-/- mice were intravenously injected with PBS or AAV8 vectors expressing codon-optimized hGAA under transcriptional control of the human α-1-antitrypsin promoter and fused to signal peptide 7 (AAV8-hAAT-sp7 -Δ8-hGAAco1) at a dose of 1E11 or 1E12 vg/mouse. The histogram plot shows the glycogen content expressed as glucose released after the enzymatic breakdown of glycogen as measured in the liver. Statistical analysis was performed by ANOVA (*=p<0.05 vs GDE −/− mice injected with PBS, =p<0.05 versus WT animals injected with PBS).
Фиг. 8. Активность GAA в средах клеток, трансфицированных плазмидами, кодирующими различные варианты GAA. Активность GAA измеряли в средах клеток HuH7 через 24 (часть A) и 48 (часть B) часов после трансфекции плазмидами, содержащими оптимизированные последовательности, кодирующие нативную GAA, комбинированную с нативным сигнальным пептидом sp1 GAA (co), или кодирующие сконструированную GAA, содержащую нативную GAA, комбинированную с гетерологичным сигнальным пептидом sp7 (sp7-co). Оценивали эффект различных делеций в кодирующей последовательности GAA после сигнального пептида sp7 (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co, sp7-Δ62-co). Плазмиду, кодирующую eGFP, использовали в качестве отрицательного контроля. Статистический анализ осуществляли посредством однофакторного дисперсионного анализа с апостериорным критерием Тьюки. Знак диез (#) в столбцах обозначает статистически значимые различия в сравнении с co; символ тау (τ) обозначает статистически значимые различия в сравнении с sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co. Данные представляют собой усредненное±SD для двух независимых экспериментов. *p<0,05, **p<0,01, ***p<0,001, ****p<0,0001, за исключением использования различных символов.Fig. 8. GAA activity in media of cells transfected with plasmids encoding various GAA variants. GAA activity was measured in HuH7 cell media 24 (part A) and 48 (part B) hours after transfection with plasmids containing optimized sequences encoding native GAA combined with native GAA sp1 signal peptide (co) or encoding engineered GAA containing native GAA combined with a heterologous sp7 signal peptide (sp7-co). The effect of various deletions in the GAA coding sequence after the sp7 signal peptide (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co, sp7-Δ62-co) was evaluated. An eGFP encoding plasmid was used as a negative control. Statistical analysis was performed by one-way ANOVA with Tukey's post hoc test. The sharp sign (#) in the columns denotes statistically significant differences compared to co; the symbol tau (τ) denotes statistically significant differences compared to sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co. Data are mean±SD of two independent experiments. *p<0.05, **p<0.01, ***p<0.001, ****p<0.0001, except for the use of different characters.
Фиг. 9. Внутриклеточная активность GAA различных вариантов GAA. Активность GAA измеряли в лизатах клеток HuH7 через 48 часов после трансфекции плазмидами, содержащими оптимизированные последовательности, кодирующие нативную GAA, комбинированную с нативным сигнальным пептидом sp1 GAA (co), или кодирующие сконструированную GAA, содержащую нативную GAA, комбинированную с гетерологичным сигнальным пептидом sp7 (sp7-co). Оценивали эффект различных делеций в кодирующей последовательности GAA после сигнального пептида (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co, sp7-Δ62-co). Плазмиду, кодирующую eGFP, использовали в качестве отрицательного контроля. Статистический анализ осуществляли посредством однофакторного дисперсионного анализа с апостериорным критерием Тьюки. Символ тау (τ) обозначает статистически значимые различия в сравнении с sp7-co, sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co. Данные представляют собой усредненное±SD для двух независимых экспериментов. *p<0,05, **p<0,01, ***p<0,001, ****p<0,0001, за исключением использования различных символов.Fig. 9. Intracellular GAA activity of various GAA variants. GAA activity was measured in lysates of HuH7 cells 48 hours after transfection with plasmids containing optimized sequences encoding native GAA combined with native signal peptide sp1 GAA (co) or encoding engineered GAA containing native GAA combined with heterologous signal peptide sp7 (sp7 -co). The effect of various deletions in the GAA coding sequence after the signal peptide (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co, sp7-Δ62-co) was evaluated. An eGFP encoding plasmid was used as a negative control. Statistical analysis was performed by one-way ANOVA with Tukey's post hoc test. The symbol tau (τ) denotes statistically significant differences compared to sp7-co, sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co. Data are mean±SD of two independent experiments. *p<0.05, **p<0.01, ***p<0.001, ****p<0.0001, except for the use of different characters.
Фиг. 10. Увеличенная активность GAA в средах клеток при использовании делеции Δ8, комбинированной с сигнальными пептидами sp6 или sp8. Активность GAA измеряли в средах (часть A) и лизатах (часть B) клеток HuH7 через 48 часов после трансфекции плазмидами, содержащими оптимизированные последовательности, кодирующие нативную GAA, комбинированную с нативным сигнальным пептидом sp1 GAA (co), или кодирующие сконструированную GAA, содержащую нативную GAA, комбинированную с гетерологичным сигнальным пептидом sp6 или sp8 (sp6-co или sp8-co). Оценивали эффект делеции 8 аминокислот в кодирующей последовательности GAA после сигнального пептида (sp6-Δ8-co, sp8-Δ8-co). Плазмиду, кодирующую eGFP, использовали в качестве отрицательного контроля. Статистический анализ осуществляли посредством однофакторного дисперсионного анализа с апостериорным критерием Тьюки. Звездочки в столбцах обозначают статистически значимые различия в сравнении с co. Данные представляют собой усредненное±SD для двух независимых экспериментов. *p<0,05, **p<0,01, ***p<0,001, ****p<0,0001, за исключением использования различных символов.Fig. 10. Increased GAA activity in cell media using Δ8 deletion combined with sp6 or sp8 signal peptides. GAA activity was measured in media (part A) and lysates (part B) of HuH7 cells 48 hours after transfection with plasmids containing optimized sequences encoding native GAA combined with native GAA sp1 signal peptide (co) or encoding engineered GAA containing native GAA combined with a heterologous sp6 or sp8 signal peptide (sp6-co or sp8-co). The effect of deletion of 8 amino acids in the GAA coding sequence after the signal peptide (sp6-Δ8-co, sp8-Δ8-co) was evaluated. An eGFP encoding plasmid was used as a negative control. Statistical analysis was performed by one-way ANOVA with Tukey's post hoc test. Asterisks in columns denote statistically significant differences compared to co. Data are mean±SD of two independent experiments. *p<0.05, **p<0.01, ***p<0.001, ****p<0.0001, except for the use of different characters.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION
Настоящее изобретение относится к усеченному полипептиду GAA, к молекуле нуклеиновой кислоты, кодирующей такой усеченный полипептид GAA, к конструкции нуклеиновой кислоты, содержащей указанную нуклеиновую кислоту, к вектору, содержащему указанную конструкцию нуклеиновой кислоты, к клетке, содержащей указанную молекулу нуклеиновой кислоты или конструкцию или вектор, и к фармацевтической композиции, содержащей полипептид, молекулу нуклеиновой кислоты, конструкцию нуклеиновой кислоты, вектору или клетку в соответствии с изобретением. Авторы изобретения к удивлению показали, что усеченная форма GAA в соответствии с изобретением значительно усовершенствует секрецию GAA, при этом снижая ее иммуногенность.The present invention relates to a truncated GAA polypeptide, to a nucleic acid molecule encoding such a truncated GAA polypeptide, to a nucleic acid construct containing said nucleic acid, to a vector containing said nucleic acid construct, to a cell containing said nucleic acid molecule or construct or vector , and to a pharmaceutical composition containing a polypeptide, nucleic acid molecule, nucleic acid construct, vector or cell in accordance with the invention. The inventors have surprisingly shown that the truncated form of GAA according to the invention significantly improves the secretion of GAA while reducing its immunogenicity.
Лизосомная кислая α-глюкозидаза или «GAA» (E.C. 3.2.1.20) (1,4-α-D-глюканглюкогидролаза) представляет собой экзо-1,4-α-D-глюкозидазу, которая гидролизует как α-1,4, так и α-1,6 связи в олигосахаридах для того, чтобы высвобождать глюкозу. Недостаточность GAA ведет к болезни накопления гликогена II типа (GSDII), также обозначаемой как болезнь Помпе (несмотря на то, что этот термин формально относится к форме заболевания с детским началом). Она катализирует полное разрушение гликогена с замедлением в точках ветвления. ген кислой α-глюкозидазы человека в 28 т. о. на хромосоме 17 кодирует мРНК в 3,6 т. о., которая продуцирует полипептид из 951 аминокислот (Hoefsloot et al., (1988) EMBO J. 7: 1697; Martiniuk et al., (1990) DNA and Cell Biology 9: 85). Фермент допускает котрансляционное N-связанное гликозилирование в эндоплазматическом ретикулуме. Он синтезируются в виде формы предшественника 110 кДа, которая созревает путем обширной модификации гликозилирования, фосфорилирования и путем протеолитического процессинга через эндосомальную промежуточную структуру приблизительно 90 кДа до конечных лизосомных форм 76 и 67 кДа (Hoefsloot, (1988) EMBO J. 7: 1697; Hoefsloot et al., (1990) Biochem. J. 272: 485; Wisselaar et al., (1993) J. Biol. Chem. 268: 2223; Hermans et al., (1993) Biochem. J. 289: 681).Lysosomal acid α-glucosidase or "GAA" (E.C. 3.2.1.20) (1,4-α-D-glucanglucohydrolase) is an exo-1,4-α-D-glucosidase that hydrolyzes both α-1,4 and and α-1,6 bonds in oligosaccharides in order to release glucose. GAA deficiency leads to glycogen storage disease type II (GSDII), also referred to as Pompe disease (despite the term formally referring to the childhood-onset form of the disease). It catalyzes the complete destruction of glycogen with a slowdown at the branch points. human acid α-glucosidase gene in 28 t. on chromosome 17 encodes a 3.6 kb mRNA that produces a 951 amino acid polypeptide (Hoefsloot et al., (1988) EMBO J. 7: 1697; Martiniuk et al., (1990) DNA and Cell Biology 9: 85). The enzyme allows co-translational N-linked glycosylation in the endoplasmic reticulum. It is synthesized as a 110 kD precursor form that matures by extensive modification of glycosylation, phosphorylation, and by proteolytic processing through an approximately 90 kD endosomal intermediate to final 76 and 67 kD lysosomal forms (Hoefsloot, (1988) EMBO J. 7: 1697; Hoefsloot et al., (1990) Biochem J. 272: 485; Wisselaar et al., (1993) J. Biol. Chem. 268: 2223; Hermans et al., (1993) Biochem. J. 289: 681).
У пациентов с GSDII недостаточность кислой α-глюкозидазы вызывает массовое накопление гликогена в лизосомах, нарушая клеточную функцию (Hirschhorn, R. and Reuser, A. J. (2001), The Metabolic and Molecular Basis for Inherited Disease, (ред. Scriver, C. R. et al.), стр. 3389-3419 (McGraw-Hill, New York). При наиболее распространенной детской форме пациенты демонстрируют нарастающую дегенерацию мышц и кардиомиопатию и погибают до достижения возраста в два года. В формах с ювенильным и взрослым началом имеет место тяжелое истощение.In patients with GSDII, acid α-glucosidase deficiency causes a massive accumulation of glycogen in lysosomes, impairing cellular function (Hirschhorn, R. and Reuser, A. J. (2001), The Metabolic and Molecular Basis for Inherited Disease, (ed. Scriver, C. R. et al. ), pp. 3389-3419 (McGraw-Hill, New York).In the most common childhood form, patients show progressive muscle degeneration and cardiomyopathy and die before
Кроме того, пациенты, имеющие другие GSD, могут получать пользу от введения оптимизированной формы GAA. Например, показано (Sun et al. (2013) Mol Genet Metab 108(2): 145; WO2010/005565), что введение GAA снижает гликоген в первичных миобластах у пациентов с болезнью накопления гликогена III типа (GSDIII).In addition, patients with other GSDs may benefit from the administration of an optimized form of GAA. For example, it has been shown (Sun et al. (2013) Mol Genet Metab 108(2): 145; WO2010/005565) that GAA administration reduces glycogen in primary myoblasts in patients with type III glycogen storage disease (GSDIII).
В частности, в контексте настоящего изобретения, «форма предшественника GAA» представляет собой форму полипептида GAA, которая содержит ее природный сигнальный пептид. Например, последовательность из SEQ ID NO: 2 представляет собой форму предшественника GAA человека (hGAA). В SEQ ID NO: 2 аминокислотные остатки 1-27 соответствуют сигнальному пептиду из полипептида hGAA. Эта последовательность сигнального пептида hGAA также представлена в SEQ ID NO: 4.In particular, in the context of the present invention, a "GAA precursor form" is a form of a GAA polypeptide that contains its natural signal peptide. For example, the sequence from SEQ ID NO: 2 is the precursor form of human GAA (hGAA). In SEQ ID NO: 2, amino acid residues 1-27 correspond to the signal peptide from the hGAA polypeptide. This hGAA signal peptide sequence is also shown in SEQ ID NO: 4.
В контексте настоящего изобретения, усеченный полипептид GAA по изобретению происходит из родительского полипептида GAA. В соответствии с настоящим изобретением, «родительский полипептид GAA» представляет собой функциональную последовательность предшественника GAA, как определено выше, но свободную от ее сигнального пептида. Например, со ссылкой на типичный полипептид GAA человека дикого типа, полный полипептид GAA дикого типа (т. е. форма предшественника GAA) представлен в SEQ ID NO: 2 или в SEQ ID NO: 30 и имеет сигнальный пептид (соответствующий аминокислотам 1-27 из SEQ ID NO: 2 или SEQ ID NO: 30), тогда как родительский полипептид GAA, служащий в качестве основы для усеченных форм GAA этих полипептидов GAA человека дикого типа, представлены в SEQ ID NO: 1 и SEQ ID NO: 33, соответственно, и не имеют сигнального пептида. В этом примере, последнее, соответствующее аминокислотам 28-952 из SEQ ID NO: 2 и аминокислотам 28-952 из SEQ ID NO: 30, обозначают как родительский полипептид GAA.In the context of the present invention, the truncated GAA polypeptide of the invention is derived from the parent GAA polypeptide. In accordance with the present invention, a "parental GAA polypeptide" is a functional GAA precursor sequence as defined above, but free of its signal peptide. For example, with reference to a typical human wild-type GAA polypeptide, the complete wild-type GAA polypeptide (i.e., the precursor form of GAA) is shown in SEQ ID NO: 2 or SEQ ID NO: 30 and has a signal peptide (corresponding to amino acids 1-27 of SEQ ID NO: 2 or SEQ ID NO: 30), while the parental GAA polypeptide serving as the basis for the truncated GAA forms of these wild-type human GAA polypeptides are shown in SEQ ID NO: 1 and SEQ ID NO: 33, respectively , and do not have a signal peptide. In this example, the latter, corresponding to amino acids 28-952 of SEQ ID NO: 2 and amino acids 28-952 of SEQ ID NO: 30, is referred to as the parental GAA polypeptide.
В соответствии с изобретением, усеченный полипептид GAA по изобретению представляет собой функциональный полипептид GAA, т. е. он обладает функциональностью полипептида GAA дикого типа. Как определено выше, функциональность GAA дикого типа состоит в том, чтобы гидролизовать как α-1,4, так и α-1,6 связи олигосахаридов и полисахаридов, более конкретно гликогена, чтобы высвобождать глюкозу. Функциональный белок GAA, кодируемый нуклеиновой кислотой по изобретению, может иметь гидролитическую активность в отношении гликогена по меньшей мере 50%, 60%, 70%, 80%, 90%, 95%, 99% или по меньшей мере 100% по сравнению с полипептидом GAA дикого типа из SEQ ID NO: 1 или SEQ ID NO: 33. Активность белка GAA кодируемого нуклеиновой кислотой по изобретению даже может быть больше чем 100%, например, больше чем 110%, 120%, 130%, 140% или даже больше чем 150% от активности белка GAA дикого типа из SEQ ID NO: 1 или из SEQ ID NO: 33.According to the invention, the truncated GAA polypeptide of the invention is a functional GAA polypeptide, ie it has the functionality of a wild-type GAA polypeptide. As defined above, the functionality of wild-type GAA is to hydrolyze both the α-1,4 and α-1,6 bonds of oligosaccharides and polysaccharides, more specifically glycogen, to release glucose. The functional GAA protein encoded by the nucleic acid of the invention may have a glycogen hydrolytic activity of at least 50%, 60%, 70%, 80%, 90%, 95%, 99%, or at least 100% relative to the polypeptide Wild-type GAA of SEQ ID NO: 1 or SEQ ID NO: 33. The activity of the GAA protein encoded by the nucleic acid of the invention may even be greater than 100%, such as greater than 110%, 120%, 130%, 140%, or even more than 150% of the activity of the wild-type GAA protein from SEQ ID NO: 1 or from SEQ ID NO: 33.
Аминокислотная последовательность родительского полипептида GAA или ее кодирующая последовательность могут происходить из любого источника, в том числе биологических видов птиц и млекопитающих. Термин «птицы», как используют в настоящем описании, включает, но не ограничиваясь этим, курицу, утку, гуся, перепелку, индюшку и фазана. Термин «млекопитающее», как используют в настоящем описании, включает, но не ограничиваясь этим, человека, обезьянообразных и других не являющиеся человеком приматов, корову, овцу, козу, лошадь, кошку, собаку, зайцеобразных и т. д. В вариантах осуществления изобретения, родительский полипептид GAA представляет собой полипептид GAA человека, мыши или перепелки, в частности человека.The amino acid sequence of the parent GAA polypeptide or its coding sequence may be from any source, including avian and mammalian species. The term "birds" as used herein includes, but is not limited to, chicken, duck, goose, quail, turkey, and pheasant. The term "mammal" as used herein includes, but is not limited to, human, simians and other non-human primates, cow, sheep, goat, horse, cat, dog, lagomorphs, etc. In embodiments of the invention , the parental GAA polypeptide is a human, mouse or quail, in particular human, GAA polypeptide.
Кроме того, родительский полипептид GAA может представлять собой функциональный вариант полипептида GAA, который содержит одну или несколько аминокислотных модификаций, таких как аминокислотная инсерция, делеция и/или замена по сравнению с полипептидом GAA. Например, родительский полипептид может представлять собой функциональное производное полипептида GAA человека, такого как полипептид из SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, обладающее по меньшей мере 80, 85, 90, 95, 96, 97, 98 или по меньшей мере 99% идентичностью последовательностей с этим полипептидом GAA человека. Например, в дополнение к усечению, которое определено выше, функциональный вариант полипептида GAA может иметь между 0 и 50, между 0 и 30, между 0 и 20, между 0 и 15, между 0 и 10 или между 0 и 5 аминокислотными изменениями в родительском полипептиде GAA, таком как родительский полипептид GAA, приведенный в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1. В частности, родительский полипептид GAA может состоять из полипептида GAA человека, имеющего аминокислотную последовательность, приведенную в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.In addition, the parent GAA polypeptide may be a functional variant of the GAA polypeptide that contains one or more amino acid modifications, such as an amino acid insertion, deletion and/or substitution, compared to the GAA polypeptide. For example, the parent polypeptide may be a functional derivative of a human GAA polypeptide, such as the polypeptide of SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1 having at least 80, 85, 90, 95, 96 , 97, 98 or at least 99% sequence identity with this human GAA polypeptide. For example, in addition to the truncation defined above, a functional GAA polypeptide variant may have between 0 and 50, between 0 and 30, between 0 and 20, between 0 and 15, between 0 and 10, or between 0 and 5 amino acid changes in the parent a GAA polypeptide, such as the parent GAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1. In particular, the parent GAA polypeptide may consist of a human GAA polypeptide having the amino acid sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1.
Термин «идентичный» и его производные относятся к идентичности последовательностей между двумя молекулами нуклеиновой кислоты. Когда положение в обеих из двух сравниваемых последовательностей занимает одно и то же основание, например, если положение в каждой из двух молекул ДНК занимает аденин, то молекулы идентичны в этом положении. % идентичности между двумя последовательностями представляет собой функцию числа совпадающих положений, которыми обладают две последовательности, деленного на число сравниваемых положений, × 100. Например, если 6 из 10 положений в двух последовательностях совпадают, то две последовательности идентичны на 60%. В целом, сравнение выполняют, когда две последовательности выровнены для того, чтобы давать максимальную идентичность. Различные биоинформационные инструменты, известные специалисту в данной области, можно использовать для выравнивания последовательностей нуклеиновой кислоты, например, BLAST или FASTA.The term "identical" and its derivatives refer to sequence identity between two nucleic acid molecules. When the position in both of the two compared sequences is occupied by the same base, for example, if the position in each of the two DNA molecules is occupied by adenine, then the molecules are identical at that position. The % identity between two sequences is a function of the number of matching positions that the two sequences have divided by the number of positions compared,
Родительский полипептид GAA также может представлять собой вариант GAA, такой как GAA II, как описано Kunita et al., (1997) Biochemica et Biophysica Acta 1362: 269; полиморфизмы и SNP в GAA описаны Hirschhorn, R. and Reuser, A. J. (2001), The Metabolic and Molecular Basis for Inherited Disease (ред. Scriver, C. R., Beaudet, A. L., Sly, W. S. и Valle, D.), стр. 3389-3419. McGraw-Hill, New York, см. стр. 3403-3405. Любой вариант полипептида GAA, известный в данной области, можно использовать в качестве основы для определения родительского полипептида GAA. Иллюстративные варианты полипептидов GAA включают SEQ ID NO: 2 (эталонная последовательность NCBI NP_000143.2); SEQ ID NO: 29 (GenBank AAA52506.1); SEQ ID NO: 30 (GenBank CAA68763.1); SEQ ID NO: 31 (GenBank: EAW89583.1) и SEQ ID NO: 32 (GenBank ABI53718.1). Другие эффективные варианты включают те, которые описаны в Hoefsloot et al., (1988) EMBO J. 7: 1697; и Van Hove et al., (1996) Proc. Natl. Acad. Sci. USA 93: 65 (человек), и номер доступа Genbank NM_008064 (мышь). Другие варианты полипептидов GAA включают те, которые описаны в WO2012/145644, WO00/34451 и US6858425. В конкретном варианте осуществления родительский полипептид GAA происходит от аминокислотной последовательности, приведенной в SEQ ID NO: 2 или SEQ ID NO: 30.The parent GAA polypeptide can also be a GAA variant such as GAA II as described by Kunita et al., (1997) Biochemica et Biophysica Acta 1362: 269; polymorphisms and SNPs in GAA are described by Hirschhorn, R. and Reuser, A. J. (2001), The Metabolic and Molecular Basis for Inherited Disease (eds. Scriver, C. R., Beaudet, A. L., Sly, W. S. and Valle, D.), page 3389 -3419. McGraw-Hill, New York, see pp. 3403-3405. Any GAA polypeptide variant known in the art can be used as a basis for determining the parent GAA polypeptide. Exemplary GAA polypeptide variants include SEQ ID NO: 2 (NCBI reference sequence NP_000143.2); SEQ ID NO: 29 (GenBank AAA52506.1); SEQ ID NO: 30 (GenBank CAA68763.1); SEQ ID NO: 31 (GenBank: EAW89583.1) and SEQ ID NO: 32 (GenBank ABI53718.1). Other effective options include those described in Hoefsloot et al., (1988) EMBO J. 7: 1697; and Van Hove et al., (1996) Proc. Natl. Acad. sci. USA 93: 65 (human), and Genbank accession number NM_008064 (mouse). Other GAA polypeptide variants include those described in WO2012/145644, WO00/34451 and US6858425. In a specific embodiment, the parental GAA polypeptide is derived from the amino acid sequence shown in SEQ ID NO: 2 or SEQ ID NO: 30.
Усеченная форма GAA в соответствии с изобретением представляет собой усеченную по N-концу форму родительского полипептида GAA, в которой по меньшей мере одна аминокислота удалена с N-конца указанного родительского полипептида GAA.A truncated form of GAA according to the invention is an N-terminally truncated form of a parent GAA polypeptide in which at least one amino acid is removed from the N-terminus of said parent GAA polypeptide.
Под «усеченной формой» понимают полипептид GAA, который содержит одну или несколько последовательных аминокислот, удаленных из N-концевой части родительского полипептида GAA. Например, фрагмент GAA может иметь от 1 до 75 последовательных аминокислот или больше чем 75 последовательных аминокислот, усеченных с ее N-конца, по сравнению с родительским полипептидом GAA. В частности, усеченный полипептид GAA может иметь 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74 или 75 последовательных аминокислот, усеченных с ее N-конца по сравнению с родительским белком GAA (в частности, усеченная форма родительского белка hGAA, приведенная в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1). Используя альтернативную номенклатуру, полипептид GAA в результате усечения 1 аминокислоты в родительском полипептиде GAA обозначают как Δ1 усеченную форму GAA, полипептид GAA в результате усечения 2 последовательных аминокислот с N-конца обозначают как Δ2 усеченную форму GAA, полипептид GAA в результате усечения 3 последовательных аминокислот в родительском полипептиде GAA обозначают как Δ3 усеченную форму GAA) и т. д. В конкретном варианте осуществления усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, Δ47, Δ48, Δ49, Δ50, Δ51, Δ52, Δ53, Δ54, Δ55, Δ56, Δ57, Δ58, Δ59, Δ60, Δ61, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74 или Δ75 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).By "truncated form" is meant a GAA polypeptide that contains one or more consecutive amino acids removed from the N-terminal portion of the parent GAA polypeptide. For example, a GAA fragment may have from 1 to 75 consecutive amino acids, or more than 75 consecutive amino acids truncated from its N-terminus, compared to the parent GAA polypeptide. In particular, a truncated GAA polypeptide may have 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74 or 75 consecutive amino acids truncated from its N-terminus compared to the parent GAA protein (in particular, the truncated form of the parent hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1). Using alternative nomenclature, a GAA polypeptide resulting from a 1 amino acid truncation in the parent GAA polypeptide is referred to as the Δ1 truncated form of GAA, a GAA polypeptide resulting from a truncation of 2 consecutive amino acids from the N-terminus is referred to as the Δ2 truncated form of GAA, a GAA polypeptide resulting from a truncated 3 consecutive amino acids in parent GAA polypeptide is referred to as Δ3 truncated form GAA), etc. In a specific embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, δ14, δ15, δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, ON, Δ25, ONA, Δ27, Δ28, ONA, PA, δ31, δ32, ON, ON, ONA, δ36, δ37, δ37, ONA, δ37, δ37, ONA, δ37, ONA, δ37, δ37, ONAS. Δ38, δ39, δ40, δ41, Δ42, δ43, δ44, Δ45, Δ46, Δ47, Δ48, δ49, PA, Δ51, δ52, Δ53, Δ54, PA, δ56, δ57, δ58, ON, Δ60, δ61, Δ62, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74, or Δ75 a truncated form of GAA (in particular, a truncated form of the hGAA parent protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1).
В другом конкретном варианте осуществления усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46 или Δ47 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In another specific embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, ONA, Δ29, Δ30, Δ31, ON32, PA, Δ34, Δ35, Δ36, ON37, ONA, δ39, Δ40, ONA, Δ42, ON43, ONA, Δ44, ONA, ONA, Δ44, ONA, δ4, ONA, PA. Δ45, Δ46 or Δ47 truncated form of GAA (particularly the truncated form of the parental hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1).
В другом конкретном варианте осуществления усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45 или Δ46 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In another specific embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, δ27, ONA, Δ29, Δ30, δ31, ON32, ON33, PA, Δ35, Δ36, ON37, ONA, Δ39, Δ40, ONA, ONA, δ43, δ44, ONA, Δ44, ONA, δ4, ONA, δ4, ONA, δ4, IT Δ45 or Δ46 truncated form of GAA (particularly a truncated form of the parental hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1).
В другом конкретном варианте осуществления усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44 или Δ45 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In another specific embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, δ27, ONA, Δ29, Δ30, Δ31, ON32, ON, Δ34, Δ35, ON, Δ37, PAR, δ39, Δ40, ONA, ONA, δ43, δ44 or Δ44, or ONA, or Δ44, or ONA, Δ44, or Δ45 truncated form of GAA (particularly the truncated form of the parent hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43 или Δ44 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19 , Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43 или Δ44 a truncated form of GAA (particularly a truncated form of the parent hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19 , Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA (particularly a truncated form of the parent hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19 , Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ4G20 (truncated form in particular the truncated form of the parent hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20 , Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ423 in particular the truncated form of the parent hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21 . a truncated form of the parental hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22 . the parental hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23 , Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, or Δ43 the truncated form of the GAA protein hGAA listed in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24 , Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, or shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25 , Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, or Δ43 the truncated form of GAA (in particular the truncated form of the parent protein in hGAA SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA (в частности усеченную форму родительского белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ226 , Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, or Δ43 a truncated form of GAA (in particular, a truncated form of the parent hGAA protein given in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9 или Δ10 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1), в частности Δ7, Δ8 или Δ9 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1), более конкретно Δ8 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is a Δ6, Δ7, Δ8, Δ9, or Δ10 truncated form of GAA (particularly the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, specifically in SEQ ID NO: 1), in particular the Δ7, Δ8 or Δ9 truncated form of GAA (in particular the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1), more specifically the Δ8 truncated form GAA (in particular the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ27, Δ28, Δ29, Δ30 или Δ31 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, конкретно в SEQ ID NO: 1), в частности Δ28, Δ29 или Δ30 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1), более конкретно Δ29 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, конкретно в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is a Δ27, Δ28, Δ29, Δ30, or Δ31 truncated form of GAA (particularly the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, specifically in SEQ ID NO: : 1), in particular the Δ28, Δ29 or Δ30 truncated form of GAA (in particular the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1), more specifically the Δ29 truncated form of GAA (in particular the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, specifically in SEQ ID NO: 1).
В другом конкретном варианте осуществления усеченный полипептид GAA по изобретению представляет собой Δ40, Δ41, Δ42, Δ43, или Δ44 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, конкретно в SEQ ID NO: 1), в частности Δ41, Δ42 или Δ43 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1), более конкретно Δ42 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, конкретно в SEQ ID NO: 1).In another specific embodiment, the truncated GAA polypeptide of the invention is a Δ40, Δ41, Δ42, Δ43, or Δ44 truncated form of GAA (particularly the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, specifically in SEQ ID NO : 1), in particular the Δ41, Δ42 or Δ43 truncated form of GAA (in particular the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1), more specifically the Δ42 truncated form of GAA (in particular the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, specifically in SEQ ID NO: 1).
В дополнительном конкретном варианте осуществления, усеченный полипептид GAA по изобретению представляет собой Δ41, Δ42, Δ43, Δ44 или Δ45 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1), в частности Δ42, Δ43 или Δ44 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1), более конкретно Δ43 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1).In a further specific embodiment, the truncated GAA polypeptide of the invention is a Δ41, Δ42, Δ43, Δ44 or Δ45 truncated form of GAA (particularly the hGAA protein shown in SEQ ID NO: 1), in particular a Δ42, Δ43 or Δ44 truncated form of GAA (particularly the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1), more specifically the Δ43 truncated form of GAA (particularly the hGAA protein shown in SEQ ID NO: 1) .
В другом варианте осуществления усеченный полипептид GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46 или Δ47 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, конкретно в SEQ ID NO: 1).In another embodiment, the truncated GAA polypeptide of the invention is a Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, or Δ47 truncated form of GAA ( in particular the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, specifically in SEQ ID NO: 1).
В другом варианте осуществления усеченный полипептид GAA по изобретению представляет собой Δ7, Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43 или Δ44 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, конкретно в SEQ ID NO: 1).In another embodiment, the truncated GAA polypeptide of the invention is a Δ7, Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43, or Δ44 truncated form of GAA (particularly the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO : 33, specifically in SEQ ID NO: 1).
В другом варианте осуществления усеченный полипептид GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 или Δ44, усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, конкретно в SEQ ID NO: 1).In another embodiment, the truncated GAA polypeptide of the invention is Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43, or Δ44, a truncated form of GAA (particularly the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, specifically in SEQ ID NO: 1).
В другом варианте осуществления усеченный полипептид GAA по изобретению представляет собой Δ8, Δ29, Δ42, Δ43 или Δ47 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, конкретно в SEQ ID NO: 1).In another embodiment, the truncated GAA polypeptide of the invention is a Δ8, Δ29, Δ42, Δ43, or Δ47 truncated form of GAA (particularly the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, specifically in SEQ ID NO: 1 ).
В другом варианте осуществления усеченный полипептид GAA по изобретению представляет собой Δ8, Δ29, Δ42 или Δ43 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, конкретно в SEQ ID NO: 1).In another embodiment, the truncated GAA polypeptide of the invention is a Δ8, Δ29, Δ42, or Δ43 truncated form of GAA (specifically the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, specifically in SEQ ID NO: 1).
В другом варианте осуществления усеченный полипептид GAA по изобретению представляет собой Δ8 или Δ42 усеченную форму GAA (в частности белка hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, конкретно в SEQ ID NO: 1).In another embodiment, the truncated GAA polypeptide of the invention is a Δ8 or Δ42 truncated form of GAA (particularly the hGAA protein shown in SEQ ID NO: 1 or SEQ ID NO: 33, specifically in SEQ ID NO: 1).
В конкретном варианте осуществления изобретения, усеченный полипептид GAA по изобретению представляет собой усеченную форму функционального полипептида GAA человека. В дополнительном конкретном варианте осуществления, родительский полипептид hGAA представляет собой полипептид hGAA, приведенный в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1. В варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, Δ47, Δ48, Δ49, Δ50, Δ51, Δ52, Δ53, Δ54, Δ55, Δ56, Δ57, Δ58, Δ59, Δ60, Δ61, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74 или Δ75 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In a specific embodiment of the invention, the truncated GAA polypeptide of the invention is a truncated form of a functional human GAA polypeptide. In a further specific embodiment, the parent hGAA polypeptide is an hGAA polypeptide as set forth in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1. In an embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ1Δ9, Δ20, Δ21, Δ23, Δ22, Δ22 , Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46, Δ47, Δ48, Δ49, Δ50 , Δ51, Δ52, Δ53, Δ54, Δ55, Δ56, Δ57, Δ58, Δ59, Δ60, Δ61, Δ62, Δ63, Δ64, Δ65, Δ66, Δ67, Δ68, Δ69, Δ70, Δ71, Δ72, Δ73, Δ74 или Δ75 a truncated GAA form of an hGAA polypeptide, and more specifically an hGAA polypeptide as shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having less at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45, Δ46 или Δ47 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In a variant of this embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, δ20, Δ21, Δ22, Δ23, δ24, Δ25, Δ26, Δ27, ONA28, Δ29, PA, Δ31, Δ32, δ33, Δ34, ON, ON36, ONA, Δ38, Δ39, ON, ONA, δ42, δ43, PA, δ43, δ43, δ43, δ43, PAS, Δ43, Δ43, Δ43, δ43, ILS Δ44, Δ45, Δ46, or Δ47 a truncated GAA form of an hGAA polypeptide, and more particularly an hGAA polypeptide as set forth in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically SEQ ID NO: 1, or a functional variant thereof containing substitutions amino acids in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96 , 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44, Δ45 или Δ46 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In a variant of this embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, δ20, Δ21, Δ22, Δ23, δ24, Δ25, Δ26, Δ27, ONA28, Δ29, PA, Δ31, Δ32, δ33, Δ34, ON, ON36, ONA, Δ38, Δ39, ON, ONA, δ42, δ43, PA, δ43, δ43, δ43, δ43, PAS, Δ43, Δ43, Δ43, δ43, ILS Δ44, Δ45 or Δ46 a truncated form of the GAA of an hGAA polypeptide, and more specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97 , 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43, Δ44 или Δ45 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In a variant of this embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, δ20, Δ21, Δ22, Δ23, δ24, Δ25, Δ26, Δ27, ONA28, Δ29, PA, Δ31, Δ32, δ33, Δ34, ON, ON36, ONA, Δ38, Δ39, ON, ONA, δ42, δ43, PA, δ43, δ43, δ43, δ43, PAS, Δ43, Δ43, Δ43, δ43, ILS The Δ44 or Δ45 truncated GAA form of the hGAA polypeptide, and more particularly the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence, listed in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43 или Δ44 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18 , Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, Δ43 or the Δ44 truncated GAA form of an hGAA polypeptide, and more specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence given in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18 , Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 a truncated GAA form of an hGAA polypeptide, and more specifically an hGAA polypeptide as shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ1, Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18 , Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму The GAA of an hGAA polypeptide, and more specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO : 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19 , Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ4ΔA2 polypeptide or truncated form hGAA, and more specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20 , Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ4A truncated polypeptide GAA1 and more specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21 , Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, ΔGA2 or more truncated polypeptide, GAA2 specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO : 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22 , Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 or Δ42 a truncated form of the h hGAA listed in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33 , in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO : 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23 , Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 or Δ42 a truncated form of the GAA polypeptide, hGAA, and more specifically hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33 , in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24 , Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, or Δ42 a truncated GAA form of the hGAA polypeptide, and more specifically, given in hGAA polypeptide SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75%, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41 или Δ42 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25 , Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, or Δ42 the GAA truncated form of the hGAA polypeptide, and more specifically the hGAA polypeptide listed in the SEQID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO : 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ2, Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19 , Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму The GAA of an hGAA polypeptide, and more specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO : 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ3, Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20 , Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, hGAA, and more specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ4, Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21 , Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ4GA3 polypeptide, or a truncated form of GAA3 polypeptide and more specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ5, Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22 , Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 or more truncated polypeptide GAA3 specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO : 33, in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ6, Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23 , Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, or Δ43 a truncated form of the polypeptide h hGAA as shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33 , in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO : 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ7, Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24 , Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, or Δ43 a truncated form of the GAA polypeptide, hGAA, and more specifically hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in in particular SEQ ID NO: 1, and having at least 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33 , in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25, Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42 или Δ43 усеченную форму GAA полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, даже более конкретно в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, и обладающего по меньшей мере 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 SEQ ID NO: 33, в частности SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ8, Δ9, Δ10, Δ11, Δ12, Δ13, Δ14, Δ15, Δ16, Δ17, Δ18, Δ19, Δ20, Δ21, Δ22, Δ23, Δ24, Δ25 , Δ26, Δ27, Δ28, Δ29, Δ30, Δ31, Δ32, Δ33, Δ34, Δ35, Δ36, Δ37, Δ38, Δ39, Δ40, Δ41, Δ42, or Δ43 a truncated GAA form of the hGAA polypeptide, and more specifically, the hGAA polypeptide is given in SEQ ID NO: 1 or SEQ ID NO: 33, even more specifically in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, and having at least 75%, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 SEQ ID NO: 33, in in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9 или Δ10, в частности Δ7, Δ8 или Δ9, более конкретно Δ8 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ6, Δ7, Δ8, Δ9, or Δ10, in particular Δ7, Δ8 or Δ9, more specifically the Δ8 truncated form of an hGAA polypeptide, and more specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, and having at least 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% identity with SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ27, Δ28, Δ29, Δ30 или Δ31, в частности Δ28, Δ29 или Δ30, более конкретно Δ29 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ27, Δ28, Δ29, Δ30 or Δ31, in particular Δ28, Δ29 or Δ30, more specifically Δ29 a truncated form of an hGAA polypeptide, and more specifically an hGAA polypeptide as shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, and having at least 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% identity with SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ40, Δ41, Δ42, Δ43 или Δ44, в частности Δ41, Δ42 или Δ43, более конкретно Δ42 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ40, Δ41, Δ42, Δ43 or Δ44, in particular Δ41, Δ42 or Δ43, more specifically Δ42 the truncated form of an hGAA polypeptide, and more specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, and having at least 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% identity with SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ41, Δ42, Δ43, Δ44 или Δ45, в частности Δ42, Δ43 или Δ44, более конкретно Δ43 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ41, Δ42, Δ43, Δ44 or Δ45, in particular Δ42, Δ43 or Δ44, more specifically Δ43 a truncated form of an hGAA polypeptide, and more specifically an hGAA polypeptide as shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, and having at least 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% identity with SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44 или Δ45, в частности Δ7, Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43 или Δ44, в частности Δ8, Δ29, Δ42 или Δ43 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is Δ6, Δ7, Δ8, Δ9, Δ10, Δ27, Δ28, Δ29, Δ30, Δ31, Δ40, Δ41, Δ42, Δ43, Δ44, or Δ45, in particular Δ7 , Δ8, Δ9, Δ28, Δ29, Δ30, Δ41, Δ42, Δ43 or Δ44, in particular Δ8, Δ29, Δ42 or Δ43 is a truncated form of the hGAA polypeptide, and more specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO : 33, in particular in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, and having at least at least 80, 85, 90, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 или Δ44, в частности Δ8 или Δ42 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is a Δ6, Δ7, Δ8, Δ9, Δ10, Δ40, Δ41, Δ42, Δ43 or Δ44, in particular a Δ8 or Δ42 truncated form of an hGAA polypeptide, and more specifically an hGAA polypeptide , shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, or its functional variant containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in in particular in SEQ ID NO: 1, and having at least 80, 85, 90, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: one.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ8, Δ29, Δ42, Δ43 или Δ47 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is a Δ8, Δ29, Δ42, Δ43, or Δ47 truncated form of an hGAA polypeptide, and more particularly an hGAA polypeptide as shown in SEQ ID NO: 1 or SEQ ID NO: 33, in in particular in SEQ ID NO: 1, or a functional variant thereof containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, and having at least 80, 85 , 90, 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ8, Δ29, Δ42 или Δ43 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is a Δ8, Δ29, Δ42, or Δ43 truncated form of an hGAA polypeptide, and more particularly an hGAA polypeptide as set forth in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, or a functional variant thereof, containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, and having at least 80, 85, 90 , 95, 96, 97, 98 or 99% identity with SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1.
В другом варианте по этому варианту осуществления, усеченный полипептид GAA по изобретению представляет собой Δ8 или Δ42 усеченную форму полипептида hGAA, и более конкретно полипептида hGAA, приведенного в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, или его функционального варианта, содержащего замены аминокислот в последовательности, приведенной в SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1, и обладающего по меньшей мере 80, 85, 90, 95, 96, 97, 98 или 99% идентичностью с SEQ ID NO: 1 или SEQ ID NO: 33, в частности в SEQ ID NO: 1.In another embodiment of this embodiment, the truncated GAA polypeptide of the invention is a Δ8 or Δ42 truncated form of an hGAA polypeptide, and more specifically the hGAA polypeptide shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, or a functional variant thereof, containing amino acid substitutions in the sequence shown in SEQ ID NO: 1 or SEQ ID NO: 33, in particular in SEQ ID NO: 1, and having at least 80, 85, 90, 95, 96 , 97, 98 or 99% identity with SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1.
В конкретном варианте осуществления усеченный полипептид hGAA по изобретению имеет аминокислотную последовательность, состоящую из последовательности, приведенной в SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 34, SEQ ID NO: 35 или SEQ ID NO: 36, или ее функциональный вариант, содержащий от 1 до 5, в частности от 1 до 4, в частности от 1 до 3, более конкретно от 1 до 2, в частности 1 замену аминокислоты, по сравнению с последовательностью, приведенной в SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 34, SEQ ID NO: 35 или SEQ ID NO: 36. В другом конкретном варианте осуществления, усеченный полипептид hGAA по изобретению имеет аминокислотную последовательность, состоящую из последовательности, приведенной в SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 34 или SEQ ID NO: 35, или ее функциональный вариант, содержащий от 1 до 5 замен аминокислот по сравнению с последовательностью, приведенной в SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 34 или SEQ ID NO: 35. В конкретном варианте осуществления усеченный полипептид hGAA по изобретению имеет аминокислотную последовательность, состоящую из последовательности, приведенной в SEQ ID NO: 27 или SEQ ID NO: 28, или ее функциональный вариант, содержащий от 1 до 5, в частности от 1 до 4, в частности от 1 до 3, более конкретно от 1 до 2, в частности 1 замену аминокислоты, по сравнению с последовательностью, приведенной в SEQ ID NO: 27 или SEQ ID NO: 28.In a specific embodiment, the truncated hGAA polypeptide of the invention has an amino acid sequence consisting of the sequence shown in SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 34, SEQ ID NO: 35, or SEQ ID NO: 36, or its functional variant containing from 1 to 5, in particular from 1 to 4, in particular from 1 to 3, more specifically from 1 to 2, in particular 1 amino acid substitution, compared to the sequence shown in SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 34, SEQ ID NO: 35, or SEQ ID NO: 36. In another specific embodiment, the truncated hGAA polypeptide of the invention has an amino acid sequence consisting of the sequence shown in SEQ ID NO: 27 , SEQ ID NO: 28, SEQ ID NO: 34 or SEQ ID NO: 35, or a functional variant thereof containing 1 to 5 amino acid substitutions compared to the sequence shown in SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 34 or SEQ ID NO: 35. In a specific embodiment, the truncated floor The hGAA ipeptide according to the invention has an amino acid sequence consisting of the sequence shown in SEQ ID NO: 27 or SEQ ID NO: 28, or a functional variant thereof, containing from 1 to 5, in particular from 1 to 4, in particular from 1 to 3 , more specifically 1 to 2, in particular 1 amino acid substitution, compared to the sequence shown in SEQ ID NO: 27 or SEQ ID NO: 28.
Усеченный полипептид GAA в соответствии с изобретением дополнительно может содержать сигнальный пептид, такой как природный сигнальный пептид GAA или альтернативный сигнальный пептид, происходящих из другого секретируемого белка. Неограничивающие примеры таких сигнальных пептидов включают те, которые приведены в SEQ ID NO: с 3 до 7. Авторы изобретения к удивлению показали, что слияние усеченного полипептида GAA по изобретению с альтернативным сигнальным пептидом даже дополнительно усиливает его секрецию. Изобретение тем самым предусматривает химерный полипептид GAA, содержащий сигнальный фрагмент и усеченный полипептидный фрагмент GAA, усеченный полипептидный фрагмент GAA представляет собой усеченный полипептид GAA, как определено выше. В конкретном варианте осуществления сигнальный пептид представляет собой природный сигнальный пептид GAA, такой как сигнальный пептид hGAA, приведенный в SEQ ID NO: 4. В другом варианте осуществления сигнальный пептид представляет собой экзогенный (или альтернативный) сигнальный пептид, происходящий из белка, отличного от GAA. В конкретном варианте осуществления альтернативный сигнальный пептид выбирают в группе, состоящей из SEQ ID NO: 3, 5, 6 и 7 или ее функционального производного, как определено далее.The truncated GAA polypeptide according to the invention may further comprise a signal peptide, such as a naturally occurring GAA signal peptide or an alternative signal peptide, derived from another secreted protein. Non-limiting examples of such signal peptides include those shown in SEQ ID NO: 3 to 7. The inventors have surprisingly shown that fusing a truncated GAA polypeptide of the invention with an alternative signal peptide even further enhances its secretion. The invention thus provides a chimeric GAA polypeptide comprising a signal fragment and a truncated GAA polypeptide fragment, the truncated GAA polypeptide fragment is a truncated GAA polypeptide as defined above. In a particular embodiment, the signal peptide is a naturally occurring GAA signal peptide, such as the hGAA signal peptide shown in SEQ ID NO: 4. In another embodiment, the signal peptide is an exogenous (or alternative) signal peptide derived from a protein other than GAA . In a specific embodiment, the alternative signal peptide is selected from the group consisting of SEQ ID NOs: 3, 5, 6 and 7, or a functional derivative thereof, as defined below.
Авторы изобретения показали, что экзогенный сигнальный пептид, слитый с остальной частью белка GAA, увеличивает секрецию получаемого химерного полипептида GAA, по сравнению с соответствующим полипептидом GAA, содержащим свой природный сигнальный пептид. Кроме того, усеченный полипептидный фрагмент GAA также увеличивает секрецию химерного полипептида GAA (включая как сигнальный пептид, так и усеченный полипептид GAA) по сравнению с химерным полипептидом GAA, содержащим тот же сигнальный пептид, слитый с родительским полипептидом GAA.The inventors have shown that an exogenous signal peptide fused to the rest of the GAA protein increases the secretion of the resulting chimeric GAA polypeptide compared to the corresponding GAA polypeptide containing its natural signal peptide. In addition, the truncated GAA polypeptide fragment also increases the secretion of the chimeric GAA polypeptide (including both the signal peptide and the truncated GAA polypeptide) compared to a chimeric GAA polypeptide containing the same signal peptide fused to the parental GAA polypeptide.
Конкретные экзогенные сигнальные пептиды, работающие в настоящем изобретении, включают аминокислоты 1-20 из химотрипсиногена B2 (SEQ ID NO: 3), сигнальный пептид α-1-антитрипсина человека (SEQ ID NO: 5), аминокислоты 1-25 из идуронат-2-сульфатазы (SEQ ID NO: 6), и аминокислоты 1-23 из ингибитора протеазы C1 (SEQ ID NO: 7). Сигнальные пептиды из SEQ ID NO: 3 и SEQ ID NO: с 5 до 7 делают возможной более высокую секрецию химерного белка GAA как in vitro, так и in vivo по сравнению с GAA, содержащей ее природный сигнальный пептид. В конкретном варианте осуществления сигнальный пептид имеет последовательность, приведенную в SEQ ID NO: с 3 до 7, или представляет собой ее функциональное производное, т. е. последовательность, содержащую от 1 до 5, в частности от 1 до 4, в частности от 1 до 3, более конкретно от 1 до 2, в частности 1 аминокислотную делецию, инсерцию или замену, по сравнению с последовательностями, приведенными в SEQ ID NO: с 3 до 7, до тех пор, пока получаемая последовательность соответствует функциональному сигнальному пептиду, т. е. сигнальному пептиду, который делает возможной секрецию белка GAA. В конкретном варианте осуществления последовательность фрагмента сигнального пептида состоит из последовательности, выбранной в группе, состоящей из SEQ ID NO: с 3 до 7.Specific exogenous signal peptides useful in the present invention include amino acids 1-20 from chymotrypsinogen B2 (SEQ ID NO: 3), human α-1-antitrypsin signal peptide (SEQ ID NO: 5), amino acids 1-25 from iduronate-2 α-sulfatase (SEQ ID NO: 6), and amino acids 1-23 from a C1 protease inhibitor (SEQ ID NO: 7). The signal peptides from SEQ ID NO: 3 and SEQ ID NO: 5 to 7 allow higher secretion of the chimeric GAA protein both in vitro and in vivo compared to GAA containing its native signal peptide. In a specific embodiment, the signal peptide has the sequence shown in SEQ ID NO: 3 to 7, or is a functional derivative thereof, i.e. a sequence containing 1 to 5, in particular 1 to 4, in particular 1 to 3, more specifically 1 to 2, in particular 1 amino acid deletion, insertion or substitution, compared to the sequences shown in SEQ ID NOs: 3 to 7, as long as the resulting sequence corresponds to a functional signal peptide, i.e. e. a signal peptide that allows the secretion of the GAA protein. In a specific embodiment, the sequence of the signal peptide fragment consists of a sequence selected from the group consisting of SEQ ID NOs: 3 to 7.
В конкретных вариантах осуществления полипептид GAA по изобретению выбирают из:In specific embodiments, the GAA polypeptide of the invention is selected from:
- комбинации из SEQ ID NO: 3 с Δ8 усеченной формой GAA, такой как Δ8 усеченная форма hGAA, представленная в SEQ ID NO: 27;- combinations of SEQ ID NO: 3 with an Δ8 truncated form of GAA, such as the Δ8 truncated form of hGAA shown in SEQ ID NO: 27;
- комбинации из SEQ ID NO: 4 с Δ8 усеченной формой GAA, такой как Δ8 усеченная форма hGAA, представленная в SEQ ID NO: 27;- combinations of SEQ ID NO: 4 with an Δ8 truncated form of GAA, such as the Δ8 truncated form of hGAA shown in SEQ ID NO: 27;
- комбинации из SEQ ID NO: 5 с Δ8 усеченной формой GAA, такой как Δ8 усеченная форма hGAA, представленная в SEQ ID NO: 27;- combinations of SEQ ID NO: 5 with an Δ8 truncated form of GAA, such as the Δ8 truncated form of hGAA shown in SEQ ID NO: 27;
- комбинации из SEQ ID NO: 6 с Δ8 усеченной формой GAA, такой как Δ8 усеченная форма hGAA, представленная в SEQ ID NO: 27;- combinations of SEQ ID NO: 6 with an Δ8 truncated form of GAA, such as the Δ8 truncated form of hGAA shown in SEQ ID NO: 27;
- комбинации из SEQ ID NO: 7 с Δ8 усеченной формой GAA, такой как Δ8 усеченная форма hGAA, представленная в SEQ ID NO: 27;- combinations of SEQ ID NO: 7 with an Δ8 truncated form of GAA, such as the Δ8 truncated form of hGAA shown in SEQ ID NO: 27;
- комбинации из SEQ ID NO: 3 с Δ29 усеченной формой GAA, такой как Δ29 усеченная форма hGAA, представленная в SEQ ID NO: 34;- combinations of SEQ ID NO: 3 with an Δ29 truncated form of GAA, such as the Δ29 truncated form of hGAA shown in SEQ ID NO: 34;
- комбинации из SEQ ID NO: 4 с Δ29 усеченной формой GAA, такой как Δ29 усеченная форма hGAA, представленная в SEQ ID NO: 34;- combinations of SEQ ID NO: 4 with an Δ29 truncated form of GAA, such as the Δ29 truncated form of hGAA shown in SEQ ID NO: 34;
- комбинации из SEQ ID NO: 5 с Δ29 усеченной формой GAA, такой как Δ29 усеченная форма hGAA, представленная в SEQ ID NO: 34;- combinations of SEQ ID NO: 5 with an Δ29 truncated form of GAA, such as the Δ29 truncated form of hGAA shown in SEQ ID NO: 34;
- комбинация из SEQ ID NO: 6 с Δ29 усеченной формой GAA, такой как Δ29 усеченная форма hGAA, представленная в SEQ ID NO: 34;a combination of SEQ ID NO: 6 with an Δ29 truncated form of GAA, such as the Δ29 truncated form of hGAA shown in SEQ ID NO: 34;
- комбинации из SEQ ID NO: 7 с Δ29 усеченной формой GAA, такой как Δ29 усеченная форма hGAA, представленная в SEQ ID NO: 34;- combinations of SEQ ID NO: 7 with an Δ29 truncated form of GAA, such as the Δ29 truncated form of hGAA shown in SEQ ID NO: 34;
- комбинации из SEQ ID NO: 3 с Δ42 усеченной формой GAA, такой как Δ42 усеченная форма hGAA, представленная в SEQ ID NO: 28;- combinations of SEQ ID NO: 3 with an Δ42 truncated form of GAA, such as the Δ42 truncated form of hGAA shown in SEQ ID NO: 28;
- комбинации из SEQ ID NO: 4 с Δ42 усеченной формой GAA, такой как Δ42 усеченная форма hGAA, представленная в SEQ ID NO: 28;- combinations of SEQ ID NO: 4 with an Δ42 truncated form of GAA, such as the Δ42 truncated form of hGAA shown in SEQ ID NO: 28;
- комбинации из SEQ ID NO: 5 с Δ42 усеченной формой GAA, такой как Δ42 усеченная форма hGAA, представленная в SEQ ID NO: 28;- combinations of SEQ ID NO: 5 with an Δ42 truncated form of GAA, such as the Δ42 truncated form of hGAA shown in SEQ ID NO: 28;
- комбинации из SEQ ID NO: 6 с Δ42 усеченной формой GAA, такой как Δ42 усеченная форма hGAA, представленная в SEQ ID NO: 28;- combinations of SEQ ID NO: 6 with an Δ42 truncated form of GAA, such as the Δ42 truncated form of hGAA shown in SEQ ID NO: 28;
- комбинации из SEQ ID NO: 7 с Δ42 усеченной формой GAA, такой как Δ42 усеченная форма hGAA, представленная в SEQ ID NO: 28;- combinations of SEQ ID NO: 7 with an Δ42 truncated form of GAA, such as the Δ42 truncated form of hGAA shown in SEQ ID NO: 28;
- комбинации из SEQ ID NO: 3 с Δ43 усеченной формой GAA, такой как Δ43 усеченная форма hGAA, представленная в SEQ ID NO: 35;- combinations of SEQ ID NO: 3 with an Δ43 truncated form of GAA, such as the Δ43 truncated form of hGAA shown in SEQ ID NO: 35;
- комбинации из SEQ ID NO: 4 с Δ43 усеченной формой GAA, такой как Δ43 усеченная форма hGAA, представленная в SEQ ID NO: 35;- combinations of SEQ ID NO: 4 with an Δ43 truncated form of GAA, such as the Δ43 truncated form of hGAA shown in SEQ ID NO: 35;
- комбинации из SEQ ID NO: 5 с Δ43 усеченной формой GAA, такой как Δ43 усеченная форма hGAA, представленная в SEQ ID NO: 35;- combinations of SEQ ID NO: 5 with an Δ43 truncated form of GAA, such as the Δ43 truncated form of hGAA shown in SEQ ID NO: 35;
- комбинации из SEQ ID NO: 6 с Δ43 усеченной формой GAA, такой как Δ43 усеченная форма hGAA, представленная в SEQ ID NO: 35; и- combinations of SEQ ID NO: 6 with an Δ43 truncated form of GAA, such as the Δ43 truncated form of hGAA shown in SEQ ID NO: 35; and
- комбинации из SEQ ID NO: 7 с Δ43 усеченной формой GAA, такой как Δ43 усеченная форма hGAA, представленная в SEQ ID NO: 35;- combinations of SEQ ID NO: 7 with an Δ43 truncated form of GAA, such as the Δ43 truncated form of hGAA shown in SEQ ID NO: 35;
- комбинации из SEQ ID NO: 3 с Δ47 усеченной формой GAA, такой как Δ47 усеченная форма hGAA, представленная в SEQ ID NO: 36;- combinations of SEQ ID NO: 3 with an Δ47 truncated form of GAA, such as the Δ47 truncated form of hGAA shown in SEQ ID NO: 36;
- комбинации из SEQ ID NO: 4 с Δ47 усеченной формой GAA, такой как Δ47 усеченная форма hGAA, представленная в SEQ ID NO: 36;- combinations of SEQ ID NO: 4 with an Δ47 truncated form of GAA, such as the Δ47 truncated form of hGAA shown in SEQ ID NO: 36;
- комбинации из SEQ ID NO: 5 с Δ47 усеченной формой GAA, такой как Δ47 усеченная форма hGAA, представленная в SEQ ID NO: 36;- combinations of SEQ ID NO: 5 with an Δ47 truncated form of GAA, such as the Δ47 truncated form of hGAA shown in SEQ ID NO: 36;
- комбинации из SEQ ID NO: 6 с Δ47 усеченной формой GAA, такой как Δ47 усеченная форма hGAA, представленная в SEQ ID NO: 36; и- combinations of SEQ ID NO: 6 with an Δ47 truncated form of GAA, such as the Δ47 truncated form of hGAA shown in SEQ ID NO: 36; and
- комбинации из SEQ ID NO: 7 с Δ47 усеченной формой GAA, такой как Δ47 усеченная форма hGAA, представленная в SEQ ID NO: 36;- combinations of SEQ ID NO: 7 with an Δ47 truncated form of GAA, such as the Δ47 truncated form of hGAA shown in SEQ ID NO: 36;
или он представляет собой их функциональное производное, обладающее по меньшей мере 90% идентичностью, в частности, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98% или по меньшей мере 99% идентичностью с получаемой комбинацией последовательностей. В этих вариантах осуществления, как указано выше, фрагмент сигнального пептида может представлять собой последовательность, содержащую от 1 до 5, в частности от 1 до 4, в частности от 1 до 3, более конкретно от 1 до 2, в частности 1 аминокислотную делецию, инсерцию или замену, по сравнению с последовательностями, приведенными в SEQ ID NO: с 3 до 7, до тех пор пока получаемая последовательность соответствует функциональному сигнальному пептиду, т. е. сигнальному пептиду, который допускает секрецию получаемого химерного усеченного белка GAA.or it is a functional derivative thereof having at least 90% identity, in particular at least 95%, at least 96%, at least 97%, at least 98% or at least 99% identity with resulting combination of sequences. In these embodiments, as indicated above, the signal peptide fragment may be a sequence containing 1 to 5, in particular 1 to 4, in particular 1 to 3, more in particular 1 to 2, in particular 1 amino acid deletion, insertion or substitution, compared to the sequences shown in SEQ ID NO: 3 to 7, as long as the resulting sequence corresponds to a functional signal peptide, i.e., a signal peptide that allows the secretion of the resulting chimeric truncated GAA protein.
Относительная доля вновь синтезированной GAA, которую секретирует клетка, можно обычным образом определять с помощью известных в данной области способов и как описано в примерах. Секретируемые белки можно обнаруживать путем непосредственного измерения самого белка (например, путем Вестерн-блоттинга) или путем анализа активности белка (например, ферментативный анализ) в клеточной культуральной среде, сыворотке, молоке и т. д.The relative proportion of newly synthesized GAA that a cell secretes can be routinely determined using methods known in the art and as described in the examples. Secreted proteins can be detected by direct measurement of the protein itself (e.g. Western blot) or by analysis of protein activity (e.g. enzymatic assay) in cell culture media, serum, milk, etc.
Специалисты в данной области, кроме того, должны понимать, что усеченный полипептид GAA или химерный полипептид GAA может содержать дополнительные аминокислоты, например, в результате манипуляций с конструкцией нуклеиновой кислоты, таких как добавление участка рестрикции, до тех пор пока эти дополнительные аминокислоты не делают сигнальный пептид или полипептид GAA нефункциональным. Дополнительные аминокислоты могут отщепляться или можно сохраняться в зрелом полипептиде до тех пор, пока сохранение не ведет к нефункциональному полипептиду.Those skilled in the art will further appreciate that a truncated GAA polypeptide or a chimeric GAA polypeptide may contain additional amino acids, for example, as a result of nucleic acid design manipulations, such as the addition of a restriction site, as long as those additional amino acids do not signal peptide or polypeptide GAA non-functional. Additional amino acids may be cleaved off or may be retained in the mature polypeptide as long as retention does not result in a non-functional polypeptide.
В другом аспекте изобретение относится к молекуле нуклеиновой кислоты, кодирующей усеченный полипептид GAA по изобретению или химерный полипептид GAA по изобретению.In another aspect, the invention provides a nucleic acid molecule encoding a truncated GAA polypeptide of the invention or a chimeric GAA polypeptide of the invention.
Последовательность молекулы нуклеиновой кислоты по изобретению, кодирующую усеченный GAA, оптимизируют для экспрессии полипептида GAA in vivo. Оптимизация последовательности может включать множество изменений в последовательности нуклеиновой кислоты, в том числе оптимизацию кодонов, увеличение содержания GC, снижение числа островков CpG, снижение числа альтернативных открытых рамок считывания (ARF) и снижение числа участков доноров сплайсинга и акцепторов сплайсинга. По причине вырожденности генетического кода, различные молекулы нуклеиновой кислоты могут кодировать один и тот же белок. Также хорошо известно, что генетические коды различных организмов часто смещены в сторону использования одного из нескольких кодонов, которые кодируют одну и ту же аминокислоту, относительно других. Через оптимизацию кодонов в нуклеотидную последовательность вводят изменения, которые дают преимущество предпочтения кодонов, существующего в заданном клеточном контексте, чтобы экспрессия получаемой нуклеотидной последовательности с оптимизированными кодонами с большей вероятностью происходила в таком заданном клеточном контексте на относительно высоком уровне по сравнению с последовательностью без оптимизированных кодонов. В предпочтительном варианте осуществления изобретения, такая нуклеотидная последовательность с оптимизированной последовательностью, кодирующая усеченную GAA, имеет оптимизацию кодонов для того, чтобы усовершенствовать ее экспрессию в клетках человека по сравнению с нуклеотидными последовательностями без оптимизированных кодонов, кодирующими тот же усеченный белок GAA, например, используя преимущество предпочтения конкретных кодонов у человека.The sequence of a nucleic acid molecule of the invention encoding a truncated GAA is optimized for in vivo expression of a GAA polypeptide. Sequence optimization can include a variety of changes in the nucleic acid sequence, including codon optimization, increasing GC content, reducing the number of CpG islands, reducing the number of alternative open reading frames (ARFs), and reducing the number of splicing donor and splicing acceptor sites. Due to the degeneracy of the genetic code, different nucleic acid molecules can code for the same protein. It is also well known that the genetic codes of different organisms are often biased towards using one of several codons that code for the same amino acid relative to others. Through codon optimization, changes are introduced into the nucleotide sequence that take advantage of the codon preference that exists in a given cellular context, so that the resulting codon-optimized nucleotide sequence is more likely to be expressed in that given cellular context at a relatively high level compared to a sequence without codon-optimized. In a preferred embodiment of the invention, such a sequence-optimized nucleotide sequence encoding a truncated GAA protein has a codon optimization to improve its expression in human cells compared to non-codon-optimized nucleotide sequences encoding the same truncated GAA protein, for example, taking advantage of preference for specific codons in humans.
В конкретном варианте осуществления оптимизированная кодирующая последовательность GAA имеет оптимизированные кодоны и/или имеет повышенное содержание GC и/или имеет сниженное число альтернативных открытых рамок считывания и/или имеет сниженное число участков доноров сплайсинга и/или акцепторов сплайсинга по сравнению с нуклеотидами 82-2859 из кодирующей hGAA дикого типа последовательности из SEQ ID NO: 8. Например, последовательность нуклеиновой кислоты по изобретению ведет к по меньшей мере 2, 3, 4, 5 или 10% увеличению содержания GC в последовательности GAA по сравнению с последовательностью последовательности GAA дикого типа. В конкретном варианте осуществления последовательность нуклеиновой кислоты по изобретению ведет к 2, 3, 4 или, более конкретно, 5% или 10% (в частности 5%) увеличению содержания GC в последовательности GAA по сравнению с последовательность нуклеотидной последовательности GAA дикого типа. В конкретном варианте осуществления последовательность нуклеиновой кислоты по изобретению, кодирующая функциональный полипептид GAA, является «по существу идентичной», то есть приблизительно на 70% идентичной, более предпочтительно приблизительно на 80% идентичной, даже более предпочтительно приблизительно на 90% идентичной, даже более предпочтительно приблизительно на 95% идентичной, даже более предпочтительно приблизительно на 97%, 98% или даже 99% идентичной нуклеотидам 82-2859 из последовательности, приведенной в SEQ ID NO: 8. Как указано выше, в дополнение к содержанию GC и/или числу ARF, оптимизация последовательности также может включать снижение числа островков CpG в последовательности и/или снижение числа участков доноров сплайсинга и акцепторов сплайсинга. Конечно, специалистам в данной области хорошо известно, что оптимизация последовательности представляет собой баланс между всеми этими параметрами, что обозначает, что последовательность можно считать оптимизированной, если по меньшей мере один из вышеуказанных параметров усовершенствован, тогда как один или несколько других параметров нет, до тех пор пока оптимизированная последовательность ведет к усовершенствованию трансгена, такому как усовершенствованная экспрессия и/или сниженный иммунный ответ на трансген in vivo.In a specific embodiment, the optimized GAA coding sequence has optimized codons and/or has an increased GC content and/or has a reduced number of alternative open reading frames and/or has a reduced number of splice donor and/or splice acceptor sites compared to nucleotides 82-2859 of wild-type hGAA encoding sequence from SEQ ID NO: 8. For example, a nucleic acid sequence of the invention results in at least a 2%, 3%, 4%, 5%, or 10% increase in GC content in a GAA sequence compared to a wild-type GAA sequence sequence. In a specific embodiment, the nucleic acid sequence of the invention results in a 2, 3, 4 or more specifically 5% or 10% (in particular 5%) increase in GC content in the GAA sequence compared to the wild-type GAA nucleotide sequence sequence. In a specific embodiment, the nucleic acid sequence of the invention encoding a functional GAA polypeptide is "substantially identical", that is, about 70% identical, more preferably about 80% identical, even more preferably about 90% identical, even more preferably about 95% identical, even more preferably about 97%, 98% or even 99% identical to nucleotides 82-2859 of the sequence shown in SEQ ID NO: 8. As above, in addition to GC content and/or number of ARFs , sequence optimization may also include reducing the number of CpG islands in the sequence and/or reducing the number of splicing donor and splicing acceptor sites. Of course, it is well known to those skilled in the art that sequence optimization is a balance between all of these parameters, which means that a sequence can be considered optimized if at least one of the above parameters is improved while one or more of the other parameters are not, until as long as the optimized sequence leads to an improvement in the transgene, such as improved expression and/or reduced immune response to the transgene in vivo.
Кроме того, адаптивность нуклеотидной последовательности, кодирующей функциональную GAA, к использованию кодонов клетками человека можно выражать в виде коэффициента адаптации кодонов (CAI). Коэффициент адаптации кодонов определяют в настоящем описании как измерение относительной адаптивности к использованию кодонов гена относительно использования кодонов высоко экспрессируемыми генами человека. Относительная адаптивность (w) каждого кодона представляет собой соотношение использования каждого кодона к таковому для наиболее распространенного кодона для одной и той же аминокислоты. CAI определяют как геометрическое среднее этих значений относительной адаптивности. Не синонимические кодоны и терминирующие кодоны (в зависимости от генетического кода) исключают. Значения CAI находятся в диапазоне от 0 до 1, причем более высокие значения указывают на более высокую долю наиболее распространенных кодонов (см. Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295; также см.: Kim et al, Gen. 1997, 199:293-301; zur Megede et al, Journal of Virology, 2000, 74: 2628-2635). Предпочтительно, молекула нуклеиновой кислоты, кодирующая GAA, имеет CAI по меньшей мере 0,75 (в частности 0,77), 0,8, 0,85, 0,90, 0,92 или 0,94.In addition, the adaptability of a nucleotide sequence encoding a functional GAA to human cell codon usage can be expressed as a codon adaptation coefficient (CAI). Codon adaptation coefficient is defined herein as a measure of the relative adaptability to codon usage of a gene relative to the codon usage of highly expressed human genes. The relative adaptability (w) of each codon is the ratio of each codon usage to that of the most common codon for the same amino acid. CAI is defined as the geometric mean of these relative adaptability values. Non-synonymous codons and termination codons (depending on the genetic code) are excluded. CAI values range from 0 to 1, with higher values indicating a higher proportion of the most common codons (see Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295; also see: Kim et al, Gen. 1997, 199:293-301; zur Megede et al, Journal of Virology, 2000, 74: 2628-2635). Preferably, the nucleic acid molecule encoding GAA has a CAI of at least 0.75 (particularly 0.77), 0.8, 0.85, 0.90, 0.92, or 0.94.
Термин «последовательность нуклеиновой кислоты» (или молекула нуклеиновой кислоты) относится к молекуле ДНК или РНК в одно- или двухцепочечной форме, в частности ДНК, кодирующей белок GAA в соответствии с изобретением.The term "nucleic acid sequence" (or nucleic acid molecule) refers to a DNA or RNA molecule in single or double stranded form, in particular DNA encoding a GAA protein according to the invention.
Авторы изобретения обнаружили, что описанный выше усеченный полипептид GAA, при экспрессии с молекулы нуклеиновой кислоты, кодирующей его, обеспечивает к удивлению высокие уровни экспрессии функционального белка GAA как in vitro, так и in vivo по сравнению с кДНК GAA дикого типа. Кроме того, что также показано авторами изобретения, усеченный белок GAA, продуцируемый клетками печени и мышцы, экспрессирующими молекулу нуклеиновой кислоты по изобретению, не индуцирует иммунный ответ. Это обозначает, что эту молекулу нуклеиновой кислоты можно использовать для получения высоких уровней белка GAA, и она обеспечивает терапевтические эффекты, такие как возможность избежать иммуносупрессорного лечения, возможность иммуносупрессорного лечения в низких дозах и возможность повторного введения молекулы нуклеиновой кислоты по изобретению нуждающемуся в этом субъекту. Следовательно, усеченный полипептид GAA по изобретению и молекула нуклеиновой кислоты по изобретению представляют особый интерес в контексте дефицита экспрессии и/или активность GAA или где высокие уровни экспрессии GAA могут улучшать заболевание, например, при болезни накопления гликогена. Конкретно болезнь накопления гликогена может представлять собой GSDI (болезнь Гирке), GSDII (болезнь Помпе), GSDIII (болезнь Кори), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII или летальную врожденную болезнь накопления гликогена в сердце. Более конкретно, болезнь накопления гликогена выбирают в группе, состоящей из GSDI, GSDII и GSDIII, даже более конкретно в группе, состоящей из GSDII и GSDIII. В даже более конкретном варианте осуществления, болезнь накопления гликогена представляет собой GSDII. В частности, молекулы нуклеиновой кислоты по изобретению можно использовать при генной терапии для того, чтобы лечить GAA-дефицитные состояния или другие состояния, ассоциированные с накоплением гликогена, такими как GSDI (болезнь Гирке), GSDII (болезнь Помпе), GSDIII (болезнь Кори), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII и летальная врожденная болезнь накопления гликогена в сердце, более конкретно GSDI, GSDII или GSDIII, даже более конкретно GSDII и GSDIII. В даже более конкретном варианте осуществления, молекулы нуклеиновой кислоты по изобретению можно использовать при генной терапии для того, чтобы лечить GSDII.The inventors have found that the truncated GAA polypeptide described above, when expressed from the nucleic acid molecule encoding it, provides surprisingly high levels of functional GAA protein expression both in vitro and in vivo compared to wild-type GAA cDNA. In addition, as also shown by the inventors, the truncated GAA protein produced by liver and muscle cells expressing the nucleic acid molecule of the invention does not induce an immune response. This means that this nucleic acid molecule can be used to obtain high levels of GAA protein, and it provides therapeutic effects such as the ability to avoid immunosuppressive treatment, the ability to immunosuppressive treatment at low doses, and the ability to re-administer the nucleic acid molecule of the invention to a subject in need of it. Therefore, the truncated GAA polypeptide of the invention and the nucleic acid molecule of the invention are of particular interest in the context of deficient expression and/or activity of GAA or where high levels of GAA expression may improve a disease, such as glycogen storage disease. Specifically, the glycogen storage disease can be GSDI (Girke's disease), GSDII (Pompe's disease), GSDIII (Measles disease), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII, or lethal congenital heart glycogen storage disease. More specifically, glycogen storage disease is selected from the group consisting of GSDI, GSDII and GSDIII, even more specifically from the group consisting of GSDII and GSDIII. In an even more specific embodiment, the glycogen storage disease is GSDII. In particular, the nucleic acid molecules of the invention can be used in gene therapy to treat GAA-deficient conditions or other conditions associated with glycogen storage, such as GSDI (Girke's disease), GSDII (Pompe's disease), GSDIII (Measles disease) , GSDIV, GSDV, GSDVI, GSDVII, GSDVIII and lethal congenital heart glycogen storage disease, more specifically GSDI, GSDII or GSDIII, even more specifically GSDII and GSDIII. In an even more specific embodiment, the nucleic acid molecules of the invention can be used in gene therapy in order to treat GSDII.
В другом варианте осуществления изобретения, часть молекулы нуклеиновой кислоты по изобретению, кодирующей усеченный полипептидный фрагмент GAA, обладает по меньшей мере 75% (например, 77,7%) или по меньшей мере 80% или по меньшей мере 82% (например, 83,1%) идентичностью с соответствующей частью нуклеотидной последовательности, кодирующей SEQ ID NO: 1 или SEQ ID NO: 33, в частности SEQ ID NO: 1, которые представляют собой последовательности полипептидов hGAA дикого типа, свободные от сигнального пептида.In another embodiment of the invention, the portion of the nucleic acid molecule of the invention encoding a truncated GAA polypeptide fragment has at least 75% (e.g., 77.7%) or at least 80%, or at least 82% (e.g., 83, 1%) identity with the corresponding part of the nucleotide sequence encoding SEQ ID NO: 1 or SEQ ID NO: 33, in particular SEQ ID NO: 1, which are signal peptide-free hGAA polypeptide sequences.
Усеченный фрагмент GAA молекулы нуклеиновой кислоты по изобретению предпочтительно обладает по меньшей мере 85%, более предпочтительно по меньшей мере 90% и даже более предпочтительно по меньшей мере 92% идентичностью, в частности, по меньшей мере 95% идентичностью, например, по меньшей мере 98, 99 или 100% идентичностью с нуклеотидной последовательностью из SEQ ID NO: 10 или 11, которые представляют собой последовательности с оптимизированной последовательностью.A truncated GAA fragment of a nucleic acid molecule according to the invention preferably has at least 85%, more preferably at least 90% and even more preferably at least 92% identity, in particular at least 95% identity, for example at least 98 , 99 or 100% identity with the nucleotide sequence of SEQ ID NO: 10 or 11, which are sequence-optimized sequences.
Термин «идентичный» и его производные относятся к идентичности последовательностей между двумя молекулами нуклеиновой кислоты. Когда положение в обеих из двух сравниваемых последовательностей занимает одно и то же основание (например, если положение в каждой из двух молекул ДНК занято аденином), то молекулы идентичны в этом положении. % идентичности между двумя последовательностями представляет собой функцию числа совпадающих положений, которые имеют две последовательности, деленного на число сравниваемых положений, × 100. Например, если совпадает 6 из 10 положений в двух последовательностях, то две последовательности идентичны на 60%. В целом, сравнение выполняют, когда две последовательности выравнивают так, чтобы давать максимальную идентичность. Различные биоинформационные инструменты, известные специалисту в данной области, можно использовать для выравнивания последовательностей нуклеиновой кислоты, например, BLAST или FASTA.The term "identical" and its derivatives refer to sequence identity between two nucleic acid molecules. When a position in both of the two compared sequences is occupied by the same base (for example, if the position in each of the two DNA molecules is occupied by adenine), then the molecules are identical at that position. The % identity between two sequences is a function of the number of matching positions that the two sequences have, divided by the number of positions compared, × 100. For example, if 6 out of 10 positions in two sequences match, then the two sequences are 60% identical. In general, a comparison is made when two sequences are aligned to give maximum identity. Various bioinformatic tools known to the person skilled in the art can be used to align nucleic acid sequences, such as BLAST or FASTA.
Кроме того, молекула нуклеиновой кислоты по изобретению кодирует функциональный белок GAA, т. е. она кодирует белок GAA человека, который, при экспрессии, обладает функциональностью белка GAA дикого типа. Как определено выше, функциональность GAA дикого типа состоит в том, чтобы гидролизовать как α-1,4, так и α-1,6 связи олигосахаридов и полисахаридов, более конкретно гликогена, чтобы высвобождать глюкозу. Функциональный белок GAA, кодируемый нуклеиновой кислотой по изобретению, может иметь гидролитическую активность в отношении гликогена по меньшей мере 50%, 60%, 70%, 80%, 90%, 95%, 99% или по меньшей мере 100% по сравнению с белком GAA дикого типа из SEQ ID NO: 1, 2, 30 или 33. Активность белка GAA, кодируемого нуклеиновой кислотой по изобретению, даже может составлять больше чем 100%, например, больше чем 110%, 120%, 130%, 140% или даже больше чем 150% от активности белка GAA дикого типа из SEQ ID NO: 1, 2, 30 или 33.In addition, the nucleic acid molecule of the invention encodes a functional GAA protein, ie it encodes a human GAA protein which, when expressed, has the functionality of a wild-type GAA protein. As defined above, the functionality of wild-type GAA is to hydrolyze both the α-1,4 and α-1,6 bonds of oligosaccharides and polysaccharides, more specifically glycogen, to release glucose. A functional GAA protein encoded by a nucleic acid of the invention may have a glycogen hydrolytic activity of at least 50%, 60%, 70%, 80%, 90%, 95%, 99%, or at least 100% relative to the protein Wild-type GAA of SEQ ID NO: 1, 2, 30, or 33. The activity of the GAA protein encoded by the nucleic acid of the invention may even be greater than 100%, such as greater than 110%, 120%, 130%, 140%, or even more than 150% of the wild-type GAA protein activity of SEQ ID NO: 1, 2, 30 or 33.
Специалист без труда сможет определять, экспрессирует ли нуклеиновая кислота в соответствии с изобретением функциональный белок GAA. Подходящие способы будут видны специалистам в данной области. Например, один подходящий способ in vitro включает встраивание нуклеиновой кислоты в вектор, такой как плазмида или вирусный вектор, трансфекцию или трансдукцию клеток-хозяев, таких как клетки 293T или HeLa, или других клеток, таких как Huh7, с использованием вектора, и анализ активности GAA. Альтернативно, подходящий способ in vivo включает трансдукцию вектора, содержащего нуклеиновую кислоту, в модели болезни Помпе на мышах или другого нарушения накопления гликогена и анализ функциональной GAA в плазме мыши и присутствия GAA в тканях. Подходящие способы описаны более подробно далее в экспериментальной части.One skilled in the art will readily be able to determine whether a nucleic acid according to the invention expresses a functional GAA protein. Suitable methods will be apparent to those skilled in the art. For example, one suitable in vitro method includes inserting the nucleic acid into a vector such as a plasmid or viral vector, transfecting or transducing host cells such as 293T or HeLa cells or other cells such as Huh7 using the vector, and assaying the activity GAA. Alternatively, a suitable in vivo method comprises transducing the vector containing the nucleic acid in a mouse model of Pompe disease or other disorder of glycogen storage and assaying functional GAA in mouse plasma and the presence of GAA in tissues. Suitable methods are described in more detail later in the experimental part.
В конкретном варианте осуществления молекула нуклеиновой кислоты по изобретению содержит последовательность, приведенную в SEQ ID NO: 12 или SEQ ID NO: 13, кодирующую полипептид, имеющий аминокислотную последовательность, приведенную в SEQ ID NO: 27; последовательность, приведенную в SEQ ID NO: 48 или SEQ ID NO: 49, кодирующую полипептид, имеющий аминокислотную последовательность, приведенную в SEQ ID NO: 28; последовательность, приведенную в SEQ ID NO: 50 или SEQ ID NO: 51, кодирующую полипептид, имеющий аминокислотную последовательность, приведенную в SEQ ID NO: 35; или последовательность, приведенную в SEQ ID NO: 52 или SEQ ID NO: 53, кодирующую полипептид, имеющий аминокислотную последовательность, приведенную в SEQ ID NO: 36. В дополнительном варианте осуществления молекула нуклеиновой кислоты по изобретению содержит последовательность, приведенную в SEQ ID NO: 12 или SEQ ID NO: 13, кодирующую полипептид, имеющий аминокислотную последовательность, приведенную в SEQ ID NO: 27; последовательность, приведенную в SEQ ID NO: 48 или SEQ ID NO: 49, кодирующую полипептид, имеющий аминокислотную последовательность, приведенную в SEQ ID NO: 28; или последовательность, приведенную в SEQ ID NO: 50 или SEQ ID NO: 51, кодирующую полипептид, имеющий аминокислотную последовательность, приведенную в SEQ ID NO: 35. В конкретном варианте осуществления молекула нуклеиновой кислоты по изобретению содержит последовательность, приведенную в SEQ ID NO: 12 или SEQ ID NO: 13, кодирующую полипептид, имеющий аминокислотную последовательность, приведенную в SEQ ID NO: 27.In a specific embodiment, the nucleic acid molecule according to the invention contains the sequence shown in SEQ ID NO: 12 or SEQ ID NO: 13 encoding a polypeptide having the amino acid sequence shown in SEQ ID NO: 27; the sequence shown in SEQ ID NO: 48 or SEQ ID NO: 49 encoding a polypeptide having the amino acid sequence shown in SEQ ID NO: 28; the sequence shown in SEQ ID NO: 50 or SEQ ID NO: 51 encoding a polypeptide having the amino acid sequence shown in SEQ ID NO: 35; or the sequence shown in SEQ ID NO: 52 or SEQ ID NO: 53 encoding a polypeptide having the amino acid sequence shown in SEQ ID NO: 36. In a further embodiment, the nucleic acid molecule of the invention comprises the sequence shown in SEQ ID NO: 12 or SEQ ID NO: 13 encoding a polypeptide having the amino acid sequence shown in SEQ ID NO: 27; the sequence shown in SEQ ID NO: 48 or SEQ ID NO: 49 encoding a polypeptide having the amino acid sequence shown in SEQ ID NO: 28; or the sequence shown in SEQ ID NO: 50 or SEQ ID NO: 51 encoding a polypeptide having the amino acid sequence shown in SEQ ID NO: 35. In a particular embodiment, the nucleic acid molecule of the invention comprises the sequence shown in SEQ ID NO: 12 or SEQ ID NO: 13 encoding a polypeptide having the amino acid sequence shown in SEQ ID NO: 27.
Изобретение также относится к конструкции нуклеиновой кислоты, содержащей молекулу нуклеиновой кислоты по изобретению. Конструкция нуклеиновой кислоты может соответствовать экспрессирующей кассете, содержащей последовательность нуклеиновой кислоты по изобретению, функционально связанную с одной или несколькими управляющими экспрессией последовательностями и/или другими последовательностями, усовершенствующими экспрессию трансгена, и/или последовательностями, усиливающими секрецию кодируемого белка, и/или последовательностями, усиливающими захват кодируемого белка. Как используют в настоящем описании, термин «функционально связанный» относится к связи полинуклеотидных элементов в функциональных отношениях. Нуклеиновая кислота «функционально связана», когда ее помещают в функциональные отношения с другой последовательностью нуклеиновой кислоты. Например, промотор или другая регулирующая транскрипцию последовательность функционально связаны с кодирующей последовательностью, если они влияют на транскрипцию кодирующей последовательности. В данной области известны такие управляющие экспрессией последовательности, например, промоторы, энхансеры (такие как цис-регуляторные модули (CRM)), интроны, сигналы полиА и т. д.The invention also relates to a nucleic acid construct containing the nucleic acid molecule of the invention. The nucleic acid construct may correspond to an expression cassette containing the nucleic acid sequence of the invention operably linked to one or more expression control sequences and/or other sequences that enhance the expression of the transgene and/or sequences that enhance the secretion of the encoded protein and/or sequences that enhance uptake of the encoded protein. As used herein, the term "operably linked" refers to the linkage of polynucleotide elements in a functional relationship. A nucleic acid is "operably linked" when it is placed in a functional relationship with another nucleic acid sequence. For example, a promoter or other transcriptional control sequence is operably linked to a coding sequence if it affects the transcription of the coding sequence. Expression control sequences such as promoters, enhancers (such as cis regulatory modules (CRMs)), introns, polyA signals, etc. are known in the art.
В частности, экспрессирующая кассета может содержать промотор. Промотор может представлять собой универсальный или тканеспецифический промотор, в частности, промотор способен содействовать экспрессии в клетках или тканях, в которых экспрессия GAA желательна, например, в клетках или тканях, в которых экспрессия GAA желательна, у пациентов с дефицитом GAA. В конкретном варианте осуществления промотор представляет собой специфический промотор печени, такой как промотор α-1-антитрипсина (hAAT) (SEQ ID NO: 14), промотор транстиретина, промотор альбумина, промотор тироксинсвязывающего глобулина (TBG), промотор LSP (содержащий последовательность промотора глобулина, связывающего тиреоидный гормон, две копии энхансерной последовательности α1-микроглобулина/бикунина и лидерную последовательность - 34.Ill, C. R., et al. (1997). Optimization of the human factor VIII complementary DNA expression plasmid for gene therapy of hemophilia A. Blood Coag. Fibrinol. 8: S23-S30.) и т. д. Другие эффективные специфические промоторы печени известны в данной области, например, те, которые перечислены в Liver Specific Gene Promoter Database, компилированной Cold Spring Harbor Laboratory (http://rulai.cshl.edu/LSPD/). Предпочтительным промотором в контексте изобретения является промотор hAAT. В другом варианте осуществления промотор представляет собой промотор, управляющий экспрессией в одной ткани или клетке, представляющей интерес, (например, в клетках мышцы), и в клетках печени. Например, в определенной степени, промоторы со специфичностью к клеткам мышцы, такие как промоторы десмина, Spc5-12 и MCK, могут давать некоторую утечку экспрессии в клетки печени, что может быть благоприятно для индукции иммунологической толерантности у субъекта к полипептиду GAA, экспрессируемому с нуклеиновой кислоты по изобретению.In particular, the expression cassette may contain a promoter. The promoter may be a general purpose or tissue-specific promoter, in particular the promoter is capable of promoting expression in cells or tissues in which GAA expression is desired, for example in cells or tissues in which GAA expression is desired in GAA deficient patients. In a specific embodiment, the promoter is a specific liver promoter such as the α-1-antitrypsin (hAAT) promoter (SEQ ID NO: 14), transthyretin promoter, albumin promoter, thyroxine-binding globulin (TBG) promoter, LSP promoter (containing the globulin promoter sequence binding thyroid hormone, two copies of the α1-microglobulin/bicunin enhancer sequence and a leader sequence - 34. Ill, C. R., et al.(1997). Fibrinol. 8: S23-S30.), etc. Other effective specific liver promoters are known in the art, such as those listed in the Liver Specific Gene Promoter Database compiled by Cold Spring Harbor Laboratory (http://rulai. cshl.edu/LSPD/). The preferred promoter in the context of the invention is the hAAT promoter. In another embodiment, the promoter is a promoter that drives expression in one tissue or cell of interest (eg, muscle cells) and liver cells. For example, to a certain extent, promoters with muscle cell specificity, such as the desmin, Spc5-12, and MCK promoters, may confer some leakage of expression into liver cells, which may be beneficial in inducing immunological tolerance in a subject to a GAA polypeptide expressed from a nucleic acid. acids according to the invention.
Другие тканеспецифические или не тканеспецифические промоторы можно использовать при практической реализации изобретения. Например, экспрессирующая кассета может содержать тканеспецифический промотор, который представляет собой промотор, отличный от специфического промотора печени. Например, промотор может обладать специфичностью к мышцам, такой как промотор десмина (и вариант промотора десмина, такой как промотор десмина, содержащий природные или искусственные энхансеры), промотор SPc5-12 или MCK. В другом варианте осуществления промотор представляет собой промотор со специфичностью к другой клеточной линии дифференцировки, такой как промотор эритропоэтина, для экспрессии полипептида GAA в клетках эритроидной линии дифференцировки.Other tissue-specific or non-tissue-specific promoters may be used in the practice of the invention. For example, the expression cassette may contain a tissue-specific promoter that is a promoter other than the specific liver promoter. For example, a promoter may be muscle specific, such as a desmin promoter (and a desmin promoter variant such as a desmin promoter containing natural or artificial enhancers), the SPc5-12 promoter, or MCK. In another embodiment, the promoter is a promoter with specificity for another cell lineage, such as the erythropoietin promoter, for expression of the GAA polypeptide in erythroid lineage cells.
В другом варианте осуществления промотор представляет собой универсальный промотор. Репрезентативные универсальные промоторы включают энхансер цитомегаловируса/промотор β-актина курицы (CAG), энхансер/промотор цитомегаловируса (CMV), промотор PGK, ранний промотор SV40 и т. д.In another embodiment, the promoter is a universal promoter. Representative universal promoters include cytomegalovirus enhancer/chicken β-actin (CAG) promoter, cytomegalovirus (CMV) enhancer/promoter, PGK promoter, SV40 early promoter, etc.
Кроме того, промотор также может представлять собой эндогенный промотор, такой как промотор альбумина или промотор GAA.In addition, the promoter may also be an endogenous promoter such as an albumin promoter or a GAA promoter.
В конкретном варианте осуществления промотор ассоциирован с энхансерной последовательностью, такой как цис-регуляторные модули (CRM) или искусственная энхансерная последовательность. Например, промотор может быть ассоциирован с энхансерной последовательностью, такой как управляющая область ApoE человека (или локус гена аполипопротеина E/C-I человека, печеночная управляющая область HCR-1 - номер доступа GenBank U32510, приведена в SEQ ID NO: 15). В конкретном варианте осуществления энхансерная последовательность, такая как последовательность ApoE, ассоциирована со специфическим промотором печени, таким как те, что перечислены выше, и в частности такими, как промотор hAAT. Другие CRM, эффективные при практической реализации настоящего изобретения, включают те, которые описаны в Rincon et al., Mol Ther. 2015 Jan;23(1):43-52, Chuah et al., Mol Ther. 2014 Sep;22(9):1605-13 или Nair et al., Blood. 2014 May 15;123(20):3195-9.In a specific embodiment, the promoter is associated with an enhancer sequence, such as cis regulatory modules (CRMs) or an artificial enhancer sequence. For example, a promoter may be associated with an enhancer sequence such as a human ApoE control region (or human apolipoprotein E/C-I gene locus, HCR-1 hepatic control region - GenBank accession number U32510, shown in SEQ ID NO: 15). In a particular embodiment, an enhancer sequence, such as an ApoE sequence, is associated with a specific liver promoter, such as those listed above, and in particular such as the hAAT promoter. Other CRMs useful in the practice of the present invention include those described in Rincon et al., Mol Ther. 2015 Jan;23(1):43-52, Chuah et al., Mol Ther. 2014 Sep;22(9):1605-13 or Nair et al., Blood. 2014 May 15;123(20):3195-9.
В другом конкретном варианте осуществления конструкция нуклеиновой кислоты содержит интрон, в частности интрон, размещенный между промотором и кодирующей последовательностью GAA. Интрон можно вводить для увеличения стабильности мРНК и продуцирования белка. В дополнительном варианте осуществления конструкция нуклеиновой кислоты содержит интрон β-глобина b2 человека (или HBB2), интрон фактора свертывания IX (FIX), интрон SV40 или интрон β-глобина курицы. В другом дополнительном варианте осуществления, конструкция нуклеиновой кислоты по изобретению содержит модифицированный интрон (в частности, модифицированный интрон HBB2 или FIX), разработанный для уменьшения числа, или даже полного удаления, альтернативных открытых рамок считывания (ARF), найденных в указанном интроне. Предпочтительно, удаляют ARF, длина которых превышает 50 п. о. и которые имеют терминирующий кодон в рамке считывания инициирующего кодона. ARF может быть удалена посредством модификации последовательности интрона. Например, модификацию можно осуществлять посредством нуклеотидной замены, инсерции или делеции, предпочтительно посредством нуклеотидной замены. В качестве иллюстрации, один или несколько нуклеотидов, в частности один нуклеотид, в инициирующем кодоне ATG или GTG, присутствующем в последовательности интрона, представляющего интерес, можно заменить на ведущий к не инициирующему кодону. Например, ATG или GTG можно заменить на CTG, который не является инициирующим кодоном, в последовательности интрона, представляющего интерес.In another specific embodiment, the nucleic acid construct contains an intron, in particular an intron located between the promoter and the GAA coding sequence. An intron can be introduced to increase mRNA stability and protein production. In a further embodiment, the nucleic acid construct comprises a human β-globin b2 (or HBB2) intron, a coagulation factor IX (FIX) intron, an SV40 intron, or a chicken β-globin intron. In another further embodiment, the nucleic acid construct of the invention comprises a modified intron (particularly a modified HBB2 or FIX intron) designed to reduce, or even eliminate completely, alternative open reading frames (ARFs) found in said intron. Preferably, ARFs that are longer than 50 bp are removed. and which have a stop codon in the reading frame of the start codon. ARF can be removed by modifying the intron sequence. For example, the modification may be by nucleotide substitution, insertion or deletion, preferably by nucleotide substitution. By way of illustration, one or more nucleotides, in particular one nucleotide, in an ATG or GTG start codon present in an intron sequence of interest can be changed to lead to a non-start codon. For example, ATG or GTG can be replaced with CTG, which is not the start codon, in the sequence of the intron of interest.
Классический интрон HBB2, используемый в конструкциях нуклеиновой кислоты, приведен в SEQ ID NO: 16. Например, этот интрон HBB2 можно модифицировать посредством элиминации инициирующих кодонов (кодонов ATG и GTG) в указанном интроне. В конкретном варианте осуществления модифицированный интрон HBB2, содержащийся в конструкции, имеет последовательность, приведенную в SEQ ID NO: 17. Классический интрон FIX, используемый в конструкциях нуклеиновой кислоты, происходит из первого интрона FIX человека и приведен в SEQ ID NO: 18. Интрон FIX можно модифицировать посредством элиминации инициирующих кодонов (кодонов ATG и GTG) в указанном интроне. В конкретном варианте осуществления модифицированный интрон FIX, содержащийся в конструкции по изобретению, имеет последовательность, приведенную в SEQ ID NO: 19. Классический интрон β-глобина курицы, используемый в конструкциях нуклеиновой кислоты, приведен в SEQ ID NO: 20. Интрон β-глобина курицы можно модифицировать посредством элиминации инициирующих кодонов (кодонов ATG и GTG) в указанном интроне. В конкретном варианте осуществления модифицированный интрон β-глобина курицы, содержащийся в конструкции по изобретению, имеет последовательность, приведенную в SEQ ID NO: 21.The classic HBB2 intron used in nucleic acid constructs is shown in SEQ ID NO: 16. For example, this HBB2 intron can be modified by eliminating start codons (ATG and GTG codons) in said intron. In a specific embodiment, the modified HBB2 intron contained in the construct has the sequence shown in SEQ ID NO: 17. The classic FIX intron used in nucleic acid constructs is derived from the first human FIX intron and is shown in SEQ ID NO: 18. FIX intron can be modified by eliminating start codons (ATG and GTG codons) in said intron. In a specific embodiment, the modified FIX intron contained in the construct of the invention has the sequence shown in SEQ ID NO: 19. The classic chicken β-globin intron used in nucleic acid constructs is shown in SEQ ID NO: 20. β-globin intron chicken can be modified by eliminating the initiation codons (ATG and GTG codons) in the specified intron. In a specific embodiment, the modified chicken β-globin intron contained in the construct of the invention has the sequence shown in SEQ ID NO: 21.
Авторы изобретения предварительно показали в WO2015/162302, что такой модифицированный интрон, в частности модифицированный интрон HBB2 или FIX, имеет благоприятные свойства и может значительно усовершенствовать экспрессию трансгена.The inventors have previously shown in WO2015/162302 that such a modified intron, in particular a modified HBB2 or FIX intron, has favorable properties and can significantly improve transgene expression.
В конкретном варианте осуществления конструкция нуклеиновой кислоты по изобретению представляет собой экспрессирующую кассету, содержащую, в ориентации от 5' к 3', промотор, которому необязательно предшествует энхансер, кодирующую последовательность по изобретению (т. е. оптимизированную кодирующую последовательность GAA по изобретению, химерную кодирующую последовательность GAA по изобретению или химерную и оптимизированную кодирующую последовательность GAA по изобретению) и сигнал полиаденилирования (такой как сигнал полиаденилирования бычьего гормона роста, сигнал полиаденилирования SV40 или другой встречаемый в природе или искусственный сигнал полиаденилирования). В конкретном варианте осуществления конструкция нуклеиновой кислоты по изобретению представляет собой экспрессирующую кассету, содержащую, в ориентации от 5' к 3', промотор, которому необязательно предшествует энхансер, (такой как управляющая область ApoE), интрон (в частности, интрон как определено выше), кодирующую последовательность по изобретению и сигнал полиаденилирования. В дополнительном конкретном варианте осуществления, конструкция нуклеиновой кислоты по изобретению представляет собой экспрессирующую кассету, содержащую, в ориентации от 5' к 3', энхансер, такой как управляющая область ApoE, промотор, интрон (в частности, интрон как определено выше), кодирующую последовательность по изобретению и сигнал полиаденилирования. В дополнительном конкретном варианте осуществления изобретения экспрессирующая кассета содержит, в ориентации от 5' к 3', управляющую область ApoE, специфический промотор hAAT печени, интрон HBB2 (в частности, модифицированный интрон HBB2 как определено выше), кодирующую последовательность по изобретению и сигнал полиаденилирования бычьего гормона роста, например, конструкцию, представленную в:In a particular embodiment, the nucleic acid construct of the invention is an expression cassette containing, in a 5' to 3' orientation, a promoter optionally preceded by an enhancer, a coding sequence of the invention (i.e., an optimized GAA coding sequence of the invention, a chimeric coding a GAA sequence of the invention or a chimeric and optimized GAA coding sequence of the invention) and a polyadenylation signal (such as a bovine growth hormone polyadenylation signal, an SV40 polyadenylation signal, or other naturally occurring or artificial polyadenylation signal). In a specific embodiment, the nucleic acid construct of the invention is an expression cassette comprising, in a 5' to 3' orientation, a promoter optionally preceded by an enhancer (such as an ApoE control region), an intron (specifically an intron as defined above) , the coding sequence of the invention and the polyadenylation signal. In a further specific embodiment, the nucleic acid construct of the invention is an expression cassette comprising, in a 5' to 3' orientation, an enhancer such as an ApoE control region, a promoter, an intron (particularly an intron as defined above), a coding sequence according to the invention and a polyadenylation signal. In a further specific embodiment, the expression cassette comprises, in a 5' to 3' orientation, an ApoE control region, a specific liver hAAT promoter, an HBB2 intron (specifically a modified HBB2 intron as defined above), a coding sequence of the invention, and a bovine polyadenylation signal. growth hormone, for example, the construct presented in:
- SEQ ID NO: 22, содержащая не оптимизированную нуклеотидную последовательность, кодирующую Δ8 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 и кодирующую сигнальный пептид из SEQ ID NO: 5;- SEQ ID NO: 22 containing a non-optimized nucleotide sequence encoding an Δ8 truncated form of GAA derived from the parent hGAA of SEQ ID NO: 1 and encoding a signal peptide from SEQ ID NO: 5;
- SEQ ID NO: 23, содержащая оптимизированную последовательность, кодирующую Δ8 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и кодирующую сигнальный пептид из SEQ ID NO: 5;- SEQ ID NO: 23 containing an optimized sequence encoding an Δ8 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and encoding a signal peptide from SEQ ID NO: 5;
- SEQ ID NO: 24, содержащая другую оптимизированную последовательность, кодирующую Δ8 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и кодирующую сигнальный пептид из SEQ ID NO: 5;- SEQ ID NO: 24 containing another optimized sequence encoding the Δ8 truncated form of GAA derived from the parent hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and encoding the signal peptide from SEQ ID NO: 5;
- SEQ ID NO: 25, содержащая оптимизированную последовательность, кодирующую Δ8 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и сигнальный пептид из SEQ ID NO: 3;- SEQ ID NO: 25 containing the optimized sequence encoding the Δ8 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and the signal peptide from SEQ ID NO : 3;
- SEQ ID NO: 26, содержащая оптимизированную последовательность, кодирующую Δ42 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и сигнальный пептид из SEQ ID NO: 3;- SEQ ID NO: 26 containing the optimized sequence encoding the Δ42 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and the signal peptide from SEQ ID NO : 3;
- SEQ ID NO: 37, содержащая не оптимизированную последовательность, кодирующую Δ29 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из не оптимизированной последовательности из SEQ ID NO: 9), и сигнальный пептид из SEQ ID NO: 3;- SEQ ID NO: 37 containing the non-optimized sequence encoding the Δ29 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the non-optimized sequence of SEQ ID NO: 9) and the signal peptide from SEQ ID NO: 3;
- SEQ ID NO: 38, содержащая оптимизированную последовательность, кодирующую Δ29 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и сигнальный пептид из SEQ ID NO: 3;- SEQ ID NO: 38 containing the optimized sequence encoding the Δ29 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and the signal peptide from SEQ ID NO : 3;
- SEQ ID NO: 39, содержащая другую оптимизированную последовательность, кодирующую Δ29 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и сигнальный пептид из SEQ ID NO: 3;- SEQ ID NO: 39 containing another optimized sequence encoding the Δ29 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and a signal peptide from SEQ ID NO: 3;
- SEQ ID NO: 40: содержит не оптимизированную последовательность, кодирующую Δ42 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из не оптимизированной последовательности из SEQ ID NO: 9), и сигнальный пептид из SEQ ID NO: 3;- SEQ ID NO: 40: contains the non-optimized sequence encoding the Δ42 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the non-optimized sequence of SEQ ID NO: 9) and the signal peptide from SEQ ID NO: 3;
- SEQ ID NO: 41, содержащая другую оптимизированную последовательность, кодирующую Δ42 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и сигнальный пептид из SEQ ID NO: 3;- SEQ ID NO: 41 containing another optimized sequence encoding the Δ42 truncated form of GAA derived from the parent hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and the signal peptide from SEQ ID NO: 3;
- SEQ ID NO: 42, содержащая не оптимизированную последовательность, кодирующую Δ43 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из не оптимизированной последовательности из SEQ ID NO: 9), и сигнальный пептид из SEQ ID NO: 3;- SEQ ID NO: 42 containing the non-optimized sequence encoding the Δ43 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the non-optimized sequence of SEQ ID NO: 9) and the signal peptide from SEQ ID NO: 3;
- SEQ ID NO: 43, содержащая оптимизированную последовательность, кодирующую Δ43 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и сигнальный пептид из SEQ ID NO: 3; и- SEQ ID NO: 43 containing the optimized sequence encoding the Δ43 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and the signal peptide from SEQ ID NO : 3; and
- SEQ ID NO: 44, содержащая другую оптимизированную последовательность, кодирующую Δ43 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и сигнальный пептид из SEQ ID NO: 3;- SEQ ID NO: 44 containing another optimized sequence encoding the Δ43 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and a signal peptide from SEQ ID NO: 3;
- SEQ ID NO: 45, содержащая не оптимизированную последовательность, кодирующую Δ47 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из не оптимизированной последовательности из SEQ ID NO: 9), и сигнальный пептид из SEQ ID NO: 3;- SEQ ID NO: 45 containing the non-optimized sequence encoding the Δ47 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the non-optimized sequence of SEQ ID NO: 9) and the signal peptide from SEQ ID NO: 3;
- SEQ ID NO: 46, содержащая оптимизированную последовательность, кодирующую Δ47 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и сигнальный пептид из SEQ ID NO: 3; и- SEQ ID NO: 46 containing the optimized sequence encoding the Δ47 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and the signal peptide from SEQ ID NO : 3; and
- SEQ ID NO: 47, содержащая другую оптимизированную последовательность, кодирующую Δ47 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и сигнальный пептид из SEQ ID NO: 3.- SEQ ID NO: 47 containing another optimized sequence encoding the Δ47 truncated form of GAA derived from the parent hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and the signal peptide from SEQ ID NO: 3.
Другие экспрессирующие кассеты по изобретению могут содержать следующие последовательности нуклеиновой кислоты:Other expression cassettes of the invention may contain the following nucleic acid sequences:
- не оптимизированная нуклеотидная последовательность, кодирующая Δ8 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1, и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- a non-optimized nucleotide sequence encoding an Δ8 truncated form of GAA derived from the parent hGAA of SEQ ID NO: 1 and encoding a signal peptide of SEQ ID NO: 4, 6 or 7;
- не оптимизированная нуклеотидная последовательность, кодирующая Δ29 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1, и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- a non-optimized nucleotide sequence encoding the Δ29 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 and encoding the signal peptide of SEQ ID NO: 4, 6 or 7;
- не оптимизированная нуклеотидная последовательность, кодирующая Δ42 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1, и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- a non-optimized nucleotide sequence encoding an Δ42 truncated form of GAA derived from the parent hGAA of SEQ ID NO: 1 and encoding a signal peptide of SEQ ID NO: 4, 6 or 7;
- не оптимизированная нуклеотидная последовательность, кодирующая Δ43 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1, и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- a non-optimized nucleotide sequence encoding the Δ43 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 and encoding the signal peptide of SEQ ID NO: 4, 6 or 7;
- не оптимизированная нуклеотидная последовательность, кодирующая Δ47 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1, и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- a non-optimized nucleotide sequence encoding the Δ47 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 and encoding the signal peptide of SEQ ID NO: 4, 6 or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ8 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding an Δ8 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ8 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding an Δ8 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ29 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding the ∆29 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ29 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding the Δ29 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ42 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding an Δ42 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ42 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7- an optimized nucleotide sequence encoding an Δ42 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7
- оптимизированная нуклеотидная последовательность, кодирующая Δ43 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding the Δ43 truncated form of GAA derived from the parent hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ43 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7- an optimized nucleotide sequence encoding the Δ43 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7
- оптимизированная нуклеотидная последовательность, кодирующая Δ47 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding the ∆47 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ47 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7.- an optimized nucleotide sequence encoding the ∆47 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7.
В альтернативных вариантах осуществления этих конкретных конструкций, последовательность, кодирующую SEQ ID NO: 1, заменяют на последовательность, кодирующую SEQ ID NO: 33.In alternative embodiments of these specific constructs, the sequence encoding SEQ ID NO: 1 is replaced with the sequence encoding SEQ ID NO: 33.
В конкретном варианте осуществления экспрессирующая кассета содержит управляющую область ApoE, специфический промотор hAAT печени, интрон HBB2 с оптимизацией кодонов, кодирующую последовательность по изобретению и сигнал полиаденилирования бычьего гормона роста.In a particular embodiment, the expression cassette contains an ApoE control region, a specific liver hAAT promoter, a codon optimized HBB2 intron, a coding sequence of the invention, and a bovine growth hormone polyadenylation signal.
При разработке конструкции нуклеиновой кислоты по изобретению, специалист в данной области уделит внимание ограничению размера вектора, используемого для доставки указанной конструкции в клетку или орган. В частности, специалист в данной области знает, что основное ограничение AAV вектора состоит в его полезной вместимости, которая может варьировать от одного серотипа AAV к другом, но предположительно ограничена приблизительным размером родительского вирусного генома. Например, 5 т. о. Это максимальный размер, который обычно планируют упаковать в капсид AAV8 (Wu Z. et al., Mol Ther., 2010, 18(1): 80-86; Lai Y. et al., Mol Ther., 2010, 18(1): 75-79; Wang Y. et al., Hum Gene Ther Methods, 2012, 23(4): 225-33). Соответственно, специалисты в данной области, при практическом осуществлении настоящего изобретения, уделят внимание тому, чтобы выбирать компоненты конструкции нуклеиновой кислоты по изобретению с тем, чтобы получаемая последовательность нуклеиновой кислоты, в том числе последовательности, кодирующие AAV 5'- и 3'-ITR, предпочтительно не превышала 110% от полезной вместимости внедряемого AAV вектора, в частности, предпочтительно не превышала 5,5 т. о.In developing a nucleic acid construct of the invention, one skilled in the art will consider limiting the size of the vector used to deliver said construct to a cell or organ. In particular, one of skill in the art is aware that the main limitation of an AAV vector is its usable capacity, which may vary from one AAV serotype to another, but is presumably limited by the approximate size of the parent viral genome. For example, 5 tons. This is the maximum size usually planned to be packaged in an AAV8 capsid (Wu Z. et al., Mol Ther., 2010, 18(1): 80-86; Lai Y. et al., Mol Ther., 2010, 18(1 ): 75-79; Wang Y. et al., Hum Gene Ther Methods, 2012, 23(4): 225-33). Accordingly, those skilled in the art, in the practice of the present invention, will take care to select the components of the nucleic acid construct of the invention so that the resulting nucleic acid sequence, including sequences encoding the AAV 5'- and 3'-ITR, preferably does not exceed 110% of the useful capacity of the introduced AAV vector, in particular, preferably does not exceed 5.5 t.
Изобретение также относится к вектору, содержащему молекулу нуклеиновой кислоты или конструкцию, как раскрыто в настоящем описании. В частности, вектор по изобретению представляет собой вектор, подходящий для экспрессии белка, предпочтительно для использования в генной терапии. В одном из вариантов осуществления вектор представляет собой плазмидный вектор. В другом варианте осуществления вектор представляет собой наночастицу, содержащую молекулу нуклеиновой кислоты по изобретению, в частности информационную РНК, кодирующую полипептид GAA по изобретению. В другом варианте осуществления вектор представляет собой систему на основе транспозонов, которая делает возможным встраивание молекулы нуклеиновой кислоты или конструкции по изобретению в геном целевой клетки, такой как гиперактивная транспозонная система Sleeping Beauty (SB100X) (Mates et al. 2009). В другом варианте осуществления вектор представляет собой вирусный вектор, подходящий для генной терапии, который направлен на любую клетку, представляющую интерес, такую как ткань или клетки печени, клетка мышцы, клетки CNS (такие как клетки головного мозга) или гематопоэтические стволовые клетки, такие как клетки эритроидной линии дифференцировки (такие как эритроциты). В этом случае, конструкция нуклеиновой кислоты по изобретению также содержит последовательности, подходящие для получения эффективного вирусного вектора, как хорошо известно в данной области. В конкретном варианте осуществления вирусный вектор происходит из интегрирующего вируса. В частности, вирусный вектор может происходить из ретровируса или лентивируса. В дополнительном конкретном варианте осуществления, вирусный вектор представляет собой AAV вектор, такой как AAV вектор, подходящий для трансдукции тканей или клеток печени, более конкретно AAV-1, -2 и варианты AAV-2 (такие как оптимизированный AAV-2 с четверной мутацией капсида, содержащие сконструированный капсид с изменениями Y44+500+730F+T491V, как раскрыто в Ling et al., 2016 Jul 18, Hum Gene Ther Methods [электронная публикация перед печатью]), -3 и варианты AAV-3 (такие как вариант AAV3-ST, содержащий сконструированный капсид AAV3 с двумя аминокислотными изменениями, S663V+T492V, как раскрыто в Vercauteren et al., 2016, Mol. Ther. том 24(6), стр. 1042), -3B и варианты AAV-3B, -4, -5, -6 и варианты AAV-6 (такие как вариант AAV6, содержащий форму капсида AAV6 с тройной мутацией Y731F/Y705F/T492V, как раскрыто в Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, стр. 16026), -7, -8, -9, -10, например, -cy10 и -rh10, -rh74, -dj, Anc80, LK03, AAV2i8, серотипы AAV свиньи, такие как AAVpo4 и AAVpo6 и т. д., вектор или ретровирусный вектор, такой как лентивирусный вектор и альфаретровирус. Как известно в данной области, в зависимости от конкретного вирусного вектора, рассматриваемого для использования, дополнительные подходящие последовательности вводят в конструкцию нуклеиновой кислоты по изобретению для получения функционального вирусного вектора. Подходящие последовательности включают ITR AAV для AAV вектора или LTR для лентивирусных векторов. По существу, изобретение также относится к экспрессирующей кассете, как описано выше, фланкированной с помощью ITR или LTR с каждой стороны.The invention also relates to a vector containing a nucleic acid molecule or construct, as disclosed in the present description. In particular, the vector of the invention is a vector suitable for protein expression, preferably for use in gene therapy. In one embodiment, the vector is a plasmid vector. In another embodiment, the vector is a nanoparticle containing a nucleic acid molecule of the invention, in particular a messenger RNA encoding a GAA polypeptide of the invention. In another embodiment, the vector is a transposon based system that allows the insertion of a nucleic acid molecule or construct of the invention into the genome of a target cell, such as the Sleeping Beauty hyperactive transposon system (SB100X) (Mates et al. 2009). In another embodiment, the vector is a viral vector suitable for gene therapy that targets any cell of interest such as liver tissue or cells, muscle cell, CNS cells (such as brain cells), or hematopoietic stem cells such as erythroid lineage cells (such as erythrocytes). In this case, the nucleic acid construct of the invention also contains sequences suitable for producing an effective viral vector, as is well known in the art. In a specific embodiment, the viral vector is derived from an integrating virus. In particular, the viral vector may be derived from a retrovirus or a lentivirus. In a further specific embodiment, the viral vector is an AAV vector, such as an AAV vector suitable for liver tissue or cell transduction, more specifically AAV-1, -2, and AAV-2 variants (such as an optimized AAV-2 with a quadruple capsid mutation containing engineered capsid with Y44+500+730F+T491V changes as disclosed in Ling et al., 2016 Jul 18, Hum Gene Ther Methods [preprint electronic publication]), -3 and AAV-3 variants (such as AAV3 variant -ST containing an engineered AAV3 capsid with two amino acid changes, S663V+T492V, as disclosed in Vercauteren et al., 2016, Mol Ther vol 24(6), page 1042), -3B and variants of AAV-3B, - 4, -5, -6 and AAV-6 variants (such as the AAV6 variant containing the Y731F/Y705F/T492V triple mutation AAV6 capsid form as disclosed in Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, p. . 16026), -7, -8, -9, -10 e.g. -cy10 and -rh10, -rh74, -dj, Anc80, LK03, AAV2i8, swine AAV serotypes such as A AVpo4 and AAVpo6, etc., vector or retroviral vector such as lentiviral vector and alfaretrovirus. As is known in the art, depending on the particular viral vector being considered for use, additional suitable sequences are introduced into the nucleic acid construct of the invention in order to obtain a functional viral vector. Suitable sequences include AAV ITR for AAV vector or LTR for lentiviral vectors. As such, the invention also relates to an expression cassette as described above, flanked with an ITR or LTR on each side.
Преимущества вирусных векторов рассмотрены в следующей части этого раскрытия. Вирусные векторы предпочтительны для доставки молекулы нуклеиновой кислоты или конструкции по изобретению, такой как ретровирусный вектор, например, лентивирусный вектор, или непатогенный парвовирус, более предпочтительно AAV вектор. Парвовирусный аденоассоциированный вирус (AAV) человека представляет собой депендовирус, имеющий природный дефект репликации, который способен встраиваться в геном инфицированной клетки для того, чтобы устанавливать латентную инфекцию. Последнее свойство, по-видимому, является уникальным среди вирусов млекопитающих, поскольку встраивание происходит в конкретном участке в геноме человека, называемом AAVS1, который расположен на хромосоме 19 (19q13.3-qter).The advantages of viral vectors are discussed in the next part of this disclosure. Viral vectors are preferred for delivery of a nucleic acid molecule or construct of the invention, such as a retroviral vector, eg a lentiviral vector, or a non-pathogenic parvovirus, more preferably an AAV vector. Human parvovirus adeno-associated virus (AAV) is a dependovirus having a natural replication defect that is able to integrate into the genome of an infected cell in order to establish a latent infection. The latter property appears to be unique among mammalian viruses because the insertion occurs at a specific site in the human genome called AAVS1, which is located on chromosome 19 (19q13.3-qter).
Следовательно, AAV векторы вызывают существенный интерес в качестве потенциальных векторов для генной терапии человека. Среди благоприятных свойств вируса имеют место отсутствие у него связи с любым заболеванием человека, его способность инфицировать делящиеся и не делящиеся клетки, и широкий диапазон клеточных линий, происходящих из различных тканей, которые могут быть инфицированы.Therefore, AAV vectors are of considerable interest as potential vectors for human gene therapy. Among the favorable properties of the virus are its lack of association with any human disease, its ability to infect dividing and non-dividing cells, and the wide range of cell lines derived from various tissues that can be infected.
Среди серотипов AAV, выделенных у человека или не являющихся человеком приматов (NHP) и хорошо охарактеризованных, серотип 2 человека представляет собой первый AAV, который разрабатывали в качестве вектора переноса генов. Другие используемые в настоящее время серотипы AAV включают AAV-1, варианты AAV-2 (такие как оптимизированный AAV-2 с четверной мутацией капсида, содержащий сконструированный капсид с изменениями Y44+500+730F+T491V, как раскрыто в Ling et al., 2016 Jul 18, Hum Gene Ther Methods [электронная публикация перед печатью]), -3 и варианты AAV-3 (такие как вариант AAV3-ST, содержащий сконструированный капсид AAV3 с двумя аминокислотными изменениями, S663V+T492V, как раскрыто в Vercauteren et al., 2016, Mol. Ther. том 24(6), стр. 1042), -3B и варианты AAV-3B, -4, -5, -6 и варианты AAV-6 (такие как вариант AAV6, содержащий форму капсида AAV6 с тройной мутацией Y731F/Y705F/T492V, как раскрыто в Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, стр. 16026), -7, -8, -9, -10, например, cy10 и -rh10, -rh74, -dj, Anc80, LK03, AAV2i8, серотипы AAV свиньи, такие как AAVpo4 и AAVpo6, и тирозиновые, лизиновые и сериновые мутантные капсиды серотипов AAV и т. д. Кроме того, другие не природные сконструированные варианты и химерные AAV также могут быть эффективны.Among AAV serotypes isolated from humans or non-human primates (NHP) and well characterized,
Вирусы AAV можно конструировать с использованием стандартных приемов молекулярной биологии, которые позволяют оптимизировать эти частицы для доставки последовательностей нуклеиновой кислоты в конкретные клетки, для минимизации иммуногенности, для корректировки стабильности и времени жизни частиц, для эффективного разрушения, для точной доставки в ядро.AAV viruses can be engineered using standard molecular biology techniques that allow these particles to be optimized for delivery of nucleic acid sequences to specific cells, to minimize immunogenicity, to adjust for particle stability and lifetime, for efficient disruption, for precise delivery to the nucleus.
Желательные фрагменты AAV для сборки в векторы включают белки cap, в том числе vp1, vp2, vp3 и гипервариабельные области, белки rep, в том числе rep 78, rep 68, rep 52 и rep 40, и последовательности, кодирующие эти белки. Эти фрагменты легко можно использовать в различных векторных системах и клетках-хозяевах.Desirable AAV fragments for assembly into vectors include cap proteins, including vp1, vp2, vp3 and hypervariable regions, rep proteins, including rep 78, rep 68, rep 52 and
Рекомбинантные векторы на основе AAV, лишенные белка Rep, встраиваются с низким эффектом в геном хозяина и преимущественно представлены в виде стабильных круглых эписом, которые могут персистировать в течение лет в целевых клетках.Recombinant AAV-based vectors lacking the Rep protein integrate with low efficiency into the host genome and are predominantly presented as stable round episomes that can persist for years in target cells.
Альтернативно использованию природных серотипов AAV, в контексте настоящего изобретения можно использовать искусственные серотипы AAV, в том числе, без ограничения, AAV с не встречаемым в природе белком капсида. Такой искусственный капсид можно создавать с помощью любого подходящего приема, используя выбранную AAV последовательность (например, фрагмент белка капсида vp1) в комбинации с гетерологичными последовательностями, которые можно получать из другого выбранного серотипа AAV, не связанных частей AAV того же серотипа, из не AAV вирусного источника или из не вирусного источника. Искусственный серотип AAV может представлять собой, без ограничения, химерный AAV капсид, рекомбинантный AAV капсид или «гуманизированный» AAV капсид.As an alternative to using naturally occurring AAV serotypes, artificial AAV serotypes, including but not limited to AAV with a non-naturally occurring capsid protein, can be used in the context of the present invention. Such an artificial capsid can be generated by any suitable technique using a selected AAV sequence (e.g., a fragment of the vp1 capsid protein) in combination with heterologous sequences that can be derived from another selected AAV serotype, unrelated portions of an AAV of the same serotype, from a non-AAV viral source or from a non-viral source. The artificial AAV serotype can be, without limitation, a chimeric AAV capsid, a recombinant AAV capsid, or a "humanized" AAV capsid.
Соответственно, настоящее изобретение относится к AAV вектору, содержащему молекулу нуклеиновой кислоты или конструкцию по изобретению. В контексте настоящего изобретения, AAV вектор содержит AAV капсид, способный трансдуцировать целевые клетки, представляющие интерес, в частности, гепатоциты. В соответствии с конкретным вариантом осуществления, AAV вектор относится к AAV-1, -2, вариантам AAV-2 (например, оптимизированный AAV-2 с четверной мутацией капсида, содержащий сконструированный капсид с изменениями Y44+500+730F+T491V, как раскрыто в Ling et al., 2016 Jul 18, Hum Gene Ther Methods [электронная публикация перед печатью]), -3 и варианты AAV-3 (например, вариант AAV3-ST, содержащий сконструированный капсид AAV3 с двумя аминокислотными изменениями, S663V+T492V, как раскрыто в Vercauteren et al., 2016, Mol. Ther. том 24(6), стр. 1042), -3B и варианты AAV-3B, -4, -5, -6 и варианты AAV-6 (например, вариант AAV6, содержащий форму капсида AAV6 с тройной мутацией Y731F/Y705F/T492V, как раскрыто в Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, стр. 16026), -7, -8, -9, -10, например, -cy10 и -rh10, -rh74, -dj, Anc80, LK03, AAV2i8, AAV свиньи, такой как AAVpo4 и AAVpo6, и тирозиновые, лизиновые и сериновые капсидные мутанты серотипов AAV, и т. д., серотип. В конкретном варианте осуществления AAV вектор относится к серотипу AAV8, AAV9, AAVrh74 или AAV2i8 (т. е. AAV вектор имеет капсид серотипа AAV8, AAV9, AAVrh74 или AAV2i8). В дополнительном конкретном варианте осуществления, AAV вектор представляет собой псевдотипированный вектор, т. е. его геном и капсид происходят из AAV различных серотипов. Например, псевдотипированный AAV вектор может представлять собой вектор, геном которого происходит из одного из указанных выше серотипов AAV и капсид которого происходит из другого серотипа. Например, геном псевдотипированного вектора может иметь капсид, происходящий из серотипа AAV8, AAV9, AAVrh74 или AAV2i8, и его геном может происходить из другого серотипа. В конкретном варианте осуществления AAV вектор имеет капсид серотипа AAV8, AAV9 или AAVrh74, в частности серотипа AAV8 или AAV9, более конкретно серотипа AAV8.Accordingly, the present invention relates to an AAV vector containing the nucleic acid molecule or construct of the invention. In the context of the present invention, an AAV vector contains an AAV capsid capable of transducing target cells of interest, in particular hepatocytes. According to a specific embodiment, the AAV vector refers to AAV-1, -2, AAV-2 variants (e.g., an optimized AAV-2 with a quadruple capsid mutation containing an engineered capsid with Y44+500+730F+T491V changes as disclosed in Ling et al., 2016 Jul 18, Hum Gene Ther Methods [e-published ahead of print]), -3 and AAV-3 variants (e.g. AAV3-ST variant containing an engineered AAV3 capsid with two amino acid changes, S663V+T492V, as disclosed in Vercauteren et al., 2016, Mol Ther vol 24(6), page 1042), -3B and variants AAV-3B, -4, -5, -6 and variants AAV-6 (e.g. containing the AAV6 capsid form with the Y731F/Y705F/T492V triple mutation as disclosed in Rosario et al., 2016, Mol Ther Methods Clin Dev. 3, page 16026), -7, -8, -9, -10, e.g. , -cy10 and -rh10, -rh74, -dj, Anc80, LK03, AAV2i8, porcine AAV such as AAVpo4 and AAVpo6, and tyrosine, lysine and serine capsid mutants of AAV serotypes, etc., serotype. In a specific embodiment, the AAV vector is of serotype AAV8, AAV9, AAVrh74, or AAV2i8 (i.e., the AAV vector has a capsid of serotype AAV8, AAV9, AAVrh74, or AAV2i8). In a further specific embodiment, the AAV vector is a pseudotyped vector, ie its genome and capsid are derived from AAVs of different serotypes. For example, a pseudotyped AAV vector may be a vector whose genome is derived from one of the above AAV serotypes and whose capsid is derived from another serotype. For example, the genome of a pseudotyped vector may have a capsid derived from the serotype AAV8, AAV9, AAVrh74, or AAV2i8 and its genome may be derived from another serotype. In a specific embodiment, the AAV vector has a capsid of the AAV8, AAV9 or AAVrh74 serotype, in particular the AAV8 or AAV9 serotype, more specifically the AAV8 serotype.
В конкретном варианте осуществления, в котором вектор предназначен для использования в доставке трансгена в клетки мышцы, AAV вектор можно выбирать, среди прочих, в группе, состоящей из AAV8, AAV9 и AAVrh74.In a specific embodiment in which the vector is for use in delivering a transgene to muscle cells, the AAV vector may be selected from the group consisting of AAV8, AAV9 and AAVrh74, among others.
В другом конкретном варианте осуществления, в котором вектор предназначен для использования в доставке трансгена в клетки печени, AAV вектор можно выбирать, среди прочих, в группе, состоящей из AAV5, AAV8, AAV9, AAV-LK03, AAV-Anc80 и AAV3B.In another specific embodiment, in which the vector is for use in delivering a transgene to liver cells, the AAV vector may be selected from the group consisting of AAV5, AAV8, AAV9, AAV-LK03, AAV-Anc80, and AAV3B, among others.
В другом варианте осуществления капсид представляет собой модифицированный капсид. В контексте настоящего изобретения, «модифицированный капсид» может представлять собой химерный капсид или капсид, содержащий один или несколько вариантов белков капсида VP, происходящих из одного или нескольких белков капсида VP AAV дикого типа.In another embodiment, the capsid is a modified capsid. In the context of the present invention, a "modified capsid" can be a chimeric capsid or a capsid containing one or more variants of VP capsid proteins derived from one or more wild-type AAV VP capsid proteins.
В конкретном варианте осуществления AAV вектор представляет собой химерный вектор, т. е. его капсид содержит белки капсида VP, происходящие из по меньшей мере двух различных серотипов AAV, или содержит по меньшей мере один химерный белок VP, объединяющий области или домены белков VP, происходящие из по меньшей мере двух серотипов AAV. Примеры таких химерных AAV векторов, эффективных для трансдукции клеток печени, описаны в Shen et al., Molecular Therapy, 2007 и в Tenney et al., Virology, 2014. Например, химерный AAV вектор может происходить из комбинации последовательности капсида AAV8 с последовательностью серотипа AAV, отличного от серотипа AAV8, такого как любой из тех, что конкретно указаны выше. В другом варианте осуществления капсид AAV вектора содержит один или несколько вариантов белков капсида VP, таких как те, что описаны в WO2015013313, в частности варианты капсида RHM4-1, RHM15-1, RHM15-2, RHM15-3/RHM15-5, RHM15-4 и RHM15-6, которые дают высокий тропизм к печени.In a specific embodiment, the AAV vector is a chimeric vector, i.e., its capsid contains VP capsid proteins derived from at least two different AAV serotypes, or contains at least one chimeric VP protein combining regions or domains of VP proteins derived from from at least two AAV serotypes. Examples of such chimeric AAV vectors effective for transducing liver cells are described in Shen et al., Molecular Therapy, 2007 and Tenney et al., Virology, 2014. For example, a chimeric AAV vector can be derived from a combination of an AAV8 capsid sequence with an AAV serotype sequence. , other than the AAV8 serotype, such as any of those specifically mentioned above. In another embodiment, the AAV vector capsid contains one or more VP capsid protein variants such as those described in WO2015013313, in particular RHM4-1, RHM15-1, RHM15-2, RHM15-3/RHM15-5, RHM15 capsid variants. -4 and RHM15-6, which give a high tropism to the liver.
В другом варианте осуществления модифицированный капсид может происходить также из модификаций капсида, вставленных с помощью допускающей ошибки ПЦР и/или инсерции пептида (например, как описано в Bartel et al., 2011). Кроме того, варианты капсида могут содержать изменения одной аминокислоты, такие как тирозиновые мутанты (например, как описано в Zhong et al., 2008)In another embodiment, the modified capsid may also be derived from capsid modifications inserted by error-prone PCR and/or peptide insertion (eg, as described in Bartel et al., 2011). In addition, capsid variants may contain single amino acid changes such as tyrosine mutants (eg, as described in Zhong et al., 2008)
Кроме того, геном AAV вектора может представлять собой одноцепочечный или самокомплементарный двухцепочечный геном (McCarty et al., Gene Therapy, 2003). Самокомплементарные двухцепочечные AAV векторы создают посредством делеции сайта концевого разрешения (trs) из одного из концевых повторов AAV. Эти модифицированные векторы, реплицирующийся геном которых составляет половину длины от генома AAV дикого типа, обладают склонностью к упаковыванию димеров ДНК. В предпочтительном варианте осуществления AAV вектор, используемый при практической реализации настоящего изобретения, имеет одноцепочечный геном и дополнительно предпочтительно содержит капсид AAV8, AAV9, AAVrh74 или AAV2i8, в частности капсид AAV8, AAV9 или AAVrh74, такой как капсид AAV8 или AAV9, более конкретно капсид AAV8.In addition, the AAV vector genome can be a single stranded or self complementary double stranded genome (McCarty et al., Gene Therapy, 2003). Self-complementary double-stranded AAV vectors are generated by deletion of the terminal clearance site (trs) from one of the AAV terminal repeats. These modified vectors, whose replicating genome is half the length of the wild-type AAV genome, tend to package DNA dimers. In a preferred embodiment, the AAV vector used in the practice of the present invention has a single stranded genome and further preferably contains an AAV8, AAV9, AAVrh74 or AAV2i8 capsid, in particular an AAV8, AAV9 or AAVrh74 capsid, such as an AAV8 or AAV9 capsid, more specifically an AAV8 capsid .
В особенно предпочтительном варианте осуществления изобретение относится к AAV вектору, содержащему, в одноцепочечном или двухцепочечном самокомплементарном геноме (например, одноцепочечном геноме), конструкцию нуклеиновой кислоты по изобретению. В одном из вариантов осуществления AAV вектор содержит капсид AAV8, AAV9, AAVrh74 или AAV2i8, в частности капсид AAV8, AAV9 или AAVrh74, такой как капсид AAV8 или AAV9, более конкретно капсид AAV8. В дополнительном конкретном варианте осуществления, указанная нуклеиновая кислота функционально связана с промотором, в частности, универсальным или специфическим промотором печени. В соответствии с вариантом осуществления конкретного варианта, промотор представляет собой универсальный промотор, такой как энхансер цитомегаловируса/промотор β-актина курицы (CAG), энхансер/промотор цитомегаловируса(CMV), промотор PGK и ранний промотор SV40. В конкретном варианте универсальный промотор представляет собой промотор CAG. В соответствии с другим вариантом, промотор представляет собой специфический промотор печени, такой как промотор α-1-антитрипсина (hAAT), промотор транстиретина, промотор альбумина и промотор тироксинсвязывающего глобулина (TBG). В конкретном варианте, специфический промотор печени представляет собой специфический промотор hAAT печени из SEQ ID NO: 14. В дополнительном конкретном варианте осуществления, конструкция нуклеиновой кислоты, содержащаяся в геноме AAV вектора по изобретению, дополнительно содержит интрон, как описано выше, такой как интрон, помещенный между промотором и последовательностью нуклеиновой кислоты, кодирующей кодирующую последовательность GAA (т. е. оптимизированную кодирующую последовательность GAA по изобретению, химерную кодирующую последовательность GAA по изобретению или химерную и оптимизированную кодирующую последовательность GAA по изобретению). Репрезентативные интроны, которые могут быть включены в конструкцию нуклеиновой кислоты, введенную в геном AAV вектора, включают, без ограничения, интрон β-глобина b2 человека (или HBB2), интрон FIX и интрон β-глобина курицы. Указанный интрон в геноме AAV вектора может представлять собой классический (или немодифицированный) интрон или модифицированный интрон, разработанный для снижения числа, или даже полного удаления, альтернативных открытых рамок считывания (ARF) в указанном интроне. Модифицированные и немодифицированные интроны, которые можно использовать при практической реализации этого варианта осуществления, где нуклеиновую кислоту по изобретению вводят в AAV вектор, тщательно описаны выше. В конкретном варианте осуществления AAV вектор, в частности AAV вектор, содержащий капсид AAV8, AAV9, AAVrh74 или AAV2i8, в частности капсид AAV8, AAV9 или AAVrh74, например, капсид AAV8 или AAV9, более конкретно капсид AAV8, по изобретению содержит в своем геноме модифицированный (или оптимизированный) интрон, такой как модифицированный интрон HBB2 из SEQ ID NO: 17, модифицированный интрон FIX из SEQ ID NO: 19 и модифицированный интрон β-глобина курицы из SEQ ID NO: 21. В дополнительном конкретном варианте осуществления, вектор по изобретению представляет собой AAV вектор, содержащий капсид AAV8, AAV9, AAVrh74 или AAV2i8, в частности капсид AAV8, AAV9 или AAVrh74, например, капсид AAV8 или AAV9, более конкретно капсид AAV8, который содержит геном, содержащий, в ориентации от 5' к 3': AAV 5'-ITR (например, AAV2 5'-ITR); управляющую область ApoE; специфический промотор hAAT печени; интрон HBB2 (в частности модифицированный интрон HBB2, как определено выше); кодирующую последовательность GAA по изобретению; сигнал полиаденилирования бычьего гормона роста; и AAV 3'-ITR (например, AAV2 3'-ITR), такой как геном, содержащий конструкцию нуклеиновой кислоты, приведенную в SEQ ID NO: с 22 до 26 и SEQ ID NO: с 37 до 47, фланкированную с помощью AAV 5'-ITR (например, AAV2 5'-ITR) и AAV 3'-ITR (например, AAV2 3'-ITR). Другие конструкции нуклеиновой кислоты, эффективные при практической реализации настоящего изобретения, включают те, которые описаны выше, в том числе:In a particularly preferred embodiment, the invention relates to an AAV vector comprising, in a single-stranded or double-stranded self-complementary genome (eg, single-stranded genome), the nucleic acid construct of the invention. In one embodiment, the AAV vector comprises an AAV8, AAV9, AAVrh74 or AAV2i8 capsid, in particular an AAV8, AAV9 or AAVrh74 capsid, such as an AAV8 or AAV9 capsid, more specifically an AAV8 capsid. In a further specific embodiment, said nucleic acid is operably linked to a promoter, in particular a universal or specific liver promoter. According to a particular embodiment, the promoter is a universal promoter such as a cytomegalovirus enhancer/chicken β-actin (CAG) promoter, a cytomegalovirus (CMV) enhancer/promoter, a PGK promoter, and an early SV40 promoter. In a specific embodiment, the universal promoter is a CAG promoter. Alternatively, the promoter is a specific liver promoter such as the α-1-antitrypsin (hAAT) promoter, transthyretin promoter, albumin promoter, and thyroxine-binding globulin (TBG) promoter. In a specific embodiment, the specific liver promoter is the specific liver hAAT promoter of SEQ ID NO: 14. In a further specific embodiment, the nucleic acid construct contained in the genome of the AAV vector of the invention further comprises an intron as described above, such as an intron, placed between the promoter and a nucleic acid sequence encoding a GAA coding sequence (i.e., an optimized GAA coding sequence of the invention, a chimeric GAA coding sequence of the invention, or a chimeric and optimized GAA coding sequence of the invention). Representative introns that can be included in a nucleic acid construct introduced into the genome of an AAV vector include, without limitation, the human b2 (or HBB2) β-globin intron, the FIX intron, and the chicken β-globin intron. Said intron in the genome of an AAV vector may be a classical (or unmodified) intron or a modified intron designed to reduce, or even eliminate, alternative open reading frames (ARFs) in said intron. Modified and unmodified introns that can be used in the practice of this embodiment, where the nucleic acid of the invention is introduced into an AAV vector, are described in detail above. In a specific embodiment, an AAV vector, in particular an AAV vector containing an AAV8, AAV9, AAVrh74 or AAV2i8 capsid, in particular an AAV8, AAV9 or AAVrh74 capsid, for example an AAV8 or AAV9 capsid, more specifically an AAV8 capsid, according to the invention contains in its genome a modified (or optimized) intron, such as the modified HBB2 intron of SEQ ID NO: 17, the modified FIX intron of SEQ ID NO: 19, and the modified chicken β-globin intron of SEQ ID NO: 21. In a further specific embodiment, the vector of the invention is an AAV vector containing an AAV8, AAV9, AAVrh74 or AAV2i8 capsid, in particular an AAV8, AAV9 or AAVrh74 capsid, for example an AAV8 or AAV9 capsid, more specifically an AAV8 capsid, which contains a genome containing, in the orientation from 5' to 3' : AAV 5'-ITR (e.g. AAV2 5'-ITR); an ApoE control area; liver hAAT specific promoter; an HBB2 intron (particularly a modified HBB2 intron as defined above); the GAA coding sequence of the invention; bovine growth hormone polyadenylation signal; and AAV 3'-ITR (e.g. AAV2 3'-ITR) such as a genome containing the nucleic acid construct shown in SEQ ID NO: 22 to 26 and SEQ ID NO: 37 to 47 flanked with AAV 5 '-ITR (eg AAV2 5'-ITR) and AAV 3'-ITR (eg AAV2 3'-ITR). Other nucleic acid constructs useful in the practice of the present invention include those described above, including:
- не оптимизированная нуклеотидная последовательность, кодирующая Δ8 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1, и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- a non-optimized nucleotide sequence encoding an Δ8 truncated form of GAA derived from the parent hGAA of SEQ ID NO: 1 and encoding a signal peptide of SEQ ID NO: 4, 6 or 7;
- не оптимизированная нуклеотидная последовательность, кодирующая Δ29 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1, и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- a non-optimized nucleotide sequence encoding the Δ29 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 and encoding the signal peptide of SEQ ID NO: 4, 6 or 7;
- не оптимизированная нуклеотидная последовательность, кодирующая Δ42 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1, и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- a non-optimized nucleotide sequence encoding an Δ42 truncated form of GAA derived from the parent hGAA of SEQ ID NO: 1 and encoding a signal peptide of SEQ ID NO: 4, 6 or 7;
- не оптимизированная нуклеотидная последовательность, кодирующая Δ43 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1, и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- a non-optimized nucleotide sequence encoding the Δ43 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 and encoding the signal peptide of SEQ ID NO: 4, 6 or 7;
- не оптимизированная нуклеотидная последовательность, кодирующая Δ47 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1, и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7- non-optimized nucleotide sequence encoding the Δ47 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 and encoding the signal peptide of SEQ ID NO: 4, 6 or 7
- оптимизированная нуклеотидная последовательность, кодирующая Δ8 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding an Δ8 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ8 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding an Δ8 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ29 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding the Δ29 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ29 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding the ∆29 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ42 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и кодирующая сигнальный пептид из SEQ ID NO: 4 или 6;- an optimized nucleotide sequence encoding an Δ42 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and encoding a signal peptide from SEQ ID NO: 4 or 6;
- оптимизированная нуклеотидная последовательность, кодирующая Δ42 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding an Δ42 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ43 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding the Δ43 truncated form of GAA derived from the parent hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ43 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding the Δ43 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ47 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 12), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7;- an optimized nucleotide sequence encoding the ∆47 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 12) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7;
- оптимизированная нуклеотидная последовательность, кодирующая Δ47 усеченную форму GAA, происходящую из родительской hGAA из SEQ ID NO: 1 (нуклеотидная последовательность, происходящая из оптимизированной последовательности из SEQ ID NO: 13), и кодирующая сигнальный пептид из SEQ ID NO: 4, 6 или 7.- an optimized nucleotide sequence encoding the Δ47 truncated form of GAA derived from the parental hGAA of SEQ ID NO: 1 (nucleotide sequence derived from the optimized sequence of SEQ ID NO: 13) and encoding a signal peptide from SEQ ID NO: 4, 6, or 7.
В альтернативных вариантах осуществления этих конкретных конструкций, последовательность, кодирующую SEQ ID NO: 1, заменяют на последовательность, кодирующую SEQ ID NO: 33.In alternative embodiments of these specific constructs, the sequence encoding SEQ ID NO: 1 is replaced with the sequence encoding SEQ ID NO: 33.
В конкретном варианте осуществления изобретения, конструкция нуклеиновой кислоты по изобретению содержит специфический промотор печени, как описано выше, и вектор представляет собой вирусный вектор, способный к трансдукции ткани или клеток печени, как описано выше. Авторы изобретения приводят далее данные, показывающие, что протолерогенные и метаболические свойства печени благоприятно реализованы благодаря этому варианту осуществления для разработки высоко эффективных и оптимизированных векторов для экспрессии высоко секретируемых форм GAA в гепатоцитах и индукции иммунологической толерантности на белок.In a particular embodiment of the invention, the nucleic acid construct of the invention comprises a specific liver promoter as described above and the vector is a viral vector capable of transducing liver tissue or cells as described above. The inventors further provide data showing that the protolerogenic and metabolic properties of the liver are beneficially realized by this embodiment to develop highly efficient and optimized vectors for expressing highly secreted forms of GAA in hepatocytes and inducing immunological tolerance to the protein.
Кроме того, в дополнительном конкретном варианте осуществления, изобретение относится к комбинации двух векторов, например, двух вирусных векторов, в частности, двух AAV векторов, для усовершенствования доставки гена и эффекта лечения в клетках, представляющих интерес. Например, два вектора могут нести молекулу нуклеиновой кислоты по изобретению, кодирующую белок GAA по изобретению, под управлением одного промотора, различного в каждом из этих двух векторов. В конкретном варианте осуществления один вектор содержит промотор, который представляет собой специфический промотор печени (как один из описанных выше), и другой вектор содержит промотор, который обладает специфичностью к другой ткани, представляющей интерес, для лечения нарушения накопления гликогена, такой как специфический промотор мышц, например, промотор десмина. В конкретном варианте по этому варианту осуществления, эта комбинация векторов соответствует нескольким совместно упакованным AAV векторам, получаемым, как описано в WO2015196179.Furthermore, in a further specific embodiment, the invention relates to a combination of two vectors, eg two viral vectors, in particular two AAV vectors, to improve gene delivery and treatment effect in cells of interest. For example, two vectors may carry a nucleic acid molecule of the invention encoding a GAA protein of the invention under the control of a single promoter that is different in each of the two vectors. In a particular embodiment, one vector contains a promoter that is a liver specific promoter (as one described above) and the other vector contains a promoter that has specificity for another tissue of interest for treating glycogen storage disorder, such as a muscle specific promoter. eg the desmin promoter. In a particular embodiment of this embodiment, this combination of vectors corresponds to multiple co-packaged AAV vectors obtained as described in WO2015196179.
Изобретение также относится к клетке, например, клетке печени, которую трансформируют молекулой нуклеиновой кислоты или конструкцией по изобретению, как в случае генной терапии ex vivo. Клетки по изобретению можно доставлять субъекту, нуждающемуся в этом, такому как пациент с дефицитом GAA, с помощью любого подходящего пути введения, например, через инъекцию в печень или в кровоток указанного субъекта. В конкретном варианте осуществления изобретение включает введение молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты или вектора, в частности лентивирусного вектора, по изобретению в клетки печени, в частности в клетки печени субъекта, подлежащего лечению, и введение указанных трансформированных клеток печени, в которые вводили нуклеиновую кислоту, субъекту. Благоприятно, этот вариант осуществления можно использовать для секреции GAA из указанных клеток. В конкретном варианте осуществления клетки печени представляют собой клетки печени от пациента, подлежащего лечению, или стволовые клетки печени, которые дополнительно трансформируют и дифференцируют in vitro в клетки печени, для последующего введения пациенту.The invention also relates to a cell, for example a liver cell, which is transformed with a nucleic acid molecule or construct according to the invention, as in the case of ex vivo gene therapy. The cells of the invention can be delivered to a subject in need, such as a GAA deficient patient, by any suitable route of administration, for example, by injection into the liver or into the blood stream of said subject. In a specific embodiment, the invention includes introducing a nucleic acid molecule, a nucleic acid construct or a vector, in particular a lentiviral vector, according to the invention into liver cells, in particular liver cells of a subject to be treated, and introducing said transformed liver cells into which the nucleic acid was introduced , subject. Advantageously, this embodiment can be used to secrete GAA from said cells. In a specific embodiment, the liver cells are liver cells from a patient to be treated or liver stem cells that are further transformed and differentiated in vitro into liver cells for subsequent administration to the patient.
Настоящее изобретение дополнительно относится к трансгенному не относящемуся к человеку животному, содержащему в своем геноме молекулу нуклеиновой кислоты или конструкцию, кодирующую полипептид GAA в соответствии с изобретением. В конкретном варианте осуществления животным является мышь.The present invention further relates to a transgenic non-human animal containing in its genome a nucleic acid molecule or construct encoding a GAA polypeptide in accordance with the invention. In a particular embodiment, the animal is a mouse.
Помимо систем специфической доставки, осуществляемых далее в примерах, известны различные системы доставки, которые можно использовать для того, чтобы вводить молекулу нуклеиновой кислоты или конструкцию по изобретению, например, инкапсулирование в липосомы, микрочастицы, микрокапсулы, рекомбинантные клетки, способные экспрессировать кодирующую последовательность по изобретению, рецептор-опосредованный эндоцитоз, конструкция терапевтической нуклеиновой кислоты в качестве части ретровирусного или другого вектора и т. д.In addition to the specific delivery systems carried out in the examples below, various delivery systems are known that can be used to introduce a nucleic acid molecule or construct according to the invention, for example, encapsulation in liposomes, microparticles, microcapsules, recombinant cells capable of expressing the coding sequence of the invention , receptor-mediated endocytosis, therapeutic nucleic acid construct as part of a retroviral or other vector, etc.
В соответствии с одним из вариантов осуществления, может быть желательно вводить полипептид GAA, молекулу нуклеиновой кислоты, конструкцию нуклеиновой кислоты или клетку по изобретению в печень субъекта посредством любого подходящего пути. Вдобавок депротеинизированную ДНК, такую как миникольца и транспозоны, можно использовать для векторов доставки или лентивирусных векторов. Дополнительно, технологии редактирования генов, такие как нуклеазы с цинковым пальцем, мегануклеазы, TALEN и CRISPR, также можно использовать для того, чтобы доставлять кодирующую последовательность по изобретению.According to one embodiment, it may be desirable to introduce a GAA polypeptide, nucleic acid molecule, nucleic acid construct, or cell of the invention into the liver of a subject via any suitable route. In addition, deproteinized DNA such as minicircles and transposons can be used for delivery or lentiviral vectors. Additionally, gene editing technologies such as zinc finger nucleases, meganucleases, TALEN and CRISPR can also be used to deliver the coding sequence of the invention.
Настоящее изобретение также относится к фармацевтическим композициям, содержащим молекулу нуклеиновой кислоты, конструкцию нуклеиновой кислоты, вектор, полипептид GAA или клетку по изобретению. Такие композиции содержат терапевтически эффективное количество терапевтического средства (молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, полипептида GAA или клетки по изобретению) и фармацевтически приемлемый носитель. В конкретном варианте осуществления термин «фармацевтически приемлемый» обозначает одобрение регулирующего органа государственного или регионального правительства или включение в фармакопею США или Европейскую фармакопею или другие общепризнанные фармакопеи для использования у животных и человека. Термин «носитель» относится к разбавителю, адъюванту, эксципиенту или носителю, с которым вводят терапевтическое средство. Такие фармацевтические носители могут представлять собой стерильные жидкости, такие как вода и масла, в том числе те, которые имеют происхождение из нефти, животных, овощей или синтеза, например, арахисовое масло, соевое масло, минеральное масло, сезамовое масло и т. п. Вода является предпочтительным носителем, когда фармацевтическую композицию вводят внутривенно. Солевые растворы и водные растворы декстрозы и глицерина также можно использовать в качестве жидких носителей, в частности, для инъецируемых растворов. Подходящие фармацевтические эксципиенты включают крахмал, глюкозу, лактозу, сахарозу, стеарат натрия, глицерина моностеарат, тальк, хлорид натрия, сухое обезжиренное молоко, глицерин, пропиленгликоль, воду, этанол и т. п.The present invention also relates to pharmaceutical compositions containing a nucleic acid molecule, a nucleic acid construct, a vector, a GAA polypeptide, or a cell of the invention. Such compositions contain a therapeutically effective amount of a therapeutic agent (nucleic acid molecule, nucleic acid construct, vector, GAA polypeptide or cell of the invention) and a pharmaceutically acceptable carrier. In a specific embodiment, the term "pharmaceutically acceptable" means approval by a state or regional government regulatory body or inclusion in the USP or European Pharmacopoeia or other generally recognized pharmacopoeias for use in animals and humans. The term "carrier" refers to a diluent, adjuvant, excipient or carrier with which a therapeutic agent is administered. Such pharmaceutical carriers may be sterile liquids such as water and oils, including those derived from petroleum, animal, vegetable, or synthetic origin, such as peanut oil, soybean oil, mineral oil, sesame oil, and the like. Water is the preferred carrier when the pharmaceutical composition is administered intravenously. Saline solutions and aqueous solutions of dextrose and glycerol can also be used as liquid carriers, in particular for injectable solutions. Suitable pharmaceutical excipients include starch, glucose, lactose, sucrose, sodium stearate, glycerol monostearate, talc, sodium chloride, skimmed milk powder, glycerin, propylene glycol, water, ethanol, and the like.
Композиция, при желании, также может содержать незначительные количества смачивающих или эмульгирующих средств или pH буферных средств. Эти композиции могут принимать форму растворов, суспензий, эмульсий, таблеток, пилюль, капсул, порошков, составов с замедленным высвобождением и т. п. Оральный состав может содержать стандартные носители, такие как маннит, лактоза, крахмал, стеарат магния, сахарин натрия, целлюлоза, карбонат магния фармацевтической степени чистоты и т. д. Примеры подходящих фармацевтических носителей описаны в «Remington's Pharmaceutical Sciences», E. W. Martin. Такие композиции должны содержать терапевтически эффективное количество терапевтического средства, предпочтительно в очищенной форме, вместе с подходящим количеством носителя с тем, чтобы предоставлять форму для надлежащего введения субъекту. В конкретном варианте осуществления нуклеиновую кислоту, вектор или клетку по изобретению формулируют в композиции, содержащей фосфатно-солевой буфер, с добавлением 0,25% сывороточного альбумина человека. В другом конкретном варианте осуществления нуклеиновую кислоту, вектор или клетку по изобретению формулируют в композиции, содержащей лактат Рингера и неионное поверхностно-активное средство, такое как pluronic F68, в конечной концентрации 0,01-0,0001%, например, в концентрации 0,001%, по массе общей композиции. Состав дополнительно может содержать сывороточный альбумин, в частности сывороточный альбумин человека, такой как сывороточный альбумин человека 0,25%. Другие подходящие составы для хранения или введения известны в данной области, в частности, из WO 2005/118792 или Allay et al., 2011.The composition, if desired, may also contain minor amounts of wetting or emulsifying agents or pH buffering agents. These compositions may take the form of solutions, suspensions, emulsions, tablets, pills, capsules, powders, sustained release formulations, and the like. The oral formulation may contain conventional carriers such as mannitol, lactose, starch, magnesium stearate, sodium saccharin, cellulose , pharmaceutical grade magnesium carbonate, etc. Examples of suitable pharmaceutical carriers are described in Remington's Pharmaceutical Sciences, E. W. Martin. Such compositions should contain a therapeutically effective amount of the therapeutic agent, preferably in purified form, together with a suitable amount of carrier so as to provide a form for appropriate administration to the subject. In a specific embodiment, the nucleic acid, vector or cell of the invention is formulated in a composition containing phosphate-buffered saline supplemented with 0.25% human serum albumin. In another specific embodiment, the nucleic acid, vector or cell of the invention is formulated in a composition containing Ringer's lactate and a non-ionic surfactant such as pluronic F68 at a final concentration of 0.01-0.0001%, for example at a concentration of 0.001% , by weight of the total composition. The composition may additionally contain serum albumin, in particular human serum albumin, such as human serum albumin 0.25%. Other suitable formulations for storage or administration are known in the art, in particular from WO 2005/118792 or Allay et al., 2011.
В предпочтительном варианте осуществления композицию формулируют в соответствии со стандартными процедурами в качестве фармацевтической композиции, адаптированной для внутривенного введения человеку. Обычно композиции для внутривенного введения представляют собой растворы в стерильном изотоническом водном буфере. При необходимости, композиция также может содержать солюбилизирующее средство и местный анестетик, такой как лигнокаин, чтобы снимать боль в месте инъекции.In a preferred embodiment, the composition is formulated according to standard procedures as a pharmaceutical composition adapted for intravenous administration to humans. Typically, compositions for intravenous administration are solutions in sterile isotonic aqueous buffer. If necessary, the composition may also contain a solubilizing agent and a local anesthetic such as lignocaine to relieve pain at the injection site.
В одном из вариантов осуществления молекулу нуклеиновой кислоты, конструкцию нуклеиновой кислоты, вектор, полипептид GAA или клетку по изобретению можно доставлять в везикуле, в частности липосоме. В еще одном другом варианте осуществления молекулу нуклеиновой кислоты, конструкцию нуклеиновой кислоты, вектор, полипептид GAA или клетку по изобретению можно доставлять в системе с контролируемым высвобождением.In one embodiment, the nucleic acid molecule, nucleic acid construct, vector, GAA polypeptide or cell of the invention can be delivered in a vesicle, in particular a liposome. In yet another embodiment, a nucleic acid molecule, nucleic acid construct, vector, GAA polypeptide, or cell of the invention can be delivered in a controlled release system.
Способы введения молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, полипептида GAA или клетки по изобретению включают, но не ограничиваясь этим, внутрикожный, внутримышечный, интраперитонеальный, внутривенный, подкожный, интраназальный, эпидуральный и оральный пути. В конкретном варианте осуществления введение происходит через внутривенный или внутримышечный путь. Молекула нуклеиновой кислоты, конструкция нуклеиновой кислоты, вектор, полипептид GAA или клетки по изобретению, в форме вектора или нет, можно вводить с помощью любого удобного пути, например, посредством инфузии или болюсной инъекции, посредством абсорбции через эпителиальные или кожно-слизистые оболочки (например, слизистую оболочку полости рта, слизистую оболочку прямой кишки и кишечника и т. д.), и можно вводить вместе с другими биологически активными средствами. Введение может быть системным или местным.Methods for administering a nucleic acid molecule, nucleic acid construct, vector, GAA polypeptide, or cell of the invention include, but are not limited to, intradermal, intramuscular, intraperitoneal, intravenous, subcutaneous, intranasal, epidural, and oral routes. In a specific embodiment, administration is via the intravenous or intramuscular route. The nucleic acid molecule, nucleic acid construct, vector, GAA polypeptide, or cells of the invention, whether in vector form or not, may be administered by any convenient route, e.g., by infusion or bolus injection, by absorption through epithelial or mucocutaneous membranes (e.g., , oral mucosa, rectal and intestinal mucosa, etc.), and can be administered together with other biologically active agents. The introduction can be systemic or local.
В конкретном варианте осуществления может быть желательно вводить фармацевтические композиции по изобретению локально в области, нуждающейся в лечении, например, печени. Этого можно достигать, например, посредством имплантата, указанный имплантат из пористого, непористого или гелеобразного материала, в том числе мембран, таких как мембраны «sialastic», или волокон.In a particular embodiment, it may be desirable to administer the pharmaceutical compositions of the invention locally to the area in need of treatment, such as the liver. This can be achieved, for example, by means of an implant, said implant of a porous, non-porous or gel-like material, including membranes such as "sialastic" membranes or fibers.
Количество терапевтического средства (т. е. молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, полипептида GAA или клетки по изобретению) по изобретению, которое будет эффективным при лечении болезни накопления гликогена, можно определять с помощью стандартных клинических приемов. Кроме того, анализы in vivo и/или in vitro необязательно можно использовать для того, чтобы помогать предсказывать оптимальные диапазоны доз. Точная доза, используемая в составе, также зависит от пути введения и тяжести заболевания, и ее следует выбирать в соответствии с суждением практикующего специалиста и обстоятельствами каждого пациента. Доза молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, полипептида GAA или клетки по изобретению, вводимых субъекту, нуждающемуся в этом, варьирует в зависимости от нескольких факторов, включая, без ограничения, путь введения, конкретное заболевание, которое лечат, возраст субъекта или уровень экспрессии, необходимый для достижения терапевтического эффекта. Специалист в данной области может легко определять, на основе своих знаний в этой области, необходимый диапазон доз на основе этих и других факторов. В случае лечения, включающего введение вирусного вектора, такого как AAV вектор, субъекту, типичные дозы вектор составляют по меньшей мере 1×108 векторных геномов на килограмм массы тела (вг/кг), например, по меньшей мере 1×109 вг/кг, по меньшей мере 1×1010 вг/кг, по меньшей мере 1×1011 вг/кг, по меньшей мере 1×1012 вг/кг по меньшей мере 1×1013 вг/кг или по меньшей мере 1×1014 вг/кг.The amount of a therapeutic agent (i.e., nucleic acid molecule, nucleic acid construct, vector, GAA polypeptide, or cell of the invention) of the invention that will be effective in treating glycogen storage disease can be determined using standard clinical procedures. Additionally, in vivo and/or in vitro assays may optionally be used to help predict optimal dosage ranges. The precise dosage used in the formulation also depends on the route of administration and the severity of the disease, and should be selected according to the judgment of the practitioner and the circumstances of each patient. The dosage of a nucleic acid molecule, nucleic acid construct, vector, GAA polypeptide, or cell of the invention administered to a subject in need thereof will vary depending on several factors, including, but not limited to, the route of administration, the particular disease being treated, the age of the subject, or the level expression necessary to achieve a therapeutic effect. The person skilled in the art can readily determine, based on his knowledge of the art, the required dosage range based on these and other factors. In the case of treatment involving the introduction of a viral vector, such as an AAV vector, to a subject, typical doses of the vector are at least 1×10 8 vector genomes per kilogram of body weight (wg/kg), for example, at least 1×10 9 vg/ kg, at least 1×10 10 vg/kg, at least 1×10 11 vg/kg, at least 1×10 12 vg/kg at least 1×10 13 vg/kg or at least 1× 10 14 vg/kg.
Изобретение также относится к способу лечения болезни накопления гликогена, который включает стадию доставки терапевтически эффективного количества нуклеиновой кислоты, вектора, полипептида GAA, фармацевтической композиции или клетки по изобретению нуждающемуся в этом субъекту.The invention also relates to a method for treating glycogen storage disease which comprises the step of delivering a therapeutically effective amount of a nucleic acid, vector, GAA polypeptide, pharmaceutical composition or cell of the invention to a subject in need thereof.
Изобретение также относится к способу лечения болезни накопления гликогена, указанный способ не индуцирует иммунный ответ на трансген (т. е. на полипептид GAA по изобретению) или индуцирует сниженный иммунный ответ на трансген, который включает стадию доставки терапевтически эффективного количества молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, фармацевтической композиции или клетки по изобретению нуждающемуся в этом субъекту. Изобретение также относится к способу лечения болезни накопления гликогена, указанный способ включает повторное введение терапевтически эффективного количества молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, фармацевтической композиции или клетки по изобретению нуждающемуся в этом субъекту. В этом аспекте, молекула нуклеиновой кислоты или конструкция нуклеиновой кислоты по изобретению содержит промотор, который функционален в клетках печени, тем самым делая возможной иммунологическую толерантность к экспрессируемому полипептиду GAA, продуцируемому ими. Также в этом аспекте фармацевтическая композиция, используемая в этом аспекте, содержит молекулу нуклеиновой кислоты или конструкцию нуклеиновой кислоты, содержащую промотор, который функционален в клетках печени. В случае доставки клеток печени, указанные клетки могут представлять собой клетки, предварительно взятые у субъекта, нуждающегося в лечении, и сконструированные посредством введения в них молекулы нуклеиновой кислоты или конструкции нуклеиновой кислоты по изобретению, чтобы тем самым делать их способными продуцировать полипептид GAA по изобретению. В соответствии с одним из вариантов осуществления, в аспекте, включающем повторное введение, указанное введение можно повторять по меньшей мере один раз или больше, и даже можно рассматривать его выполнение в соответствии с периодической схемой, например, раз в неделю, в месяц или в год. Периодическая схема также может включать введение один раз каждые 2, 3, 4, 5, 6, 7, 8, 9 или 10 лет или больше чем 10 лет. В другом конкретном варианте осуществления введение каждого введения вирусного вектора по изобретению выполняют с использованием отличающегося вируса для каждого последующего введения, тем самым избегая снижения эффекта по причине возможного иммунного ответа на ранее введенный вирусный вектор. Например, можно осуществлять первое введение вирусного вектора, содержащего капсид AAV8, после чего следует введение вектора, содержащего AAV9 капсид, или даже введение вируса, не родственного с AAV, такого как ретровирусный или лентивирусный вектор.The invention also relates to a method for treating glycogen storage disease, said method does not induce an immune response to a transgene (i.e., to a GAA polypeptide of the invention) or induces a reduced immune response to the transgene, which includes the step of delivering a therapeutically effective amount of a nucleic acid molecule, a nucleic acid construct acid, vector, pharmaceutical composition or cell of the invention to a subject in need. The invention also relates to a method for treating glycogen storage disease, said method comprising re-administering a therapeutically effective amount of a nucleic acid molecule, nucleic acid construct, vector, pharmaceutical composition or cell of the invention to a subject in need thereof. In this aspect, the nucleic acid molecule or nucleic acid construct of the invention contains a promoter that is functional in liver cells, thereby allowing immunological tolerance to an expressed GAA polypeptide produced by them. Also in this aspect, the pharmaceutical composition used in this aspect contains a nucleic acid molecule or a nucleic acid construct containing a promoter that is functional in liver cells. In the case of delivery of liver cells, said cells may be cells previously taken from a subject in need of treatment and constructed by introducing into them the nucleic acid molecule or nucleic acid construct of the invention, thereby making them capable of producing the GAA polypeptide of the invention. According to one embodiment, in an aspect involving repeated administration, said administration may be repeated at least once or more, and may even be considered to be performed according to a periodic pattern, such as once a week, a month, or a year. . The periodic schedule may also include administration once every 2, 3, 4, 5, 6, 7, 8, 9 or 10 years or more than 10 years. In another specific embodiment, the introduction of each introduction of the viral vector of the invention is performed using a different virus for each subsequent introduction, thereby avoiding a decrease in effect due to a possible immune response to the previously introduced viral vector. For example, a first introduction of a viral vector containing an AAV8 capsid may be carried out, followed by the introduction of a vector containing an AAV9 capsid, or even the introduction of a non-AAV related virus such as a retroviral or lentiviral vector.
В соответствии с настоящим изобретением, лечение может включать излечивающие, облегчающие или профилактические эффекты. Соответственно, терапевтическое и профилактическое лечение включает улучшение симптомов конкретной болезни накопления гликогена или предотвращение или иное снижение риска развития конкретной болезни накопления гликогена. Термин «профилактическое» можно рассматривать в качестве снижения тяжести или начала конкретного состояния. «Профилактическое» также включает предотвращение повторения конкретного состояния у пациента, у которого предварительно диагностировали состояние. «Терапевтическое» также может снижать тяжесть существующего состояния. Термин «лечение» используют в настоящем описании для обозначения любой схемы, которая может принести пользу животному, в частности млекопитающему, более конкретно человеческому субъекту.In accordance with the present invention, the treatment may include curative, alleviating or prophylactic effects. Accordingly, therapeutic and prophylactic treatment includes improving the symptoms of a particular glycogen storage disease or preventing or otherwise reducing the risk of developing a particular glycogen storage disease. The term "prophylactic" can be thought of as reducing the severity or onset of a particular condition. "Prophylactic" also includes preventing a recurrence of a particular condition in a patient previously diagnosed with the condition. "Therapeutic" can also reduce the severity of an existing condition. The term "treatment" is used herein to refer to any regimen that can benefit an animal, in particular a mammal, more specifically a human subject.
Изобретение также относится к способу генной терапии ex vivo для лечения болезни накопления гликогена, который включает введение молекулы нуклеиновой кислоты или конструкции нуклеиновой кислоты по изобретению в выделенную клетку пациента, нуждающегося в этом, например, выделенную гематопоэтическую стволовую клетку, и введение указанной клетки указанному пациенту, нуждающемуся в этом. В конкретном варианте осуществления по этому аспекту, молекулу нуклеиновой кислоты или конструкцию вводят в клетку с использованием вектора, как определено выше. В конкретном варианте осуществления вектор представляет собой интегрирующий вирусный вектор. В дополнительном конкретном варианте осуществления вирусный вектор представляет собой ретровирусный вектор, такой как лентивирусный вектор. Например, лентивирусный вектор, как раскрыто в van Til et al., 2010, Blood, 115(26), стр. 5329, можно использовать при практической реализации способа по настоящему изобретению.The invention also relates to an ex vivo gene therapy method for treating glycogen storage disease, which comprises introducing a nucleic acid molecule or nucleic acid construct of the invention into an isolated cell of a patient in need thereof, such as an isolated hematopoietic stem cell, and administering said cell to said patient, in need of it. In a specific embodiment of this aspect, the nucleic acid molecule or construct is introduced into a cell using a vector as defined above. In a specific embodiment, the vector is an integrating viral vector. In a further specific embodiment, the viral vector is a retroviral vector, such as a lentiviral vector. For example, a lentiviral vector, as disclosed in van Til et al., 2010, Blood, 115(26), page 5329, can be used in the practice of the method of the present invention.
Изобретение также относится к молекуле нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектору, полипептиду GAA или клетке по изобретению для применения в качестве лекарственного средства.The invention also relates to a nucleic acid molecule, nucleic acid construct, vector, GAA polypeptide or cell of the invention for use as a drug.
Изобретение также относится к молекуле нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектору, полипептиду GAA или клетке по изобретению для использования в способе лечения заболевания, обусловленного мутацией в гене GAA, в частности, в способе лечения болезнь Помпе. Изобретение дополнительно относится к молекуле нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектору, полипептиду GAA или клетке по изобретению для использования в способе лечения болезни накопления гликогена, такой как GSDI (болезнь Гирке), GSDII (болезнь Помпе), GSDIII (болезнь Кори), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII и летальная врожденная болезнь накопления гликогена в сердце, более конкретно GSDI, GSDII или GSDIII, даже более конкретно GSDII и GSDIII и наиболее конкретно GSDII. Усеченный полипептид GAA по изобретению можно вводить нуждающемуся в этом пациенту для использования в ферментозаместительной терапии (ERT), например, для использования в ферментозаместительной терапии болезни накопления гликогена, такой как GSDI (болезнь Гирке), GSDII (болезнь Помпе), GSDIII (болезнь Кори), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII и летальная врожденная болезнь накопления гликогена в сердце, более конкретно GSDI, GSDII или GSDIII, даже более конкретно GSDII и GSDIII и наиболее конкретно GSDII.The invention also relates to a nucleic acid molecule, nucleic acid construct, vector, GAA polypeptide or cell of the invention for use in a method for treating a disease caused by a mutation in the GAA gene, in particular a method for treating Pompe disease. The invention further relates to a nucleic acid molecule, nucleic acid construct, vector, GAA polypeptide or cell of the invention for use in a method of treating a glycogen storage disease such as GSDI (Girke's disease), GSDII (Pompe's disease), GSDIII (Corey's disease), GSDIV , GSDV, GSDVI, GSDVII, GSDVIII and lethal congenital heart glycogen storage disease, more specifically GSDI, GSDII or GSDIII, even more specifically GSDII and GSDIII and most specifically GSDII. A truncated GAA polypeptide of the invention can be administered to a patient in need thereof for use in enzyme replacement therapy (ERT), e.g. for use in enzyme replacement therapy for glycogen storage disease such as GSDI (Girke's disease), GSDII (Pompe disease), GSDIII (Measles disease) , GSDIV, GSDV, GSDVI, GSDVII, GSDVIII and lethal congenital heart glycogen storage disease, more specifically GSDI, GSDII or GSDIII, even more specifically GSDII and GSDIII and most specifically GSDII.
Изобретение дополнительно относится к использованию молекулы нуклеиновой кислоты, конструкции нуклеиновой кислоты, вектора, полипептида GAA или клетки по изобретению при изготовлении лекарственного средства, эффективного для лечения болезни накопления гликогена, такой как GSDI (болезнь Гирке), GSDII (болезнь Помпе), GSDIII (болезнь Кори), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII и летальная врожденная болезнь накопления гликогена в сердце, более конкретно GSDI, GSDII или GSDIII, даже более конкретно GSDII и GSDIII и наиболее конкретно GSDII.The invention further relates to the use of a nucleic acid molecule, a nucleic acid construct, a vector, a GAA polypeptide, or a cell of the invention in the manufacture of a medicament effective for the treatment of a glycogen storage disease such as GSDI (Girke's disease), GSDII (Pompe disease), GSDIII (Pompe disease). Corey), GSDIV, GSDV, GSDVI, GSDVII, GSDVIII and lethal congenital heart glycogen storage disease, more specifically GSDI, GSDII or GSDIII, even more specifically GSDII and GSDIII and most specifically GSDII.
ПРИМЕРЫEXAMPLES
Изобретение дополнительно описано подробно со ссылкой на следующие экспериментальные примеры и приложенные фиг. Эти примеры приведены лишь в иллюстративных целях и не предназначены в качестве ограничения.The invention is further described in detail with reference to the following Experimental Examples and the attached FIGS. These examples are provided for illustrative purposes only and are not intended to be limiting.
МАТЕРИАЛЫ И СПОСОБЫMATERIALS AND METHODS
Активность GAAGAA Activity
Активность GAA измеряли после гомогенизации замороженных образцов тканей в дистиллированной воде. 50-100 мг ткани взвешивали и гомогенизировали, затем центрифугировали в течение 20 минут на 10000×g. Реакцию проводили с использованием 10 мкл супернатанта и 20 мкл субстрата - 4MUα-D-глюкозида, в 96-луночном планшете. Реакционную смесь инкубировали при 37°C в течение одного часа и затем останавливали добавлением 150 мкл буфера с карбонатом натрия pH 10,5. Калибровочную кривую (4MU 0-2500 пмоль/мкл) использовали для того, чтобы измерять высвобождаемый флуоресцентный 4MU из индивидуальной реакционной смеси, используя считыватель планшетов EnSpire α (Perkin-Elmer) на 449 нм (испускание) и 360 нм (возбуждение). Концентрацию белка осветленного супернатанта количественно определяли с помощью BCA (Thermo Fisher Scientific). Для того чтобы вычислять активность GAA, концентрацию высвобождаемого 4MU делили на концентрацию белка в образце и активность приводили в виде нмоль/час/мг белка.GAA activity was measured after homogenization of frozen tissue samples in distilled water. 50-100 mg tissue was weighed and homogenized, then centrifuged for 20 minutes at 10000×g. The reaction was carried out using 10 μl of the supernatant and 20 μl of the substrate - 4MUα-D-glucoside, in a 96-well plate. The reaction mixture was incubated at 37°C for one hour and then stopped by adding 150 μl of buffer with sodium carbonate pH 10.5. A calibration curve (4MU 0-2500 pmol/µl) was used to measure the fluorescent 4MU released from the individual reaction mixture using an EnSpire α plate reader (Perkin-Elmer) at 449 nm (emission) and 360 nm (excitation). The protein concentration of the clarified supernatant was quantified using BCA (Thermo Fisher Scientific). In order to calculate GAA activity, the concentration of 4MU released was divided by the protein concentration in the sample and the activity was reported as nmol/h/mg of protein.
Исследования мышейMouse studies
GAA-/- мышь создавали посредством направленного разрушения экзона 6 и поддерживали на фоне C57BL/6J/129X1/SvJ (Raben N. et al 1998). Векторы доставляли через хвостовую вену в объеме 0,2 мл. Образцы сыворотки брали ежемесячно для того, чтобы осуществлять мониторинг уровней секретируемой hGAA. Пораженных животных, которым инъецировали PBS, и однопометников дикого типа использовали в качестве контролей.A GAA-/- mouse was created by targeted disruption of
Исследование NHPNHP study
Самцов яванских макаков содержали в клетках из нержавеющей стали и с поддержанием 12-часового цикла свет/темнота. Все макаки имели титры нейтрализующих антител < 1:5 перед началом исследования дозу 2E12 вг/кг AAV8-hAAT-sp7-Δ8-hGAAco1 инфузировали через подкожную вену. Образцы крови брали за 12 суток до и через 30 суток после инъекции через бедренную вену. Цельную кровь собрали в содержащие EDTA пробирки и центрифугировали для того, чтобы отделять сыворотку. Через 3 месяца после введения вектора всех макаков умерщвляли. Животных сначала анестезировали смесью кетамина/дексмедетомидина и затем эвтаназировали с использованием IV инъекции пентобарбитала натрия. Ткани собирали непосредственно и замораживали в жидком азоте.Male cynomolgus monkeys were kept in stainless steel cages and maintained on a 12 hour light/dark cycle. All macaques had neutralizing antibody titers < 1:5 before the start of the study, a dose of 2E12 vg/kg AAV8-hAAT-sp7-Δ8-hGAAco1 was infused via the saphenous vein. Blood samples were taken 12 days before and 30 days after injection via the femoral vein. Whole blood was collected into tubes containing EDTA and centrifuged to separate serum. 3 months after the introduction of the vector, all macaques were sacrificed. Animals were first anesthetized with a mixture of ketamine/dexmedetomidine and then euthanized using an IV injection of sodium pentobarbital. Tissues were harvested directly and frozen in liquid nitrogen.
Анализ вестерн-блоттингаWestern blot analysis
Получали полные гомогенаты замороженных мышц. Концентрацию белка определяли в экстрактах с помощью Pierce BCA Protein Assay (Thermo Fisher Scientific), придерживаясь инструкций производителя. Вестерн-блоттинг осуществляли с использованием антитела против hGAA (Abcam). Антитело против тубулина (Sigma Aldrich) использовали в качестве контроля загрузки.Complete homogenates of frozen muscles were obtained. Protein concentration was determined in the extracts using the Pierce BCA Protein Assay (Thermo Fisher Scientific) following the manufacturer's instructions. Western blotting was performed using an anti-hGAA antibody (Abcam). An anti-tubulin antibody (Sigma Aldrich) was used as a loading control.
РЕЗУЛЬТАТЫRESULTS
С целью разработки новых форм GAA с усовершенствованной секрецией и сниженной иммуногенностью, авторы изобретения решали получать усеченные формы GAA, необязательно комбинируя их с альтернативными сигнальными пептидами.In order to develop new forms of GAA with improved secretion and reduced immunogenicity, the inventors decided to obtain truncated forms of GAA, optionally combining them with alternative signal peptides.
GAA человека, приведенная в SEQ ID NO: 2, служила в качестве основы для разработки этих новых форм. SEQ ID NO: 1 соответствует последовательности из SEQ ID NO: 2, свободной от соответствующего природного сигнального пептида GAA (аминокислоты 1-27 из SEQ ID NO: 2). Конструкции нуклеиновой кислоты разрабатывали для того, чтобы кодировать полипептиды GAA, происходящие из SEQ ID NO: 1, усеченные по их N-концу. Авторы изобретения начинали с разработки последовательности нуклеиновой кислоты на основе кодирующей последовательности hGAA дикого типа (SEQ ID NO: 9, соответствующая нуклеотидам 82-2859 из SEQ ID NO: 8, которая представляет собой кодирующую последовательность hGAA дикого типа, содержащую кодирующую последовательность сигнального пептида) с делецией кодонов, соответствующих первым 8 аминокислотам из SEQ ID NO: 1 (Δ8). В дополнение к кодирующей последовательности hGAA дикого типа, авторы изобретения разрабатывали оптимизированную последовательность нуклеиновой кислоты, кодирующую Δ8 усеченный полипептид hGAA (SEQ ID NO: 10 и SEQ ID NO: 11 соответствуют оптимизированной кодирующей последовательности hGAAco1 и hGAAco2, соответственно), чтобы исключать возможный эффект конкретной последовательности. The human GAA shown in SEQ ID NO: 2 served as the basis for the development of these new forms. SEQ ID NO: 1 corresponds to the sequence from SEQ ID NO: 2 free of the corresponding natural GAA signal peptide (amino acids 1-27 from SEQ ID NO: 2). Nucleic acid constructs were designed to encode GAA polypeptides derived from SEQ ID NO: 1 truncated at their N-terminus. The inventors started by designing a nucleic acid sequence based on the wild-type hGAA coding sequence (SEQ ID NO: 9, corresponding to nucleotides 82-2859 of SEQ ID NO: 8, which is the wild-type hGAA coding sequence containing the signal peptide coding sequence) with deletion of codons corresponding to the first 8 amino acids of SEQ ID NO: 1 (Δ8). In addition to the wild-type hGAA coding sequence, the inventors designed an optimized nucleic acid sequence encoding the Δ8 truncated hGAA polypeptide (SEQ ID NO: 10 and SEQ ID NO: 11 correspond to the optimized hGAAco1 and hGAAco2 coding sequence, respectively) to eliminate the possible effect of a specific sequences.
Таблица 1. Описание оптимизированных последовательностей. В таблице приведены характеристики двух оптимизированных последовательностей hGAA по сравнению с последовательностью дикого типа. a) коэффициент адаптации кодонов и b) содержание GC вычисляли с использованием инструмента анализа редких кодонов (http://www.genscript.com). c) и d) соответственно представляют собой альтернативные открытые рамки считывания, вычисленные на 5'-3' (aORF 5'→3') и 3'-5' (aORF 3'→5') нитях. e) и f) соответственно представляют собой участки акцепторов (SA) и доноров (SD) сплайсинга, вычисленные с использованием онлайн-инструмента предсказания участков сплайсинга (http://www.fruitfly.org/seq_tools/splice.html). g) и h) соответственно представляют собой процент идентичности, вычисляемый в сравнении с последовательностью дикого типа (wt) и оптимизированной последовательностью co1. i) островки CpG вычисляли с использованием онлайн-инструмента MethDB (http://www.methdb.de/links.html). Островки CpG представляют собой последовательности длиннее 100 п. о., с содержанием GC > 60% и соотношением наблюдаемые/ожидаемые > 0,6.Table 1. Description of optimized sequences. The table shows the performance of the two optimized hGAA sequences compared to the wild-type sequence. a) codon adaptation coefficient; and b) GC content was calculated using a rare codon analysis tool (http://www.genscript.com). c) and d) respectively represent alternative open reading frames calculated on 5'-3' (aORF 5'→3') and 3'-5' (aORF 3'→5') strands. e) and f) respectively are the splicing acceptor (SA) and donor (SD) regions calculated using the online splicing site prediction tool (http://www.fruitfly.org/seq_tools/splice.html). g) and h) respectively represent the percent identity calculated in comparison with the sequence of the wild type (wt) and optimized sequence co1. i) CpG islands were calculated using the MethDB online tool (http://www.methdb.de/links.html). CpG islands are sequences longer than 100 bp, with a GC content of >60% and an observed/expected ratio of >0.6.
Аминокислоты 1-27 из последовательностей hGAA (соответствующие природному сигнальному пептиду hGAA, здесь определены как sp1; их последовательность приведена в SEQ ID NO: 4) заменяли на аминокислоты 1-24 из последовательности α-1-антитрипсина человека (NP_000286.3), здесь определяемую как sp2 (последовательность приведена в SEQ ID NO: 5). Авторы изобретения трансфицировали клетки гепатомы человека (Huh-7) кодирующими усеченную hGAA конструкциями параллельно с их полноразмерными версиями, и авторы изобретения измеряли количество hGAA, высвобождаемой в среду, через 48 часов фиг. 1A). Делеция Δ8 в последовательностях hGAA вела к значимому, 50% увеличению уровня секреции, как для последовательности дикого типа (hGAA), так и для последовательности с оптимизированными кодонами (hGAAco2). То же усечение, выполняемое на другой последовательности с оптимизированными кодонами (hGAAco1), также усовершенствовало секрецию hGAA в той же степени.Amino acids 1-27 from the hGAA sequences (corresponding to the natural hGAA signal peptide, here defined as sp1; their sequence is given in SEQ ID NO: 4) were replaced with amino acids 1-24 from the sequence of human α-1-antitrypsin (NP_000286.3), here defined as sp2 (the sequence is given in SEQ ID NO: 5). The inventors transfected human hepatoma (Huh-7) cells with truncated hGAA-encoding constructs in parallel with their full-length versions, and the inventors measured the amount of hGAA released into the medium after 48 hours of FIG. 1A). Deletion of Δ8 in the hGAA sequences resulted in a significant 50% increase in secretion levels for both the wild-type (hGAA) and codon-optimized (hGAAco2) sequences. The same truncation performed on another codon-optimized sequence (hGAAco1) also improved hGAA secretion to the same extent.
Для того чтобы подтверждать, что изменение в последовательности следующего сигнального пептида может усовершенствовать секрецию hGAA, авторы изобретения дополнительно усекали полипептид hGAA. Авторы изобретения устраняли кодоны, соответствующие первым 42 аминокислотам hGAA, из конструкции hGAAco1 (Δ42), и авторы изобретения заменяли их на сигнальный пептид, происходящий из химотрипсиногена B1 (sp7; последовательность приведена в SEQ ID NO: 3). Затем авторы изобретения сравнивали эффект секреции, получаемый с использованием этой новой конструкции с делецией, с ее Δ8 версией, слитой с сигнальным пептидом sp7 и полноразмерной hGAAco1 с sp1 или с sp7. Авторы изобретения трансфицировали клетки Huh-7 этим конструкциями, и авторы изобретения измеряли активность hGAA в среде через 48 часов. Как ожидали, авторы изобретения могли измерять активность hGAA после трансфекции полноразмерной hGAAco1 (p=0,055 в сравнении с GFP), и ее секреция двукратно возрастала при замене сигнального пептида дикого типа на sp7 (p=0,006 в сравнении с hGAAco1). К удивлению, обе последовательности Δ8 и Δ42 hGAA, слитые с сигнальным пептидом sp7, демонстрировали двукратное увеличение секретируемой hGAA по сравнению с полноразмерной последовательностью (p=0,0002 и 0,0003, соответственно, в сравнении с sp7-hGAAco1, фиг. 1B).In order to confirm that a change in the sequence of the following signal peptide can improve hGAA secretion, the inventors further truncated the hGAA polypeptide. The inventors removed the codons corresponding to the first 42 amino acids of hGAA from the hGAAco1 construct (Δ42) and the inventors replaced them with a signal peptide derived from chymotrypsinogen B1 (sp7; the sequence is given in SEQ ID NO: 3). The inventors then compared the secretion effect obtained using this new deletion construct with its Δ8 version fused to the sp7 signal peptide and full-length hGAAco1 to either sp1 or sp7. The inventors transfected Huh-7 cells with these constructs and the inventors measured the hGAA activity in the medium after 48 hours. As expected, the inventors could measure hGAA activity after transfection with full-length hGAAco1 (p=0.055 vs. GFP) and its secretion increased two-fold when the wild-type signal peptide was replaced by sp7 (p=0.006 vs. hGAAco1). Surprisingly, both Δ8 and Δ42 hGAA sequences fused to the sp7 signal peptide showed a 2-fold increase in secreted hGAA compared to the full-length sequence (p=0.0002 and 0.0003, respectively, compared to sp7-hGAAco1, Fig. 1B) .
В совокупности, эти данные демонстрируют, что усечение последовательности hGAA, соединенной с эффективным сигнальным пептидом, позволяет увеличивать секрецию белка in vitro. Дополнительно, усечение имеет одно важное преимущество по сравнению с мутагенезом нативной последовательности, поскольку при нем не возникают основные неоантигены, что является преимуществом при конструировании терапевтического продукта.Taken together, these data demonstrate that truncation of the hGAA sequence coupled to an effective signal peptide allows increased protein secretion in vitro. Additionally, truncation has one important advantage over native sequence mutagenesis in that it does not generate major neoantigens, which is an advantage in therapeutic product design.
Затем авторы изобретения верифицировали эти находки in vivo, в модели болезни Помпе на мышах. Авторы изобретения инъецировали GAA-/- мышам (Raben et al J. Bio. Chem. 1998) AAV8 векторы, экспрессирующие полноразмерную hGAAco1, Δ8 или Δ42, слитую с сигнальным пептидом sp7 под транскрипционным управлением высоко активного специфического промотора печени, полученного слиянием энхансера аполипопротеин B и промотора α-1-антитрипсина человека (hAAT). Через один месяц после инъекции 2E12 вг/кг векторов, описанных выше, у мышей брали кров и измеряли активность hGAA в сыворотке. Лечение мышей векторами, экспрессирующими полноразмерную hGAAco1, слитую с sp7, показывало повышенный уровень hGAA в кровотоке (p=0,115 в сравнении с PBS). К удивлению, обе усеченные hGAA, Δ8 и Δ42, вели к значимому увеличению уровня hGAA в сыворотке (p=0,014 и 0,013, соответственно).The inventors then verified these findings in vivo, in a mouse model of Pompe disease. The inventors injected GAA-/- mice (Raben et al J. Bio. Chem. 1998) with AAV8 vectors expressing full-length hGAAco1, Δ8 or Δ42 fused to the sp7 signal peptide under transcriptional control of a highly active liver-specific promoter derived from the fusion of the apolipoprotein B enhancer and the human α-1-antitrypsin (hAAT) promoter. One month after injection of 2E12 vg/kg of the vectors described above, mice were bled and serum hGAA activity was measured. Treatment of mice with vectors expressing full length hGAAco1 fused to sp7 showed elevated circulating levels of hGAA (p=0.115 vs. PBS). Surprisingly, both truncated hGAA, Δ8 and Δ42, led to a significant increase in serum hGAA levels (p=0.014 and 0.013, respectively).
Эти данные показывают, что делеция первых аминокислот hGAA вела к значимому усовершенствованию уровня hGAA, секретируемой в кровоток.These data show that the deletion of the first amino acids of hGAA led to a significant improvement in the level of hGAA secreted into the bloodstream.
Кроме того, другой сигнальный пептид сливали с Δ8 усеченной формой hGAA, соответствующий аминокислотам 1-25, из идуронат-2-сульфатазы (sp6; SEQ ID NO: 6). Авторы изобретения трансфицировали клетки гепатомы (Huh-7) плазмидами, экспрессирующими GFP или hGAA дикого типа (hGAA; родительский полипептид, соответствующий аминокислотным остаткам 28-952 из SEQ ID NO: 30), параллельно с плазмидами, экспрессирующими оптимизированную hGAA (hGAAco1), слитую с sp1, sp2, sp6, sp7 или sp8. Через 48 часов после трансфекции, среду для выращивания анализировали на присутствие hGAA. Следует отметить, что эти конструкции вели к значительно более высоким уровням секреции hGAA, чем то, то наблюдали в отрицательном контроле, представленном GFP-трансфицированными клетками (фиг. 3).In addition, another signal peptide was fused to the Δ8 truncated form of hGAA corresponding to amino acids 1-25 from iduronate-2-sulfatase (sp6; SEQ ID NO: 6). The inventors transfected hepatoma (Huh-7) cells with plasmids expressing GFP or wild-type hGAA (hGAA; parental polypeptide corresponding to amino acid residues 28-952 of SEQ ID NO: 30) in parallel with plasmids expressing optimized hGAA (hGAAco1) fused with sp1, sp2, sp6, sp7 or sp8. 48 hours after transfection, the growth medium was analyzed for the presence of hGAA. Of note, these constructs resulted in significantly higher levels of hGAA secretion than were observed in the negative control represented by GFP-transfected cells (FIG. 3).
Затем авторы изобретения оценивали содержание гликогена в сердце, диафрагме и квадрицепсе GAA-/- мышей, которых лечили, как описано выше, с использованием Δ8-hGAA. Следует отметить, что авторы изобретения наблюдали высокие уровни hGAA в тканях после лечения с использованием экспрессирующих Δ8-hGAAco векторов (данные не представлены), которые коррелировали со значимым снижением содержания гликогена во всех рассматриваемых тканях (фиг. 4B-D). В частности, в сердце (фиг. 4B) уровень гликогена, измеряемый после лечения векторами, несущими высоко эффективные сигнальные пептиды sp7 и 8, неотличим от того, который наблюдали у не пораженных животных (p=0,983 и 0,996 в сравнении с WT, соответственно). Важно, что уровень, наблюдаемый после лечения с использованием векторов sp7 и sp8, значительно снижался по сравнению с GAA-/- животными, которые получали инъекции PBS или лечение вектором, экспрессирующим hGAAco, слитую с сигнальным пептидом sp1.The inventors then assessed the glycogen content in the heart, diaphragm and quadriceps of GAA-/- mice treated as described above with Δ8-hGAA. Of note, the inventors observed high levels of hGAA in tissues following treatment with Δ8-hGAAco expression vectors (data not shown), which correlated with a significant decrease in glycogen content in all tissues considered (Fig. 4B-D). In particular, in the heart (Fig. 4B), the glycogen level measured after treatment with vectors carrying the highly effective signal peptides sp7 and 8 was indistinguishable from that observed in unaffected animals (p=0.983 and 0.996 compared to WT, respectively) . Importantly, the level observed after treatment with the sp7 and sp8 vectors was significantly reduced compared to GAA-/- animals that received PBS injections or treatment with a vector expressing hGAAco fused to the sp1 signal peptide.
Авторы изобретения также тестировали, индуцировала ли трансдукция печени с использованием векторов авторов изобретения гуморальный ответ на трансген. Мышам внутривенно инъецировали AAV8 векторы, экспрессирующие hGAAco1 с нативным сигнальным пептидом sp1 (co) или Δ8-hGAAco1, слитую с sp2, sp7 или sp8, под транскрипционным управлением специфического промотора печени. Результаты представлены на фиг. 5. Gaa-/- получали внутримышечную инъекцию AAV, экспрессирующего Δ8-hGAAco1 под транскрипционным управлением конститутивного промотора, который демонстрировал очень высокий уровень общего IgG (~150 мкг/мл), тогда как в целом вектор, экспрессирующий тот же белок в печени, демонстрировал более низкий уровень гуморального ответа. Интересно, что мыши, которым инъецировали экспрессирующий sp1 hGAAco1 (co) вектор, демонстрировали поддающийся обнаружению уровень антител при обеих дозах, тогда как мыши, которым инъецировали сконструированные векторы высокой секреции, имели неподдающиеся обнаружению уровни IgG. Эти данные показывают, что экспрессия трансгена в печени является необходимой для индукции периферической толерантности, также они предоставляют указания на то, что высокие уровни циркулирующей hGAA, которых достигали посредством слияния с эффективным сигнальным пептидом, индуцируют снижение гуморального ответа на сам белок.The inventors also tested whether liver transduction using the vectors of the inventors induced a humoral response to the transgene. Mice were intravenously injected with AAV8 vectors expressing hGAAco1 with native signal peptide sp1 (co) or Δ8-hGAAco1 fused to sp2, sp7 or sp8 under the transcriptional control of a specific liver promoter. The results are shown in FIG. 5. Gaa-/- received an intramuscular injection of AAV expressing Δ8-hGAAco1 under the transcriptional control of a constitutive promoter, which showed a very high level of total IgG (~150 μg/ml), while in general the vector expressing the same protein in the liver showed lower humoral response. Interestingly, mice injected with the hGAAco1 (co) sp1 expression vector exhibited detectable levels of antibodies at both doses, while mice injected with high secretion engineered vectors had undetectable IgG levels. These data indicate that hepatic expression of the transgene is necessary to induce peripheral tolerance, and they also provide indications that high circulating hGAA levels, achieved through fusion with an effective signal peptide, induce a reduction in the humoral response to the protein itself.
Наиболее действенный вектор, выбранный в исследовании на мышах, инъецировали двум не являющимся человеком приматам (NHP, Macaca fascicularis sp.) для того, чтобы верифицировать эффект секреции вектора авторов изобретения и захват в мышцах. Авторы изобретения инъецировали двум обезьянам 2E12 вг/кг AAV8-hAAT-sp7-Δ8-hGAAco1. Через один месяц после инъекции авторы изобретения измеряли уровни hGAA в сыворотке двух животных посредством вестерн-блоттинга с использованием специфического антитела против hGAA. У двух обезьян авторы изобретения наблюдали четкую полосу с размером, совместимым с таковым у hGAA. Эта полоса отсутствовала в образцах сыворотки, полученных за 12 суток до инъекции вектора, что, таким образом, подтверждает специфичность способа обнаружения авторов изобретения (фиг. 6A). Через 3 месяца после инъекции авторы изобретения умерщвляли животных и авторы изобретения получали ткани для того, чтобы верифицировать, если hGAA, секретируемая печенью в кровоток, эффективно захватывалась мышцей. Авторы изобретения выполняли вестерн-блоттинг с использованием антитела со специфичностью к hGAA на общих лизатах, полученных из бицепса и диафрагмы двух обезьян. Интересно, что авторы изобретения могли наблюдать четкую полосу у животного № 2, которое также демонстрировало самые высокие уровни hGAA в кровотоке (фиг. 6B). Также у животного № 1 авторы изобретения могли наблюдать слабую полосу с молекулярной массы, соответствующей таковой у hGAA, в обеих анализируемых мышцах. Эти данные показывают, что вектор AAV8-hAAT-sp7-Δ8-hGAAco1 эффективно трансдуцирует печень у NHP. Также они демонстрируют, что белок, секретируемый в кровоток, эффективно захватывается мышцей и что это захват коррелирует с уровнем hGAA, измеряемой в крови.The most potent vector selected in the mouse study was injected with two non-human primates (NHP, Macaca fascicularis sp.) in order to verify the effect of our vector secretion and muscle uptake. The inventors injected two monkeys with 2E12 vg/kg AAV8-hAAT-sp7-Δ8-hGAAco1. One month after injection, the inventors measured the serum levels of hGAA in two animals by Western blotting using a specific antibody against hGAA. In two monkeys, the inventors observed a clear band with a size consistent with that of hGAA. This band was absent in serum samples obtained 12 days before vector injection, thus confirming the specificity of the method of detection of the inventors (Fig. 6A). 3 months after the injection, the inventors sacrificed the animals and the inventors obtained tissues in order to verify if the hGAA secreted by the liver into the bloodstream was effectively taken up by the muscle. The inventors performed a Western blot using an antibody specific for hGAA on total lysates obtained from the biceps and diaphragm of two monkeys. Interestingly, the inventors could observe a clear band in
Авторы изобретения также определяли эффект наиболее действенного вектора, выбранного в исследовании на мышах (AAV8-hAAT-sp7-Δ8-hGAAco1) в модели GSDIII на мышах. Авторы изобретения разрабатывали модель на мышах с нокаутом для гликоген-деветвящего фермента (GDE). Эта модель повторяет фенотип заболевания, наблюдаемый у людей, пораженных болезнью накопления гликогена III типа (GSDIII). В частности, GDE-/- мыши, у которых полностью отсутствует активность GDE, имеют ослабление силы мышц и накопление гликогена в различных тканях. Также интересно, что они накапливают гликоген в печени, что также наблюдают у человека. Здесь авторы изобретения тестировали, предотвращает ли сверхэкспрессия sp7-Δ8-hGAA в печени накопление гликогена, наблюдаемое у GDE-/- мышей. Авторы изобретения инъецировали GDE-/- мышам 1E11 или 1E12 вг/мышь AAV8-hAAT-sp7-Δ8-hGAAco1. В качестве контролей авторы изобретения параллельно инъецировали PBS мышам дикого типа (WT) и GDE-/- мышам. Через 3 месяца после введения вектора, мышей умерщвляли и количественно определяли уровень гликогена в печени. Результаты приведены на фиг. 7. Как уже сообщалось (Pagliarani et al и модель авторов изобретения), GDE-/- мыши демонстрировали значимое увеличение накопления гликогена в печени (p=1,3E-7) - в 5 раз больше гликогена по сравнению с животными дикого типа. К удивлению, лечение с использованием 1E11 и 1E12 вг/мышь вектора AAV8-hAAT-sp7-Δ8-hGAAco1 вызывало статистически значимое снижение содержания гликогена (p=4,5E-5 и 1,4E-6, соответственно). Важно, что уровни гликогена, измеряемого в печени мышей, которым инъецировали вектор AAV8-hAAT-sp7-Δ8-hGAAco1, не отличались от таковых, измеряемых у животных дикого типа, в частности, в самой высокой дозе (p=0,053 для когорты дозы 1E11 и 0,244 для когорты дозы 1E12).The inventors also determined the effect of the most potent vector selected in the mouse study (AAV8-hAAT-sp7-Δ8-hGAAco1) in a GSDIII mouse model. The inventors developed a knockout mouse model for glycogen debranching enzyme (GDE). This model replicates the disease phenotype seen in humans affected by glycogen storage disease type III (GSDIII). In particular, GDE -/- mice, which completely lack GDE activity, have a weakening of muscle strength and accumulation of glycogen in various tissues. It is also interesting that they accumulate glycogen in the liver, which is also observed in humans. Here, the inventors tested whether overexpression of sp7-Δ8-hGAA in the liver prevents the accumulation of glycogen observed in GDE -/- mice. The inventors injected GDE-/- mice 1E11 or 1E12 vg/mouse AAV8-hAAT-sp7-Δ8-hGAAco1. As controls, we injected PBS into wild-type (WT) and GDE-/- mice in parallel. 3 months after the introduction of the vector, the mice were sacrificed and the level of glycogen in the liver was quantified. The results are shown in FIG. 7. As already reported (Pagliarani et al and the inventors' model), GDE -/- mice showed a significant increase in hepatic glycogen accumulation (p=1.3E-7) - 5 times more glycogen compared to wild-type animals. Surprisingly, treatment with 1E11 and 1E12 vg/mouse vector AAV8-hAAT-sp7-Δ8-hGAAco1 caused a statistically significant decrease in glycogen content (p=4.5E-5 and 1.4E-6, respectively). Importantly, glycogen levels measured in the liver of mice injected with the AAV8-hAAT-sp7-Δ8-hGAAco1 vector did not differ from those measured in wild-type animals, in particular at the highest dose (p=0.053 for the 1E11 dose cohort and 0.244 for the 1E12 dose cohort).
Авторы изобретения проводили анализ активности GAA в средах и лизатах клеток HuH7, трансфицированных различными версиями GAA (все с оптимизацией кодонов): 1. нативная GAA, содержащая нативный сигнальный пептид sp1 GAA (co), 2. сконструированная GAA, содержащая гетерологичный сигнальный пептид sp7 (sp7-co), и 3. сконструированная GAA, содержащая гетерологичный сигнальный пептид sp7, после которого следует делеция переменного числа аминокислот (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7-Δ47-co и sp7-Δ62-co, в которых удаляют, соответственно, 8, 29, 42, 47 и 62 первых N-концевых аминокислот из SEQ ID NO: 1). Анализ показывал (фиг. 8) значительно более высокую активность GAA в средах клеток, трансфицированных с использованием Δ8, Δ29, Δ42 и Δ43 версий GAA по сравнению как со сконструированной GAA без делеций (sp7-co), так и с нативной GAA (co). Значительно более низкую активность GAA наоборот наблюдали в средах клеток, трансфицированных с использованием Δ47 и Δ62 версий GAA, по сравнению с другими сконструированными версиями GAA [с делециями (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) и без делеций (sp7-co)]. Интересно, что (фиг. 9) внутриклеточная активность GAA не различалась среди продуктивных делеций (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) и версии без делеций (sp7-co), что указывает на то, что все они эффективно продуцируются и процессируются в клетке. Внутриклеточная активность GAA наоборот была очень низкой для версий sp7-Δ47-co и sp7-Δ62-co и значительно ниже по сравнению со всеми другими сконструированными версиями [с делециями (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) и без делеций (sp7-co)].The inventors analyzed GAA activity in media and lysates of HuH7 cells transfected with different versions of GAA (all with codon optimization): 1. native GAA containing the native signal peptide sp1 GAA (co), 2. engineered GAA containing the heterologous signal peptide sp7 ( sp7-co), and 3. an engineered GAA containing a heterologous sp7 signal peptide followed by a variable amino acid deletion (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co, sp7 -Δ47-co and sp7-Δ62-co, in which the 8, 29, 42, 47 and 62 first N-terminal amino acids from SEQ ID NO: 1 are removed, respectively. The analysis showed (FIG. 8) significantly higher GAA activity in the media of cells transfected with the Δ8, Δ29, Δ42 and Δ43 versions of GAA compared to both engineered GAA without deletions (sp7-co) and native GAA (co) . Conversely, significantly lower GAA activity was observed in the media of cells transfected with the Δ47 and Δ62 versions of GAA compared to other engineered versions of GAA [with deletions (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7 -Δ43-co) and without deletions (sp7-co)]. Interestingly, (Fig. 9) intracellular GAA activity did not differ between productive deletions (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42-co, sp7-Δ43-co) and non-deleted versions (sp7-co) , which indicates that all of them are efficiently produced and processed in the cell. Conversely, intracellular GAA activity was very low for sp7-Δ47-co and sp7-Δ62-co versions and significantly lower compared to all other engineered versions [with deletions (sp7-Δ8-co, sp7-Δ29-co, sp7-Δ42- co, sp7-Δ43-co) and without deletions (sp7-co)].
Авторы изобретения также выполняли анализ активности GAA в средах и лизатах клеток HuH7, трансфицированных различными версиями GAA (все с оптимизированными кодонами): 1. нативная GAA, содержащая нативный сигнальный пептид sp1 GAA (co), 2. сконструированная GAA, содержащая гетерологичный сигнальный пептид sp6 или sp8 (sp6-co, sp8-co), и 3. сконструированная GAA, содержащая гетерологичный сигнальный пептид sp6 или sp8, после которого следует делеция 8 аминокислот (sp6-Δ8-co, sp8-Δ8-co). Анализ показывал (фиг. 10) значительно более высокую активность GAA в средах клеток, трансфицированных Δ8 версиями, по сравнению с: i. соответствующими им сконструированными версиями GAA без делеций (sp6-co или sp8-co); и ii. нативной GAA (co). Интересно, что внутриклеточная активность GAA не различалась среди всех сконструированных версий GAA (как с делециями, так и без делеций), что указывает на то, что все они эффективно продуцируются и процессируются в клетке (часть лизатов клеток). Внутриклеточная активность GAA наоборот была значительно выше при использовании нативной GAA (co) по сравнению со сконструированными версиями, что указывает на то, что нативная GAA преимущественно удерживается в клетке.The inventors also performed an analysis of GAA activity in media and lysates of HuH7 cells transfected with different versions of GAA (all with optimized codons): 1. native GAA containing the native signal peptide sp1 GAA (co), 2. engineered GAA containing the heterologous signal peptide sp6 or sp8 (sp6-co, sp8-co), and 3. engineered GAA containing a heterologous sp6 or sp8 signal peptide followed by an 8 amino acid deletion (sp6-Δ8-co, sp8-Δ8-co). The analysis showed (FIG. 10) significantly higher GAA activity in the media of cells transfected with Δ8 versions compared to: i. their respective engineered versions of GAA without deletions (sp6-co or sp8-co); and ii. native GAA (co). Interestingly, the intracellular activity of GAA did not differ among all engineered versions of GAA (both with and without deletions), indicating that they are all efficiently produced and processed in the cell (part of cell lysates). Conversely, intracellular GAA activity was significantly higher with native GAA (co) compared to the engineered versions, indicating that native GAA is preferentially retained in the cell.
--->--->
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST
<110> GENETHON et al.<110> GENETHON et al.
<120> ВАРИАНТЫ КИСЛОЙ АЛЬФА-ГЛЮКОЗИДАЗЫ И ИХ ИСПОЛЬЗОВАНИЕ <120> ACID ALPHA-GLUCOSIDASE VARIANTS AND THEIR USES
<130> B2299PC00<130> B2299PC00
<160> 53 <160> 53
<170> PatentIn версии 3.3<170> PatentIn version 3.3
<210> 1<210> 1
<211> 925<211> 925
<212> Белок<212> Protein
<213> искусственная<213> artificial
<220><220>
<223> hGAAwt без sp<223> hGAAwt without sp
<400> 1<400> 1
Gly His Ile Leu Leu His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly His Ile Leu Leu His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser
1 5 10 15 1 5 10 15
Gly Ser Ser Pro Val Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Gly Ser Ser Pro Val Leu Glu Glu Thr His Pro Ala His Gln Gln Gly
20 25 30 20 25 30
Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro
35 40 45 35 40 45
Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp
50 55 60 50 55 60
Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly
65 70 75 80 65 70 75 80
Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly
85 90 95 85 90 95
Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Gln Pro Trp Cys Phe Phe Pro Ser Tyr Pro Ser Tyr Lys Leu Glu
100 105 110 100 105 110
Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr
115 120 125 115 120 125
Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val
130 135 140 130 135 140
Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala
145 150 155 160 145 150 155 160
Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val His Ser Arg Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val His Ser Arg
165 170 175 165 170 175
Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly
180 185 190 180 185 190
Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr
195 200 205 195 200 205
Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser
210 215 220 210 215 220
Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu
225 230 235 240 225 230 235 240
Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu
245 250 255 245 250 255
Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu
260 265 270 260 265 270
Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser
275 280 285 275 280 285
Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg
290 295 300 290 295 300
Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro
305 310 315 320 305 310 315 320
Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met
325 330 335 325 330 335
Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser
340 345 350 340 345 350
Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala His Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala His
355 360 365 355 360 365
Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg
370 375 380 370 375 380
Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met
385 390 395 400 385 390 395 400
Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp
405 410 415 405 410 415
Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp
420 425 430 420 425 430
Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro
435 440 445 435 440 445
Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr
450 455 460 450 455 460
Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe His
465 470 475 480 465 470 475 480
Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser
485 490 495 485 490 495
Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu
500 505 510 500 505 510
Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala
515 520 525 515 520 525
Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu
530 535 540 530 535 540
His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu
545 550 555 560 545 550 555 560
Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe
565 570 575 565 570 575
Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser
580 585 590 580 585 590
Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn
595 600 605 595 600 605
Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly
610 615 620 610 615 620
Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe
625 630 635 640 625 630 635 640
Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu
645 650 655 645 650 655
Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu
660 665 670 660 665 670
Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln
675 680 685 675 680 685
Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe
690 695 700 690 695 700
Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly
705 710 715 720 705 710 715 720
Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val
725 730 735 725 730 735
Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro
740 745 750 740 745 750
Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu
755 760 765 755 760 765
Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu
770 775 780 770 775 780
Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln
785 790 795 800 785 790 795 800
Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu
805 810 815 805 810 815
Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp
820 825 830 820 825 830
Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln
835 840 845 835 840 845
Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg
850 855 860 850 855 860
Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu
865 870 875 880 865 870 875 880
Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val
885 890 895 885 890 895
Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val
900 905 910 900 905 910
Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
915 920 925 915 920 925
<210> 2<210> 2
<211> 952<211> 952
<212> Белок<212> Protein
<213> homo sapiens<213> homo sapiens
<400> 2<400> 2
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15 1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30 20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45 35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60 50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80 65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95 85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110 100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125 115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140 130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160 145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175 165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190 180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205 195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220 210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240 225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255 245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270 260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285 275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300 290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320 305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335 325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350 340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365 355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380 370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400 385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415 405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430 420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445 435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460 450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480 465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495 485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510 500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525 515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540 530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560 545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575 565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590 580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605 595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620 610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640 625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655 645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670 660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685 675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700 690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720 705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735 725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750 740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765 755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly
770 775 780 770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800 785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815 805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830 820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845 835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860 850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880 865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895 885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910 900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925 915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940 930 935 940
Glu Gln Phe Leu Val Ser Trp Cys Glu Gln Phe Leu Val Ser Trp Cys
945 950 945 950
<210> 3<210> 3
<211> 18<211> 18
<212> Белок<212> Protein
<213> искусственная<213> artificial
<220><220>
<223> sp7<223> sp7
<400> 3<400> 3
Met Ala Phe Leu Trp Leu Leu Ser Cys Trp Ala Leu Leu Gly Thr Thr Met Ala Phe Leu Trp Leu Leu Ser Cys Trp Ala Leu Leu Gly Thr Thr
1 5 10 15 1 5 10 15
Phe Gly Phe Gly
<210> 4<210> 4
<211> 27<211> 27
<212> Белок<212> Protein
<213> искусственная<213> artificial
<220><220>
<223> sp1<223>sp1
<400> 4<400> 4
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15 1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu
20 25 20 25
<210> 5<210> 5
<211> 24<211> 24
<212> Белок<212> Protein
<213> искусственная<213> artificial
<220><220>
<223> sp2<223>sp2
<400> 5<400> 5
Met Pro Ser Ser Val Ser Trp Gly Ile Leu Leu Leu Ala Gly Leu Cys Met Pro Ser Ser Val Ser Trp Gly Ile Leu Leu Leu Ala Gly Leu Cys
1 5 10 15 1 5 10 15
Cys Leu Val Pro Val Ser Leu Ala Cys Leu Val Pro Val Ser Leu Ala
20 twenty
<210> 6<210> 6
<211> 25<211> 25
<212> Белок<212> Protein
<213> искусственная<213> artificial
<220><220>
<223> sp6<223> sp6
<400> 6<400> 6
Met Pro Pro Pro Arg Thr Gly Arg Gly Leu Leu Trp Leu Gly Leu Val Met Pro Pro Pro Arg Thr Gly Arg Gly Leu Leu Trp Leu Gly Leu Val
1 5 10 15 1 5 10 15
Leu Ser Ser Val Cys Val Ala Leu Gly Leu Ser Ser Val Cys Val Ala Leu Gly
20 25 20 25
<210> 7<210> 7
<211> 22<211> 22
<212> Белок<212> Protein
<213> искусственная<213> artificial
<220><220>
<223> sp8<223>sp8
<400> 7<400> 7
Met Ala Ser Arg Leu Thr Leu Leu Thr Leu Leu Leu Leu Leu Leu Ala Met Ala Ser Arg Leu Thr Leu Leu Thr Leu Leu Leu Leu Leu Leu Ala
1 5 10 15 1 5 10 15
Gly Asp Arg Ala Ser Ser Gly Asp Arg Ala Ser Ser
20 twenty
<210> 8<210> 8
<211> 2859<211> 2859
<212> ДНК<212> DNA
<213> homo sapiens<213> homo sapiens
<400> 8<400> 8
atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60atgggagtga ggcacccgcc ctgctcccac cggctcctgg ccgtctgcgc cctcgtgtcc 60
ttggcaaccg cagcgctcct ggggcacatc ctactccatg atttcctgct ggttccccga 120ttggcaaccg cagcgctcct ggggcacatc ctactccatg atttcctgct ggttccccga 120
gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180gagctgagtg gctcctcccc agtcctggag gagactcacc cagctcacca gcagggagcc 180
agcagaccag ggccccggga tgcccaggca caccccgggc ggccgcgagc agtgcccaca 240agcagaccag ggccccggga tgcccaggca caccccggggc ggccgcgagc agtgcccaca 240
cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300cagtgcgacg tcccccccaa cagccgcttc gattgcgccc ctgacaaggc catcacccag 300
gaacagtgcg aggcccgcgg ctgttgctac atccctgcaa agcaggggct gcagggagcc 360gaacagtgcg aggcccgcgg ctgttgctac atccctgcaa agcaggggct gcagggagcc 360
cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420cagatggggc agccctggtg cttcttccca cccagctacc ccagctacaa gctggagaac 420
ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480ctgagctcct ctgaaatggg ctacacggcc accctgaccc gtaccacccc caccttcttc 480
cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540cccaaggaca tcctgaccct gcggctggac gtgatgatgg agactgagaa ccgcctccac 540
ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcatgtc 600ttcacgatca aagatccagc taacaggcgc tacgaggtgc ccttggagac cccgcatgtc 600
cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660cacagccggg caccgtcccc actctacagc gtggagttct ccgaggagcc cttcggggtg 660
atcgtgcgcc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720atcgtgcgcc ggcagctgga cggccgcgtg ctgctgaaca cgacggtggc gcccctgttc 720
tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780tttgcggacc agttccttca gctgtccacc tcgctgccct cgcagtatat cacaggcctc 780
gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840gccgagcacc tcagtcccct gatgctcagc accagctgga ccaggatcac cctgtggaac 840
cgggaccttg cgcccacgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900cgggaccttg cgccccgcc cggtgcgaac ctctacgggt ctcacccttt ctacctggcg 900
ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960ctggaggacg gcgggtcggc acacggggtg ttcctgctaa acagcaatgc catggatgtg 960
gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020gtcctgcagc cgagccctgc ccttagctgg aggtcgacag gtgggatcct ggatgtctac 1020
atcttcctgg gcccagagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080atcttcctgg gccgagcc caagagcgtg gtgcagcagt acctggacgt tgtgggatac 1080
ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140ccgttcatgc cgccatactg gggcctgggc ttccacctgt gccgctgggg ctactcctcc 1140
accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200accgctatca cccgccaggt ggtggagaac atgaccaggg cccacttccc cctggacgtc 1200
cagtggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260cagtggaacg acctggacta catggactcc cggagggact tcacgttcaa caaggatggc 1260
ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320ttccgggact tcccggccat ggtgcaggag ctgcaccagg gcggccggcg ctacatgatg 1320
atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380atcgtggatc ctgccatcag cagctcgggc cctgccggga gctacaggcc ctacgacgag 1380
ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440ggtctgcgga ggggggtttt catcaccaac gagaccggcc agccgctgat tgggaaggta 1440
tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500tggcccgggt ccactgcctt ccccgacttc accaacccca cagccctggc ctggtgggag 1500
gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560gacatggtgg ctgagttcca tgaccaggtg cccttcgacg gcatgtggat tgacatgaac 1560
gagccttcca acttcatcag gggctctgag gacggctgcc ccaacaatga gctggagaac 1620gagccttcca acttcatcag gggctctgag gacggctgcc ccaacaatga gctggagaac 1620
ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680ccaccctacg tgcctggggt ggttgggggg accctccagg cggccaccat ctgtgcctcc 1680
agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740agccaccagt ttctctccac acactacaac ctgcacaacc tctacggcct gaccgaagcc 1740
atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800atcgcctccc acagggcgct ggtgaaggct cgggggacac gcccatttgt gatctcccgc 1800
tcgacctttg ctggccacgg ccgatacgcc ggccactgga cgggggacgt gtggagctcc 1860tcgacctttg ctggcacgg ccgatacgcc ggccactgga cggggggacgt gtggagctcc 1860
tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920tgggagcagc tcgcctcctc cgtgccagaa atcctgcagt ttaacctgct gggggtgcct 1920
ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980ctggtcgggg ccgacgtctg cggcttcctg ggcaacacct cagaggagct gtgtgtgcgc 1980
tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040tggacccagc tgggggcctt ctaccccttc atgcggaacc acaacagcct gctcagtctg 2040
ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100ccccaggagc cgtacagctt cagcgagccg gcccagcagg ccatgaggaa ggccctcacc 2100
ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160ctgcgctacg cactcctccc ccacctctac acactgttcc accaggccca cgtcgcgggg 2160
gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220gagaccgtgg cccggcccct cttcctggag ttccccaagg actctagcac ctggactgtg 2220
gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280gaccaccagc tcctgtgggg ggaggccctg ctcatcaccc cagtgctcca ggccgggaag 2280
gccgaagtga ctggctactt ccccttgggc acatggtacg acctgcagac ggtgccagta 2340gccgaagtga ctggctactt ccccttggggc acatggtacg acctgcagac ggtgccagta 2340
gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400gaggcccttg gcagcctccc acccccacct gcagctcccc gtgagccagc catccacagc 2400
gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460gaggggcagt gggtgacgct gccggccccc ctggacacca tcaacgtcca cctccgggct 2460
gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520gggtacatca tccccctgca gggccctggc ctcacaacca cagagtcccg ccagcagccc 2520
atggccctgg ctgtggccct gaccaagggt ggggaggccc gaggggagct gttctgggac 2580atggccctgg ctgtggccct gaccaagggt ggggaggccc gaggggagct gttctgggac 2580
gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640gatggagaga gcctggaagt gctggagcga ggggcctaca cacaggtcat cttcctggcc 2640
aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700aggaataaca cgatcgtgaa tgagctggta cgtgtgacca gtgagggagc tggcctgcag 2700
ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760ctgcagaagg tgactgtcct gggcgtggcc acggcgcccc agcaggtcct ctccaacggt 2760
gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820gtccctgtct ccaacttcac ctacagcccc gacaccaagg tcctggacat ctgtgtctcg 2820
ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859ctgttgatgg gagagcagtt tctcgtcagc tggtgttag 2859
<210> 9<210> 9
<211> 2778<211> 2778
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> hGAAwt без sp<223> hGAAwt without sp
<400> 9<400> 9
gggcacatcc tactccatga tttcctgctg gttccccgag agctgagtgg ctcctcccca 60gggcacatcc tactccatga tttcctgctg gttccccgag agctgagtgg ctcctcccca 60
gtcctggagg agactcaccc agctcaccag cagggagcca gcagaccagg gccccgggat 120gtcctggagg agactcaccc agctcaccag cagggagcca gcagaccagg gccccgggat 120
gcccaggcac accccgggcg gccgcgagca gtgcccacac agtgcgacgt cccccccaac 180gcccaggcac accccgggcg gccgcgagca gtgcccacac agtgcgacgt cccccccaac 180
agccgcttcg attgcgcccc tgacaaggcc atcacccagg aacagtgcga ggcccgcggc 240agccgcttcg attgcgcccc tgacaaggcc atcacccagg aacagtgcga ggcccgcggc 240
tgttgctaca tccctgcaaa gcaggggctg cagggagccc agatggggca gccctggtgc 300tgttgctaca tccctgcaaa gcaggggctg cagggagccc agatggggca gccctggtgc 300
ttcttcccac ccagctaccc cagctacaag ctggagaacc tgagctcctc tgaaatgggc 360ttcttcccac ccagctaccc cagctacaag ctggagaacc tgagctcctc tgaaatggggc 360
tacacggcca ccctgacccg taccaccccc accttcttcc ccaaggacat cctgaccctg 420tacacggcca ccctgacccg taccaccccc accttcttcc ccaaggacat cctgaccctg 420
cggctggacg tgatgatgga gactgagaac cgcctccact tcacgatcaa agatccagct 480cggctggacg tgatgatgga gactgagaac cgcctccact tcacgatcaa agatccagct 480
aacaggcgct acgaggtgcc cttggagacc ccgcatgtcc acagccgggc accgtcccca 540aacaggcgct acgaggtgcc cttggagacc ccgcatgtcc acagccggggc accgtcccca 540
ctctacagcg tggagttctc cgaggagccc ttcggggtga tcgtgcgccg gcagctggac 600ctctacagcg tggagttctc cgaggagccc ttcggggtga tcgtgcgccg gcagctggac 600
ggccgcgtgc tgctgaacac gacggtggcg cccctgttct ttgcggacca gttccttcag 660ggccgcgtgc tgctgaacac gacggtggcg cccctgttct ttgcggacca gttccttcag 660
ctgtccacct cgctgccctc gcagtatatc acaggcctcg ccgagcacct cagtcccctg 720ctgtccacct cgctgccctc gcagtatatc acaggcctcg ccgagcacct cagtcccctg 720
atgctcagca ccagctggac caggatcacc ctgtggaacc gggaccttgc gcccacgccc 780atgctcagca ccagctggac caggatcacc ctgtggaacc gggaccttgc gcccacgccc 780
ggtgcgaacc tctacgggtc tcaccctttc tacctggcgc tggaggacgg cgggtcggca 840ggtgcgaacc tctacgggtc tcaccctttc tacctggcgc tggaggacgg cgggtcggca 840
cacggggtgt tcctgctaaa cagcaatgcc atggatgtgg tcctgcagcc gagccctgcc 900cacggggtgt tcctgctaaa cagcaatgcc atggatgtgg tcctgcagcc gagccctgcc 900
cttagctgga ggtcgacagg tgggatcctg gatgtctaca tcttcctggg cccagagccc 960cttagctgga ggtcgacagg tgggatcctg gatgtctaca tcttcctgggg cccagagccc 960
aagagcgtgg tgcagcagta cctggacgtt gtgggatacc cgttcatgcc gccatactgg 1020aagagcgtgg tgcagcagta cctggacgtt gtgggatacc cgttcatgcc gccatactgg 1020
ggcctgggct tccacctgtg ccgctggggc tactcctcca ccgctatcac ccgccaggtg 1080ggcctgggct tccacctgtg ccgctggggc tactcctcca ccgctatcac ccgccaggtg 1080
gtggagaaca tgaccagggc ccacttcccc ctggacgtcc agtggaacga cctggactac 1140gtggagaaca tgaccagggc ccacttcccc ctggacgtcc agtggaacga cctggactac 1140
atggactccc ggagggactt cacgttcaac aaggatggct tccgggactt cccggccatg 1200atggactccc ggagggactt cacgttcaac aaggatggct tccgggactt cccggccatg 1200
gtgcaggagc tgcaccaggg cggccggcgc tacatgatga tcgtggatcc tgccatcagc 1260gtgcaggagc tgcaccaggg cggccggcgc tacatgatga tcgtggatcc tgccatcagc 1260
agctcgggcc ctgccgggag ctacaggccc tacgacgagg gtctgcggag gggggttttc 1320agctcgggcc ctgccgggag ctacaggccc tacgacgagg gtctgcggag gggggttttc 1320
atcaccaacg agaccggcca gccgctgatt gggaaggtat ggcccgggtc cactgccttc 1380atcaccaacg agaccggcca gccgctgatt gggaaggtat ggcccgggtc cactgccttc 1380
cccgacttca ccaaccccac agccctggcc tggtgggagg acatggtggc tgagttccat 1440ccgacttca ccaaccccac agccctggcc tggtgggagg acatggtggc tgagttccat 1440
gaccaggtgc ccttcgacgg catgtggatt gacatgaacg agccttccaa cttcatcagg 1500gaccaggtgc ccttcgacgg catgtggatt gacatgaacg agccttccaa cttcatcagg 1500
ggctctgagg acggctgccc caacaatgag ctggagaacc caccctacgt gcctggggtg 1560ggctctgagg acggctgccc caacaatgag ctggagaacc caccctacgt gcctggggtg 1560
gttgggggga ccctccaggc ggccaccatc tgtgcctcca gccaccagtt tctctccaca 1620gttgggggga ccctccaggc ggccaccatc tgtgcctcca gccaccagtt tctctccaca 1620
cactacaacc tgcacaacct ctacggcctg accgaagcca tcgcctccca cagggcgctg 1680cactacaacc tgcacaacct ctacggcctg accgaagcca tcgcctccca cagggcgctg 1680
gtgaaggctc gggggacacg cccatttgtg atctcccgct cgacctttgc tggccacggc 1740gtgaaggctc gggggacacg cccatttgtg atctcccgct cgacctttgc tggccacggc 1740
cgatacgccg gccactggac gggggacgtg tggagctcct gggagcagct cgcctcctcc 1800cgatacgccg gccactggac gggggacgtg tggagctcct gggagcagct cgcctcctcc 1800
gtgccagaaa tcctgcagtt taacctgctg ggggtgcctc tggtcggggc cgacgtctgc 1860gtgccagaaa tcctgcagtt taacctgctg ggggtgcctc tggtcggggc cgacgtctgc 1860
ggcttcctgg gcaacacctc agaggagctg tgtgtgcgct ggacccagct gggggccttc 1920ggcttcctgg gcaacacctc agaggagctg tgtgtgcgct ggacccagct gggggccttc 1920
taccccttca tgcggaacca caacagcctg ctcagtctgc cccaggagcc gtacagcttc 1980taccccttca tgcggaacca caacagcctg ctcagtctgc cccaggagcc gtacagcttc 1980
agcgagccgg cccagcaggc catgaggaag gccctcaccc tgcgctacgc actcctcccc 2040agcgagccgg cccagcaggc catgaggaag gccctcaccc tgcgctacgc actcctcccc 2040
cacctctaca cactgttcca ccaggcccac gtcgcggggg agaccgtggc ccggcccctc 2100cacctctaca cactgttcca ccaggcccac gtcgcgggggg agaccgtggc ccggcccctc 2100
ttcctggagt tccccaagga ctctagcacc tggactgtgg accaccagct cctgtggggg 2160ttcctggagt tccccaagga ctctagcacc tggactgtgg accaccagct cctgtggggg 2160
gaggccctgc tcatcacccc agtgctccag gccgggaagg ccgaagtgac tggctacttc 2220gaggccctgc tcatcacccc agtgctccag gccgggaagg ccgaagtgac tggctacttc 2220
cccttgggca catggtacga cctgcagacg gtgccagtag aggcccttgg cagcctccca 2280cccttgggca catggtacga cctgcagacg gtgccagtag aggcccttgg cagcctccca 2280
cccccacctg cagctccccg tgagccagcc atccacagcg aggggcagtg ggtgacgctg 2340cccccacctg cagctccccg tgagccagcc atccacagcg aggggcagtg ggtgacgctg 2340
ccggcccccc tggacaccat caacgtccac ctccgggctg ggtacatcat ccccctgcag 2400ccggcccccc tggacaccat caacgtccac ctccgggctg ggtacatcat ccccctgcag 2400
ggccctggcc tcacaaccac agagtcccgc cagcagccca tggccctggc tgtggccctg 2460ggccctggcc tcacaaccac agagtcccgc cagcagccca tggccctggc tgtggccctg 2460
accaagggtg gggaggcccg aggggagctg ttctgggacg atggagagag cctggaagtg 2520accaagggtg gggaggcccg aggggagctg ttctgggacg atggagagag cctggaagtg 2520
ctggagcgag gggcctacac acaggtcatc ttcctggcca ggaataacac gatcgtgaat 2580ctggagcgag gggcctacac acaggtcatc ttcctggcca ggaataacac gatcgtgaat 2580
gagctggtac gtgtgaccag tgagggagct ggcctgcagc tgcagaaggt gactgtcctg 2640gagctggtac gtgtgaccag tgagggagct ggcctgcagc tgcagaaggt gactgtcctg 2640
ggcgtggcca cggcgcccca gcaggtcctc tccaacggtg tccctgtctc caacttcacc 2700ggcgtggcca cggcgcccca gcaggtcctc tccaacggtg tccctgtctc caacttcacc 2700
tacagccccg acaccaaggt cctggacatc tgtgtctcgc tgttgatggg agagcagttt 2760tacagccccg acaccaaggt cctggacatc tgtgtctcgc tgttgatggg agagcagttt 2760
ctcgtcagct ggtgttag 2778ctcgtcagct ggtgttag 2778
<210> 10<210> 10
<211> 2778<211> 2778
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> hGAAco1 без sp<223> hGAAco1 no sp
<400> 10<400> 10
ggccatatcc tgctgcacga ctttctacta gtgcccagag agctgagcgg cagctctccc 60ggccatatcc tgctgcacga ctttctacta gtgccgag agctgagcgg cagctctccc 60
gtgctggaag aaacacaccc tgcccatcag cagggcgcct ctagacctgg acctagagat 120gtgctggaag aaacacaccc tgcccatcag cagggcgcct ctagacctgg acctagagat 120
gcccaggccc accccggcag acctagagct gtgcctaccc agtgtgacgt gccccccaac 180gcccaggccc accccggcag acctagagct gtgcctaccc agtgtgacgt gccccccaac 180
agcagattcg actgcgcccc tgacaaggcc atcacccagg aacagtgcga ggccagaggc 240agcagattcg actgcgcccc tgacaaggcc atcacccagg aacagtgcga ggccagaggc 240
tgctgctaca tccctgccaa gcagggactg cagggcgctc agatgggaca gccctggtgc 300tgctgctaca tccctgccaa gcagggactg cagggcgctc agatgggaca gccctggtgc 300
ttcttcccac cctcctaccc cagctacaag ctggaaaacc tgagcagcag cgagatgggc 360ttcttcccac cctcctaccc cagctacaag ctggaaaacc tgagcagcag cgagatgggc 360
tacaccgcca ccctgaccag aaccaccccc acattcttcc caaaggacat cctgaccctg 420tacaccgcca ccctgaccag aaccaccccc acattcttcc caaaggacat cctgaccctg 420
cggctggacg tgatgatgga aaccgagaac cggctgcact tcaccatcaa ggaccccgcc 480cggctggacg tgatgatgga aaccgagaac cggctgcact tcaccatcaa ggaccccgcc 480
aatcggagat acgaggtgcc cctggaaacc ccccacgtgc actctagagc ccccagccct 540aatcggagat acgaggtgcc ccctggaaacc ccccacgtgc actctagagc ccccagccct 540
ctgtacagcg tggaattcag cgaggaaccc ttcggcgtga tcgtgcggag acagctggat 600ctgtacagcg tggaattcag cgaggaaccc ttcggcgtga tcgtgcggag acagctggat 600
ggcagagtgc tgctgaacac caccgtggcc cctctgttct tcgccgacca gttcctgcag 660ggcagagtgc tgctgaacac caccgtggcc cctctgttct tcgccgacca gttcctgcag 660
ctgagcacca gcctgcccag ccagtacatc acaggactgg ccgagcacct gagccccctg 720ctgagcacca gcctgcccag ccagtacatc acaggactgg ccgagcacct gagccccctg 720
atgctgagca catcctggac ccggatcacc ctgtggaaca gggatctggc ccctacccct 780atgctgagca catcctggac ccggatcacc ctgtggaaca gggatctggc ccctacccct 780
ggcgccaatc tgtacggcag ccaccctttc tacctggccc tggaagatgg cggatctgcc 840ggcgccaatc tgtacggcag ccaccctttc tacctggccc tggaagatgg cggatctgcc 840
cacggagtgt ttctgctgaa ctccaacgcc atggacgtgg tgctgcagcc tagccctgcc 900cacggagtgt ttctgctgaa ctccaacgcc atggacgtgg tgctgcagcc tagccctgcc 900
ctgtcttgga gaagcacagg cggcatcctg gatgtgtaca tctttctggg ccccgagccc 960ctgtcttgga gaagcacagg cggcatcctg gatgtgtaca tctttctggg ccccgagccc 960
aagagcgtgg tgcagcagta tctggatgtc gtgggctacc ccttcatgcc cccttactgg 1020aagagcgtgg tgcagcagta tctggatgtc gtgggctacc ccttcatgcc cccttactgg 1020
ggcctgggat tccacctgtg cagatggggc tactccagca ccgccatcac cagacaggtg 1080ggcctgggat tccacctgtg cagatggggc tactccagca ccgccatcac cagacaggtg 1080
gtggaaaaca tgaccagagc ccacttccca ctggatgtgc agtggaacga cctggactac 1140gtggaaaaca tgaccagagc ccacttccca ctggatgtgc agtggaacga cctggactac 1140
atggacagca gacgggactt caccttcaac aaggacggct tccgggactt ccccgccatg 1200atggacagca gacgggactt caccttcaac aaggacggct tccgggactt ccccgccatg 1200
gtgcaggaac tgcatcaggg cggcagacgg tacatgatga tcgtggatcc cgccatcagc 1260gtgcaggaac tgcatcaggg cggcagacgg tacatgatga tcgtggatcc cgccatcagc 1260
tcctctggcc ctgccggctc ttacagaccc tacgacgagg gcctgcggag aggcgtgttc 1320tcctctggcc ctgccggctc ttacagaccc tacgacgagg gcctgcggag aggcgtgttc 1320
atcaccaacg agacaggcca gcccctgatc ggcaaagtgt ggcctggcag cacagccttc 1380atcaccaacg agacaggcca gcccctgatc ggcaaagtgt ggcctggcag cacagccttc 1380
cccgacttca ccaatcctac cgccctggct tggtgggagg acatggtggc cgagttccac 1440cccgacttca ccaatcctac cgccctggct tggtgggagg acatggtggc cgagttccac 1440
gaccaggtgc ccttcgacgg catgtggatc gacatgaacg agcccagcaa cttcatccgg 1500gaccaggtgc ccttcgacgg catgtggatc gacatgaacg agcccagcaa cttcatccgg 1500
ggcagcgagg atggctgccc caacaacgaa ctggaaaatc ccccttacgt gcccggcgtc 1560ggcagcgagg atggctgccc caacaacgaa ctggaaaatc ccccttacgt gcccggcgtc 1560
gtgggcggaa cactgcaggc cgctacaatc tgtgccagca gccaccagtt tctgagcacc 1620gtgggcggaa cactgcaggc cgctacaatc tgtgccagca gccaccagtt tctgagcacc 1620
cactacaacc tgcacaacct gtacggcctg accgaggcca ttgccagcca ccgcgctctc 1680cactacaacc tgcacaacct gtacggcctg accgaggcca ttgccagcca ccgcgctctc 1680
gtgaaagcca gaggcacacg gcccttcgtg atcagcagaa gcacctttgc cggccacggc 1740gtgaaagcca gaggcacacg gcccttcgtg atcagcagaa gcacctttgc cggccacggc 1740
agatacgccg gacattggac tggcgacgtg tggtcctctt gggagcagct ggcctctagc 1800agatacgccg gacattggac tggcgacgtg tggtcctctt gggagcagct ggcctctagc 1800
gtgcccgaga tcctgcagtt caatctgctg ggcgtgccac tcgtgggcgc cgatgtgtgt 1860gtgcccgaga tcctgcagtt caatctgctg ggcgtgccac tcgtgggcgc cgatgtgtgt 1860
ggcttcctgg gcaacacctc cgaggaactg tgtgtgcggt ggacacagct gggcgccttc 1920ggcttcctgg gcaacacctc cgaggaactg tgtgtgcggt ggacacagct gggcgccttc 1920
taccctttca tgagaaacca caacagcctg ctgagcctgc cccaggaacc ctacagcttt 19801980
agcgagcctg cacagcaggc catgcggaag gccctgacac tgagatacgc tctgctgccc 2040agcgagcctg cacagcaggc catgcggaag gccctgacac tgagatacgc tctgctgccc 2040
cacctgtaca ccctgtttca ccaggcccat gtggccggcg agacagtggc cagacctctg 2100cacctgtaca ccctgtttca ccaggcccat gtggccggcg agacagtggc cagacctctg 2100
tttctggaat tccccaagga cagcagcacc tggaccgtgg accatcagct gctgtgggga 2160tttctggaat tccccaagga cagcagcacc tggaccgtgg accatcagct gctgtgggga 2160
gaggctctgc tgattacccc agtgctgcag gcaggcaagg ccgaagtgac cggctacttt 2220gaggctctgc tgattacccc agtgctgcag gcaggcaagg ccgaagtgac cggctacttt 2220
cccctgggca cttggtacga cctgcagacc gtgcctgtgg aagccctggg atctctgcct 2280cccctgggca cttggtacga cctgcagacc gtgcctgtgg aagccctggg atctctgcct 2280
ccacctcctg ccgctcctag agagcctgcc attcactctg agggccagtg ggtcacactg 2340ccacctcctg ccgctcctag agagcctgcc attcactctg agggccagtg ggtcacactg 2340
cctgcccccc tggataccat caacgtgcac ctgagggccg gctacatcat accactgcag 2400cctgcccccc tggataccat caacgtgcac ctgaggggccg gctacatcat accactgcag 2400
ggacctggcc tgaccaccac cgagtctaga cagcagccaa tggccctggc cgtggccctg 2460ggacctggcc tgaccaccac cgagtctaga cagcagccaa tggccctggc cgtggccctg 2460
accaaaggcg gagaagctag gggcgagctg ttctgggacg atggcgagag cctggaagtg 2520accaaaggcg gagaagctag gggcgagctg ttctgggacg atggcgagag cctggaagtg 2520
ctggaaagag gcgcctatac ccaagtgatc ttcctggccc ggaacaacac catcgtgaac 2580ctggaaagag gcgcctatac ccaagtgatc ttcctggccc ggaacaacac catcgtgaac 2580
gagctggtgc gcgtgacctc tgaaggcgct ggactgcagc tgcagaaagt gaccgtgctg 2640gagctggtgc gcgtgacctc tgaaggcgct ggactgcagc tgcagaaagt gaccgtgctg 2640
ggagtggcca cagcccctca gcaggtgctg tctaatggcg tgcccgtgtc caacttcacc 2700ggagtggcca cagcccctca gcaggtgctg tctaatggcg tgcccgtgtc caacttcacc 2700
tacagccccg acaccaaggt gctggacatc tgcgtgtcac tgctgatggg agagcagttt 27602760
ctggtgtcct ggtgctga 2778ctggtgtcct ggtgctga 2778
<210> 11<210> 11
<211> 2778<211> 2778
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> hGAAco2 без sp<223> hGAAco2 without sp
<400> 11<400> 11
ggacacatcc tgctgcacga cttcctgttg gtgcctagag agctgagcgg atcatcccca 60ggacacatcc tgctgcacga cttcctgttg gtgcctagag agctgagcgg atcatcccca 60
gtgctggagg agactcatcc tgctcaccaa cagggagctt ccagaccagg accgagagac 120gtgctggagg agactcatcc tgctcaccaa cagggagctt ccagaccagg accgagagac 120
gcccaagccc atcctggtag accaagagct gtgcctaccc aatgcgacgt gccacccaac 180gcccaagcc atcctggtag accaaggct gtgcctaccc aatgcgacgt gccacccaac 180
tcccgattcg actgcgcgcc agataaggct attacccaag agcagtgtga agccagaggt 240tcccgattcg actgcgcgcc agataaggct attacccaag agcagtgtga agccagaggt 240
tgctgctaca tcccagcgaa gcaaggattg caaggcgccc aaatgggaca accttggtgt 300tgctgctaca tcccagcgaa gcaaggattg caaggcgccc aaatgggaca accttggtgt 300
ttcttccccc cttcgtaccc atcatataaa ctcgaaaacc tgtcctcttc ggaaatgggt 360ttcttccccc cttcgtaccc atcatataaa ctcgaaaacc tgtcctcttc ggaaatgggt 360
tatactgcca ccctcaccag aactactcct actttcttcc cgaaagacat cttgaccttg 420tatactgcca ccctcaccag aactactcct actttcttcc cgaaagacat cttgaccttg 420
aggctggacg tgatgatgga gactgaaaac cggctgcatt tcactatcaa agatcctgcc 480aggctggacg tgatgatgga gactgaaaac cggctgcatt tcactatcaa agatcctgcc 480
aatcggcgat acgaggtccc tctggaaacc cctcacgtgc actcacgggc tccttctccg 540aatcggcgat acgaggtccc tctggaaacc cctcacgtgc actcacggggc tccttctccg 540
ctttactccg tcgaattctc tgaggaaccc ttcggagtga tcgttagacg ccagctggat 600ctttactccg tcgaattctc tgaggaaccc ttcggagtga tcgttagacg ccagctggat 600
ggtagagtgc tgttgaacac tactgtggcc ccacttttct tcgctgacca gtttctgcaa 660ggtagagtgc tgttgaacac tactgtggcc ccacttttct tcgctgacca gtttctgcaa 660
ctgtccactt ccctgccatc ccagtacatt actggactcg ccgaacacct gtcgccactg 720ctgtccactt ccctgccatc ccagtacatt actggactcg ccgaacacct gtcgccactg 720
atgctctcga cctcttggac tagaatcact ttgtggaaca gagacttggc ccctactccg 780atgctctcga cctcttggac tagaatcact ttgtggaaca gagacttggc ccctactccg 780
ggagcaaatc tgtacggaag ccaccctttt tacctggcgc tcgaagatgg cggatccgct 840ggagcaaatc tgtacggaag ccaccctttt tacctggcgc tcgaagatgg cggatccgct 840
cacggagtgt tcctgctgaa tagcaacgca atggacgtgg tgctgcaacc ttcccctgca 900cacggagtgt tcctgctgaa tagcaacgca atggacgtgg tgctgcaacc ttcccctgca 900
ctcagttgga gaagtaccgg gggtattctg gacgtgtaca tcttcctcgg accagaaccc 960ctcagttgga gaagtaccgg gggtattctg gacgtgtaca tcttcctcgg accagaaccc 960
aagagcgtgg tgcagcaata tctggacgtg gtcggatacc cttttatgcc tccttactgg 1020aagagcgtgg tgcagcaata tctggacgtg gtcggatacc cttttatgcc tccttactgg 1020
ggactgggat tccacctttg ccgttggggc tactcatcca ccgccattac cagacaggtg 1080ggactgggat tccacctttg ccgttggggc tactcatcca ccgccattac cagacaggtg 1080
gtggagaata tgaccagagc ccacttccct ctcgacgtgc agtggaacga tctggactat 1140gtggagaata tgaccagagc ccacttccct ctcgacgtgc agtggaacga tctggactat 1140
atggactccc ggagagattt caccttcaac aaggacgggt tccgcgattt tcccgcgatg 12001200
gttcaagagc tccaccaggg tggtcgaaga tatatgatga tcgtcgaccc agccatttcg 12601260
agcagcggac ccgctggatc ttatagacct tacgacgaag gccttaggag aggagtgttc 1320agcagcggac ccgctggatc ttatagacct tacgacgaag gccttaggag aggagtgttc 1320
atcacaaacg agactggaca gcctttgatc ggtaaagtgt ggcctggatc aaccgccttt 13801380
cctgacttta ccaatcccac tgccttggct tggtgggagg acatggtggc cgaattccac 1440cctgacttta ccaatcccac tgccttggct tggtgggagg acatggtggc cgaattccac 1440
gaccaagtcc cctttgatgg aatgtggatc gatatgaacg aaccaagcaa ttttatcaga 1500gaccaagtcc cctttgatgg aatgtggatc gatatgaacg aaccaagcaa ttttatcaga 1500
ggttccgaag acggttgccc caacaacgaa ctggaaaacc ctccttatgt gcccggagtc 1560ggttccgaag acggttgccc caacaacgaa ctggaaaacc ctccttatgt gcccggagtc 1560
gtgggcggaa cattacaggc cgcgactatt tgcgccagca gccaccaatt cctgtccact 1620gtgggcggaa cattacaggc cgcgactatt tgcgccagca gccaccaatt cctgtccact 1620
cactacaacc tccacaacct ttatggatta accgaagcta ttgcaagtca cagggctctg 1680cactacaacc tccacaacct ttatggatta accgaagcta ttgcaagtca cagggctctg 1680
gtgaaggcta gagggactag gccctttgtg atctcccgat ccacctttgc cggacacggg 1740gtgaaggcta gagggactag gccctttgtg atctcccgat ccacctttgc cggacacggg 1740
agatacgccg gtcactggac tggtgacgtg tggagctcat gggaacaact ggcctcctcc 1800agatacgccg gtcactggac tggtgacgtg tggagctcat gggaacaact ggcctcctcc 1800
gtgccggaaa tcttacagtt caaccttctg ggtgtccctc ttgtcggagc agacgtgtgt 18601860
gggtttcttg gtaacacctc cgaggaactg tgtgtgcgct ggactcaact gggtgcattc 1920gggtttcttg gtaacacctc cgaggaactg tgtgtgcgct ggactcaact gggtgcattc 1920
tacccattca tgagaaacca caactccttg ctgtccctgc cacaagagcc ctactcgttc 1980tacccattca tgagaaacca caactccttg ctgtccctgc cacaagagcc ctactcgttc 1980
agcgagcctg cacaacaggc tatgcggaag gcactgaccc tgagatacgc cctgcttcca 2040agcgagcctg cacaacaggc tatgcggaag gcactgaccc tgagatacgc cctgcttcca 2040
cacttataca ctctcttcca tcaagcgcat gtggcaggag aaaccgttgc aaggcctctt 2100cacttataca ctctcttcca tcaagcgcat gtggcaggag aaaccgttgc aaggcctctt 2100
ttccttgaat tccccaagga ttcctcgact tggacggtgg atcatcagct gctgtgggga 2160ttccttgaat tccccaagga ttcctcgact tggacggtgg atcatcagct gctgtgggga 2160
gaagctctgc tgattactcc agtgttgcaa gccggaaaag ctgaggtgac cggatacttt 2220gaagctctgc tgattactcc agtgttgcaa gccggaaaag ctgaggtgac cggatacttt 2220
ccgctgggaa cctggtacga cctccagact gtccctgttg aagcccttgg atcactgcct 2280ccgctgggaa cctggtacga ccctccagact gtccctgttg aagcccttgg atcactgcct 2280
ccgcctccgg cagctccacg cgaaccagct atacattccg agggacagtg ggttacatta 2340ccgcctccgg cagctccacg cgaaccagct atacattccg agggacagtg ggttacatta 2340
ccagctcctc tggacacaat caacgtccac ttaagagctg gctacattat ccctctgcaa 2400ccagctcctc tggacaat caacgtccac ttaagagctg gctacattat ccctctgcaa 2400
ggaccaggac tgactacgac cgagagcaga cagcagccaa tggcactggc tgtggctctg 2460ggaccaggac tgactacgac cgagagcaga cagcagccaa tggcactggc tgtggctctg 2460
accaagggag gggaagctag aggagaactc ttctgggatg atggggagtc ccttgaagtg 2520accaagggag gggaagctag aggagaactc ttctgggatg atggggagtc ccttgaagtg 2520
ctggaaagag gcgcttacac tcaagtcatt ttccttgcac ggaacaacac cattgtgaac 2580ctggaaagag gcgcttacac tcaagtcatt ttccttgcac ggaacaacac cattgtgaac 2580
gaattggtgc gagtgaccag cgaaggagct ggacttcaac tgcagaaggt cactgtgctc 2640gaattggtgc gagtgaccag cgaaggagct ggacttcaac tgcagaaggt cactgtgctc 2640
ggagtggcta ccgctcctca gcaagtgctg tcgaatggag tccccgtgtc aaactttacc 2700ggagtggcta ccgctcctca gcaagtgctg tcgaatggag tccccgtgtc aaactttacc 2700
tactcccctg acactaaggt gctcgacatt tgcgtgtccc tcctgatggg agagcagttc 2760tactcccctg acactaaggt gctcgacatt tgcgtgtccc tcctgatggg agagcagttc 2760
cttgtgtcct ggtgttga 2778cttgtgtcct ggtgttga 2778
<210> 12<210> 12
<211> 2754<211> 2754
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> hGAAco1-дельта-8 без sp<223> hGAAco1-delta-8 no sp
<400> 12<400> 12
ctactagtgc ccagagagct gagcggcagc tctcccgtgc tggaagaaac acaccctgcc 60ctactagtgc ccagagagct gagcggcagc tctcccgtgc tggaagaaac acaccctgcc 60
catcagcagg gcgcctctag acctggacct agagatgccc aggcccaccc cggcagacct 120catcagcagg gcgcctctag acctggacct agagatgccc aggcccaccc cggcagacct 120
agagctgtgc ctacccagtg tgacgtgccc cccaacagca gattcgactg cgcccctgac 180agagctgtgc ctacccagtg tgacgtgccc cccaacagca gattcgactg cgcccctgac 180
aaggccatca cccaggaaca gtgcgaggcc agaggctgct gctacatccc tgccaagcag 240aaggccatca ccgggaaca gtgcgaggcc agaggctgct gctacatccc tgccaagcag 240
ggactgcagg gcgctcagat gggacagccc tggtgcttct tcccaccctc ctaccccagc 300ggactgcagg gcgctcagat gggacagccc tggtgcttct tcccaccctc ctaccccagc 300
tacaagctgg aaaacctgag cagcagcgag atgggctaca ccgccaccct gaccagaacc 360tacaagctgg aaaacctgag cagcagcgag atgggctaca ccgccaccct gaccagaacc 360
acccccacat tcttcccaaa ggacatcctg accctgcggc tggacgtgat gatggaaacc 420acccccacat tcttcccaaa ggacatcctg accctgcggc tggacgtgat gatggaaacc 420
gagaaccggc tgcacttcac catcaaggac cccgccaatc ggagatacga ggtgcccctg 480gagaaccggc tgcacttcac catcaaggac cccgccaatc ggagatacga ggtgcccctg 480
gaaacccccc acgtgcactc tagagccccc agccctctgt acagcgtgga attcagcgag 540gaaacccccc acgtgcactc tagagccccc agccctctgt acagcgtgga attcagcgag 540
gaacccttcg gcgtgatcgt gcggagacag ctggatggca gagtgctgct gaacaccacc 600gaacccttcg gcgtgatcgt gcggagacag ctggatggca gagtgctgct gaacaccacc 600
gtggcccctc tgttcttcgc cgaccagttc ctgcagctga gcaccagcct gcccagccag 660gtggcccctc tgttcttcgc cgaccagttc ctgcagctga gcaccagcct gcccagccag 660
tacatcacag gactggccga gcacctgagc cccctgatgc tgagcacatc ctggacccgg 720tacatcacag gactggccga gcacctgagc cccctgatgc tgagcacatc ctggacccgg 720
atcaccctgt ggaacaggga tctggcccct acccctggcg ccaatctgta cggcagccac 780atcaccctgt ggaacagggga tctggcccct acccctggcg ccaatctgta cggcagccac 780
cctttctacc tggccctgga agatggcgga tctgcccacg gagtgtttct gctgaactcc 840cctttctacc tggccctgga agatggcggga tctgcccacg gagtgtttct gctgaactcc 840
aacgccatgg acgtggtgct gcagcctagc cctgccctgt cttggagaag cacaggcggc 900aacgccatgg acgtggtgct gcagcctagc cctgccctgt cttggagaag cacaggcggc 900
atcctggatg tgtacatctt tctgggcccc gagcccaaga gcgtggtgca gcagtatctg 960atcctggatg tgtacatctt tctgggcccc gagcccaaga gcgtggtgca gcagtatctg 960
gatgtcgtgg gctacccctt catgccccct tactggggcc tgggattcca cctgtgcaga 1020gatgtcgtgg gctacccctt catgccccct tactggggcc tgggattcca cctgtgcaga 1020
tggggctact ccagcaccgc catcaccaga caggtggtgg aaaacatgac cagagcccac 1080tggggctact ccagcaccgc catcaccaga caggtggtgg aaaacatgac cagagcccac 1080
ttcccactgg atgtgcagtg gaacgacctg gactacatgg acagcagacg ggacttcacc 1140ttcccactgg atgtgcagtg gaacgacctg gactacatgg acagcagacg ggacttcacc 1140
ttcaacaagg acggcttccg ggacttcccc gccatggtgc aggaactgca tcagggcggc 1200ttcaacaagg acggcttccg ggacttcccc gccatggtgc aggaactgca tcagggcggc 1200
agacggtaca tgatgatcgt ggatcccgcc atcagctcct ctggccctgc cggctcttac 1260agacggtaca tgatgatcgt ggatcccgcc atcagctcct ctggccctgc cggctcttac 1260
agaccctacg acgagggcct gcggagaggc gtgttcatca ccaacgagac aggccagccc 1320agaccctacg acgaggggcct gcggagaggc gtgttcatca ccaacgagac aggccagccc 1320
ctgatcggca aagtgtggcc tggcagcaca gccttccccg acttcaccaa tcctaccgcc 1380ctgatcggca aagtgtggcc tggcagcaca gccttccccg acttcaccaa tcctaccgcc 1380
ctggcttggt gggaggacat ggtggccgag ttccacgacc aggtgccctt cgacggcatg 1440ctggcttggt gggaggacat ggtggccgag ttccacgacc aggtgccctt cgacggcatg 1440
tggatcgaca tgaacgagcc cagcaacttc atccggggca gcgaggatgg ctgccccaac 1500tggatcgaca tgaacgagcc cagcaacttc atccggggca gcgaggatgg ctgccccaac 1500
aacgaactgg aaaatccccc ttacgtgccc ggcgtcgtgg gcggaacact gcaggccgct 1560aacgaactgg aaaatccccc ttacgtgccc ggcgtcgtgg gcggaacact gcaggccgct 1560
acaatctgtg ccagcagcca ccagtttctg agcacccact acaacctgca caacctgtac 16201620
ggcctgaccg aggccattgc cagccaccgc gctctcgtga aagccagagg cacacggccc 1680ggcctgaccg aggccattgc cagccaccgc gctctcgtga aagccagagg cacacggccc 1680
ttcgtgatca gcagaagcac ctttgccggc cacggcagat acgccggaca ttggactggc 1740ttcgtgatca gcagaagcac ctttgccggc cacggcagat acgccggaca ttggactggc 1740
gacgtgtggt cctcttggga gcagctggcc tctagcgtgc ccgagatcct gcagttcaat 1800gacgtgtggt cctcttggga gcagctggcc tctagcgtgc ccgagatcct gcagttcaat 1800
ctgctgggcg tgccactcgt gggcgccgat gtgtgtggct tcctgggcaa cacctccgag 1860ctgctgggcg tgccactcgt gggcgccgat gtgtgtggct tcctgggcaa cacctccgag 1860
gaactgtgtg tgcggtggac acagctgggc gccttctacc ctttcatgag aaaccacaac 1920gaactgtgtg tgcggtggac acagctgggc gccttctacc ctttcatgag aaaccacaac 1920
agcctgctga gcctgcccca ggaaccctac agctttagcg agcctgcaca gcaggccatg 1980agcctgctga gcctgcccca ggaaccctac agctttagcg agcctgcaca gcaggccatg 1980
cggaaggccc tgacactgag atacgctctg ctgccccacc tgtacaccct gtttcaccag 2040cggaaggccc tgacactgag atacgctctg ctgccccacc tgtacaccct gtttcaccag 2040
gcccatgtgg ccggcgagac agtggccaga cctctgtttc tggaattccc caaggacagc 2100gcccatgtgg ccggcgagac agtggccaga cctctgtttc tggaattccc caaggacagc 2100
agcacctgga ccgtggacca tcagctgctg tggggagagg ctctgctgat taccccagtg 2160agcacctgga ccgtggacca tcagctgctg tggggagagg ctctgctgat taccccagtg 2160
ctgcaggcag gcaaggccga agtgaccggc tactttcccc tgggcacttg gtacgacctg 2220ctgcaggcag gcaaggccga agtgaccggc tactttcccc tgggcacttg gtacgacctg 2220
cagaccgtgc ctgtggaagc cctgggatct ctgcctccac ctcctgccgc tcctagagag 2280cagaccgtgc ctgtggaagc cctgggatct ctgcctccac ctcctgccgc tcctagagag 2280
cctgccattc actctgaggg ccagtgggtc acactgcctg cccccctgga taccatcaac 2340cctgccattc actctgagg ccagtgggtc acactgcctg cccccctgga taccatcaac 2340
gtgcacctga gggccggcta catcatacca ctgcagggac ctggcctgac caccaccgag 2400gtgcacctga gggccggcta catcatacca ctgcagggac ctggcctgac caccaccgag 2400
tctagacagc agccaatggc cctggccgtg gccctgacca aaggcggaga agctaggggc 2460tctagacagc agccaatggc cctggccgtg gccctgacca aaggcggaga agctagggggc 2460
gagctgttct gggacgatgg cgagagcctg gaagtgctgg aaagaggcgc ctatacccaa 2520gagctgttct gggacgatgg cgagagcctg gaagtgctgg aaagaggcgc ctatacccaa 2520
gtgatcttcc tggcccggaa caacaccatc gtgaacgagc tggtgcgcgt gacctctgaa 2580gtgatcttcc tggcccggaa caacaccatc gtgaacgagc tggtgcgcgt gaccctctgaa 2580
ggcgctggac tgcagctgca gaaagtgacc gtgctgggag tggccacagc ccctcagcag 2640ggcgctggac tgcagctgca gaaagtgacc gtgctgggag tggccacagc ccctcagcag 2640
gtgctgtcta atggcgtgcc cgtgtccaac ttcacctaca gccccgacac caaggtgctg 2700gtgctgtcta atggcgtgcc cgtgtccaac ttcacctaca gccccgacac caaggtgctg 2700
gacatctgcg tgtcactgct gatgggagag cagtttctgg tgtcctggtg ctga 2754gacatctgcg tgtcactgct gatgggagag cagtttctgg tgtcctggtg ctga 2754
<210> 13<210> 13
<211> 2754<211> 2754
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> hGAAco2-дельта8 без sp<223> hGAAco2-delta8 without sp
<400> 13<400> 13
ctgttggtgc ctagagagct gagcggatca tccccagtgc tggaggagac tcatcctgct 60ctgttggtgc ctagagagct gagcggatca tccccagtgc tggaggagac tcatcctgct 60
caccaacagg gagcttccag accaggaccg agagacgccc aagcccatcc tggtagacca 120caccaacagg gagcttccag accaggaccg agagacgccc aagcccatcc tggtagacca 120
agagctgtgc ctacccaatg cgacgtgcca cccaactccc gattcgactg cgcgccagat 180agagctgtgc ctacccaatg cgacgtgcca cccaactccc gattcgactg cgcgccagat 180
aaggctatta cccaagagca gtgtgaagcc agaggttgct gctacatccc agcgaagcaa 240aaggctatta cccaaagca gtgtgaagcc agaggttgct gctacatccc agcgaagcaa 240
ggattgcaag gcgcccaaat gggacaacct tggtgtttct tccccccttc gtacccatca 300ggattgcaag gcgcccaaat gggacaacct tggtgtttct tccccccttc gtacccatca 300
tataaactcg aaaacctgtc ctcttcggaa atgggttata ctgccaccct caccagaact 360tataaactcg aaaacctgtc ctcttcggaa atgggttata ctgccaccct caccagaact 360
actcctactt tcttcccgaa agacatcttg accttgaggc tggacgtgat gatggagact 420actcctactt tcttcccgaa agacatcttg accttgaggc tggacgtgat gatggagact 420
gaaaaccggc tgcatttcac tatcaaagat cctgccaatc ggcgatacga ggtccctctg 480gaaaaccggc tgcatttcac tatcaaagat cctgccaatc ggcgatacga ggtccctctg 480
gaaacccctc acgtgcactc acgggctcct tctccgcttt actccgtcga attctctgag 540gaaacccctc acgtgcactc acgggctcct tctccgcttt actccgtcga attctctgag 540
gaacccttcg gagtgatcgt tagacgccag ctggatggta gagtgctgtt gaacactact 600gaacccttcg gagtgatcgt tagacgccag ctggatggta gagtgctgtt gaacactact 600
gtggccccac ttttcttcgc tgaccagttt ctgcaactgt ccacttccct gccatcccag 660gtggccccac ttttcttcgc tgaccagttt ctgcaactgt ccacttccct gccatcccag 660
tacattactg gactcgccga acacctgtcg ccactgatgc tctcgacctc ttggactaga 720tacattactg gactcgccga acacctgtcg ccactgatgc tctcgacctc ttggactaga 720
atcactttgt ggaacagaga cttggcccct actccgggag caaatctgta cggaagccac 780atcactttgt ggaacagaga cttggcccct actccgggag caaatctgta cggaagccac 780
cctttttacc tggcgctcga agatggcgga tccgctcacg gagtgttcct gctgaatagc 840cctttttacc tggcgctcga agatggcgga tccgctcacg gagtgttcct gctgaatagc 840
aacgcaatgg acgtggtgct gcaaccttcc cctgcactca gttggagaag taccgggggt 900aacgcaatgg acgtggtgct gcaaccttcc cctgcactca gttggagaag taccgggggt 900
attctggacg tgtacatctt cctcggacca gaacccaaga gcgtggtgca gcaatatctg 960attctggacg tgtacatctt cctcggacca gaacccaaga gcgtggtgca gcaatatctg 960
gacgtggtcg gatacccttt tatgcctcct tactggggac tgggattcca cctttgccgt 1020gacgtggtcg gatacccttt tatgcctcct tactggggac tgggattcca cctttgccgt 1020
tggggctact catccaccgc cattaccaga caggtggtgg agaatatgac cagagcccac 1080tggggctact catccaccgc cattaccaga caggtggtgg agaatatgac cagagcccac 1080
ttccctctcg acgtgcagtg gaacgatctg gactatatgg actcccggag agatttcacc 1140ttccctctcg acgtgcagtg gaacgatctg gactatatgg actcccggag agatttcacc 1140
ttcaacaagg acgggttccg cgattttccc gcgatggttc aagagctcca ccagggtggt 1200ttcaacaagg acgggttccg cgattttccc gcgatggttc aagagctcca ccagggtggt 1200
cgaagatata tgatgatcgt cgacccagcc atttcgagca gcggacccgc tggatcttat 1260cgaagatata tgatgatcgt cgacccagcc atttcgagca gcggacccgc tggatcttat 1260
agaccttacg acgaaggcct taggagagga gtgttcatca caaacgagac tggacagcct 1320agaccttacg acgaaggcct taggagagga gtgttcatca caaacgagac tggacagcct 1320
ttgatcggta aagtgtggcc tggatcaacc gcctttcctg actttaccaa tcccactgcc 1380ttgatcggta aagtgtggcc tggatcaacc gcctttcctg actttaccaa tcccactgcc 1380
ttggcttggt gggaggacat ggtggccgaa ttccacgacc aagtcccctt tgatggaatg 1440ttggcttggt gggaggacat ggtggccgaa ttccacgacc aagtcccctt tgatggaatg 1440
tggatcgata tgaacgaacc aagcaatttt atcagaggtt ccgaagacgg ttgccccaac 1500tggatcgata tgaacgaacc aagcaatttt atcagaggtt ccgaagacgg ttgccccaac 1500
aacgaactgg aaaaccctcc ttatgtgccc ggagtcgtgg gcggaacatt acaggccgcg 1560aacgaactgg aaaaccctcc ttatgtgccc ggagtcgtgg gcggaacatt acaggccgcg 1560
actatttgcg ccagcagcca ccaattcctg tccactcact acaacctcca caacctttat 1620actatttgcg ccagcagcca ccaattcctg tccactcact acaacctcca caacctttat 1620
ggattaaccg aagctattgc aagtcacagg gctctggtga aggctagagg gactaggccc 1680ggattaaccg aagctattgc aagtcacagg gctctggtga aggctagagg gactaggccc 1680
tttgtgatct cccgatccac ctttgccgga cacgggagat acgccggtca ctggactggt 1740tttgtgatct cccgatccac ctttgccgga cacgggagat acgccggtca ctggactggt 1740
gacgtgtgga gctcatggga acaactggcc tcctccgtgc cggaaatctt acagttcaac 1800gacgtgtgga gctcatggga acaactggcc tcctccgtgc cggaaatctt acagttcaac 1800
cttctgggtg tccctcttgt cggagcagac gtgtgtgggt ttcttggtaa cacctccgag 1860cttctgggtg tccctcttgt cggagcagac gtgtgtgggt ttcttggtaa cacctccgag 1860
gaactgtgtg tgcgctggac tcaactgggt gcattctacc cattcatgag aaaccacaac 1920gaactgtgtg tgcgctggac tcaactgggt gcattctacc cattcatgag aaaccacaac 1920
tccttgctgt ccctgccaca agagccctac tcgttcagcg agcctgcaca acaggctatg 1980tccttgctgt ccctgccaca agagccctac tcgttcagcg agcctgcaca acaggctatg 1980
cggaaggcac tgaccctgag atacgccctg cttccacact tatacactct cttccatcaa 2040cggaaggcac tgaccctgag atacgccctg cttccacact tatacactct cttccatcaa 2040
gcgcatgtgg caggagaaac cgttgcaagg cctcttttcc ttgaattccc caaggattcc 2100gcgcatgtgg caggagaaac cgttgcaagg cctcttttcc ttgaattccc caaggattcc 2100
tcgacttgga cggtggatca tcagctgctg tggggagaag ctctgctgat tactccagtg 2160tcgacttgga cggtggatca tcagctgctg tggggagaag ctctgctgat tactccagtg 2160
ttgcaagccg gaaaagctga ggtgaccgga tactttccgc tgggaacctg gtacgacctc 2220ttgcaagccg gaaaagctga ggtgaccgga tactttccgc tgggaacctg gtacgacctc 2220
cagactgtcc ctgttgaagc ccttggatca ctgcctccgc ctccggcagc tccacgcgaa 2280cagactgtcc ctgttgaagc ccttggatca ctgcctccgc ctccggcagc tccacgcgaa 2280
ccagctatac attccgaggg acagtgggtt acattaccag ctcctctgga cacaatcaac 2340ccagctatac attccgagg acagtgggtt acattaccag ctcctctgga cacaatcaac 2340
gtccacttaa gagctggcta cattatccct ctgcaaggac caggactgac tacgaccgag 2400gtccacttaa gagctggcta cattatccct ctgcaaggac caggactgac tacgaccgag 2400
agcagacagc agccaatggc actggctgtg gctctgacca agggagggga agctagagga 2460agcagacagc agccaatggc actggctgtg gctctgacca agggagggga agctagagga 2460
gaactcttct gggatgatgg ggagtccctt gaagtgctgg aaagaggcgc ttacactcaa 2520gaactcttct gggatgatgg ggagtccctt gaagtgctgg aaagaggcgc ttacactcaa 2520
gtcattttcc ttgcacggaa caacaccatt gtgaacgaat tggtgcgagt gaccagcgaa 2580gtcattttcc ttgcacggaa caacaccatt gtgaacgaat tggtgcgagt gaccagcgaa 2580
ggagctggac ttcaactgca gaaggtcact gtgctcggag tggctaccgc tcctcagcaa 2640ggagctggac ttcaactgca gaaggtcact gtgctcggag tggctaccgc tcctcagcaa 2640
gtgctgtcga atggagtccc cgtgtcaaac tttacctact cccctgacac taaggtgctc 2700gtgctgtcga atggagtccc cgtgtcaaac tttacctact cccctgacac taaggtgctc 2700
gacatttgcg tgtccctcct gatgggagag cagttccttg tgtcctggtg ttga 2754gacatttgcg tgtccctcct gatgggagag cagttccttg tgtcctggtg ttga 2754
<210> 14<210> 14
<211> 397<211> 397
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> промотор hAAT <223> hAAT promoter
<400> 14<400> 14
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 360cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 360
cagcttcagg caccaccact gacctgggac agtgaat 397cagcttcagg caccaccact gacctgggac agtgaat 397
<210> 15<210> 15
<211> 321<211> 321
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> управляющая область ApoE <223> ApoE control area
<400> 15<400> 15
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctggggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg g 321ggtttaggta gtgtgagagg g 321
<210> 16<210> 16
<211> 441<211> 441
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> интрон HBB2 <223> HBB2 intron
<400> 16<400> 16
gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60
cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120
gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180gggcaataat gtacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180
atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240
aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300
ttattttatg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360ttatttttatg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360
tcatgttcat acctcttatc ttcctcccac agctcctggg caacgtgctg gtctgtgtgc 420tcatgttcat acctcttatc ttcctcccac agctcctggg caacgtgctg gtctgtgtgc 420
tggcccatca ctttggcaaa g 441tggcccatca ctttggcaaa g 441
<210> 17<210> 17
<211> 441<211> 441
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> модифицированный интрон HBB2 <223> modified HBB2 intron
<400> 17<400> 17
gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60gtacacatat tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt 60
cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120cttttaatat acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca 120
gggcaataat gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180gggcaataat gtacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata 180
atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240atttctgggt taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt 240
aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300aactgatgta agaggtttca tattgctaat agcagctaca atccagctac cattctgctt 300
ttattttctg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360ttatttttctg gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa 360
tcttgttcat acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc 420tcttgttcat acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc 420
tggcccatca ctttggcaaa g 441tggcccatca ctttggcaaa g 441
<210> 18<210> 18
<211> 1438<211> 1438
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> интрон FIX <223> intron FIX
<400> 18<400> 18
ggtttgtttc cttttttaaa atacattgag tatgcttgcc ttttagatat agaaatatct 60ggtttgtttc cttttttaaa atacattgag tatgcttgcc tttttagatat agaaatatct 60
gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120
acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180
atttttaaaa ctaaatagat cgacaatgct tatgatgcat ttatgtttaa taaacactgt 240atttttaaaa ctaaatagat cgacaatgct tatgatgcat ttatgtttaa taaacactgt 240
tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300
aaattaaaag tgggaaaaca aagaaatagc agaatatagt gaaaaaaaat aaccacatta 360360
tttttgtttg gacttaccac tttgaaatca aaatgggaaa caaaagcaca aacaatggcc 420tttttgtttg gacttaccac tttgaaatca aaatgggaaa caaaagcaca aacaatggcc 420
ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480
aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540
cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600
ggaaaaaatc attttgtctc tatgtcaaac atcttggagt tgatatttgg ggaaacacaa 660660
tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720
agttagctaa tgcaacatat atcactttgt tttttcacaa ctacagtgac tttatgtatt 780agttagctaa tgcaacatat atcactttgt tttttcacaa ctacagtgac tttatgtatt 780
tcccagagga aggcatacag ggaagaaatt atcccatttg gacaaacagc atgttctcac 840tccgagga aggcatacag ggaagaaatt atcccatttg gacaaacagc atgttctcac 840
aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900
accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960
cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020
tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080
agggtgatgg atcactttgc aaagatcctc aatgagctat tttcaagtga tgacaaagtg 1140agggtgatgg atcactttgc aaagatcctc aatgagctat tttcaagtga tgacaaagtg 1140
tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200
agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260
cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320
aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 13801380
aaattttcat gatgttttct tttttgctaa aactaaagaa ttattctttt acatttca 1438aaattttcat gatgttttct tttttgctaa aactaaagaa ttattctttt acatttca 1438
<210> 19<210> 19
<211> 1438<211> 1438
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> модифицированный интрон FIX <223> modified FIX intron
<400> 19<400> 19
ggtttgtttc cttttttaaa atacattgag tatgcttgcc ttttagatat agaaatatct 60ggtttgtttc cttttttaaa atacattgag tatgcttgcc tttttagatat agaaatatct 60
gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120gatgctgtct tcttcactaa attttgatta catgatttga cagcaatatt gaagagtcta 120
acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180acagccagca cgcaggttgg taagtactgg ttctttgtta gctaggtttt cttcttcttc 180
atttttaaaa ctaaatagat cgacattgct tttgttgcat ttatgtttaa taaacactgt 240atttttaaaa ctaaatagat cgacattgct tttgttgcat ttatgtttaa taaacactgt 240
tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300tcagttcatg atttggtcat gtaattcctg ttagaaaaca ttcatctcct tggtttaaaa 300
aaattaaaag tgggaaaaca aagaaatagc agaatatagt gaaaaaaaat aaccacatta 360360
tttttgtttg gacttaccac tttgaaatca aattgggaaa caaaagcaca aacaatggcc 420tttttgtttg gacttaccac tttgaaatca aattgggaaa caaaagcaca aacaatggcc 420
ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480ttatttacac aaaaagtctg attttaagat atatgacatt tcaaggtttc agaagtatgt 480
aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540aatgaggtgt gtctctaatt ttttaaatta tatatcttca atttaaagtt ttagttaaaa 540
cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600cataaagatt aacctttcat tagcaagctg ttagttatca ccaacgcttt tcatggatta 600
ggaaaaaatc attttgtctc tttgtcaaac atcttggagt tgatatttgg ggaaacacaa 660660
tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720tactcagttg agttccctag gggagaaaag cacgcttaag aattgacata aagagtagga 720
agttagctat tgcaacatat atcactttgt tttttcacaa ctacagtgac tttttgtatt 780agttagctat tgcaacatat atcactttgt tttttcacaa ctacagtgac tttttgtatt 780
tcccagagga aggcatacag ggaagaaatt atcccatttg gacaaacagc ttgttctcac 840tccgagga aggcatacag ggaagaaatt atcccatttg gacaaacagc ttgttctcac 840
aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900aggaagcatt tatcacactt acttgtcaac tttctagaat caaatctagt agctgacagt 900
accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960accaggatca ggggtgccaa ccctaagcac ccccagaaag ctgactggcc ctgtggttcc 960
cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020cactccagac atgatgtcag ctgtgaaatc gacgtcgctg gaccataatt aggcttctgt 1020
tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080tcttcaggag acatttgttc aaagtcattt gggcaaccat attctgaaaa cagcccagcc 1080
agggtgttgg atcactttgc aaagatcctc attgagctat tttcaagtgt tgacaaagtg 1140agggtgttgg atcactttgc aaagatcctc attgagctat tttcaagtgt tgacaaagtg 1140
tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200tgaagttaac cgctcatttg agaactttct ttttcatcca aagtaaattc aaatatgatt 1200
agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260agaaatctga ccttttatta ctggaattct cttgactaaa agtaaaattg aattttaatt 1260
cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320cctaaatctc catgtgtata cagtactgtg ggaacatcac agattttggc tccatgccct 1320
aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 13801380
aaattttctt gttgttttct tttttgctaa aactaaagaa ttattctttt acatttca 14381438
<210> 20<210> 20
<211> 881<211> 881
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> интрон бета-глобина курицы <223> chicken beta-globin intron
<400> 20<400> 20
gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60
gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120
tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 180180
aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420
gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480
cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540
tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600
ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660
cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc 720cggctgtcga ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagaggggc 720
gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780
cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 840cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga 840
gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881
<210> 21<210> 21
<211> 881<211> 881
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> модифицированный интрон бета-глобина курицы <223> modified chicken beta-globin intron
<400> 21<400> 21
gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc 60
gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc 120
tccgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga 180180
aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg 240
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 300
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 360
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 420
gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480gtgcgtgggg gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca 480
cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540cccccctccc cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg 540
tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600tggcgcgggg ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc 600
ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660ggggccgcct cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg 660
cggctgtcga ggcgcggcga gccgcagcca ttgccttttt tggtaatcgt gcgagagggc 720cggctgtcga ggcgcggcga gccgcagcca ttgccttttt tggtaatcgt gcgagaggggc 720
gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780gcagggactt cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac 780
cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaat tgggcgggga 840cccctctagc gggcgcgggg cgaagcggtg cggcgccggc aggaaggaat tgggcgggga 840
gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881gggccttcgt gcgtcgccgc gccgccgtcc ccttctccct c 881
<210> 22<210> 22
<211> 4318<211> 4318
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> конструкция: sp2+hGAAwt-дельта-8<223> construct: sp2+hGAAwt-delta-8
<400> 22<400> 22
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctggggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780
cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020
taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 11401140
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200
acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260
ctttggcaaa gcacgcgtgc caccatgccg tcttctgtct cgtggggcat cctcctgctg 1320ctttggcaaa gcacgcgtgc caccatgccg tcttctgtct cgtggggcat cctcctgctg 1320
gcaggcctgt gctgcctggt ccctgtctcc ctggctctgc tggttccccg agagctgagt 1380gcaggcctgt gctgcctggt ccctgtctcc ctggctctgc tggttccccg agagctgagt 1380
ggctcctccc cagtcctgga ggagactcac ccagctcacc agcagggagc cagcagacca 1440ggctcctccc cagtcctgga ggagactcac ccagctcacc agcagggagc cagcagacca 1440
gggccccggg atgcccaggc acaccccggg cggccgcgag cagtgcccac acagtgcgac 1500gggccccggg atgcccaggc acaccccggg cggccgcgag cagtgcccac acagtgcgac 1500
gtccccccca acagccgctt cgattgcgcc cctgacaagg ccatcaccca ggaacagtgc 1560gtccccccca acagccgctt cgattgcgcc cctgacaagg ccatcaccca ggaacagtgc 1560
gaggcccgcg gctgttgcta catccctgca aagcaggggc tgcagggagc ccagatgggg 1620gaggcccgcg gctgttgcta catccctgca aagcaggggc tgcagggagc ccagatgggg 1620
cagccctggt gcttcttccc acccagctac cccagctaca agctggagaa cctgagctcc 1680cagccctggt gcttcttccc acccagctac cccagctaca agctggagaa cctgagctcc 1680
tctgaaatgg gctacacggc caccctgacc cgtaccaccc ccaccttctt ccccaaggac 1740tctgaaatgg gctacacggc caccctgacc cgtaccaccc ccaccttctt ccccaaggac 1740
atcctgaccc tgcggctgga cgtgatgatg gagactgaga accgcctcca cttcacgatc 1800atcctgaccc tgcggctgga cgtgatgatg gagactgaga accgcctcca cttcacgatc 1800
aaagatccag ctaacaggcg ctacgaggtg cccttggaga ccccgcatgt ccacagccgg 18601860
gcaccgtccc cactctacag cgtggagttc tccgaggagc ccttcggggt gatcgtgcgc 1920gcaccgtccc cactctacag cgtggagttc tccgaggagc ccttcggggt gatcgtgcgc 1920
cggcagctgg acggccgcgt gctgctgaac acgacggtgg cgcccctgtt ctttgcggac 1980cggcagctgg acggccgcgt gctgctgaac acgacggtgg cgcccctgtt ctttgcggac 1980
cagttccttc agctgtccac ctcgctgccc tcgcagtata tcacaggcct cgccgagcac 2040cagttccttc agctgtccac ctcgctgccc tcgcagtata tcacaggcct cgccgagcac 2040
ctcagtcccc tgatgctcag caccagctgg accaggatca ccctgtggaa ccgggacctt 2100ctcagtcccc tgatgctcag caccagctgg accaggatca ccctgtggaa ccgggacctt 2100
gcgcccacgc ccggtgcgaa cctctacggg tctcaccctt tctacctggc gctggaggac 2160gcgccccgc ccggtgcgaa cctctacggg tctcaccctt tctacctggc gctggaggac 2160
ggcgggtcgg cacacggggt gttcctgcta aacagcaatg ccatggatgt ggtcctgcag 2220ggcgggtcgg cacacggggt gttcctgcta aacagcaatg ccatggatgt ggtcctgcag 2220
ccgagccctg cccttagctg gaggtcgaca ggtgggatcc tggatgtcta catcttcctg 2280ccgagccctg cccttagctg gaggtcgaca ggtgggatcc tggatgtcta catcttcctg 2280
ggcccagagc ccaagagcgt ggtgcagcag tacctggacg ttgtgggata cccgttcatg 2340ggccgagc ccaagagcgt ggtgcagcag tacctggacg ttgtgggata cccgttcatg 2340
ccgccatact ggggcctggg cttccacctg tgccgctggg gctactcctc caccgctatc 2400ccgccatact ggggcctggg cttccacctg tgccgctggg gctactcctc caccgctatc 2400
acccgccagg tggtggagaa catgaccagg gcccacttcc ccctggacgt ccagtggaac 2460acccgccagg tggtggagaa catgaccagg gcccacttcc ccctggacgt ccagtggaac 2460
gacctggact acatggactc ccggagggac ttcacgttca acaaggatgg cttccgggac 2520gacctggact acatggactc ccggagggac ttcacgttca acaaggatgg cttccgggac 2520
ttcccggcca tggtgcagga gctgcaccag ggcggccggc gctacatgat gatcgtggat 2580ttcccggcca tggtgcagga gctgcaccag ggcggccggc gctacatgat gatcgtggat 2580
cctgccatca gcagctcggg ccctgccggg agctacaggc cctacgacga gggtctgcgg 2640cctgccatca gcagctcggg ccctgccggg agctacaggc cctacgacga gggtctgcgg 2640
aggggggttt tcatcaccaa cgagaccggc cagccgctga ttgggaaggt atggcccggg 2700aggggggttt tcatcaccaa cgagaccggc cagccgctga ttgggaaggt atggcccggg 2700
tccactgcct tccccgactt caccaacccc acagccctgg cctggtggga ggacatggtg 2760tccactgcct tccccgactt caccaacccc acagccctgg cctggtggga ggacatggtg 2760
gctgagttcc atgaccaggt gcccttcgac ggcatgtgga ttgacatgaa cgagccttcc 2820gctgagttcc atgaccaggt gcccttcgac ggcatgtgga ttgacatgaa cgagccttcc 2820
aacttcatca ggggctctga ggacggctgc cccaacaatg agctggagaa cccaccctac 2880aacttcatca ggggctctga ggacggctgc cccaacaatg agctggagaa cccaccctac 2880
gtgcctgggg tggttggggg gaccctccag gcggccacca tctgtgcctc cagccaccag 2940gtgcctgggg tggttggggg gaccctccag gcggccacca tctgtgcctc cagccaccag 2940
tttctctcca cacactacaa cctgcacaac ctctacggcc tgaccgaagc catcgcctcc 3000tttctctcca cacactacaa cctgcacaac ctctacggcc tgaccgaagc catcgcctcc 3000
cacagggcgc tggtgaaggc tcgggggaca cgcccatttg tgatctcccg ctcgaccttt 30603060
gctggccacg gccgatacgc cggccactgg acgggggacg tgtggagctc ctgggagcag 3120gctggccacg gccgatacgc cggccactgg acggggggacg tgtggagctc ctgggagcag 3120
ctcgcctcct ccgtgccaga aatcctgcag tttaacctgc tgggggtgcc tctggtcggg 3180ctcgcctcct ccgtgccaga aatcctgcag tttaacctgc tgggggtgcc tctggtcggg 3180
gccgacgtct gcggcttcct gggcaacacc tcagaggagc tgtgtgtgcg ctggacccag 3240gccgacgtct gcggcttcct gggcaacacc tcagaggagc tgtgtgtgcg ctggacccag 3240
ctgggggcct tctacccctt catgcggaac cacaacagcc tgctcagtct gccccaggag 3300ctgggggcct tctacccctt catgcggaac cacaacagcc tgctcagtct gccccaggag 3300
ccgtacagct tcagcgagcc ggcccagcag gccatgagga aggccctcac cctgcgctac 3360ccgtacagct tcagcgagcc ggcccagcag gccatgagga aggccctcac cctgcgctac 3360
gcactcctcc cccacctcta cacactgttc caccaggccc acgtcgcggg ggagaccgtg 3420gcactcctcc cccacctcta cacactgttc caccaggccc acgtcgcggg ggagaccgtg 3420
gcccggcccc tcttcctgga gttccccaag gactctagca cctggactgt ggaccaccag 3480gcccggcccc tcttcctgga gttccccaag gactctagca cctggactgt ggaccaccag 3480
ctcctgtggg gggaggccct gctcatcacc ccagtgctcc aggccgggaa ggccgaagtg 3540ctcctgtggggggaggccct gctcatcacc ccagtgctcc aggccgggaa ggccgaagtg 3540
actggctact tccccttggg cacatggtac gacctgcaga cggtgccagt agaggccctt 3600actggctact tccccttggg cacatggtac gacctgcaga cggtgccagt agaggccctt 3600
ggcagcctcc cacccccacc tgcagctccc cgtgagccag ccatccacag cgaggggcag 3660ggcagcctcc cacccccacc tgcagctccc cgtgagccag ccatccacag cgaggggcag 3660
tgggtgacgc tgccggcccc cctggacacc atcaacgtcc acctccgggc tgggtacatc 3720tgggtgacgc tgccggcccc cctggacacc atcaacgtcc acctccggggc tgggtacatc 3720
atccccctgc agggccctgg cctcacaacc acagagtccc gccagcagcc catggccctg 3780atccccctgc agggccctgg cctcacaacc acagagtccc gccagcagcc catggccctg 3780
gctgtggccc tgaccaaggg tggggaggcc cgaggggagc tgttctggga cgatggagag 3840gctgtggccc tgaccaaggg tggggaggcc cgaggggagc tgttctggga cgatggagag 3840
agcctggaag tgctggagcg aggggcctac acacaggtca tcttcctggc caggaataac 3900agcctggaag tgctggagcg aggggcctac acacaggtca tcttcctggc caggaataac 3900
acgatcgtga atgagctggt acgtgtgacc agtgagggag ctggcctgca gctgcagaag 3960acgatcgtga atgagctggt acgtgtgacc agtgagggag ctggcctgca gctgcagaag 3960
gtgactgtcc tgggcgtggc cacggcgccc cagcaggtcc tctccaacgg tgtccctgtc 4020gtgactgtcc tgggcgtggc cacggcgcc cagcaggtcc tctccaacgg tgtccctgtc 4020
tccaacttca cctacagccc cgacaccaag gtcctggaca tctgtgtctc gctgttgatg 4080tccaacttca cctacagccc cgacaccaag gtcctggaca tctgtgtctc gctgttgatg 4080
ggagagcagt ttctcgtcag ctggtgttag ctcgagagat ctaccggtga attcaccgcg 4140ggagagcagt ttctcgtcag ctggtgttag ctcgagagat ctaccggtga attcaccgcg 4140
ggtttaaact gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 4200ggtttaaact gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 4200
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 4260cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 4260
gcattgtctg agtaggtgtc attctattct ggggggtggg gtgggggcta gctctaga 4318gcattgtctg agtaggtgtc attctattct ggggggtggg gtgggggcta gctctaga 4318
<210> 23<210> 23
<211> 4318<211> 4318
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> конструкция: sp2+hGAAco1-дельта-8<223> construct: sp2+hGAAco1-delta-8
<400> 23<400> 23
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctggggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780
cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020
taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 11401140
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200
acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260
ctttggcaaa gcacgcgtgc caccatgcct agctctgtgt cctggggcat tctgctgctg 1320ctttggcaaa gcacgcgtgc caccatgcct agctctgtgt cctggggcat tctgctgctg 1320
gccggcctgt gttgtctggt gcctgtgtct ctggccctac tagtgcccag agagctgagc 1380gccggcctgt gttgtctggt gcctgtgtct ctggccctac tagtgcccag agagctgagc 1380
ggcagctctc ccgtgctgga agaaacacac cctgcccatc agcagggcgc ctctagacct 1440ggcagctctc ccgtgctgga agaaacacac cctgcccatc agcaggggcgc ctctagacct 1440
ggacctagag atgcccaggc ccaccccggc agacctagag ctgtgcctac ccagtgtgac 1500ggacctagag atgcccaggc ccaccccggc agacctagag ctgtgcctac ccagtgtgac 1500
gtgcccccca acagcagatt cgactgcgcc cctgacaagg ccatcaccca ggaacagtgc 1560gtgcccccca acagcagatt cgactgcgcc cctgacaagg ccatcaccca ggaacagtgc 1560
gaggccagag gctgctgcta catccctgcc aagcagggac tgcagggcgc tcagatggga 1620gaggccagag gctgctgcta catccctgcc aagcagggac tgcagggcgc tcagatggga 1620
cagccctggt gcttcttccc accctcctac cccagctaca agctggaaaa cctgagcagc 1680cagccctggt gcttcttccc accctcctac cccagctaca agctggaaaa cctgagcagc 1680
agcgagatgg gctacaccgc caccctgacc agaaccaccc ccacattctt cccaaaggac 1740agcgagatgg gctacaccgc caccctgacc agaaccaccc ccacattctt cccaaaggac 1740
atcctgaccc tgcggctgga cgtgatgatg gaaaccgaga accggctgca cttcaccatc 1800atcctgaccc tgcggctgga cgtgatgatg gaaaccgaga accggctgca cttcaccatc 1800
aaggaccccg ccaatcggag atacgaggtg cccctggaaa ccccccacgt gcactctaga 1860aaggaccccg ccaatcggag atacgaggtg cccctggaaa cccccccgt gcactctaga 1860
gcccccagcc ctctgtacag cgtggaattc agcgaggaac ccttcggcgt gatcgtgcgg 1920gcccccagcc ctctgtacag cgtggaattc agcgaggaac ccttcggcgt gatcgtgcgg 1920
agacagctgg atggcagagt gctgctgaac accaccgtgg cccctctgtt cttcgccgac 1980agacagctgg atggcagagt gctgctgaac accaccgtgg cccctctgtt cttcgccgac 1980
cagttcctgc agctgagcac cagcctgccc agccagtaca tcacaggact ggccgagcac 2040cagttcctgc agctgagcac cagcctgccc agccagtaca tcacaggact ggccgagcac 2040
ctgagccccc tgatgctgag cacatcctgg acccggatca ccctgtggaa cagggatctg 2100ctgagccccc tgatgctgag cacatcctgg acccggatca ccctgtggaa cagggatctg 2100
gcccctaccc ctggcgccaa tctgtacggc agccaccctt tctacctggc cctggaagat 2160gcccctaccc ctggcgccaa tctgtacggc agccaccctt tctacctggc cctggaagat 2160
ggcggatctg cccacggagt gtttctgctg aactccaacg ccatggacgt ggtgctgcag 2220ggcggatctg cccacggagt gtttctgctg aactccaacg ccatggacgt ggtgctgcag 2220
cctagccctg ccctgtcttg gagaagcaca ggcggcatcc tggatgtgta catctttctg 2280cctagccctg ccctgtcttg gagaagcaca ggcggcatcc tggatgtgta catctttctg 2280
ggccccgagc ccaagagcgt ggtgcagcag tatctggatg tcgtgggcta ccccttcatg 2340ggccccgagc ccaagagcgt ggtgcagcag tatctggatg tcgtgggcta ccccttcatg 2340
cccccttact ggggcctggg attccacctg tgcagatggg gctactccag caccgccatc 2400cccccttact ggggcctggg attccacctg tgcagatggg gctactccag caccgccatc 2400
accagacagg tggtggaaaa catgaccaga gcccacttcc cactggatgt gcagtggaac 2460accagacagg tggtggaaaa catgaccaga gcccacttcc cactggatgt gcagtggaac 2460
gacctggact acatggacag cagacgggac ttcaccttca acaaggacgg cttccgggac 2520gacctggact acatggacag cagacgggac ttcaccttca acaaggacgg cttccgggac 2520
ttccccgcca tggtgcagga actgcatcag ggcggcagac ggtacatgat gatcgtggat 2580ttccccgcca tggtgcagga actgcatcag ggcggcagac ggtacatgat gatcgtggat 2580
cccgccatca gctcctctgg ccctgccggc tcttacagac cctacgacga gggcctgcgg 2640cccgccatca gctcctctgg ccctgccggc tcttacagac cctacgacga gggcctgcgg 2640
agaggcgtgt tcatcaccaa cgagacaggc cagcccctga tcggcaaagt gtggcctggc 2700agaggcgtgt tcatcaccaa cgagacaggc cagcccctga tcggcaaagt gtggcctggc 2700
agcacagcct tccccgactt caccaatcct accgccctgg cttggtggga ggacatggtg 2760agcacagcct tccccgactt caccaatcct accgccctgg cttggtggga ggacatggtg 2760
gccgagttcc acgaccaggt gcccttcgac ggcatgtgga tcgacatgaa cgagcccagc 2820gccgagttcc acgaccaggt gcccttcgac ggcatgtgga tcgacatgaa cgagcccagc 2820
aacttcatcc ggggcagcga ggatggctgc cccaacaacg aactggaaaa tcccccttac 2880aacttcatcc ggggcagcga ggatggctgc cccaacaacg aactggaaaa tcccccttac 2880
gtgcccggcg tcgtgggcgg aacactgcag gccgctacaa tctgtgccag cagccaccag 2940gtgcccggcg tcgtgggcgg aacactgcag gccgctacaa tctgtgccag cagccaccag 2940
tttctgagca cccactacaa cctgcacaac ctgtacggcc tgaccgaggc cattgccagc 3000tttctgagca cccactacaa cctgcacaac ctgtacggcc tgaccgaggc cattgccagc 3000
caccgcgctc tcgtgaaagc cagaggcaca cggcccttcg tgatcagcag aagcaccttt 3060caccgcgctc tcgtgaaagc cagaggcaca cggcccttcg tgatcagcag aagcaccttt 3060
gccggccacg gcagatacgc cggacattgg actggcgacg tgtggtcctc ttgggagcag 3120gccggccacg gcagatacgc cggacattgg actggcgacg tgtggtcctc ttgggagcag 3120
ctggcctcta gcgtgcccga gatcctgcag ttcaatctgc tgggcgtgcc actcgtgggc 3180ctggcctcta gcgtgcccga gatcctgcag ttcaatctgc tgggcgtgcc actcgtgggc 3180
gccgatgtgt gtggcttcct gggcaacacc tccgaggaac tgtgtgtgcg gtggacacag 3240gccgatgtgt gtggcttcct gggcaacacc tccgaggaac tgtgtgtgcg gtggacacag 3240
ctgggcgcct tctacccttt catgagaaac cacaacagcc tgctgagcct gccccaggaa 3300ctgggcgcct tctacccttt catgagaaac cacaacagcc tgctgagcct gccccaggaa 3300
ccctacagct ttagcgagcc tgcacagcag gccatgcgga aggccctgac actgagatac 3360ccctacagct ttagcgagcc tgcacagcag gccatgcgga aggccctgac actgagatac 3360
gctctgctgc cccacctgta caccctgttt caccaggccc atgtggccgg cgagacagtg 3420gctctgctgc cccacctgta caccctgttt caccaggccc atgtggccgg cgagacagtg 3420
gccagacctc tgtttctgga attccccaag gacagcagca cctggaccgt ggaccatcag 3480gccagacctc tgtttctgga attccccaag gacagcagca cctggaccgt ggaccatcag 3480
ctgctgtggg gagaggctct gctgattacc ccagtgctgc aggcaggcaa ggccgaagtg 3540ctgctgtggg gagaggctct gctgattacc ccagtgctgc aggcaggcaa ggccgaagtg 3540
accggctact ttcccctggg cacttggtac gacctgcaga ccgtgcctgt ggaagccctg 3600accggctact ttcccctggg cacttggtac gacctgcaga ccgtgcctgt ggaagccctg 3600
ggatctctgc ctccacctcc tgccgctcct agagagcctg ccattcactc tgagggccag 3660ggatctctgc ctccacctcc tgccgctcct agagagcctg ccattcactc tgagggccag 3660
tgggtcacac tgcctgcccc cctggatacc atcaacgtgc acctgagggc cggctacatc 3720tgggtcacac tgcctgcccc cctggatacc atcaacgtgc acctgagggc cggctacatc 3720
ataccactgc agggacctgg cctgaccacc accgagtcta gacagcagcc aatggccctg 3780ataccactgc agggacctgg cctgaccacc accgagtcta gacagcagcc aatggccctg 3780
gccgtggccc tgaccaaagg cggagaagct aggggcgagc tgttctggga cgatggcgag 3840gccgtggccc tgaccaaagg cggagaagct aggggcgagc tgttctggga cgatggcgag 3840
agcctggaag tgctggaaag aggcgcctat acccaagtga tcttcctggc ccggaacaac 3900agcctggaag tgctggaaag aggcgcctat acccaagtga tcttcctggc ccggaacaac 3900
accatcgtga acgagctggt gcgcgtgacc tctgaaggcg ctggactgca gctgcagaaa 3960accatcgtga acgagctggt gcgcgtgacc tctgaaggcg ctggactgca gctgcagaaa 3960
gtgaccgtgc tgggagtggc cacagcccct cagcaggtgc tgtctaatgg cgtgcccgtg 4020gtgaccgtgc tgggagtggc cacagcccct cagcaggtgc tgtctaatgg cgtgcccgtg 4020
tccaacttca cctacagccc cgacaccaag gtgctggaca tctgcgtgtc actgctgatg 4080tccaacttca cctacagccc cgacaccaag gtgctggaca tctgcgtgtc actgctgatg 4080
ggagagcagt ttctggtgtc ctggtgctga ctcgagagat ctaccggtga attcaccgcg 4140ggagagcagt ttctggtgtc ctggtgctga ctcgagagat ctaccggtga attcaccgcg 4140
ggtttaaact gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 4200ggtttaaact gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 4200
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 4260cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 4260
gcattgtctg agtaggtgtc attctattct ggggggtggg gtgggggcta gctctaga 4318gcattgtctg agtaggtgtc attctattct ggggggtggg gtgggggcta gctctaga 4318
<210> 24<210> 24
<211> 4318<211> 4318
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> конструкция: sp2+hGAAco2-дельта-8<223> construct: sp2+hGAAco2-delta-8
<400> 24<400> 24
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctggggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780
cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020
taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 11401140
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200
acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260
ctttggcaaa gcacgcgtgc caccatgcca tcgtcagtgt cttggggcat tcttctgctc 1320ctttggcaaa gcacgcgtgc caccatgcca tcgtcagtgt cttggggcat tcttctgctc 1320
gccggattgt gttgcctggt gcctgtctca ttggccctgt tggtgcctag agagctgagc 1380gccggattgt gttgcctggt gcctgtctca ttggccctgt tggtgcctag agagctgagc 1380
ggatcatccc cagtgctgga ggagactcat cctgctcacc aacagggagc ttccagacca 1440ggatcatccc cagtgctgga ggagactcat cctgctcacc aacagggagc ttccagacca 1440
ggaccgagag acgcccaagc ccatcctggt agaccaagag ctgtgcctac ccaatgcgac 1500ggaccgagag acgcccaagc ccatcctggt agaccaagag ctgtgcctac ccaatgcgac 1500
gtgccaccca actcccgatt cgactgcgcg ccagataagg ctattaccca agagcagtgt 15601560
gaagccagag gttgctgcta catcccagcg aagcaaggat tgcaaggcgc ccaaatggga 1620gaagccagag gttgctgcta catcccagcg aagcaaggat tgcaaggcgc ccaaatggga 1620
caaccttggt gtttcttccc cccttcgtac ccatcatata aactcgaaaa cctgtcctct 1680caaccttggt gtttcttccc cccttcgtac ccatcatata aactcgaaaa cctgtcctct 1680
tcggaaatgg gttatactgc caccctcacc agaactactc ctactttctt cccgaaagac 1740tcggaaatgg gttatactgc caccctcacc agaactactc ctactttctt cccgaaagac 1740
atcttgacct tgaggctgga cgtgatgatg gagactgaaa accggctgca tttcactatc 1800atcttgacct tgaggctgga cgtgatgatg gagactgaaa accggctgca tttcactatc 1800
aaagatcctg ccaatcggcg atacgaggtc cctctggaaa cccctcacgt gcactcacgg 1860aaagatcctg ccaatcggcg atacgaggtc cctctggaaa cccctcacgt gcactcacgg 1860
gctccttctc cgctttactc cgtcgaattc tctgaggaac ccttcggagt gatcgttaga 1920gctccttctc cgctttactc cgtcgaattc tctgaggaac ccttcggagt gatcgttaga 1920
cgccagctgg atggtagagt gctgttgaac actactgtgg ccccactttt cttcgctgac 1980cgccagctgg atggtagagt gctgttgaac actactgtgg ccccactttt cttcgctgac 1980
cagtttctgc aactgtccac ttccctgcca tcccagtaca ttactggact cgccgaacac 2040cagtttctgc aactgtccac ttccctgcca tcccagtaca ttactggact cgccgaacac 2040
ctgtcgccac tgatgctctc gacctcttgg actagaatca ctttgtggaa cagagacttg 2100ctgtcgccac tgatgctctc gacctcttgg actagaatca ctttgtggaa cagagacttg 2100
gcccctactc cgggagcaaa tctgtacgga agccaccctt tttacctggc gctcgaagat 2160gcccctactc cgggagcaaa tctgtacgga agccaccctt tttacctggc gctcgaagat 2160
ggcggatccg ctcacggagt gttcctgctg aatagcaacg caatggacgt ggtgctgcaa 2220ggcggatccg ctcacggagt gttcctgctg aatagcaacg caatggacgt ggtgctgcaa 2220
ccttcccctg cactcagttg gagaagtacc gggggtattc tggacgtgta catcttcctc 2280ccttcccctg cactcagttg gagaagtacc gggggtattc tggacgtgta catcttcctc 2280
ggaccagaac ccaagagcgt ggtgcagcaa tatctggacg tggtcggata cccttttatg 2340ggaccagaac ccaagagcgt ggtgcagcaa tatctggacg tggtcggata cccttttatg 2340
cctccttact ggggactggg attccacctt tgccgttggg gctactcatc caccgccatt 2400cctccttact ggggactggg attccacctt tgccgttggg gctactcatc caccgccatt 2400
accagacagg tggtggagaa tatgaccaga gcccacttcc ctctcgacgt gcagtggaac 2460accagacagg tggtggagaa tatgaccaga gcccacttcc ctctcgacgt gcagtggaac 2460
gatctggact atatggactc ccggagagat ttcaccttca acaaggacgg gttccgcgat 2520gatctggact atatggactc ccggagagat ttcaccttca acaaggacgg gttccgcgat 2520
tttcccgcga tggttcaaga gctccaccag ggtggtcgaa gatatatgat gatcgtcgac 2580tttcccgcga tggttcaaga gctccaccag ggtggtcgaa gatatatgat gatcgtcgac 2580
ccagccattt cgagcagcgg acccgctgga tcttatagac cttacgacga aggccttagg 2640ccagccattt cgagcagcgg acccgctggga tcttatagac cttacgacga aggccttagg 2640
agaggagtgt tcatcacaaa cgagactgga cagcctttga tcggtaaagt gtggcctgga 2700agaggagtgt tcatcacaaa cgagactgga cagcctttga tcggtaaagt gtggcctgga 2700
tcaaccgcct ttcctgactt taccaatccc actgccttgg cttggtggga ggacatggtg 2760tcaaccgcct ttcctgactt taccaatccc actgccttgg cttggtggga ggacatggtg 2760
gccgaattcc acgaccaagt cccctttgat ggaatgtgga tcgatatgaa cgaaccaagc 2820gccgaattcc acgaccaagt cccctttgat ggaatgtgga tcgatatgaa cgaaccaagc 2820
aattttatca gaggttccga agacggttgc cccaacaacg aactggaaaa ccctccttat 28802880
gtgcccggag tcgtgggcgg aacattacag gccgcgacta tttgcgccag cagccaccaa 2940gtgcccggag tcgtgggcgg aacattacag gccgcgacta tttgcgccag cagccaccaa 2940
ttcctgtcca ctcactacaa cctccacaac ctttatggat taaccgaagc tattgcaagt 3000ttcctgtcca ctcactacaa cctccacaac ctttatggat taaccgaagc tattgcaagt 3000
cacagggctc tggtgaaggc tagagggact aggccctttg tgatctcccg atccaccttt 30603060
gccggacacg ggagatacgc cggtcactgg actggtgacg tgtggagctc atgggaacaa 3120gccggacacg ggagatacgc cggtcactgg actggtgacg tgtggagctc atgggaacaa 3120
ctggcctcct ccgtgccgga aatcttacag ttcaaccttc tgggtgtccc tcttgtcgga 3180ctggcctcct ccgtgccgga aatcttacag ttcaaccttc tgggtgtccc tcttgtcgga 3180
gcagacgtgt gtgggtttct tggtaacacc tccgaggaac tgtgtgtgcg ctggactcaa 32403240
ctgggtgcat tctacccatt catgagaaac cacaactcct tgctgtccct gccacaagag 3300ctgggtgcat tctacccatt catgagaaac cacaactcct tgctgtccct gccacaagag 3300
ccctactcgt tcagcgagcc tgcacaacag gctatgcgga aggcactgac cctgagatac 3360ccctactcgt tcagcgagcc tgcacaacag gctatgcgga aggcactgac cctgagatac 3360
gccctgcttc cacacttata cactctcttc catcaagcgc atgtggcagg agaaaccgtt 3420gccctgcttc cacacttata cactctcttc catcaagcgc atgtggcagg agaaaccgtt 3420
gcaaggcctc ttttccttga attccccaag gattcctcga cttggacggt ggatcatcag 3480gcaaggcctc ttttccttga attccccaag gattcctcga cttggacggt ggatcatcag 3480
ctgctgtggg gagaagctct gctgattact ccagtgttgc aagccggaaa agctgaggtg 3540ctgctgtggg gagaagctct gctgattact ccagtgttgc aagccggaaa agctgaggtg 3540
accggatact ttccgctggg aacctggtac gacctccaga ctgtccctgt tgaagccctt 3600accggatact ttccgctggg aacctggtac gacctccaga ctgtccctgt tgaagccctt 3600
ggatcactgc ctccgcctcc ggcagctcca cgcgaaccag ctatacattc cgagggacag 3660ggatcactgc ctccgcctcc ggcagctcca cgcgaaccag ctatacattc cgagggacag 3660
tgggttacat taccagctcc tctggacaca atcaacgtcc acttaagagc tggctacatt 37203720
atccctctgc aaggaccagg actgactacg accgagagca gacagcagcc aatggcactg 3780atccctctgc aaggaccagg actgactacg accgagagca gacagcagcc aatggcactg 3780
gctgtggctc tgaccaaggg aggggaagct agaggagaac tcttctggga tgatggggag 3840gctgtggctc tgaccaaggg aggggaagct agaggagaac tcttctggga tgatggggag 3840
tcccttgaag tgctggaaag aggcgcttac actcaagtca ttttccttgc acggaacaac 3900tcccttgaag tgctggaaag aggcgcttac actcaagtca ttttccttgc acggaacaac 3900
accattgtga acgaattggt gcgagtgacc agcgaaggag ctggacttca actgcagaag 3960accattgtga acgaattggt gcgagtgacc agcgaaggag ctggacttca actgcagaag 3960
gtcactgtgc tcggagtggc taccgctcct cagcaagtgc tgtcgaatgg agtccccgtg 4020gtcactgtgc tcggagtggc taccgctcct cagcaagtgc tgtcgaatgg agtccccgtg 4020
tcaaacttta cctactcccc tgacactaag gtgctcgaca tttgcgtgtc cctcctgatg 40804080
ggagagcagt tccttgtgtc ctggtgttga ctcgagagat ctaccggtga attcaccgcg 4140ggagagcagt tccttgtgtc ctggtgttga ctcgagagat ctaccggtga attcaccgcg 4140
ggtttaaact gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 4200ggtttaaact gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 4200
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 4260cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 4260
gcattgtctg agtaggtgtc attctattct ggggggtggg gtgggggcta gctctaga 4318gcattgtctg agtaggtgtc attctattct ggggggtggg gtgggggcta gctctaga 4318
<210> 25<210> 25
<211> 4300<211> 4300
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> конструкция: sp7+hGAAco1-дельта-8<223> construct: sp7+hGAAco1-delta-8
<400> 25<400> 25
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctggggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780
cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020
taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 11401140
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200
acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260
ctttggcaaa gcacgcgtgc caccatggcc tttctgtggc tgctgagctg ttgggccctg 13201320
ctgggcacca ccttcggcct actagtgccc agagagctga gcggcagctc tcccgtgctg 1380ctgggcacca ccttcggcct actagtgccc agagagctga gcggcagctc tcccgtgctg 1380
gaagaaacac accctgccca tcagcagggc gcctctagac ctggacctag agatgcccag 1440gaagaaacac accctgccca tcagcagggc gcctctagac ctggacctag agatgcccag 1440
gcccaccccg gcagacctag agctgtgcct acccagtgtg acgtgccccc caacagcaga 1500gcccaccccg gcagacctag agctgtgcct acccagtgtg acgtgccccc caacagcaga 1500
ttcgactgcg cccctgacaa ggccatcacc caggaacagt gcgaggccag aggctgctgc 1560ttcgactgcg cccctgacaa ggccatcacc caggaacagt gcgaggccag aggctgctgc 1560
tacatccctg ccaagcaggg actgcagggc gctcagatgg gacagccctg gtgcttcttc 1620tacatccctg ccaagcaggg actgcaggggc gctcagatgg gacagccctg gtgcttcttc 1620
ccaccctcct accccagcta caagctggaa aacctgagca gcagcgagat gggctacacc 1680ccaccctcct accccagcta caagctggaa aacctgagca gcagcgagat gggctacacc 1680
gccaccctga ccagaaccac ccccacattc ttcccaaagg acatcctgac cctgcggctg 1740gccaccctga ccagaaccac ccccacattc ttcccaaagg acatcctgac cctgcggctg 1740
gacgtgatga tggaaaccga gaaccggctg cacttcacca tcaaggaccc cgccaatcgg 1800gacgtgatga tggaaaccga gaaccggctg cacttcacca tcaaggaccc cgccaatcgg 1800
agatacgagg tgcccctgga aaccccccac gtgcactcta gagcccccag ccctctgtac 1860agatacgagg tgcccctgga aaccccccac gtgcactcta gagcccccag ccctctgtac 1860
agcgtggaat tcagcgagga acccttcggc gtgatcgtgc ggagacagct ggatggcaga 1920agcgtggaat tcagcgagga acccttcggc gtgatcgtgc ggagacagct ggatggcaga 1920
gtgctgctga acaccaccgt ggcccctctg ttcttcgccg accagttcct gcagctgagc 1980gtgctgctga acaccaccgt ggcccctctg ttcttcgccg accagttcct gcagctgagc 1980
accagcctgc ccagccagta catcacagga ctggccgagc acctgagccc cctgatgctg 2040accagcctgc ccagccagta catcacagga ctggccgagc acctgagccc cctgatgctg 2040
agcacatcct ggacccggat caccctgtgg aacagggatc tggcccctac ccctggcgcc 2100agcacatcct ggacccggat caccctgtgg aacagggatc tggcccctac ccctggcgcc 2100
aatctgtacg gcagccaccc tttctacctg gccctggaag atggcggatc tgcccacgga 2160aatctgtacg gcagccaccc tttctacctg gccctggaag atggcggatc tgccccggga 2160
gtgtttctgc tgaactccaa cgccatggac gtggtgctgc agcctagccc tgccctgtct 2220gtgtttctgc tgaactccaa cgccatggac gtggtgctgc agcctagccc tgccctgtct 2220
tggagaagca caggcggcat cctggatgtg tacatctttc tgggccccga gcccaagagc 2280tggagaagca caggcggcat cctggatgtg tacatctttc tgggccccga gcccaagagc 2280
gtggtgcagc agtatctgga tgtcgtgggc taccccttca tgccccctta ctggggcctg 2340gtggtgcagc agtatctgga tgtcgtgggc taccccttca tgccccctta ctggggcctg 2340
ggattccacc tgtgcagatg gggctactcc agcaccgcca tcaccagaca ggtggtggaa 2400ggattccacc tgtgcagatg gggctactcc agcaccgcca tcaccagaca ggtggtggaa 2400
aacatgacca gagcccactt cccactggat gtgcagtgga acgacctgga ctacatggac 2460aacatgacca gagcccactt cccactggat gtgcagtgga acgacctgga ctacatggac 2460
agcagacggg acttcacctt caacaaggac ggcttccggg acttccccgc catggtgcag 2520agcagacggg acttcacctt caacaaggac ggcttccggg acttccccgc catggtgcag 2520
gaactgcatc agggcggcag acggtacatg atgatcgtgg atcccgccat cagctcctct 2580gaactgcatc agggcggcag acggtacatg atgatcgtgg atcccgccat cagctcctct 2580
ggccctgccg gctcttacag accctacgac gagggcctgc ggagaggcgt gttcatcacc 2640ggccctgccg gctcttacag accctacgac gagggcctgc ggagaggcgt gttcatcacc 2640
aacgagacag gccagcccct gatcggcaaa gtgtggcctg gcagcacagc cttccccgac 2700aacgagacag gccagcccct gatcggcaaa gtgtggcctg gcagcacagc cttccccgac 2700
ttcaccaatc ctaccgccct ggcttggtgg gaggacatgg tggccgagtt ccacgaccag 2760ttcaccaatc ctaccgccct ggcttggtgg gaggacatgg tggccgagtt ccacgaccag 2760
gtgcccttcg acggcatgtg gatcgacatg aacgagccca gcaacttcat ccggggcagc 2820gtgcccttcg acggcatgtg gatcgacatg aacgagccca gcaacttcat ccggggcagc 2820
gaggatggct gccccaacaa cgaactggaa aatccccctt acgtgcccgg cgtcgtgggc 2880gaggatggct gccccaacaa cgaactggaa aatccccctt acgtgcccgg cgtcgtggggc 2880
ggaacactgc aggccgctac aatctgtgcc agcagccacc agtttctgag cacccactac 2940ggaacactgc aggccgctac aatctgtgcc agcagccacc agtttctgag cacccactac 2940
aacctgcaca acctgtacgg cctgaccgag gccattgcca gccaccgcgc tctcgtgaaa 3000aacctgcaca acctgtacgg cctgaccgag gccattgcca gccaccgcgc tctcgtgaaa 3000
gccagaggca cacggccctt cgtgatcagc agaagcacct ttgccggcca cggcagatac 3060gccagaggca cacggccctt cgtgatcagc agaagcacct ttgccggcca cggcagatac 3060
gccggacatt ggactggcga cgtgtggtcc tcttgggagc agctggcctc tagcgtgccc 3120gccggacatt ggactggcga cgtgtggtcc tcttgggagc agctggcctc tagcgtgccc 3120
gagatcctgc agttcaatct gctgggcgtg ccactcgtgg gcgccgatgt gtgtggcttc 3180gagatcctgc agttcaatct gctgggcgtg ccactcgtgg gcgccgatgt gtgtggcttc 3180
ctgggcaaca cctccgagga actgtgtgtg cggtggacac agctgggcgc cttctaccct 3240ctgggcaaca cctccgagga actgtgtgtg cggtggacac agctgggcgc cttctaccct 3240
ttcatgagaa accacaacag cctgctgagc ctgccccagg aaccctacag ctttagcgag 3300ttcatgagaa accacaacag ctgctgagc ctgccccagg aaccctacag ctttagcgag 3300
cctgcacagc aggccatgcg gaaggccctg acactgagat acgctctgct gccccacctg 3360ccctgcacagc aggccatgcg gaaggccctg acactgagat acgctctgct gccccacctg 3360
tacaccctgt ttcaccaggc ccatgtggcc ggcgagacag tggccagacc tctgtttctg 34203420
gaattcccca aggacagcag cacctggacc gtggaccatc agctgctgtg gggagaggct 3480gaattcccca aggacagcag cacctggacc gtggaccatc agctgctgtg gggagaggct 3480
ctgctgatta ccccagtgct gcaggcaggc aaggccgaag tgaccggcta ctttcccctg 3540ctgctgatta ccccagtgct gcaggcaggc aaggccgaag tgaccggcta ctttcccctg 3540
ggcacttggt acgacctgca gaccgtgcct gtggaagccc tgggatctct gcctccacct 3600ggcacttggt acgacctgca gaccgtgcct gtggaagccc tgggatctct gcctccacct 3600
cctgccgctc ctagagagcc tgccattcac tctgagggcc agtgggtcac actgcctgcc 3660cctgccgctc ctagagagcc tgccattcac tctgaggggcc agtgggtcac actgcctgcc 3660
cccctggata ccatcaacgt gcacctgagg gccggctaca tcataccact gcagggacct 3720cccctggata ccatcaacgt gcacctgagg gccggctaca tcataccact gcagggacct 3720
ggcctgacca ccaccgagtc tagacagcag ccaatggccc tggccgtggc cctgaccaaa 3780ggcctgacca ccaccgagtc tagacagcag ccaatggccc tggccgtggc cctgaccaaa 3780
ggcggagaag ctaggggcga gctgttctgg gacgatggcg agagcctgga agtgctggaa 3840ggcggagaag ctaggggcga gctgttctgg gacgatggcg agagcctgga agtgctggaa 3840
agaggcgcct atacccaagt gatcttcctg gcccggaaca acaccatcgt gaacgagctg 3900agaggcgcct atacccaagt gatcttcctg gccgggaaca acaccatcgt gaacgagctg 3900
gtgcgcgtga cctctgaagg cgctggactg cagctgcaga aagtgaccgt gctgggagtg 3960gtgcgcgtga cctctgaagg cgctggactg cagctgcaga aagtgaccgt gctgggagtg 3960
gccacagccc ctcagcaggt gctgtctaat ggcgtgcccg tgtccaactt cacctacagc 4020gccacagccc ctcagcaggt gctgtctaat ggcgtgcccg tgtccaactt cacctacagc 4020
cccgacacca aggtgctgga catctgcgtg tcactgctga tgggagagca gtttctggtg 4080cccgacacca aggtgctgga catctgcgtg tcactgctga tgggagagca gtttctggtg 4080
tcctggtgct gactcgagag atctaccggt gaattcaccg cgggtttaaa ctgtgccttc 4140tcctggtgct gactcgagag atctaccggt gaattcaccg cgggtttaaa ctgtgccttc 4140
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 4200tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 4200
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 4260cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 4260
tcattctatt ctggggggtg gggtgggggc tagctctaga 4300tcattctatt ctggggggtg gggtggggggc tagctctaga 4300
<210> 26<210> 26
<211> 4198<211> 4198
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> sp7+hGAAco1-дельта-42<223> sp7+hGAAco1-delta-42
<400> 26<400> 26
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctggggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780agtgaataga tcctgagaac ttcagggtga gtctatggga cccttgatgt tttctttccc 780
cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840cttcttttct atggttaagt tcatgtcata ggaaggggag aagtaacagg gtacacatat 840
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 900
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 960
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1020
taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080taaggcaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1080
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttctg 11401140
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcttgttcat 1200
acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260acctcttatc ttcctcccac agctcctggg caacctgctg gtctctctgc tggcccatca 1260
ctttggcaaa gcacgcgtgc caccatggcc tttctgtggc tgctgagctg ttgggccctg 13201320
ctgggcacca ccttcggcgc ccaccccggc agacctagag ctgtgcctac ccagtgtgac 1380ctgggcacca ccttcggcgc ccaccccggc agacctagag ctgtgcctac ccagtgtgac 1380
gtgcccccca acagcagatt cgactgcgcc cctgacaagg ccatcaccca ggaacagtgc 1440gtgcccccca acagcagatt cgactgcgcc cctgacaagg ccatcaccca ggaacagtgc 1440
gaggccagag gctgctgcta catccctgcc aagcagggac tgcagggcgc tcagatggga 1500gaggccagag gctgctgcta catccctgcc aagcagggac tgcagggcgc tcagatggga 1500
cagccctggt gcttcttccc accctcctac cccagctaca agctggaaaa cctgagcagc 1560cagccctggt gcttcttccc accctcctac cccagctaca agctggaaaa cctgagcagc 1560
agcgagatgg gctacaccgc caccctgacc agaaccaccc ccacattctt cccaaaggac 1620agcgagatgg gctacaccgc caccctgacc agaaccaccc ccacattctt cccaaaggac 1620
atcctgaccc tgcggctgga cgtgatgatg gaaaccgaga accggctgca cttcaccatc 1680atcctgaccc tgcggctgga cgtgatgatg gaaaccgaga accggctgca cttcaccatc 1680
aaggaccccg ccaatcggag atacgaggtg cccctggaaa ccccccacgt gcactctaga 1740aaggaccccg ccaatcggag atacgaggtg cccctggaaa cccccccgt gcactctaga 1740
gcccccagcc ctctgtacag cgtggaattc agcgaggaac ccttcggcgt gatcgtgcgg 1800gcccccagcc ctctgtacag cgtggaattc agcgaggaac ccttcggcgt gatcgtgcgg 1800
agacagctgg atggcagagt gctgctgaac accaccgtgg cccctctgtt cttcgccgac 1860agacagctgg atggcagagt gctgctgaac accaccgtgg cccctctgtt cttcgccgac 1860
cagttcctgc agctgagcac cagcctgccc agccagtaca tcacaggact ggccgagcac 1920cagttcctgc agctgagcac cagcctgccc agccagtaca tcacaggact ggccgagcac 1920
ctgagccccc tgatgctgag cacatcctgg acccggatca ccctgtggaa cagggatctg 1980ctgagcccccc tgatgctgag cacatcctgg acccggatca ccctgtggaa cagggatctg 1980
gcccctaccc ctggcgccaa tctgtacggc agccaccctt tctacctggc cctggaagat 2040gcccctaccc ctggcgccaa tctgtacggc agccaccctt tctacctggc cctggaagat 2040
ggcggatctg cccacggagt gtttctgctg aactccaacg ccatggacgt ggtgctgcag 2100ggcggatctg cccacggagt gtttctgctg aactccaacg ccatggacgt ggtgctgcag 2100
cctagccctg ccctgtcttg gagaagcaca ggcggcatcc tggatgtgta catctttctg 2160cctagccctg ccctgtcttg gagaagcaca ggcggcatcc tggatgtgta catctttctg 2160
ggccccgagc ccaagagcgt ggtgcagcag tatctggatg tcgtgggcta ccccttcatg 2220ggccccgagc ccaagagcgt ggtgcagcag tatctggatg tcgtgggcta ccccttcatg 2220
cccccttact ggggcctggg attccacctg tgcagatggg gctactccag caccgccatc 2280cccccttact ggggcctggg attccacctg tgcagatggg gctactccag caccgccatc 2280
accagacagg tggtggaaaa catgaccaga gcccacttcc cactggatgt gcagtggaac 2340accagacagg tggtggaaaa catgaccaga gcccacttcc cactggatgt gcagtggaac 2340
gacctggact acatggacag cagacgggac ttcaccttca acaaggacgg cttccgggac 2400gacctggact acatggacag cagacgggac ttcaccttca acaaggacgg cttccgggac 2400
ttccccgcca tggtgcagga actgcatcag ggcggcagac ggtacatgat gatcgtggat 2460ttccccgcca tggtgcagga actgcatcag ggcggcagac ggtacatgat gatcgtggat 2460
cccgccatca gctcctctgg ccctgccggc tcttacagac cctacgacga gggcctgcgg 2520cccgccatca gctcctctgg ccctgccggc tcttacagac cctacgacga gggcctgcgg 2520
agaggcgtgt tcatcaccaa cgagacaggc cagcccctga tcggcaaagt gtggcctggc 2580agaggcgtgt tcatcaccaa cgagacaggc cagcccctga tcggcaaagt gtggcctggc 2580
agcacagcct tccccgactt caccaatcct accgccctgg cttggtggga ggacatggtg 2640agcacagcct tccccgactt caccaatcct accgccctgg cttggtggga ggacatggtg 2640
gccgagttcc acgaccaggt gcccttcgac ggcatgtgga tcgacatgaa cgagcccagc 2700gccgagttcc acgaccaggt gcccttcgac ggcatgtgga tcgacatgaa cgagcccagc 2700
aacttcatcc ggggcagcga ggatggctgc cccaacaacg aactggaaaa tcccccttac 2760aacttcatcc ggggcagcga ggatggctgc cccaacaacg aactggaaaa tcccccttac 2760
gtgcccggcg tcgtgggcgg aacactgcag gccgctacaa tctgtgccag cagccaccag 2820gtgcccggcg tcgtgggcgg aacactgcag gccgctacaa tctgtgccag cagccaccag 2820
tttctgagca cccactacaa cctgcacaac ctgtacggcc tgaccgaggc cattgccagc 2880tttctgagca cccactacaa cctgcacaac ctgtacggcc tgaccgaggc cattgccagc 2880
caccgcgctc tcgtgaaagc cagaggcaca cggcccttcg tgatcagcag aagcaccttt 2940caccgcgctc tcgtgaaagc cagaggcaca cggcccttcg tgatcagcag aagcaccttt 2940
gccggccacg gcagatacgc cggacattgg actggcgacg tgtggtcctc ttgggagcag 3000gccggccacg gcagatacgc cggacattgg actggcgacg tgtggtcctc ttgggagcag 3000
ctggcctcta gcgtgcccga gatcctgcag ttcaatctgc tgggcgtgcc actcgtgggc 3060ctggcctcta gcgtgcccga gatcctgcag ttcaatctgc tgggcgtgcc actcgtgggc 3060
gccgatgtgt gtggcttcct gggcaacacc tccgaggaac tgtgtgtgcg gtggacacag 3120gccgatgtgt gtggcttcct gggcaacacc tccgaggaac tgtgtgtgcg gtggacacag 3120
ctgggcgcct tctacccttt catgagaaac cacaacagcc tgctgagcct gccccaggaa 3180ctgggcgcct tctacccttt catgagaaac cacaacagcc tgctgagcct gccccaggaa 3180
ccctacagct ttagcgagcc tgcacagcag gccatgcgga aggccctgac actgagatac 3240ccctacagct ttagcgagcc tgcacagcag gccatgcgga aggccctgac actgagatac 3240
gctctgctgc cccacctgta caccctgttt caccaggccc atgtggccgg cgagacagtg 3300gctctgctgc cccacctgta caccctgttt caccaggccc atgtggccgg cgagacagtg 3300
gccagacctc tgtttctgga attccccaag gacagcagca cctggaccgt ggaccatcag 3360gccagacctc tgtttctgga attccccaag gacagcagca cctggaccgt ggaccatcag 3360
ctgctgtggg gagaggctct gctgattacc ccagtgctgc aggcaggcaa ggccgaagtg 3420ctgctgtggg gagaggctct gctgattacc ccagtgctgc aggcaggcaa ggccgaagtg 3420
accggctact ttcccctggg cacttggtac gacctgcaga ccgtgcctgt ggaagccctg 3480accggctact ttcccctggg cacttggtac gacctgcaga ccgtgcctgt ggaagccctg 3480
ggatctctgc ctccacctcc tgccgctcct agagagcctg ccattcactc tgagggccag 3540ggatctctgc ctccacctcc tgccgctcct agagagcctg ccattcactc tgagggccag 3540
tgggtcacac tgcctgcccc cctggatacc atcaacgtgc acctgagggc cggctacatc 3600tgggtcacac tgcctgcccc cctggatacc atcaacgtgc acctgagggc cggctacatc 3600
ataccactgc agggacctgg cctgaccacc accgagtcta gacagcagcc aatggccctg 3660ataccactgc agggacctgg cctgaccacc accgagtcta gacagcagcc aatggccctg 3660
gccgtggccc tgaccaaagg cggagaagct aggggcgagc tgttctggga cgatggcgag 3720gccgtggccc tgaccaaagg cggagaagct aggggcgagc tgttctggga cgatggcgag 3720
agcctggaag tgctggaaag aggcgcctat acccaagtga tcttcctggc ccggaacaac 3780agcctggaag tgctggaaag aggcgcctat acccaagtga tcttcctggc ccggaacaac 3780
accatcgtga acgagctggt gcgcgtgacc tctgaaggcg ctggactgca gctgcagaaa 3840accatcgtga acgagctggt gcgcgtgacc tctgaaggcg ctggactgca gctgcagaaa 3840
gtgaccgtgc tgggagtggc cacagcccct cagcaggtgc tgtctaatgg cgtgcccgtg 3900gtgaccgtgc tgggagtggc cacagcccct cagcaggtgc tgtctaatgg cgtgcccgtg 3900
tccaacttca cctacagccc cgacaccaag gtgctggaca tctgcgtgtc actgctgatg 3960tccaacttca cctacagccc cgacaccaag gtgctggaca tctgcgtgtc actgctgatg 3960
ggagagcagt ttctggtgtc ctggtgctga ctcgagagat ctaccggtga attcaccgcg 4020ggagagcagt ttctggtgtc ctggtgctga ctcgagagat ctaccggtga attcaccgcg 4020
ggtttaaact gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 4080ggtttaaact gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 4080
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 4140cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 4140
gcattgtctg agtaggtgtc attctattct ggggggtggg gtgggggcta gctctaga 4198gcattgtctg agtaggtgtc attctattct ggggggtggg gtgggggcta gctctaga 4198
<210> 27<210> 27
<211> 917<211> 917
<212> Белок<212> Protein
<213> искусственная<213> artificial
<220><220>
<223> hGAA-дельта-8<223> hGAA-delta-8
<400> 27<400> 27
Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val Leu Glu Glu Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val Leu Glu Glu
1 5 10 15 1 5 10 15
Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly Pro Arg Asp Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly Pro Arg Asp
20 25 30 20 25 30
Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp
35 40 45 35 40 45
Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr
50 55 60 50 55 60
Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln
65 70 75 80 65 70 75 80
Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro
85 90 95 85 90 95
Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly
100 105 110 100 105 110
Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp
115 120 125 115 120 125
Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu
130 135 140 130 135 140
His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu
145 150 155 160 145 150 155 160
Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val
165 170 175 165 170 175
Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp
180 185 190 180 185 190
Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp
195 200 205 195 200 205
Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly
210 215 220 210 215 220
Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg
225 230 235 240 225 230 235 240
Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu
245 250 255 245 250 255
Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala
260 265 270 260 265 270
His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln
275 280 285 275 280 285
Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val
290 295 300 290 295 300
Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu
305 310 315 320 305 310 315 320
Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe
325 330 335 325 330 335
His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val
340 345 350 340 345 350
Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn
355 360 365 355 360 365
Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp
370 375 380 370 375 380
Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly
385 390 395 400 385 390 395 400
Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro
405 410 415 405 410 415
Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe
420 425 430 420 425 430
Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly
435 440 445 435 440 445
Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp
450 455 460 450 455 460
Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met
465 470 475 480 465 470 475 480
Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp
485 490 495 485 490 495
Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val
500 505 510 500 505 510
Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln
515 520 525 515 520 525
Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu
530 535 540 530 535 540
Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro
545 550 555 560 545 550 555 560
Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly
565 570 575 565 570 575
His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser
580 585 590 580 585 590
Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly
595 600 605 595 600 605
Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Glu Leu Cys Val
610 615 620 610 615 620
Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn
625 630 635 640 625 630 635 640
Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala
645 650 655 645 650 655
Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro
660 665 670 660 665 670
His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val
675 680 685 675 680 685
Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr
690 695 700 690 695 700
Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val
705 710 715 720 705 710 715 720
Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr
725 730 735 725 730 735
Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro
740 745 750 740 745 750
Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln
755 760 765 755 760 765
Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg
770 775 780 770 775 780
Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu
785 790 795 800 785 790 795 800
Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly
805 810 815 805 810 815
Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val
820 825 830 820 825 830
Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn
835 840 845 835 840 845
Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu
850 855 860 850 855 860
Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln
865 870 875 880 865 870 875 880
Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp
885 890 895 885 890 895
Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe
900 905 910 900 905 910
Leu Val Ser Trp Cys Leu Val Ser Trp Cys
915 915
<210> 28<210> 28
<211> 883<211> 883
<212> Белок<212> Protein
<213> искусственная<213> artificial
<220><220>
<223> hGAA-дельта-42<223> hGAA-delta-42
<400> 28<400> 28
Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro
1 5 10 15 1 5 10 15
Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu
20 25 30 20 25 30
Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu
35 40 45 35 40 45
Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr
50 55 60 50 55 60
Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr
65 70 75 80 65 70 75 80
Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu
85 90 95 85 90 95
Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe
100 105 110 100 105 110
Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr
115 120 125 115 120 125
Pro His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Pro His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe
130 135 140 130 135 140
Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg
145 150 155 160 145 150 155 160
Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe
165 170 175 165 170 175
Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala
180 185 190 180 185 190
Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr
195 200 205 195 200 205
Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly
210 215 220 210 215 220
Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly
225 230 235 240 225 230 235 240
Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser
245 250 255 245 250 255
Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile
260 265 270 260 265 270
Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val
275 280 285 275 280 285
Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu
290 295 300 290 295 300
Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu
305 310 315 320 305 310 315 320
Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu
325 330 335 325 330 335
Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe
340 345 350 340 345 350
Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg
355 360 365 355 360 365
Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly
370 375 380 370 375 380
Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr
385 390 395 400 385 390 395 400
Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr
405 410 415 405 410 415
Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp
420 425 430 420 425 430
Met Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Met Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile
435 440 445 435 440 445
Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys
450 455 460 450 455 460
Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly
465 470 475 480 465 470 475 480
Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu
485 490 495 485 490 495
Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile
500 505 510 500 505 510
Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val
515 520 525 515 520 525
Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp
530 535 540 530 535 540
Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro
545 550 555 560 545 550 555 560
Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp
565 570 575 565 570 575
Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp
580 585 590 580 585 590
Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu
595 600 605 595 600 605
Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln
610 615 620 610 615 620
Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu
625 630 635 640 625 630 635 640
Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg
645 650 655 645 650 655
Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp
660 665 670 660 665 670
His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln
675 680 685 675 680 685
Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr
690 695 700 690 695 700
Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro
705 710 715 720 705 710 715 720
Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val
725 730 735 725 730 735
Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly
740 745 750 740 745 750
Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg
755 760 765 755 760 765
Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala
770 775 780 770 775 780
Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu
785 790 795 800 785 790 795 800
Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile
805 810 815 805 810 815
Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu
820 825 830 820 825 830
Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu
835 840 845 835 840 845
Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys
850 855 860 850 855 860
Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val
865 870 875 880 865 870 875 880
Ser Trp Cys Ser Trp Cys
<210> 29<210> 29
<211> 952<211> 952
<212> Белок<212> Protein
<213> homo sapiens<213> homo sapiens
<400> 29<400> 29
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15 1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30 20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45 35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60 50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80 65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95 85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110 100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125 115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140 130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160 145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175 165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190 180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205 195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220 210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240 225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255 245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270 260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285 275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300 290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320 305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335 325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350 340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365 355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380 370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400 385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415 405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430 420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445 435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460 450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480 465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495 485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510 500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525 515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540 530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560 545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575 565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590 580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605 595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620 610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640 625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655 645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670 660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685 675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700 690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720 705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735 725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750 740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765 755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly
770 775 780 770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800 785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815 805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830 820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845 835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860 850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880 865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895 885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910 900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925 915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940 930 935 940
Glu Gln Phe Leu Val Ser Trp Cys Glu Gln Phe Leu Val Ser Trp Cys
945 950 945 950
<210> 30<210> 30
<211> 952<211> 952
<212> Белок<212> Protein
<213> homo sapiens<213> homo sapiens
<400> 30<400> 30
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15 1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30 20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45 35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60 50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80 65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95 85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110 100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125 115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140 130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160 145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175 165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190 180 185 190
Val Pro Leu Glu Thr Pro Arg Val His Ser Arg Ala Pro Ser Pro Leu Val Pro Leu Glu Thr Pro Arg Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205 195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val His Arg Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val His Arg
210 215 220 210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240 225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255 245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270 260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285 275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300 290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320 305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335 325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350 340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365 355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380 370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400 385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415 405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430 420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445 435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460 450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480 465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495 485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510 500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525 515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540 530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560 545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575 565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590 580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605 595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620 610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640 625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655 645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670 660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685 675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700 690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720 705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735 725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750 740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765 755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly
770 775 780 770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800 785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815 805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830 820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845 835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860 850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880 865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895 885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910 900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925 915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940 930 935 940
Glu Gln Phe Leu Val Ser Trp Cys Glu Gln Phe Leu Val Ser Trp Cys
945 950 945 950
<210> 31<210> 31
<211> 957<211> 957
<212> Белок<212> Protein
<213> homo sapiens<213> homo sapiens
<400> 31<400> 31
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15 1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30 20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45 35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60 50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80 65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95 85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110 100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125 115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140 130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160 145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175 165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190 180 185 190
Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205 195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg
210 215 220 210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240 225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255 245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270 260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285 275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300 290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320 305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335 325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350 340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365 355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380 370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400 385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415 405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430 420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445 435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg
450 455 460 450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480 465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495 485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510 500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525 515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540 530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560 545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575 565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590 580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605 595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620 610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640 625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655 645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670 660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685 675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700 690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720 705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735 725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750 740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765 755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly
770 775 780 770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800 785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815 805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830 820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845 835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860 850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880 865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895 885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910 900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925 915 920 925
Ser Pro Asp Thr Lys Ala Arg Gly Pro Arg Val Leu Asp Ile Cys Val Ser Pro Asp Thr Lys Ala Arg Gly Pro Arg Val Leu Asp Ile Cys Val
930 935 940 930 935 940
Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
945 950 955 945 950 955
<210> 32<210> 32
<211> 952<211> 952
<212> Белок<212> Protein
<213> homo sapiens<213> homo sapiens
<400> 32<400> 32
Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys
1 5 10 15 1 5 10 15
Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu
20 25 30 20 25 30
His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val
35 40 45 35 40 45
Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly
50 55 60 50 55 60
Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr
65 70 75 80 65 70 75 80
Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys
85 90 95 85 90 95
Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro
100 105 110 100 105 110
Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe
115 120 125 115 120 125
Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser
130 135 140 130 135 140
Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe
145 150 155 160 145 150 155 160
Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu
165 170 175 165 170 175
Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu
180 185 190 180 185 190
Val Pro Leu Glu Thr Pro Arg Val His Ser Arg Ala Pro Ser Pro Leu Val Pro Leu Glu Thr Pro Arg Val His Ser Arg Ala Pro Ser Pro Leu
195 200 205 195 200 205
Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val His Arg Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val His Arg
210 215 220 210 215 220
Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe
225 230 235 240 225 230 235 240
Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr
245 250 255 245 250 255
Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser
260 265 270 260 265 270
Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly
275 280 285 275 280 285
Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly
290 295 300 290 295 300
Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val
305 310 315 320 305 310 315 320
Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile
325 330 335 325 330 335
Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln
340 345 350 340 345 350
Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly
355 360 365 355 360 365
Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr
370 375 380 370 375 380
Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val
385 390 395 400 385 390 395 400
Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe
405 410 415 405 410 415
Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His
420 425 430 420 425 430
Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser
435 440 445 435 440 445
Ser Gly Pro Ala Gly Ser Tyr Arg Leu Tyr Asp Glu Gly Leu Arg Arg Ser Gly Pro Ala Gly Ser Tyr Arg Leu Tyr Asp Glu Gly Leu Arg Arg
450 455 460 450 455 460
Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val
465 470 475 480 465 470 475 480
Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu
485 490 495 485 490 495
Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe
500 505 510 500 505 510
Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly
515 520 525 515 520 525
Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val
530 535 540 530 535 540
Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser
545 550 555 560 545 550 555 560
Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly
565 570 575 565 570 575
Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly
580 585 590 580 585 590
Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg
595 600 605 595 600 605
Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu
610 615 620 610 615 620
Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro
625 630 635 640 625 630 635 640
Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu
645 650 655 645 650 655
Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg
660 665 670 660 665 670
Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser
675 680 685 675 680 685
Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala
690 695 700 690 695 700
Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly
705 710 715 720 705 710 715 720
Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser
725 730 735 725 730 735
Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile
740 745 750 740 745 750
Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro
755 760 765 755 760 765
Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Ile Glu Ala Leu Gly
770 775 780 770 775 780
Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser
785 790 795 800 785 790 795 800
Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val
805 810 815 805 810 815
His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr
820 825 830 820 825 830
Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr
835 840 845 835 840 845
Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser
850 855 860 850 855 860
Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala
865 870 875 880 865 870 875 880
Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly
885 890 895 885 890 895
Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala
900 905 910 900 905 910
Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr
915 920 925 915 920 925
Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly
930 935 940 930 935 940
Glu Gln Phe Leu Val Ser Trp Cys Glu Gln Phe Leu Val Ser Trp Cys
945 950 945 950
<210> 33<210> 33
<211> 925<211> 925
<212> Белок<212> Protein
<213> искусственная<213> artificial
<220><220>
<223> вариант hGAAwt без sp<223> hGAAwt variant without sp
<400> 33<400> 33
Gly His Ile Leu Leu His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly His Ile Leu Leu His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser
1 5 10 15 1 5 10 15
Gly Ser Ser Pro Val Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Gly Ser Ser Pro Val Leu Glu Glu Thr His Pro Ala His Gln Gln Gly
20 25 30 20 25 30
Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro
35 40 45 35 40 45
Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp
50 55 60 50 55 60
Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly
65 70 75 80 65 70 75 80
Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly
85 90 95 85 90 95
Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Gln Pro Trp Cys Phe Phe Pro Ser Tyr Pro Ser Tyr Lys Leu Glu
100 105 110 100 105 110
Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr
115 120 125 115 120 125
Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val
130 135 140 130 135 140
Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala
145 150 155 160 145 150 155 160
Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro Arg Val His Ser Arg Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro Arg Val His Ser Arg
165 170 175 165 170 175
Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly
180 185 190 180 185 190
Val Ile Val His Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ile Val His Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr
195 200 205 195 200 205
Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser
210 215 220 210 215 220
Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu
225 230 235 240 225 230 235 240
Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu
245 250 255 245 250 255
Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu
260 265 270 260 265 270
Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser
275 280 285 275 280 285
Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg
290 295 300 290 295 300
Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro
305 310 315 320 305 310 315 320
Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met
325 330 335 325 330 335
Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser
340 345 350 340 345 350
Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala His Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala His
355 360 365 355 360 365
Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg
370 375 380 370 375 380
Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met
385 390 395 400 385 390 395 400
Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp
405 410 415 405 410 415
Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp
420 425 430 420 425 430
Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro
435 440 445 435 440 445
Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr
450 455 460 450 455 460
Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe His
465 470 475 480 465 470 475 480
Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser
485 490 495 485 490 495
Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu
500 505 510 500 505 510
Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala
515 520 525 515 520 525
Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu
530 535 540 530 535 540
His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu
545 550 555 560 545 550 555 560
Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe
565 570 575 565 570 575
Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser
580 585 590 580 585 590
Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn
595 600 605 595 600 605
Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly
610 615 620 610 615 620
Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe
625 630 635 640 625 630 635 640
Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu
645 650 655 645 650 655
Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu
660 665 670 660 665 670
Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln
675 680 685 675 680 685
Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe
690 695 700 690 695 700
Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly
705 710 715 720 705 710 715 720
Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val
725 730 735 725 730 735
Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro
740 745 750 740 745 750
Ile Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Ile Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu
755 760 765 755 760 765
Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu
770 775 780 770 775 780
Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln
785 790 795 800 785 790 795 800
Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu
805 810 815 805 810 815
Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp
820 825 830 820 825 830
Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln
835 840 845 835 840 845
Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg
850 855 860 850 855 860
Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu
865 870 875 880 865 870 875 880
Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val
885 890 895 885 890 895
Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val
900 905 910 900 905 910
Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
915 920 925 915 920 925
<210> 34<210> 34
<211> 896<211> 896
<212> Белок<212> Protein
<213> искусственная<213> artificial
<220><220>
<223> hGAA-дельта-29<223> hGAA-delta-29
<400> 34<400> 34
Gln Gln Gly Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro Gln Gln Gly Ala Ser Arg Pro Gly Pro Arg Asp Ala Gln Ala His Pro
1 5 10 15 1 5 10 15
Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser
20 25 30 20 25 30
Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu
35 40 45 35 40 45
Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala
50 55 60 50 55 60
Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr
65 70 75 80 65 70 75 80
Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu
85 90 95 85 90 95
Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg
100 105 110 100 105 110
Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys
115 120 125 115 120 125
Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val
130 135 140 130 135 140
His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu
145 150 155 160 145 150 155 160
Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu
165 170 175 165 170 175
Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu
180 185 190 180 185 190
Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu
195 200 205 195 200 205
Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn
210 215 220 210 215 220
Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro
225 230 235 240 225 230 235 240
Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu
245 250 255 245 250 255
Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu
260 265 270 260 265 270
Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly
275 280 285 275 280 285
Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr
290 295 300 290 295 300
Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp
305 310 315 320 305 310 315 320
Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr
325 330 335 325 330 335
Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met
340 345 350 340 345 350
Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe
355 360 365 355 360 365
Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met
370 375 380 370 375 380
Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg
385 390 395 400 385 390 395 400
Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr
405 410 415 405 410 415
Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro
420 425 430 420 425 430
Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala
435 440 445 435 440 445
Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn
450 455 460 450 455 460
Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn
465 470 475 480 465 470 475 480
Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu
485 490 495 485 490 495
Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His
500 505 510 500 505 510
Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His
515 520 525 515 520 525
Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg
530 535 540 530 535 540
Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp
545 550 555 560 545 550 555 560
Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu
565 570 575 565 570 575
Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly
580 585 590 580 585 590
Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu
595 600 605 595 600 605
Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu
610 615 620 610 615 620
Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg
625 630 635 640 625 630 635 640
Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu
645 650 655 645 650 655
Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe
660 665 670 660 665 670
Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu
675 680 685 675 680 685
Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys
690 695 700 690 695 700
Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln
705 710 715 720 705 710 715 720
Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala
725 730 735 725 730 735
Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro
740 745 750 740 745 750
Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile
755 760 765 755 760 765
Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro
770 775 780 770 775 780
Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu
785 790 795 800 785 790 795 800
Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala
805 810 815 805 810 815
Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu
820 825 830 820 825 830
Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val
835 840 845 835 840 845
Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly
850 855 860 850 855 860
Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp
865 870 875 880 865 870 875 880
Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
885 890 895 885 890 895
<210> 35<210> 35
<211> 882<211> 882
<212> Белок<212> Protein
<213> искусственная<213> artificial
<220><220>
<223> hGAA-дельта-43<223> hGAA-delta-43
<400> 35<400> 35
His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro His Pro Gly Arg Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro
1 5 10 15 1 5 10 15
Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln
20 25 30 20 25 30
Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln
35 40 45 35 40 45
Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Gly Ala Gln Met Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro
50 55 60 50 55 60
Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala
65 70 75 80 65 70 75 80
Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr
85 90 95 85 90 95
Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr
100 105 110 100 105 110
Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro
115 120 125 115 120 125
His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser His Val His Ser Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser
130 135 140 130 135 140
Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Glu Glu Pro Phe Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val
145 150 155 160 145 150 155 160
Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Leu Leu Asn Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu
165 170 175 165 170 175
Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu
180 185 190 180 185 190
His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu His Leu Ser Pro Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu
195 200 205 195 200 205
Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser
210 215 220 210 215 220
His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val His Pro Phe Tyr Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val
225 230 235 240 225 230 235 240
Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Phe Leu Leu Asn Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro
245 250 255 245 250 255
Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe
260 265 270 260 265 270
Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Leu Gly Pro Glu Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val
275 280 285 275 280 285
Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys
290 295 300 290 295 300
Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn
305 310 315 320 305 310 315 320
Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Met Thr Arg Ala His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp
325 330 335 325 330 335
Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg
340 345 350 340 345 350
Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Asp Phe Pro Ala Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr
355 360 365 355 360 365
Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Met Met Ile Val Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser
370 375 380 370 375 380
Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn
385 390 395 400 385 390 395 400
Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Glu Thr Gly Gln Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala
405 410 415 405 410 415
Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met
420 425 430 420 425 430
Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Val Ala Glu Phe His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp
435 440 445 435 440 445
Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Met Asn Glu Pro Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro
450 455 460 450 455 460
Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly
465 470 475 480 465 470 475 480
Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser
485 490 495 485 490 495
Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Thr His Tyr Asn Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala
500 505 510 500 505 510
Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser His Arg Ala Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile
515 520 525 515 520 525
Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Ser Arg Ser Thr Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr
530 535 540 530 535 540
Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Gly Asp Val Trp Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu
545 550 555 560 545 550 555 560
Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Ile Leu Gln Phe Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val
565 570 575 565 570 575
Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr
580 585 590 580 585 590
Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu
595 600 605 595 600 605
Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala
610 615 620 610 615 620
Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr
625 630 635 640 625 630 635 640
Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Thr Leu Phe His Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro
645 650 655 645 650 655
Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His
660 665 670 660 665 670
Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala
675 680 685 675 680 685
Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp
690 695 700 690 695 700
Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Leu Gln Thr Val Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro
705 710 715 720 705 710 715 720
Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Ala Ala Pro Arg Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr
725 730 735 725 730 735
Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr
740 745 750 740 745 750
Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln
755 760 765 755 760 765
Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gln Pro Met Ala Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg
770 775 780 770 775 780
Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg
785 790 795 800 785 790 795 800
Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val
805 810 815 805 810 815
Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Asn Glu Leu Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln
820 825 830 820 825 830
Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Lys Val Thr Val Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser
835 840 845 835 840 845
Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Asn Gly Val Pro Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val
850 855 860 850 855 860
Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Leu Asp Ile Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser
865 870 875 880 865 870 875 880
Trp Cys Trp Cys
<210> 36<210> 36
<211> 878<211> 878
<212> Белок<212> Protein
<213> искусственная<213> artificial
<220><220>
<223> hGAA-дельта-47<223> hGAA-delta-47
<400> 36<400> 36
Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Pro Arg Ala Val Pro Thr Gln Cys Asp Val Pro Pro Asn Ser Arg Phe
1 5 10 15 1 5 10 15
Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Asp Cys Ala Pro Asp Lys Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg
20 25 30 20 25 30
Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Cys Cys Tyr Ile Pro Ala Lys Gln Gly Leu Gln Gly Ala Gln Met
35 40 45 35 40 45
Gly Gln Pro Trp Cys Phe Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Gly Gln Pro Trp Cys Phe Phe Pro Ser Tyr Pro Ser Tyr Lys Leu
50 55 60 50 55 60
Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Glu Asn Leu Ser Ser Ser Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg
65 70 75 80 65 70 75 80
Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Thr Thr Pro Thr Phe Phe Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp
85 90 95 85 90 95
Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro Val Met Met Glu Thr Glu Asn Arg Leu His Phe Thr Ile Lys Asp Pro
100 105 110 100 105 110
Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val His Ser Ala Asn Arg Arg Tyr Glu Val Pro Leu Glu Thr Pro His Val His Ser
115 120 125 115 120 125
Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Arg Ala Pro Ser Pro Leu Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe
130 135 140 130 135 140
Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Gly Val Ile Val Arg Arg Gln Leu Asp Gly Arg Val Leu Leu Asn Thr
145 150 155 160 145 150 155 160
Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Thr Val Ala Pro Leu Phe Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr
165 170 175 165 170 175
Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro Ser Leu Pro Ser Gln Tyr Ile Thr Gly Leu Ala Glu His Leu Ser Pro
180 185 190 180 185 190
Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Met Leu Ser Thr Ser Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp
195 200 205 195 200 205
Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Pro Thr Pro Gly Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr
210 215 220 210 215 220
Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn Leu Ala Leu Glu Asp Gly Gly Ser Ala His Gly Val Phe Leu Leu Asn
225 230 235 240 225 230 235 240
Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Ser Asn Ala Met Asp Val Val Leu Gln Pro Ser Pro Ala Leu Ser Trp
245 250 255 245 250 255
Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Arg Ser Thr Gly Gly Ile Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu
260 265 270 260 265 270
Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Pro Lys Ser Val Val Gln Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe
275 280 285 275 280 285
Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Met Pro Pro Tyr Trp Gly Leu Gly Phe His Leu Cys Arg Trp Gly Tyr
290 295 300 290 295 300
Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala Ser Ser Thr Ala Ile Thr Arg Gln Val Val Glu Asn Met Thr Arg Ala
305 310 315 320 305 310 315 320
His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser His Phe Pro Leu Asp Val Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser
325 330 335 325 330 335
Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Arg Arg Asp Phe Thr Phe Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala
340 345 350 340 345 350
Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val Met Val Gln Glu Leu His Gln Gly Gly Arg Arg Tyr Met Met Ile Val
355 360 365 355 360 365
Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Pro Ala Ile Ser Ser Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr
370 375 380 370 375 380
Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Asp Glu Gly Leu Arg Arg Gly Val Phe Ile Thr Asn Glu Thr Gly Gln
385 390 395 400 385 390 395 400
Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Pro Leu Ile Gly Lys Val Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe
405 410 415 405 410 415
Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe Thr Asn Pro Thr Ala Leu Ala Trp Trp Glu Asp Met Val Ala Glu Phe
420 425 430 420 425 430
His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro His Asp Gln Val Pro Phe Asp Gly Met Trp Ile Asp Met Asn Glu Pro
435 440 445 435 440 445
Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Ser Asn Phe Ile Arg Gly Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu
450 455 460 450 455 460
Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala Glu Asn Pro Pro Tyr Val Pro Gly Val Val Gly Gly Thr Leu Gln Ala
465 470 475 480 465 470 475 480
Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn Ala Thr Ile Cys Ala Ser Ser His Gln Phe Leu Ser Thr His Tyr Asn
485 490 495 485 490 495
Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu His Asn Leu Tyr Gly Leu Thr Glu Ala Ile Ala Ser His Arg Ala
500 505 510 500 505 510
Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Leu Val Lys Ala Arg Gly Thr Arg Pro Phe Val Ile Ser Arg Ser Thr
515 520 525 515 520 525
Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp Phe Ala Gly His Gly Arg Tyr Ala Gly His Trp Thr Gly Asp Val Trp
530 535 540 530 535 540
Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Ser Ser Trp Glu Gln Leu Ala Ser Ser Val Pro Glu Ile Leu Gln Phe
545 550 555 560 545 550 555 560
Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu Asn Leu Leu Gly Val Pro Leu Val Gly Ala Asp Val Cys Gly Phe Leu
565 570 575 565 570 575
Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Gly Asn Thr Ser Glu Glu Leu Cys Val Arg Trp Thr Gln Leu Gly Ala
580 585 590 580 585 590
Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln Phe Tyr Pro Phe Met Arg Asn His Asn Ser Leu Leu Ser Leu Pro Gln
595 600 605 595 600 605
Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Glu Pro Tyr Ser Phe Ser Glu Pro Ala Gln Gln Ala Met Arg Lys Ala
610 615 620 610 615 620
Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His Leu Thr Leu Arg Tyr Ala Leu Leu Pro His Leu Tyr Thr Leu Phe His
625 630 635 640 625 630 635 640
Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Gln Ala His Val Ala Gly Glu Thr Val Ala Arg Pro Leu Phe Leu Glu
645 650 655 645 650 655
Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp Phe Pro Lys Asp Ser Ser Thr Trp Thr Val Asp His Gln Leu Leu Trp
660 665 670 660 665 670
Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Gly Glu Ala Leu Leu Ile Thr Pro Val Leu Gln Ala Gly Lys Ala Glu
675 680 685 675 680 685
Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Val Thr Gly Tyr Phe Pro Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val
690 695 700 690 695 700
Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Pro Val Glu Ala Leu Gly Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg
705 710 715 720 705 710 715 720
Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Glu Pro Ala Ile His Ser Glu Gly Gln Trp Val Thr Leu Pro Ala Pro
725 730 735 725 730 735
Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Leu Asp Thr Ile Asn Val His Leu Arg Ala Gly Tyr Ile Ile Pro Leu
740 745 750 740 745 750
Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Gln Gly Pro Gly Leu Thr Thr Thr Glu Ser Arg Gln Gln Pro Met Ala
755 760 765 755 760 765
Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Leu Ala Val Ala Leu Thr Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe
770 775 780 770 775 780
Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Trp Asp Asp Gly Glu Ser Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr
785 790 795 800 785 790 795 800
Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val Gln Val Ile Phe Leu Ala Arg Asn Asn Thr Ile Val Asn Glu Leu Val
805 810 815 805 810 815
Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val Arg Val Thr Ser Glu Gly Ala Gly Leu Gln Leu Gln Lys Val Thr Val
820 825 830 820 825 830
Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro Leu Gly Val Ala Thr Ala Pro Gln Gln Val Leu Ser Asn Gly Val Pro
835 840 845 835 840 845
Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Asn Phe Thr Tyr Ser Pro Asp Thr Lys Val Leu Asp Ile Cys
850 855 860 850 855 860
Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys Val Ser Leu Leu Met Gly Glu Gln Phe Leu Val Ser Trp Cys
865 870 875 865 870 875
<210> 37<210> 37
<211> 2745<211> 2745
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> sp7+hGAAwt-дельта-29<223> sp7+hGAAwt-delta-29
<400> 37<400> 37
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccagcag 60atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccagcag 60
ggagccagca gaccagggcc ccgggatgcc caggcacacc ccgggcggcc gcgagcagtg 120ggagccagca gaccaggggcc ccgggatgcc caggcacacc ccgggcggcc gcgagcagtg 120
cccacacagt gcgacgtccc ccccaacagc cgcttcgatt gcgcccctga caaggccatc 180cccacacagt gcgacgtccc ccccaacagc cgcttcgatt gcgcccctga caaggccatc 180
acccaggaac agtgcgaggc ccgcggctgt tgctacatcc ctgcaaagca ggggctgcag 240acccaggaac agtgcgaggc ccgcggctgt tgctacatcc ctgcaaagca ggggctgcag 240
ggagcccaga tggggcagcc ctggtgcttc ttcccaccca gctaccccag ctacaagctg 300ggagcccaga tggggcagcc ctggtgcttc ttcccaccca gctaccccag ctacaagctg 300
gagaacctga gctcctctga aatgggctac acggccaccc tgacccgtac cacccccacc 360gagaacctga gctcctctga aatgggctac acggccaccc tgacccgtac cacccccacc 360
ttcttcccca aggacatcct gaccctgcgg ctggacgtga tgatggagac tgagaaccgc 420ttcttcccca aggacatcct gaccctgcgg ctggacgtga tgatggagac tgagaaccgc 420
ctccacttca cgatcaaaga tccagctaac aggcgctacg aggtgccctt ggagaccccg 480ctccacttca cgatcaaaga tccagctaac aggcgctacg aggtgccctt ggagaccccg 480
catgtccaca gccgggcacc gtccccactc tacagcgtgg agttctccga ggagcccttc 540catgtccaca gccgggcacc gtccccactc tacagcgtgg agttctccga ggagcccttc 540
ggggtgatcg tgcgccggca gctggacggc cgcgtgctgc tgaacacgac ggtggcgccc 600ggggtgatcg tgcgccggca gctggacggc cgcgtgctgc tgaacacgac ggtggcgccc 600
ctgttctttg cggaccagtt ccttcagctg tccacctcgc tgccctcgca gtatatcaca 660ctgttctttg cggaccagtt ccttcagctg tccacctcgc tgccctcgca gtatatcaca 660
ggcctcgccg agcacctcag tcccctgatg ctcagcacca gctggaccag gatcaccctg 720ggcctcgccg agcacctcag tcccctgatg ctcagcacca gctggaccag gatcaccctg 720
tggaaccggg accttgcgcc cacgcccggt gcgaacctct acgggtctca ccctttctac 780tggaaccggg accttgcgcc cacgcccggt gcgaacctct acgggtctca ccctttctac 780
ctggcgctgg aggacggcgg gtcggcacac ggggtgttcc tgctaaacag caatgccatg 840ctggcgctgg aggacggcgg gtcggcacac ggggtgttcc tgctaaacag caatgccatg 840
gatgtggtcc tgcagccgag ccctgccctt agctggaggt cgacaggtgg gatcctggat 900gatgtggtcc tgcagccgag ccctgccctt agctggaggt cgacaggtgg gatcctggat 900
gtctacatct tcctgggccc agagcccaag agcgtggtgc agcagtacct ggacgttgtg 960gtctacatct tcctgggccc agagcccaag agcgtggtgc agcagtacct ggacgttgtg 960
ggatacccgt tcatgccgcc atactggggc ctgggcttcc acctgtgccg ctggggctac 1020ggatacccgt tcatgccgcc atactggggc ctgggcttcc acctgtgccg ctggggctac 1020
tcctccaccg ctatcacccg ccaggtggtg gagaacatga ccagggccca cttccccctg 10801080
gacgtccagt ggaacgacct ggactacatg gactcccgga gggacttcac gttcaacaag 11401140
gatggcttcc gggacttccc ggccatggtg caggagctgc accagggcgg ccggcgctac 1200gatggcttcc gggacttccc ggccatggtg caggagctgc accagggcgg ccggcgctac 1200
atgatgatcg tggatcctgc catcagcagc tcgggccctg ccgggagcta caggccctac 1260atgatgatcg tggatcctgc catcagcagc tcgggccctg ccgggagcta caggccctac 1260
gacgagggtc tgcggagggg ggttttcatc accaacgaga ccggccagcc gctgattggg 1320gacgagggtc tgcggagggg ggttttcatc accaacgaga ccggccagcc gctgattggg 1320
aaggtatggc ccgggtccac tgccttcccc gacttcacca accccacagc cctggcctgg 1380aaggtatggc ccgggtccac tgccttcccc gacttcacca accccacagc cctggcctgg 1380
tgggaggaca tggtggctga gttccatgac caggtgccct tcgacggcat gtggattgac 1440tgggaggaca tggtggctga gttccatgac caggtgccct tcgacggcat gtggattgac 1440
atgaacgagc cttccaactt catcaggggc tctgaggacg gctgccccaa caatgagctg 1500atgaacgagc cttccaactt catcaggggc tctgaggacg gctgccccaa caatgagctg 1500
gagaacccac cctacgtgcc tggggtggtt ggggggaccc tccaggcggc caccatctgt 1560gagaacccac cctacgtgcc tggggtggtt ggggggaccc tccaggcggc caccatctgt 1560
gcctccagcc accagtttct ctccacacac tacaacctgc acaacctcta cggcctgacc 1620gcctccagcc accagtttct ctccacacac tacaacctgc acaacctcta cggcctgacc 1620
gaagccatcg cctcccacag ggcgctggtg aaggctcggg ggacacgccc atttgtgatc 1680gaagccatcg cctcccacag ggcgctggtg aaggctcggg ggacacgccc atttgtgatc 1680
tcccgctcga cctttgctgg ccacggccga tacgccggcc actggacggg ggacgtgtgg 17401740
agctcctggg agcagctcgc ctcctccgtg ccagaaatcc tgcagtttaa cctgctgggg 1800agctcctggg agcagctcgc ctcctccgtg ccagaaatcc tgcagtttaa cctgctgggg 1800
gtgcctctgg tcggggccga cgtctgcggc ttcctgggca acacctcaga ggagctgtgt 1860gtgcctctgg tcggggccga cgtctgcggc ttcctgggca acacctcaga ggagctgtgt 1860
gtgcgctgga cccagctggg ggccttctac cccttcatgc ggaaccacaa cagcctgctc 1920gtgcgctgga cccagctggg ggccttctac cccttcatgc ggaaccacaa cagcctgctc 1920
agtctgcccc aggagccgta cagcttcagc gagccggccc agcaggccat gaggaaggcc 1980agtctgcccc aggagccgta cagcttcagc gagccggccc agcaggccat gaggaaggcc 1980
ctcaccctgc gctacgcact cctcccccac ctctacacac tgttccacca ggcccacgtc 2040ctcaccctgc gctacgcact cctcccccac ctctacacac tgttccacca ggccccgtc 2040
gcgggggaga ccgtggcccg gcccctcttc ctggagttcc ccaaggactc tagcacctgg 2100gcggggggaga ccgtggcccg gcccctcttc ctggagttcc ccaaggactc tagcacctgg 2100
actgtggacc accagctcct gtggggggag gccctgctca tcaccccagt gctccaggcc 2160actgtggacc accagctcct gtggggggag gccctgctca tcaccccagt gctccaggcc 2160
gggaaggccg aagtgactgg ctacttcccc ttgggcacat ggtacgacct gcagacggtg 2220gggaaggccg aagtgactgg ctacttcccc ttgggcacat ggtacgacct gcagacggtg 2220
ccagtagagg cccttggcag cctcccaccc ccacctgcag ctccccgtga gccagccatc 2280ccagtagagg cccttggcag ccctcccaccc ccacctgcag ctccccgtga gccagccatc 2280
cacagcgagg ggcagtgggt gacgctgccg gcccccctgg acaccatcaa cgtccacctc 2340cacagcgagg ggcagtgggt gacgctgccg gcccccctgg acaccatcaa cgtccacctc 2340
cgggctgggt acatcatccc cctgcagggc cctggcctca caaccacaga gtcccgccag 2400cgggctgggt acatcatccc cctgcagggc cctggcctca caaccacaga gtcccgccag 2400
cagcccatgg ccctggctgt ggccctgacc aagggtgggg aggcccgagg ggagctgttc 2460cagcccatgg ccctggctgt ggccctgacc aagggtgggg aggcccgagg ggagctgttc 2460
tgggacgatg gagagagcct ggaagtgctg gagcgagggg cctacacaca ggtcatcttc 2520tgggacgatg gagagagcct ggaagtgctg gagcgagggg cctacacaca ggtcatcttc 2520
ctggccagga ataacacgat cgtgaatgag ctggtacgtg tgaccagtga gggagctggc 2580ctggccagga ataacacgat cgtgaatgag ctggtacgtg tgaccagtga gggagctggc 2580
ctgcagctgc agaaggtgac tgtcctgggc gtggccacgg cgccccagca ggtcctctcc 2640ctgcagctgc agaaggtgac tgtcctgggc gtggccacgg cgccccagca ggtcctctcc 2640
aacggtgtcc ctgtctccaa cttcacctac agccccgaca ccaaggtcct ggacatctgt 2700aacggtgtcc ctgtctccaa cttcacctac agccccgaca ccaaggtcct ggacatctgt 2700
gtctcgctgt tgatgggaga gcagtttctc gtcagctggt gttag 2745gtctcgctgt tgatgggaga gcagtttctc gtcagctggt gttag 2745
<210> 38<210> 38
<211> 2745<211> 2745
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> sp7+hGAAco1-дельта-29<223> sp7+hGAAco1-delta-29
<400> 38<400> 38
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccagcag 60atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccagcag 60
ggcgcctcta gacctggacc tagagatgcc caggcccacc ccggcagacc tagagctgtg 120ggcgcctcta gacctggacc tagagatgcc caggcccacc ccggcagacc tagagctgtg 120
cctacccagt gtgacgtgcc ccccaacagc agattcgact gcgcccctga caaggccatc 180cctacccagt gtgacgtgcc ccccaacagc agattcgact gcgcccctga caaggccatc 180
acccaggaac agtgcgaggc cagaggctgc tgctacatcc ctgccaagca gggactgcag 240acccaggaac agtgcgaggc cagaggctgc tgctacatcc ctgccaagca gggactgcag 240
ggcgctcaga tgggacagcc ctggtgcttc ttcccaccct cctaccccag ctacaagctg 300ggcgctcaga tgggacagcc ctggtgcttc ttcccaccct cctaccccag ctacaagctg 300
gaaaacctga gcagcagcga gatgggctac accgccaccc tgaccagaac cacccccaca 360gaaaacctga gcagcagcga gatgggctac accgccaccc tgaccagaac cacccccaca 360
ttcttcccaa aggacatcct gaccctgcgg ctggacgtga tgatggaaac cgagaaccgg 420ttcttcccaa aggacatcct gaccctgcgg ctggacgtga tgatggaaac cgagaaccgg 420
ctgcacttca ccatcaagga ccccgccaat cggagatacg aggtgcccct ggaaaccccc 480ctgcacttca ccatcaagga ccccgccaat cggagatacg aggtgcccct ggaaaccccc 480
cacgtgcact ctagagcccc cagccctctg tacagcgtgg aattcagcga ggaacccttc 540cacgtgcact ctagagcccc cagccctctg tacagcgtgg aattcagcga ggaacccttc 540
ggcgtgatcg tgcggagaca gctggatggc agagtgctgc tgaacaccac cgtggcccct 600ggcgtgatcg tgcggagaca gctggatggc agagtgctgc tgaacaccac cgtggcccct 600
ctgttcttcg ccgaccagtt cctgcagctg agcaccagcc tgcccagcca gtacatcaca 660ctgttcttcg ccgaccagtt cctgcagctg agcaccagcc tgcccagcca gtacatcaca 660
ggactggccg agcacctgag ccccctgatg ctgagcacat cctggacccg gatcaccctg 720ggactggccg agcacctgag ccccctgatg ctgagcacat cctggacccg gatcaccctg 720
tggaacaggg atctggcccc tacccctggc gccaatctgt acggcagcca ccctttctac 780tggaacaggg atctggcccc tacccctggc gccaatctgt acggcagcca ccctttctac 780
ctggccctgg aagatggcgg atctgcccac ggagtgtttc tgctgaactc caacgccatg 840ctggccctgg aagatggcgg atctgcccac ggagtgtttc tgctgaactc caacgccatg 840
gacgtggtgc tgcagcctag ccctgccctg tcttggagaa gcacaggcgg catcctggat 900gacgtggtgc tgcagcctag ccctgccctg tcttggagaa gcacaggcgg catcctggat 900
gtgtacatct ttctgggccc cgagcccaag agcgtggtgc agcagtatct ggatgtcgtg 960gtgtacatct ttctgggccc cgagcccaag agcgtggtgc agcagtatct ggatgtcgtg 960
ggctacccct tcatgccccc ttactggggc ctgggattcc acctgtgcag atggggctac 1020ggctacccct tcatgccccc ttactggggc ctgggattcc acctgtgcag atggggctac 1020
tccagcaccg ccatcaccag acaggtggtg gaaaacatga ccagagccca cttcccactg 1080tccagcaccg ccatcaccag acaggtggtg gaaaacatga cccagccca cttcccactg 1080
gatgtgcagt ggaacgacct ggactacatg gacagcagac gggacttcac cttcaacaag 1140gatgtgcagt ggaacgacct ggactacatg gacagcagac gggacttcac cttcaacaag 1140
gacggcttcc gggacttccc cgccatggtg caggaactgc atcagggcgg cagacggtac 1200gacggcttcc gggacttccc cgccatggtg caggaactgc atcagggcgg cagacggtac 1200
atgatgatcg tggatcccgc catcagctcc tctggccctg ccggctctta cagaccctac 1260atgatgatcg tggatcccgc catcagctcc tctggccctg ccggctctta cagaccctac 1260
gacgagggcc tgcggagagg cgtgttcatc accaacgaga caggccagcc cctgatcggc 1320gacgaggggcc tgcggagagg cgtgttcatc accaacgaga caggccagcc cctgatcggc 1320
aaagtgtggc ctggcagcac agccttcccc gacttcacca atcctaccgc cctggcttgg 1380aaagtgtggc ctggcagcac agccttcccc gacttcacca atcctaccgc cctggcttgg 1380
tgggaggaca tggtggccga gttccacgac caggtgccct tcgacggcat gtggatcgac 1440tgggaggaca tggtggccga gttccacgac caggtgccct tcgacggcat gtggatcgac 1440
atgaacgagc ccagcaactt catccggggc agcgaggatg gctgccccaa caacgaactg 1500atgaacgagc ccagcaactt catccggggc agcgaggatg gctgccccaa caacgaactg 1500
gaaaatcccc cttacgtgcc cggcgtcgtg ggcggaacac tgcaggccgc tacaatctgt 1560gaaaatcccc cttacgtgcc cggcgtcgtg ggcggaacac tgcaggccgc tacaatctgt 1560
gccagcagcc accagtttct gagcacccac tacaacctgc acaacctgta cggcctgacc 1620gccagcagcc accagtttct gagcacccac tacaacctgc acaacctgta cggcctgacc 1620
gaggccattg ccagccaccg cgctctcgtg aaagccagag gcacacggcc cttcgtgatc 1680gaggccattg ccagccaccg cgctctcgtg aaagccagag gcacacggcc cttcgtgatc 1680
agcagaagca cctttgccgg ccacggcaga tacgccggac attggactgg cgacgtgtgg 1740agcagaagca cctttgccgg ccacggcaga tacgccggac attggactgg cgacgtgtgg 1740
tcctcttggg agcagctggc ctctagcgtg cccgagatcc tgcagttcaa tctgctgggc 1800tcctcttggg agcagctggc ctctagcgtg cccgagatcc tgcagttcaa tctgctgggc 1800
gtgccactcg tgggcgccga tgtgtgtggc ttcctgggca acacctccga ggaactgtgt 1860gtgccactcg tgggcgccga tgtgtgtggc ttcctgggca acacctccga ggaactgtgt 1860
gtgcggtgga cacagctggg cgccttctac cctttcatga gaaaccacaa cagcctgctg 1920gtgcggtgga cacagctggg cgccttctac cctttcatga gaaaccacaa cagcctgctg 1920
agcctgcccc aggaacccta cagctttagc gagcctgcac agcaggccat gcggaaggcc 1980agcctgcccc aggaacccta cagctttagc gagcctgcac agcaggccat gcggaaggcc 1980
ctgacactga gatacgctct gctgccccac ctgtacaccc tgtttcacca ggcccatgtg 2040ctgacactga gatacgctct gctgccccac ctgtacaccc tgtttcacca ggcccatgtg 2040
gccggcgaga cagtggccag acctctgttt ctggaattcc ccaaggacag cagcacctgg 2100gccggcgaga cagtggccag acctctgttt ctggaattcc ccaaggacag cagcacctgg 2100
accgtggacc atcagctgct gtggggagag gctctgctga ttaccccagt gctgcaggca 2160accgtggacc atcagctgct gtggggagag gctctgctga ttaccccagt gctgcaggca 2160
ggcaaggccg aagtgaccgg ctactttccc ctgggcactt ggtacgacct gcagaccgtg 2220ggcaaggccg aagtgaccgg ctactttccc ctgggcactt ggtacgacct gcagaccgtg 2220
cctgtggaag ccctgggatc tctgcctcca cctcctgccg ctcctagaga gcctgccatt 2280cctgtggaag ccctgggatc tctgcctcca cctcctgccg ctcctagaga gcctgccatt 2280
cactctgagg gccagtgggt cacactgcct gcccccctgg ataccatcaa cgtgcacctg 2340cactctgagg gccagtgggt cacactgcct gcccccctgg ataccatcaa cgtgcacctg 2340
agggccggct acatcatacc actgcaggga cctggcctga ccaccaccga gtctagacag 2400agggccggct acatcatacc actgcaggga cctggcctga ccaccaccga gtctagacag 2400
cagccaatgg ccctggccgt ggccctgacc aaaggcggag aagctagggg cgagctgttc 2460cagccaatgg ccctggccgt ggccctgacc aaaggcggag aagctaggggg cgagctgttc 2460
tgggacgatg gcgagagcct ggaagtgctg gaaagaggcg cctataccca agtgatcttc 2520tgggacgatg gcgagagcct ggaagtgctg gaaagaggcg cctataccca agtgatcttc 2520
ctggcccgga acaacaccat cgtgaacgag ctggtgcgcg tgacctctga aggcgctgga 2580ctggcccgga acaacaccat cgtgaacgag ctggtgcgcg tgacctctga aggcgctgga 2580
ctgcagctgc agaaagtgac cgtgctggga gtggccacag cccctcagca ggtgctgtct 2640ctgcagctgc agaaagtgac cgtgctggga gtggccacag cccctcagca ggtgctgtct 2640
aatggcgtgc ccgtgtccaa cttcacctac agccccgaca ccaaggtgct ggacatctgc 2700aatggcgtgc ccgtgtccaa cttcacctac agccccgaca ccaaggtgct ggacatctgc 2700
gtgtcactgc tgatgggaga gcagtttctg gtgtcctggt gctga 2745gtgtcactgc tgatgggaga gcagtttctg gtgtcctggt gctga 2745
<210> 39<210> 39
<211> 2745<211> 2745
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> sp7+hGAAco2-дельта-29<223> sp7+hGAAco2-delta-29
<400> 39<400> 39
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccaacag 60atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccaacag 60
ggagcttcca gaccaggacc gagagacgcc caagcccatc ctggtagacc aagagctgtg 120ggagcttcca gaccaggacc gagagacgcc caagcccatc ctggtagacc aagagctgtg 120
cctacccaat gcgacgtgcc acccaactcc cgattcgact gcgcgccaga taaggctatt 180cctacccaat gcgacgtgcc acccaactcc cgattcgact gcgcgccaga taaggctatt 180
acccaagagc agtgtgaagc cagaggttgc tgctacatcc cagcgaagca aggattgcaa 240acccaagagc agtgtgaagc cagaggttgc tgctacatcc cagcgaagca aggattgcaa 240
ggcgcccaaa tgggacaacc ttggtgtttc ttcccccctt cgtacccatc atataaactc 300ggcgcccaaa tgggacaacc ttggtgtttc ttcccccctt cgtacccatc atataaactc 300
gaaaacctgt cctcttcgga aatgggttat actgccaccc tcaccagaac tactcctact 360gaaaacctgt cctcttcgga aatgggttat actgccaccc tcaccagaac tactcctact 360
ttcttcccga aagacatctt gaccttgagg ctggacgtga tgatggagac tgaaaaccgg 420ttcttcccga aagacatctt gaccttgagg ctggacgtga tgatggagac tgaaaaccgg 420
ctgcatttca ctatcaaaga tcctgccaat cggcgatacg aggtccctct ggaaacccct 480ctgcatttca ctatcaaaga tcctgccaat cggcgatacg aggtccctct ggaaacccct 480
cacgtgcact cacgggctcc ttctccgctt tactccgtcg aattctctga ggaacccttc 540cacgtgcact cacgggctcc ttctccgctt tactccgtcg aattctctga ggaacccttc 540
ggagtgatcg ttagacgcca gctggatggt agagtgctgt tgaacactac tgtggcccca 600ggagtgatcg ttagacgcca gctggatggt agagtgctgt tgaacactac tgtggcccca 600
cttttcttcg ctgaccagtt tctgcaactg tccacttccc tgccatccca gtacattact 660cttttcttcg ctgaccagtt tctgcaactg tccacttccc tgccatccca gtacattact 660
ggactcgccg aacacctgtc gccactgatg ctctcgacct cttggactag aatcactttg 720ggactcgccg aacacctgtc gccactgatg ctctcgacct cttggactag aatcactttg 720
tggaacagag acttggcccc tactccggga gcaaatctgt acggaagcca ccctttttac 780tggaacagag acttggcccc tactccggga gcaaatctgt acggaagcca ccctttttac 780
ctggcgctcg aagatggcgg atccgctcac ggagtgttcc tgctgaatag caacgcaatg 840ctggcgctcg aagatggcgg atccgctcac ggagtgttcc tgctgaatag caacgcaatg 840
gacgtggtgc tgcaaccttc ccctgcactc agttggagaa gtaccggggg tattctggac 900gacgtggtgc tgcaaccttc ccctgcactc agttggagaa gtaccggggg tattctggac 900
gtgtacatct tcctcggacc agaacccaag agcgtggtgc agcaatatct ggacgtggtc 960gtgtacatct tcctcggacc agaacccaag agcgtggtgc agcaatatct ggacgtggtc 960
ggataccctt ttatgcctcc ttactgggga ctgggattcc acctttgccg ttggggctac 1020ggataccctt ttatgcctcc ttactgggga ctgggattcc acctttgccg ttggggctac 1020
tcatccaccg ccattaccag acaggtggtg gagaatatga ccagagccca cttccctctc 1080tcatccaccg ccattaccag acaggtggtg gagaatatga ccagagccca cttccctctc 1080
gacgtgcagt ggaacgatct ggactatatg gactcccgga gagatttcac cttcaacaag 11401140
gacgggttcc gcgattttcc cgcgatggtt caagagctcc accagggtgg tcgaagatat 1200gacgggttcc gcgattttcc cgcgatggtt caagagctcc accagggtgg tcgaagatat 1200
atgatgatcg tcgacccagc catttcgagc agcggacccg ctggatctta tagaccttac 1260atgatgatcg tcgacccagc catttcgagc agcggacccg ctggatctta tagaccttac 1260
gacgaaggcc ttaggagagg agtgttcatc acaaacgaga ctggacagcc tttgatcggt 13201320
aaagtgtggc ctggatcaac cgcctttcct gactttacca atcccactgc cttggcttgg 1380aaagtgtggc ctggatcaac cgcctttcct gactttacca atcccactgc cttggcttgg 1380
tgggaggaca tggtggccga attccacgac caagtcccct ttgatggaat gtggatcgat 1440tgggaggaca tggtggccga attccacgac caagtcccct ttgatggaat gtggatcgat 1440
atgaacgaac caagcaattt tatcagaggt tccgaagacg gttgccccaa caacgaactg 1500atgaacgaac caagcaattt tatcagaggt tccgaagacg gttgccccaa caacgaactg 1500
gaaaaccctc cttatgtgcc cggagtcgtg ggcggaacat tacaggccgc gactatttgc 1560gaaaaccctc cttatgtgcc cggagtcgtg ggcggaacat tacaggccgc gactatttgc 1560
gccagcagcc accaattcct gtccactcac tacaacctcc acaaccttta tggattaacc 1620gccagcagcc accaattcct gtccactcac tacaacctcc acaaccttta tggattaacc 1620
gaagctattg caagtcacag ggctctggtg aaggctagag ggactaggcc ctttgtgatc 1680gaagctattg caagtcacag ggctctggtg aaggctagag ggactaggcc ctttgtgatc 1680
tcccgatcca cctttgccgg acacgggaga tacgccggtc actggactgg tgacgtgtgg 1740tcccgatcca cctttgccgg acacggggaga tacgccggtc actggactgg tgacgtgtgg 1740
agctcatggg aacaactggc ctcctccgtg ccggaaatct tacagttcaa ccttctgggt 18001800
gtccctcttg tcggagcaga cgtgtgtggg tttcttggta acacctccga ggaactgtgt 1860gtccctcttg tcggagcaga cgtgtgtggg tttcttggta acacctccga ggaactgtgt 1860
gtgcgctgga ctcaactggg tgcattctac ccattcatga gaaaccacaa ctccttgctg 1920gtgcgctgga ctcaactggg tgcattctac ccattcatga gaaaccacaa ctccttgctg 1920
tccctgccac aagagcccta ctcgttcagc gagcctgcac aacaggctat gcggaaggca 1980tccctgccac aagagccta ctcgttcagc gagcctgcac aacaggctat gcggaaggca 1980
ctgaccctga gatacgccct gcttccacac ttatacactc tcttccatca agcgcatgtg 2040ctgaccctga gatacgccct gcttccacac ttatacactc tcttccatca agcgcatgtg 2040
gcaggagaaa ccgttgcaag gcctcttttc cttgaattcc ccaaggattc ctcgacttgg 2100gcaggagaaa ccgttgcaag gcctcttttc cttgaattcc ccaaggattc ctcgacttgg 2100
acggtggatc atcagctgct gtggggagaa gctctgctga ttactccagt gttgcaagcc 2160acggtggatc atcagctgct gtggggagaa gctctgctga ttactccagt gttgcaagcc 2160
ggaaaagctg aggtgaccgg atactttccg ctgggaacct ggtacgacct ccagactgtc 2220ggaaaagctg aggtgaccgg atactttccg ctgggaacct ggtacgacct cggactgtc 2220
cctgttgaag cccttggatc actgcctccg cctccggcag ctccacgcga accagctata 2280ccctgttgaag cccttggatc actgcctccg ccctccggcag ctccacgcga accagctata 2280
cattccgagg gacagtgggt tacattacca gctcctctgg acacaatcaa cgtccactta 2340cattccgagg gacagtgggt tacattacca gctcctctgg acacaatcaa cgtccactta 2340
agagctggct acattatccc tctgcaagga ccaggactga ctacgaccga gagcagacag 2400agagctggct acattatccc tctgcaagga ccaggactga ctacgaccga gagcagacag 2400
cagccaatgg cactggctgt ggctctgacc aagggagggg aagctagagg agaactcttc 2460cagccaatgg cactggctgt ggctctgacc aagggagggg aagctagagg agaactcttc 2460
tgggatgatg gggagtccct tgaagtgctg gaaagaggcg cttacactca agtcattttc 2520tgggatgatg gggagtccct tgaagtgctg gaaagaggcg cttacactca agtcattttc 2520
cttgcacgga acaacaccat tgtgaacgaa ttggtgcgag tgaccagcga aggagctgga 2580cttgcacgga acaacaccat tgtgaacgaa ttggtgcgag tgaccagcga aggagctgga 2580
cttcaactgc agaaggtcac tgtgctcgga gtggctaccg ctcctcagca agtgctgtcg 2640cttcaactgc agaaggtcac tgtgctcgga gtggctaccg ctcctcagca agtgctgtcg 2640
aatggagtcc ccgtgtcaaa ctttacctac tcccctgaca ctaaggtgct cgacatttgc 2700aatggagtcc ccgtgtcaaa ctttacctac tcccctgaca ctaaggtgct cgacatttgc 2700
gtgtccctcc tgatgggaga gcagttcctt gtgtcctggt gttga 2745gtgtccctcc tgatgggaga gcagttcctt gtgtcctggt gttga 2745
<210> 40<210> 40
<211> 2706<211> 2706
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> sp7+hGAAwt-дельта-42<223> sp7+hGAAwt-delta-42
<400> 40<400> 40
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggcgcacac 60atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggcgcacac 60
cccgggcggc cgcgagcagt gcccacacag tgcgacgtcc cccccaacag ccgcttcgat 120cccgggcggc cgcgagcagt gcccacacag tgcgacgtcc cccccaacag ccgcttcgat 120
tgcgcccctg acaaggccat cacccaggaa cagtgcgagg cccgcggctg ttgctacatc 180tgcgcccctg acaaggccat cacccaggaa cagtgcgagg cccgcggctg ttgctacatc 180
cctgcaaagc aggggctgca gggagcccag atggggcagc cctggtgctt cttcccaccc 240cctgcaaagc aggggctgca gggagcccag atggggcagc cctggtgctt cttcccaccc 240
agctacccca gctacaagct ggagaacctg agctcctctg aaatgggcta cacggccacc 300agctacccca gctacaagct ggagaacctg agctcctctg aaatgggcta cacggccacc 300
ctgacccgta ccacccccac cttcttcccc aaggacatcc tgaccctgcg gctggacgtg 360ctgacccgta ccacccccac cttcttcccc aaggacatcc tgaccctgcg gctggacgtg 360
atgatggaga ctgagaaccg cctccacttc acgatcaaag atccagctaa caggcgctac 420atgatggaga ctgagaaccg ccctccacttc acgatcaaag atccagctaa caggcgctac 420
gaggtgccct tggagacccc gcatgtccac agccgggcac cgtccccact ctacagcgtg 480gaggtgccct tggagacccc gcatgtccac agccgggcac cgtccccact ctacagcgtg 480
gagttctccg aggagccctt cggggtgatc gtgcgccggc agctggacgg ccgcgtgctg 540gagttctccg aggagccctt cggggtgatc gtgcgccggc agctggacgg ccgcgtgctg 540
ctgaacacga cggtggcgcc cctgttcttt gcggaccagt tccttcagct gtccacctcg 600ctgaacacga cggtggcgcc cctgttcttt gcggaccagt tccttcagct gtccacctcg 600
ctgccctcgc agtatatcac aggcctcgcc gagcacctca gtcccctgat gctcagcacc 660ctgccctcgc agtatatcac aggcctcgcc gagcacctca gtcccctgat gctcagcacc 660
agctggacca ggatcaccct gtggaaccgg gaccttgcgc ccacgcccgg tgcgaacctc 720agctggacca ggatcaccct gtggaaccgg gaccttgcgc ccacgcccgg tgcgaacctc 720
tacgggtctc accctttcta cctggcgctg gaggacggcg ggtcggcaca cggggtgttc 780tacgggtctc accctttcta cctggcgctg gaggacggcg ggtcggcaca cggggtgttc 780
ctgctaaaca gcaatgccat ggatgtggtc ctgcagccga gccctgccct tagctggagg 840ctgctaaaca gcaatgccat ggatgtggtc ctgcagccga gccctgccct tagctggagg 840
tcgacaggtg ggatcctgga tgtctacatc ttcctgggcc cagagcccaa gagcgtggtg 900tcgacaggtg ggatcctgga tgtctacatc ttcctgggcc cagagcccaa gagcgtggtg 900
cagcagtacc tggacgttgt gggatacccg ttcatgccgc catactgggg cctgggcttc 960cagcagtacc tggacgttgt gggatacccg ttcatgccgc catactgggg cctgggcttc 960
cacctgtgcc gctggggcta ctcctccacc gctatcaccc gccaggtggt ggagaacatg 1020cacctgtgcc gctggggcta ctcctccacc gctatcaccc gccaggtggt ggagaacatg 1020
accagggccc acttccccct ggacgtccag tggaacgacc tggactacat ggactcccgg 1080accagggccc acttccccct ggacgtccag tggaacgacc tggactacat ggactcccgg 1080
agggacttca cgttcaacaa ggatggcttc cgggacttcc cggccatggt gcaggagctg 1140agggacttca cgttcaacaa ggatggcttc cgggacttcc cggccatggt gcaggagctg 1140
caccagggcg gccggcgcta catgatgatc gtggatcctg ccatcagcag ctcgggccct 1200caccagggcg gccggcgcta catgatgatc gtggatcctg ccatcagcag ctcgggccct 1200
gccgggagct acaggcccta cgacgagggt ctgcggaggg gggttttcat caccaacgag 1260gccgggggct acaggcccta cgacgagggt ctgcggaggg gggttttcat caccaacgag 1260
accggccagc cgctgattgg gaaggtatgg cccgggtcca ctgccttccc cgacttcacc 1320accggccagc cgctgattgg gaaggtatgg cccgggtcca ctgccttccc cgacttcacc 1320
aaccccacag ccctggcctg gtgggaggac atggtggctg agttccatga ccaggtgccc 1380aaccccacag ccctggcctg gtgggaggac atggtggctg agttccatga ccaggtgccc 1380
ttcgacggca tgtggattga catgaacgag ccttccaact tcatcagggg ctctgaggac 1440ttcgacggca tgtggattga catgaacgag ccttccaact tcatcagggg ctctgaggac 1440
ggctgcccca acaatgagct ggagaaccca ccctacgtgc ctggggtggt tggggggacc 1500ggctgcccca acaatgagct ggagaaccca ccctacgtgc ctggggtggt tggggggacc 1500
ctccaggcgg ccaccatctg tgcctccagc caccagtttc tctccacaca ctacaacctg 1560ctccaggcgg ccaccatctg tgcctccagc caccagtttc tctccacaca ctacaacctg 1560
cacaacctct acggcctgac cgaagccatc gcctcccaca gggcgctggt gaaggctcgg 1620cacaacctct acggcctgac cgaagccatc gcctcccaca gggcgctggt gaaggctcgg 1620
gggacacgcc catttgtgat ctcccgctcg acctttgctg gccacggccg atacgccggc 1680gggacacgcc catttgtgat ctcccgctcg acctttgctg gccacggccg atacgccggc 1680
cactggacgg gggacgtgtg gagctcctgg gagcagctcg cctcctccgt gccagaaatc 1740cactggacgg gggacgtgtg gagctcctgg gagcagctcg cctcctccgt gccagaaatc 1740
ctgcagttta acctgctggg ggtgcctctg gtcggggccg acgtctgcgg cttcctgggc 1800ctgcagttta acctgctggg ggtgcctctg gtcggggccg acgtctgcgg cttcctgggc 1800
aacacctcag aggagctgtg tgtgcgctgg acccagctgg gggccttcta ccccttcatg 1860aacacctcag aggagctgtg tgtgcgctgg acccagctgg gggccttcta ccccttcatg 1860
cggaaccaca acagcctgct cagtctgccc caggagccgt acagcttcag cgagccggcc 1920cggaaccaca acagcctgct cagtctgccc caggagccgt acagcttcag cgagccggcc 1920
cagcaggcca tgaggaaggc cctcaccctg cgctacgcac tcctccccca cctctacaca 1980cagcaggcca tgaggaaggc cctcaccctg cgctacgcac tcctccccca cctctacaca 1980
ctgttccacc aggcccacgt cgcgggggag accgtggccc ggcccctctt cctggagttc 2040ctgttccacc aggcccacgt cgcgggggag accgtggccc ggcccctctt cctggagttc 2040
cccaaggact ctagcacctg gactgtggac caccagctcc tgtgggggga ggccctgctc 2100cccaaggact ctagcacctg gactgtggac caccagctcc tgtgggggga ggccctgctc 2100
atcaccccag tgctccaggc cgggaaggcc gaagtgactg gctacttccc cttgggcaca 2160atcaccccag tgctccaggc cgggaaggcc gaagtgactg gctacttccc cttgggcaca 2160
tggtacgacc tgcagacggt gccagtagag gcccttggca gcctcccacc cccacctgca 2220tggtacgacc tgcagacggt gccagtagag gcccttggca gcctcccacc cccacctgca 2220
gctccccgtg agccagccat ccacagcgag gggcagtggg tgacgctgcc ggcccccctg 2280gctccccgtg agccagccat ccacagcgag gggcagtggg tgacgctgcc ggcccccctg 2280
gacaccatca acgtccacct ccgggctggg tacatcatcc ccctgcaggg ccctggcctc 2340gacaccacct acgtccacct ccgggctggg tacatcatcc ccctgcaggg ccctggcctc 2340
acaaccacag agtcccgcca gcagcccatg gccctggctg tggccctgac caagggtggg 2400acaaccacag agtcccgcca gcagcccatg gccctggctg tggccctgac caaggggtggg 2400
gaggcccgag gggagctgtt ctgggacgat ggagagagcc tggaagtgct ggagcgaggg 2460gaggcccgag gggagctgtt ctgggacgat ggagagagcc tggaagtgct ggagcgaggg 2460
gcctacacac aggtcatctt cctggccagg aataacacga tcgtgaatga gctggtacgt 2520gcctacacac aggtcatctt cctggccagg aataacacga tcgtgaatga gctggtacgt 2520
gtgaccagtg agggagctgg cctgcagctg cagaaggtga ctgtcctggg cgtggccacg 2580gtgaccagtg agggagctgg cctgcagctg cagaaggtga ctgtcctggg cgtggccacg 2580
gcgccccagc aggtcctctc caacggtgtc cctgtctcca acttcaccta cagccccgac 2640gcgccccagc aggtcctctc caacggtgtc cctgtctcca acttcaccta cagccccgac 2640
accaaggtcc tggacatctg tgtctcgctg ttgatgggag agcagtttct cgtcagctgg 2700accaaggtcc tggacatctg tgtctcgctg ttgatgggag agcagtttct cgtcagctgg 2700
tgttag 2706tgttag 2706
<210> 41<210> 41
<211> 2706<211> 2706
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> sp7-hGAAco2-дельта-42<223> sp7-hGAAco2-delta-42
<400> 41<400> 41
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggcgcccat 60atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggcgcccat 60
cctggtagac caagagctgt gcctacccaa tgcgacgtgc cacccaactc ccgattcgac 120cctggtagac caagagctgt gcctacccaa tgcgacgtgc cacccaactc ccgattcgac 120
tgcgcgccag ataaggctat tacccaagag cagtgtgaag ccagaggttg ctgctacatc 180tgcgcgccag ataaggctat tacccaagag cagtgtgaag ccagaggttg ctgctacatc 180
ccagcgaagc aaggattgca aggcgcccaa atgggacaac cttggtgttt cttcccccct 240ccagcgaagc aaggattgca aggcgcccaa atgggacaac cttggtgttt cttcccccct 240
tcgtacccat catataaact cgaaaacctg tcctcttcgg aaatgggtta tactgccacc 300tcgtacccat catataaact cgaaaacctg tcctcttcgg aaatgggtta tactgccacc 300
ctcaccagaa ctactcctac tttcttcccg aaagacatct tgaccttgag gctggacgtg 360ctcaccagaa ctactcctac tttcttcccg aaagacatct tgaccttgag gctggacgtg 360
atgatggaga ctgaaaaccg gctgcatttc actatcaaag atcctgccaa tcggcgatac 420atgatggaga ctgaaaaccg gctgcatttc actatcaaag atcctgccaa tcggcgatac 420
gaggtccctc tggaaacccc tcacgtgcac tcacgggctc cttctccgct ttactccgtc 480gaggtccctc tggaaacccc tcacgtgcac tcacgggctc cttctccgct ttactccgtc 480
gaattctctg aggaaccctt cggagtgatc gttagacgcc agctggatgg tagagtgctg 540gaattctctg aggaaccctt cggagtgatc gttagacgcc agctggatgg tagagtgctg 540
ttgaacacta ctgtggcccc acttttcttc gctgaccagt ttctgcaact gtccacttcc 600ttgaacacta ctgtggcccc acttttcttc gctgaccagt ttctgcaact gtccacttcc 600
ctgccatccc agtacattac tggactcgcc gaacacctgt cgccactgat gctctcgacc 660ctgccatccc agtacattac tggactcgcc gaacacctgt cgccactgat gctctcgacc 660
tcttggacta gaatcacttt gtggaacaga gacttggccc ctactccggg agcaaatctg 720tcttggacta gaatcacttt gtggaacaga gacttggccc ctactccggg agcaaatctg 720
tacggaagcc acccttttta cctggcgctc gaagatggcg gatccgctca cggagtgttc 780tacggaagcc acccttttta cctggcgctc gaagatggcg gatccgctca cggagtgttc 780
ctgctgaata gcaacgcaat ggacgtggtg ctgcaacctt cccctgcact cagttggaga 840ctgctgaata gcaacgcaat ggacgtggtg ctgcaacctt cccctgcact cagttggaga 840
agtaccgggg gtattctgga cgtgtacatc ttcctcggac cagaacccaa gagcgtggtg 900agtaccgggg gtattctgga cgtgtacatc ttcctcggac cagaacccaa gagcgtggtg 900
cagcaatatc tggacgtggt cggataccct tttatgcctc cttactgggg actgggattc 960cagcaatatc tggacgtggt cggataccct tttatgcctc cttactgggg actgggattc 960
cacctttgcc gttggggcta ctcatccacc gccattacca gacaggtggt ggagaatatg 1020cacctttgcc gttggggcta ctcatccacc gccattacca gacaggtggt ggagaatatg 1020
accagagccc acttccctct cgacgtgcag tggaacgatc tggactatat ggactcccgg 1080accagagccc acttccctct cgacgtgcag tggaacgatc tggactatat ggactcccgg 1080
agagatttca ccttcaacaa ggacgggttc cgcgattttc ccgcgatggt tcaagagctc 1140agagatttca ccttcaacaa ggacgggttc cgcgattttc ccgcgatggt tcaagagctc 1140
caccagggtg gtcgaagata tatgatgatc gtcgacccag ccatttcgag cagcggaccc 1200caccagggtg gtcgaagata tatgatgatc gtcgacccag ccatttcgag cagcggaccc 1200
gctggatctt atagacctta cgacgaaggc cttaggagag gagtgttcat cacaaacgag 1260gctggatctt atagacctta cgacgaaggc cttaggagag gagtgttcat cacaaacgag 1260
actggacagc ctttgatcgg taaagtgtgg cctggatcaa ccgcctttcc tgactttacc 13201320
aatcccactg ccttggcttg gtgggaggac atggtggccg aattccacga ccaagtcccc 13801380
tttgatggaa tgtggatcga tatgaacgaa ccaagcaatt ttatcagagg ttccgaagac 1440tttgatggaa tgtggatcga tatgaacgaa ccaagcaatt ttatcagagg ttccgaagac 1440
ggttgcccca acaacgaact ggaaaaccct ccttatgtgc ccggagtcgt gggcggaaca 1500ggttgcccca acaacgaact ggaaaaccct ccttatgtgc ccggagtcgt gggcggaaca 1500
ttacaggccg cgactatttg cgccagcagc caccaattcc tgtccactca ctacaacctc 1560ttacaggccg cgactatttg cgccagcagc caccaattcc tgtccactca ctacaacctc 1560
cacaaccttt atggattaac cgaagctatt gcaagtcaca gggctctggt gaaggctaga 1620cacaaccttt atggattaac cgaagctatt gcaagtcaca gggctctggt gaaggctaga 1620
gggactaggc cctttgtgat ctcccgatcc acctttgccg gacacgggag atacgccggt 1680gggactaggc cctttgtgat ctcccgatcc acctttgccg gacacgggag atacgccggt 1680
cactggactg gtgacgtgtg gagctcatgg gaacaactgg cctcctccgt gccggaaatc 1740cactggactg gtgacgtgtg gagctcatgg gaacaactgg cctcctccgt gccggaaatc 1740
ttacagttca accttctggg tgtccctctt gtcggagcag acgtgtgtgg gtttcttggt 1800ttacagttca accttctggg tgtccctctt gtcggagcag acgtgtgtgg gtttcttggt 1800
aacacctccg aggaactgtg tgtgcgctgg actcaactgg gtgcattcta cccattcatg 1860aacacctccg aggaactgtg tgtgcgctgg actcaactgg gtgcattcta cccattcatg 1860
agaaaccaca actccttgct gtccctgcca caagagccct actcgttcag cgagcctgca 1920agaaaccaca actccttgct gtccctgcca caagagccct actcgttcag cgagcctgca 1920
caacaggcta tgcggaaggc actgaccctg agatacgccc tgcttccaca cttatacact 1980caacaggcta tgcggaaggc actgaccctg agatacgccc tgcttccaca cttatacact 1980
ctcttccatc aagcgcatgt ggcaggagaa accgttgcaa ggcctctttt ccttgaattc 2040ctcttccatc aagcgcatgt ggcaggagaa accgttgcaa ggcctctttt ccttgaattc 2040
cccaaggatt cctcgacttg gacggtggat catcagctgc tgtggggaga agctctgctg 2100cccaaggatt cctcgacttg gacggtggat catcagctgc tgtggggaga agctctgctg 2100
attactccag tgttgcaagc cggaaaagct gaggtgaccg gatactttcc gctgggaacc 2160attactccag tgttgcaagc cggaaaagct gaggtgaccg gatactttcc gctgggaacc 2160
tggtacgacc tccagactgt ccctgttgaa gcccttggat cactgcctcc gcctccggca 2220tggtacgacc tccagactgt ccctgttgaa gcccttggat cactgcctcc gcctccggca 2220
gctccacgcg aaccagctat acattccgag ggacagtggg ttacattacc agctcctctg 2280gctccacgcg aaccagctat acattccgag ggacagtggg ttacattacc agctcctctg 2280
gacacaatca acgtccactt aagagctggc tacattatcc ctctgcaagg accaggactg 2340gacacaatca acgtccactt aagagctggc tacattatcc ctctgcaagg accaggactg 2340
actacgaccg agagcagaca gcagccaatg gcactggctg tggctctgac caagggaggg 2400actacgaccg agagcagaca gcagccaatg gcactggctg tggctctgac caagggaggg 2400
gaagctagag gagaactctt ctgggatgat ggggagtccc ttgaagtgct ggaaagaggc 2460gaagctagag gagaactctt ctgggatgat ggggagtccc ttgaagtgct ggaaagaggc 2460
gcttacactc aagtcatttt ccttgcacgg aacaacacca ttgtgaacga attggtgcga 2520gcttacactc aagtcatttt ccttgcacgg aacaacacca ttgtgaacga attggtgcga 2520
gtgaccagcg aaggagctgg acttcaactg cagaaggtca ctgtgctcgg agtggctacc 2580gtgaccagcg aaggagctgg acttcaactg cagaaggtca ctgtgctcgg agtggctacc 2580
gctcctcagc aagtgctgtc gaatggagtc cccgtgtcaa actttaccta ctcccctgac 2640gctcctcagc aagtgctgtc gaatggagtc cccgtgtcaa actttaccta ctcccctgac 2640
actaaggtgc tcgacatttg cgtgtccctc ctgatgggag agcagttcct tgtgtcctgg 2700actaaggtgc tcgacatttg cgtgtccctc ctgatgggag agcagttcct tgtgtcctgg 2700
tgttga 2706tgttga 2706
<210> 42<210> 42
<211> 2703<211> 2703
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> sp7-hGAAwt-дельта-43<223> sp7-hGAAwt-delta-43
<400> 42<400> 42
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccacccc 60atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccacccc 60
gggcggccgc gagcagtgcc cacacagtgc gacgtccccc ccaacagccg cttcgattgc 120gggcggccgc gagcagtgcc cacacagtgc gacgtccccc ccaacagccg cttcgattgc 120
gcccctgaca aggccatcac ccaggaacag tgcgaggccc gcggctgttg ctacatccct 180gcccctgaca aggccatcac cggaacag tgcgaggccc gcggctgttg ctacatccct 180
gcaaagcagg ggctgcaggg agcccagatg gggcagccct ggtgcttctt cccacccagc 240gcaaagcagg ggctgcaggg agccgatg gggcagccct ggtgcttctt cccacccagc 240
taccccagct acaagctgga gaacctgagc tcctctgaaa tgggctacac ggccaccctg 300taccccagct acaagctgga gaacctgagc tcctctgaaa tgggctacac ggccaccctg 300
acccgtacca cccccacctt cttccccaag gacatcctga ccctgcggct ggacgtgatg 360acccgtacca cccccacctt cttccccaag gacatcctga ccctgcggct ggacgtgatg 360
atggagactg agaaccgcct ccacttcacg atcaaagatc cagctaacag gcgctacgag 420atggagactg agaaccgcct ccacttcacg atcaaagatc cagctaacag gcgctacgag 420
gtgcccttgg agaccccgca tgtccacagc cgggcaccgt ccccactcta cagcgtggag 480gtgcccttgg agaccccgca tgtccacagc cgggcaccgt ccccactcta cagcgtggag 480
ttctccgagg agcccttcgg ggtgatcgtg cgccggcagc tggacggccg cgtgctgctg 540ttctccgagg agcccttcgg ggtgatcgtg cgccggcagc tggacggccg cgtgctgctg 540
aacacgacgg tggcgcccct gttctttgcg gaccagttcc ttcagctgtc cacctcgctg 600aacacgacgg tggcgcccct gttctttgcg gaccagttcc ttcagctgtc cacctcgctg 600
ccctcgcagt atatcacagg cctcgccgag cacctcagtc ccctgatgct cagcaccagc 660ccctcgcagt atatcacagg cctcgccgag cacctcagtc ccctgatgct cagcaccagc 660
tggaccagga tcaccctgtg gaaccgggac cttgcgccca cgcccggtgc gaacctctac 720tggaccagga tcaccctgtg gaaccgggac cttgcgccca cgcccggtgc gaacctctac 720
gggtctcacc ctttctacct ggcgctggag gacggcgggt cggcacacgg ggtgttcctg 780gggtctcacc ctttctacct ggcgctggag gacggcgggt cggcacacgg ggtgttcctg 780
ctaaacagca atgccatgga tgtggtcctg cagccgagcc ctgcccttag ctggaggtcg 840ctaaacagca atgccatgga tgtggtcctg cagccgagcc ctgcccttag ctggaggtcg 840
acaggtggga tcctggatgt ctacatcttc ctgggcccag agcccaagag cgtggtgcag 900acaggtggga tcctggatgt ctacatcttc ctgggcccag agcccaagag cgtggtgcag 900
cagtacctgg acgttgtggg atacccgttc atgccgccat actggggcct gggcttccac 960cagtacctgg acgttgtggg atacccgttc atgccgccat actggggcct gggcttccac 960
ctgtgccgct ggggctactc ctccaccgct atcacccgcc aggtggtgga gaacatgacc 1020ctgtgccgct ggggctactc ctccaccgct atcacccgcc aggtggtgga gaacatgacc 1020
agggcccact tccccctgga cgtccagtgg aacgacctgg actacatgga ctcccggagg 1080agggcccact tccccctgga cgtccagtgg aacgacctgg actacatgga ctcccgggagg 1080
gacttcacgt tcaacaagga tggcttccgg gacttcccgg ccatggtgca ggagctgcac 1140gacttcacgt tcaacaagga tggcttccgg gacttcccgg ccatggtgca ggagctgcac 1140
cagggcggcc ggcgctacat gatgatcgtg gatcctgcca tcagcagctc gggccctgcc 1200cagggcggcc ggcgctacat gatgatcgtg gatcctgcca tcagcagctc gggccctgcc 1200
gggagctaca ggccctacga cgagggtctg cggagggggg ttttcatcac caacgagacc 1260gggagctaca ggccctacga cgagggtctg cggagggggg ttttcatcac caacgagacc 1260
ggccagccgc tgattgggaa ggtatggccc gggtccactg ccttccccga cttcaccaac 1320ggccagccgc tgattgggaa ggtatggccc gggtccactg ccttccccga cttcaccaac 1320
cccacagccc tggcctggtg ggaggacatg gtggctgagt tccatgacca ggtgcccttc 1380cccacagccc tggcctggtg ggaggacatg gtggctgagt tccatgacca ggtgcccttc 1380
gacggcatgt ggattgacat gaacgagcct tccaacttca tcaggggctc tgaggacggc 1440gacggcatgt ggattgacat gaacgagcct tccaacttca tcaggggctc tgaggacggc 1440
tgccccaaca atgagctgga gaacccaccc tacgtgcctg gggtggttgg ggggaccctc 1500tgccccaaca atgagctgga gaacccaccc tacgtgcctg gggtggttgg ggggaccctc 1500
caggcggcca ccatctgtgc ctccagccac cagtttctct ccacacacta caacctgcac 1560caggcggcca ccatctgtgc ctccagccac cagtttctct ccacacacta caacctgcac 1560
aacctctacg gcctgaccga agccatcgcc tcccacaggg cgctggtgaa ggctcggggg 1620aacctctacg gcctgaccga agccatcgcc tcccacaggg cgctggtgaa ggctcggggg 1620
acacgcccat ttgtgatctc ccgctcgacc tttgctggcc acggccgata cgccggccac 1680acacgcccat ttgtgatctc ccgctcgacc tttgctggcc acggccgata cgccggccac 1680
tggacggggg acgtgtggag ctcctgggag cagctcgcct cctccgtgcc agaaatcctg 1740tggacggggg acgtgtggag ctcctgggag cagctcgcct cctccgtgcc agaaatcctg 1740
cagtttaacc tgctgggggt gcctctggtc ggggccgacg tctgcggctt cctgggcaac 1800cagtttaacc tgctgggggt gcctctggtc ggggccgacg tctgcggctt cctgggcaac 1800
acctcagagg agctgtgtgt gcgctggacc cagctggggg ccttctaccc cttcatgcgg 1860acctcagagg agctgtgtgt gcgctggacc cagctggggg ccttctaccc cttcatgcgg 1860
aaccacaaca gcctgctcag tctgccccag gagccgtaca gcttcagcga gccggcccag 1920aaccacaaca gcctgctcag tctgccccag gagccgtaca gcttcagcga gccggcccag 1920
caggccatga ggaaggccct caccctgcgc tacgcactcc tcccccacct ctacacactg 1980caggccatga ggaaggccct caccctgcgc tacgcactcc tcccccacct ctacacactg 1980
ttccaccagg cccacgtcgc gggggagacc gtggcccggc ccctcttcct ggagttcccc 2040ttccaccagg cccacgtcgc gggggagacc gtggcccggc ccctcttcct ggagttcccc 2040
aaggactcta gcacctggac tgtggaccac cagctcctgt ggggggaggc cctgctcatc 2100aaggactcta gcacctggac tgtggaccac cagctcctgt ggggggaggc cctgctcatc 2100
accccagtgc tccaggccgg gaaggccgaa gtgactggct acttcccctt gggcacatgg 2160accccagtgc tccaggccgg gaaggccgaa gtgactggct acttcccctt gggcacatgg 2160
tacgacctgc agacggtgcc agtagaggcc cttggcagcc tcccaccccc acctgcagct 2220tacgacctgc agacggtgcc agtagaggcc cttggcagcc tcccaccccc acctgcagct 2220
ccccgtgagc cagccatcca cagcgagggg cagtgggtga cgctgccggc ccccctggac 2280ccccgtgagc cagccatcca cagcgagggg cagtgggtga cgctgccggc ccccctggac 2280
accatcaacg tccacctccg ggctgggtac atcatccccc tgcagggccc tggcctcaca 2340accatcaacg tccacctccg ggctgggtac atcatccccc tgcagggccc tggcctcaca 2340
accacagagt cccgccagca gcccatggcc ctggctgtgg ccctgaccaa gggtggggag 2400accacagagt cccgccagca gcccatggcc ctggctgtgg ccctgaccaa gggtggggag 2400
gcccgagggg agctgttctg ggacgatgga gagagcctgg aagtgctgga gcgaggggcc 2460gcccgagggg agctgttctg ggacgatgga gagagcctgg aagtgctgga gcgaggggcc 2460
tacacacagg tcatcttcct ggccaggaat aacacgatcg tgaatgagct ggtacgtgtg 2520tacacacagg tcatcttcct ggccaggaat aacacgatcg tgaatgagct ggtacgtgtg 2520
accagtgagg gagctggcct gcagctgcag aaggtgactg tcctgggcgt ggccacggcg 2580accagtgagg gagctggcct gcagctgcag aaggtgactg tcctgggcgt ggccacggcg 2580
ccccagcagg tcctctccaa cggtgtccct gtctccaact tcacctacag ccccgacacc 2640ccccagcagg tcctctccaa cggtgtccct gtctccaact tcacctacag ccccgacacc 2640
aaggtcctgg acatctgtgt ctcgctgttg atgggagagc agtttctcgt cagctggtgt 2700aaggtcctgg acatctgtgt ctcgctgttg atgggagagc agtttctcgt cagctggtgt 2700
tag 2703tag 2703
<210> 43<210> 43
<211> 2703<211> 2703
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> sp7+hGAAco1-дельта-43<223> sp7+hGAAco1-delta-43
<400> 43<400> 43
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccacccc 60atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccacccc 60
ggcagaccta gagctgtgcc tacccagtgt gacgtgcccc ccaacagcag attcgactgc 120ggcagaccta gagctgtgcc tacccagtgt gacgtgcccc ccaacagcag attcgactgc 120
gcccctgaca aggccatcac ccaggaacag tgcgaggcca gaggctgctg ctacatccct 180gcccctgaca aggccatcac cggaacag tgcgaggcca gaggctgctg ctacatccct 180
gccaagcagg gactgcaggg cgctcagatg ggacagccct ggtgcttctt cccaccctcc 240gccaagcagg gactgcaggg cgctcagatg ggacagccct ggtgcttctt cccaccctcc 240
taccccagct acaagctgga aaacctgagc agcagcgaga tgggctacac cgccaccctg 300taccccagct acaagctgga aaacctgagc agcagcgaga tgggctacac cgccaccctg 300
accagaacca cccccacatt cttcccaaag gacatcctga ccctgcggct ggacgtgatg 360accagaacca cccccacatt cttcccaaag gacatcctga ccctgcggct ggacgtgatg 360
atggaaaccg agaaccggct gcacttcacc atcaaggacc ccgccaatcg gagatacgag 420atggaaaccg agaaccggct gcacttcacc atcaaggacc ccgccaatcg gagatacgag 420
gtgcccctgg aaacccccca cgtgcactct agagccccca gccctctgta cagcgtggaa 480gtgcccctgg aaaccccca cgtgcactct agagccccca gccctctgta cagcgtggaa 480
ttcagcgagg aacccttcgg cgtgatcgtg cggagacagc tggatggcag agtgctgctg 540ttcagcgagg aacccttcgg cgtgatcgtg cggagacagc tggatggcag agtgctgctg 540
aacaccaccg tggcccctct gttcttcgcc gaccagttcc tgcagctgag caccagcctg 600aacaccaccg tggcccctct gttcttcgcc gaccagttcc tgcagctgag caccagcctg 600
cccagccagt acatcacagg actggccgag cacctgagcc ccctgatgct gagcacatcc 660cccagccagt acatcacagg actggccgag cacctgagcc ccctgatgct gagcacatcc 660
tggacccgga tcaccctgtg gaacagggat ctggccccta cccctggcgc caatctgtac 720tggacccgga tcaccctgtg gaacagggat ctggccccta cccctggcgc caatctgtac 720
ggcagccacc ctttctacct ggccctggaa gatggcggat ctgcccacgg agtgtttctg 780ggcagccacc ctttctacct ggccctggaa gatggcggat ctgccccgg agtgtttctg 780
ctgaactcca acgccatgga cgtggtgctg cagcctagcc ctgccctgtc ttggagaagc 840ctgaactcca acgccatgga cgtggtgctg cagcctagcc ctgccctgtc ttggagaagc 840
acaggcggca tcctggatgt gtacatcttt ctgggccccg agcccaagag cgtggtgcag 900acaggcggca tcctggatgt gtacatcttt ctgggccccg agcccaagag cgtggtgcag 900
cagtatctgg atgtcgtggg ctaccccttc atgccccctt actggggcct gggattccac 960cagtatctgg atgtcgtggg ctaccccttc atgccccctt actggggcct gggattccac 960
ctgtgcagat ggggctactc cagcaccgcc atcaccagac aggtggtgga aaacatgacc 1020ctgtgcagat ggggctactc cagcaccgcc atcaccagac aggtggtgga aaacatgacc 1020
agagcccact tcccactgga tgtgcagtgg aacgacctgg actacatgga cagcagacgg 1080agagcccact tcccactgga tgtgcagtgg aacgacctgg actacatgga cagcagacgg 1080
gacttcacct tcaacaagga cggcttccgg gacttccccg ccatggtgca ggaactgcat 1140gacttcacct tcaacaagga cggcttccgg gacttccccg ccatggtgca ggaactgcat 1140
cagggcggca gacggtacat gatgatcgtg gatcccgcca tcagctcctc tggccctgcc 1200cagggcggca gacggtacat gatgatcgtg gatcccgcca tcagctcctc tggccctgcc 1200
ggctcttaca gaccctacga cgagggcctg cggagaggcg tgttcatcac caacgagaca 1260ggctcttaca gaccctacga cgaggggcctg cggagaggcg tgttcatcac caacgagaca 1260
ggccagcccc tgatcggcaa agtgtggcct ggcagcacag ccttccccga cttcaccaat 1320ggccagcccc tgatcggcaa agtgtggcct ggcagcacag ccttccccga cttcaccaat 1320
cctaccgccc tggcttggtg ggaggacatg gtggccgagt tccacgacca ggtgcccttc 1380cctaccgccc tggcttggtg ggaggacatg gtggccgagt tccacgacca ggtgcccttc 1380
gacggcatgt ggatcgacat gaacgagccc agcaacttca tccggggcag cgaggatggc 1440gacggcatgt ggatcgacat gaacgagccc agcaacttca tccggggcag cgaggatggc 1440
tgccccaaca acgaactgga aaatccccct tacgtgcccg gcgtcgtggg cggaacactg 1500tgccccaaca acgaactgga aaatccccct tacgtgcccg gcgtcgtggg cggaacactg 1500
caggccgcta caatctgtgc cagcagccac cagtttctga gcacccacta caacctgcac 1560caggccgcta caatctgtgc cagcagccac cagtttctga gcacccacta caacctgcac 1560
aacctgtacg gcctgaccga ggccattgcc agccaccgcg ctctcgtgaa agccagaggc 1620aacctgtacg gcctgaccga ggccattgcc agccaccgcg ctctcgtgaa agccagaggc 1620
acacggccct tcgtgatcag cagaagcacc tttgccggcc acggcagata cgccggacat 1680acacggccct tcgtgatcag cagaagcacc tttgccggcc acggcagata cgccggacat 1680
tggactggcg acgtgtggtc ctcttgggag cagctggcct ctagcgtgcc cgagatcctg 1740tggactggcg acgtgtggtc ctcttgggag cagctggcct ctagcgtgcc cgagatcctg 1740
cagttcaatc tgctgggcgt gccactcgtg ggcgccgatg tgtgtggctt cctgggcaac 1800cagttcaatc tgctgggcgt gccactcgtg ggcgccgatg tgtgtggctt cctgggcaac 1800
acctccgagg aactgtgtgt gcggtggaca cagctgggcg ccttctaccc tttcatgaga 1860acctccgagg aactgtgtgt gcggtggaca cagctgggcg ccttctaccc tttcatgaga 1860
aaccacaaca gcctgctgag cctgccccag gaaccctaca gctttagcga gcctgcacag 1920aaccacaaca gcctgctgag cctgccccag gaaccctaca gctttagcga gcctgcacag 1920
caggccatgc ggaaggccct gacactgaga tacgctctgc tgccccacct gtacaccctg 1980caggccatgc ggaaggccct gacactgaga tacgctctgc tgccccacct gtacaccctg 1980
tttcaccagg cccatgtggc cggcgagaca gtggccagac ctctgtttct ggaattcccc 2040tttcaccagg cccatgtggc cggcgagaca gtggccagac ctctgtttct ggaattcccc 2040
aaggacagca gcacctggac cgtggaccat cagctgctgt ggggagaggc tctgctgatt 2100aaggacagca gcacctggac cgtggaccat cagctgctgt ggggagaggc tctgctgatt 2100
accccagtgc tgcaggcagg caaggccgaa gtgaccggct actttcccct gggcacttgg 2160accccagtgc tgcaggcagg caaggccgaa gtgaccggct actttcccct gggcacttgg 2160
tacgacctgc agaccgtgcc tgtggaagcc ctgggatctc tgcctccacc tcctgccgct 2220tacgacctgc agaccgtgcc tgtggaagcc ctgggatctc tgcctccacc tcctgccgct 2220
cctagagagc ctgccattca ctctgagggc cagtgggtca cactgcctgc ccccctggat 2280cctagagc ctgccattca ctctgagggc cagtgggtca cactgcctgc ccccctggat 2280
accatcaacg tgcacctgag ggccggctac atcataccac tgcagggacc tggcctgacc 2340accatcaacg tgcacctgag ggccggctac atcataccac tgcagggacc tggcctgacc 2340
accaccgagt ctagacagca gccaatggcc ctggccgtgg ccctgaccaa aggcggagaa 2400accaccgagt ctagacagca gccaatggcc ctggccgtgg ccctgaccaa aggcggagaa 2400
gctaggggcg agctgttctg ggacgatggc gagagcctgg aagtgctgga aagaggcgcc 2460gctagggggcg agctgttctg ggacgatggc gagagcctgg aagtgctgga aagaggcgcc 2460
tatacccaag tgatcttcct ggcccggaac aacaccatcg tgaacgagct ggtgcgcgtg 2520tatacccaag tgatcttcct ggccgggaac aacaccatcg tgaacgagct ggtgcgcgtg 2520
acctctgaag gcgctggact gcagctgcag aaagtgaccg tgctgggagt ggccacagcc 2580acctctgaag gcgctggact gcagctgcag aaagtgaccg tgctgggagt ggccacagcc 2580
cctcagcagg tgctgtctaa tggcgtgccc gtgtccaact tcacctacag ccccgacacc 2640ccctcagcagg tgctgtctaa tggcgtgccc gtgtccaact tcacctacag ccccgacacc 2640
aaggtgctgg acatctgcgt gtcactgctg atgggagagc agtttctggt gtcctggtgc 2700aaggtgctgg acatctgcgt gtcactgctg atgggagagc agtttctggt gtcctggtgc 2700
tga 2703tga 2703
<210> 44<210> 44
<211> 2703<211> 2703
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> sp7+hGAAco2-дельта-43<223> sp7+hGAAco2-delta-43
<400> 44<400> 44
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccatcct 60atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccatcct 60
ggtagaccaa gagctgtgcc tacccaatgc gacgtgccac ccaactcccg attcgactgc 120ggtagaccaa gagctgtgcc tacccaatgc gacgtgccac ccaactcccg attcgactgc 120
gcgccagata aggctattac ccaagagcag tgtgaagcca gaggttgctg ctacatccca 180gcgccagata aggctattac ccaagagcag tgtgaagcca gaggttgctg ctacatccca 180
gcgaagcaag gattgcaagg cgcccaaatg ggacaacctt ggtgtttctt ccccccttcg 240gcgaagcaag gattgcaagg cgcccaaatg ggacaacctt ggtgtttctt ccccccttcg 240
tacccatcat ataaactcga aaacctgtcc tcttcggaaa tgggttatac tgccaccctc 300tacccatcat ataaactcga aaacctgtcc tcttcggaaa tgggttatac tgccaccctc 300
accagaacta ctcctacttt cttcccgaaa gacatcttga ccttgaggct ggacgtgatg 360accagaacta ctcctacttt cttcccgaaa gacatcttga ccttgaggct ggacgtgatg 360
atggagactg aaaaccggct gcatttcact atcaaagatc ctgccaatcg gcgatacgag 420atggagactg aaaaccggct gcatttcact atcaaagatc ctgccaatcg gcgatacgag 420
gtccctctgg aaacccctca cgtgcactca cgggctcctt ctccgcttta ctccgtcgaa 480gtccctctgg aaacccctca cgtgcactca cgggctcctt ctccgcttta ctccgtcgaa 480
ttctctgagg aacccttcgg agtgatcgtt agacgccagc tggatggtag agtgctgttg 540ttctctgagg aacccttcgg agtgatcgtt agacgccagc tggatggtag agtgctgttg 540
aacactactg tggccccact tttcttcgct gaccagtttc tgcaactgtc cacttccctg 600aacactactg tggccccact tttcttcgct gaccagtttc tgcaactgtc cacttccctg 600
ccatcccagt acattactgg actcgccgaa cacctgtcgc cactgatgct ctcgacctct 660ccatcccagt acattactgg actcgccgaa cacctgtcgc cactgatgct ctcgacctct 660
tggactagaa tcactttgtg gaacagagac ttggccccta ctccgggagc aaatctgtac 720tggactagaa tcactttgtg gaacagagac ttggccccta ctccgggagc aaatctgtac 720
ggaagccacc ctttttacct ggcgctcgaa gatggcggat ccgctcacgg agtgttcctg 780ggaagccacc ctttttacct ggcgctcgaa gatggcggat ccgctcacgg agtgttcctg 780
ctgaatagca acgcaatgga cgtggtgctg caaccttccc ctgcactcag ttggagaagt 840ctgaatagca acgcaatgga cgtggtgctg caaccttccc ctgcactcag ttggagaagt 840
accgggggta ttctggacgt gtacatcttc ctcggaccag aacccaagag cgtggtgcag 900accgggggta ttctggacgt gtacatcttc ctcggaccag aacccaagag cgtggtgcag 900
caatatctgg acgtggtcgg ataccctttt atgcctcctt actggggact gggattccac 960caatatctgg acgtggtcgg ataccctttt atgcctcctt actggggact gggattccac 960
ctttgccgtt ggggctactc atccaccgcc attaccagac aggtggtgga gaatatgacc 1020ctttgccgtt ggggctactc atccaccgcc attaccagac aggtggtgga gaatatgacc 1020
agagcccact tccctctcga cgtgcagtgg aacgatctgg actatatgga ctcccggaga 1080agagcccact tccctctcga cgtgcagtgg aacgatctgg actatatgga ctcccggaga 1080
gatttcacct tcaacaagga cgggttccgc gattttcccg cgatggttca agagctccac 1140gatttcacct tcaacaagga cgggttccgc gattttcccg cgatggttca agagctccac 1140
cagggtggtc gaagatatat gatgatcgtc gacccagcca tttcgagcag cggacccgct 1200cagggtggtc gaagatatat gatgatcgtc gacccagcca tttcgagcag cggacccgct 1200
ggatcttata gaccttacga cgaaggcctt aggagaggag tgttcatcac aaacgagact 1260ggatcttata gaccttacga cgaaggcctt aggagaggag tgttcatcac aaacgagact 1260
ggacagcctt tgatcggtaa agtgtggcct ggatcaaccg cctttcctga ctttaccaat 1320ggacagcctt tgatcggtaa agtgtggcct ggatcaaccg ccttttcctga ctttaccaat 1320
cccactgcct tggcttggtg ggaggacatg gtggccgaat tccacgacca agtccccttt 13801380
gatggaatgt ggatcgatat gaacgaacca agcaatttta tcagaggttc cgaagacggt 1440gatggaatgt ggatcgatat gaacgaacca agcaatttta tcagaggttc cgaagacggt 1440
tgccccaaca acgaactgga aaaccctcct tatgtgcccg gagtcgtggg cggaacatta 1500tgccccaaca acgaactgga aaaccctcct tatgtgcccg gagtcgtggg cggaacatta 1500
caggccgcga ctatttgcgc cagcagccac caattcctgt ccactcacta caacctccac 1560caggccgcga ctatttgcgc cagcagccac caattcctgt ccactcacta caacctccac 1560
aacctttatg gattaaccga agctattgca agtcacaggg ctctggtgaa ggctagaggg 16201620
actaggccct ttgtgatctc ccgatccacc tttgccggac acgggagata cgccggtcac 1680actaggccct ttgtgatctc ccgatccacc tttgccggac acgggagata cgccggtcac 1680
tggactggtg acgtgtggag ctcatgggaa caactggcct cctccgtgcc ggaaatctta 1740tggactggtg acgtgtggag ctcatgggaa caactggcct cctccgtgcc ggaaatctta 1740
cagttcaacc ttctgggtgt ccctcttgtc ggagcagacg tgtgtgggtt tcttggtaac 1800cagttcaacc ttctgggtgt ccctcttgtc ggagcagacg tgtgtgggtt tcttggtaac 1800
acctccgagg aactgtgtgt gcgctggact caactgggtg cattctaccc attcatgaga 1860acctccgagg aactgtgtgt gcgctggact caactgggtg cattctaccc attcatgaga 1860
aaccacaact ccttgctgtc cctgccacaa gagccctact cgttcagcga gcctgcacaa 1920aaccacaact ccttgctgtc cctgccacaa gagccctact cgttcagcga gcctgcacaa 1920
caggctatgc ggaaggcact gaccctgaga tacgccctgc ttccacactt atacactctc 1980caggctatgc ggaaggcact gaccctgaga tacgccctgc ttccacactt atacactctc 1980
ttccatcaag cgcatgtggc aggagaaacc gttgcaaggc ctcttttcct tgaattcccc 2040ttccatcaag cgcatgtggc aggagaaacc gttgcaaggc ctcttttcct tgaattcccc 2040
aaggattcct cgacttggac ggtggatcat cagctgctgt ggggagaagc tctgctgatt 2100aaggattcct cgacttggac ggtggatcat cagctgctgt ggggagaagc tctgctgatt 2100
actccagtgt tgcaagccgg aaaagctgag gtgaccggat actttccgct gggaacctgg 2160actccagtgt tgcaagccgg aaaagctgag gtgaccggat actttccgct gggaacctgg 2160
tacgacctcc agactgtccc tgttgaagcc cttggatcac tgcctccgcc tccggcagct 2220tacgacctcc agactgtccc tgttgaagcc cttggatcac tgcctccgcc tccggcagct 2220
ccacgcgaac cagctataca ttccgaggga cagtgggtta cattaccagc tcctctggac 2280ccacgcgaac cagctataca ttccgaggga cagtgggtta cattaccagc tcctctggac 2280
acaatcaacg tccacttaag agctggctac attatccctc tgcaaggacc aggactgact 2340acaatcaacg tccacttaag agctggctac attatccctc tgcaaggacc aggactgact 2340
acgaccgaga gcagacagca gccaatggca ctggctgtgg ctctgaccaa gggaggggaa 2400acgaccgaga gcagacagca gccaatggca ctggctgtgg ctctgaccaa gggaggggaa 2400
gctagaggag aactcttctg ggatgatggg gagtcccttg aagtgctgga aagaggcgct 2460gctagaggag aactcttctg ggatgatggg gagtcccttg aagtgctgga aagaggcgct 2460
tacactcaag tcattttcct tgcacggaac aacaccattg tgaacgaatt ggtgcgagtg 25202520
accagcgaag gagctggact tcaactgcag aaggtcactg tgctcggagt ggctaccgct 2580accagcgaag gagctggact tcaactgcag aaggtcactg tgctcggagt ggctaccgct 2580
cctcagcaag tgctgtcgaa tggagtcccc gtgtcaaact ttacctactc ccctgacact 2640ccctcagcaag tgctgtcgaa tggagtcccc gtgtcaaact ttacctactc ccctgacact 2640
aaggtgctcg acatttgcgt gtccctcctg atgggagagc agttccttgt gtcctggtgt 2700aaggtgctcg acatttgcgt gtccctcctg atgggagagc agttccttgt gtcctggtgt 2700
tga 2703tga 2703
<210> 45<210> 45
<211> 2691<211> 2691
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> sp7+hGAAwt-дельта-47<223> sp7+hGAAwt-delta-47
<400> 45<400> 45
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggcccgcga 60atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggcccgcga 60
gcagtgccca cacagtgcga cgtccccccc aacagccgct tcgattgcgc ccctgacaag 120gcagtgccca cacagtgcga cgtccccccc aacagccgct tcgattgcgc ccctgacaag 120
gccatcaccc aggaacagtg cgaggcccgc ggctgttgct acatccctgc aaagcagggg 180gccatcaccc aggaacagtg cgaggcccgc ggctgttgct acatccctgc aaagcagggg 180
ctgcagggag cccagatggg gcagccctgg tgcttcttcc cacccagcta ccccagctac 240ctgcagggag cccagatggg gcagccctgg tgcttcttcc cacccagcta ccccagctac 240
aagctggaga acctgagctc ctctgaaatg ggctacacgg ccaccctgac ccgtaccacc 300aagctggaga acctgagctc ctctgaaatg ggctacacgg ccaccctgac ccgtaccacc 300
cccaccttct tccccaagga catcctgacc ctgcggctgg acgtgatgat ggagactgag 360cccaccttct tccccaagga catcctgacc ctgcggctgg acgtgatgat ggagactgag 360
aaccgcctcc acttcacgat caaagatcca gctaacaggc gctacgaggt gcccttggag 420aaccgcctcc acttcacgat caaagatcca gctaacaggc gctacgaggt gcccttggag 420
accccgcatg tccacagccg ggcaccgtcc ccactctaca gcgtggagtt ctccgaggag 480accccgcatg tccacagccg ggcaccgtcc ccactctaca gcgtggagtt ctccgaggag 480
cccttcgggg tgatcgtgcg ccggcagctg gacggccgcg tgctgctgaa cacgacggtg 540cccttcgggg tgatcgtgcg ccggcagctg gacggccgcg tgctgctgaa cacgacggtg 540
gcgcccctgt tctttgcgga ccagttcctt cagctgtcca cctcgctgcc ctcgcagtat 600gcgcccctgt tctttgcgga ccagttcctt cagctgtcca cctcgctgcc ctcgcagtat 600
atcacaggcc tcgccgagca cctcagtccc ctgatgctca gcaccagctg gaccaggatc 660atcacaggcc tcgccgagca cctcagtccc ctgatgctca gcaccagctg gaccaggatc 660
accctgtgga accgggacct tgcgcccacg cccggtgcga acctctacgg gtctcaccct 720accctgtgga accgggacct tgcgccccg cccggtgcga acctctacgg gtctcaccct 720
ttctacctgg cgctggagga cggcgggtcg gcacacgggg tgttcctgct aaacagcaat 780ttctacctgg cgctggagga cggcgggtcg gcacacgggg tgttcctgct aaacagcaat 780
gccatggatg tggtcctgca gccgagccct gcccttagct ggaggtcgac aggtgggatc 840gccatggatg tggtcctgca gccgagccct gcccttagct ggaggtcgac aggtgggatc 840
ctggatgtct acatcttcct gggcccagag cccaagagcg tggtgcagca gtacctggac 900ctggatgtct acatcttcct gggccgag cccaagagcg tggtgcagca gtacctggac 900
gttgtgggat acccgttcat gccgccatac tggggcctgg gcttccacct gtgccgctgg 960gttgtgggat acccgttcat gccgccatac tggggcctgg gcttccacct gtgccgctgg 960
ggctactcct ccaccgctat cacccgccag gtggtggaga acatgaccag ggcccacttc 1020ggctactcct ccaccgctat cacccgccag gtggtggaga acatgaccag ggcccacttc 1020
cccctggacg tccagtggaa cgacctggac tacatggact cccggaggga cttcacgttc 1080cccctggacg tccagtggaa cgacctggac tacatggact cccggaggga cttcacgttc 1080
aacaaggatg gcttccggga cttcccggcc atggtgcagg agctgcacca gggcggccgg 1140aacaaggatg gcttccggga cttcccggcc atggtgcagg agctgcacca gggcggccgg 1140
cgctacatga tgatcgtgga tcctgccatc agcagctcgg gccctgccgg gagctacagg 1200cgctacatga tgatcgtgga tcctgccatc agcagctcgg gccctgccgg gagctacagg 1200
ccctacgacg agggtctgcg gaggggggtt ttcatcacca acgagaccgg ccagccgctg 1260ccctacgacg agggtctgcg gaggggggtt ttcatcacca acgagaccgg ccagccgctg 1260
attgggaagg tatggcccgg gtccactgcc ttccccgact tcaccaaccc cacagccctg 1320attgggaagg tatggcccgg gtccactgcc ttccccgact tcaccaaccc cacagccctg 1320
gcctggtggg aggacatggt ggctgagttc catgaccagg tgcccttcga cggcatgtgg 1380gcctggtggg aggacatggt ggctgagttc catgaccagg tgcccttcga cggcatgtgg 1380
attgacatga acgagccttc caacttcatc aggggctctg aggacggctg ccccaacaat 1440attgacatga acgagccttc caacttcatc aggggctctg aggacggctg ccccaacaat 1440
gagctggaga acccacccta cgtgcctggg gtggttgggg ggaccctcca ggcggccacc 1500gagctggaga acccacccta cgtgcctggg gtggttgggg ggaccctcca ggcggccacc 1500
atctgtgcct ccagccacca gtttctctcc acacactaca acctgcacaa cctctacggc 1560atctgtgcct ccagccacca gtttctctcc acacactaca acctgcacaa cctctacggc 1560
ctgaccgaag ccatcgcctc ccacagggcg ctggtgaagg ctcgggggac acgcccattt 1620ctgaccgaag cccatcgcctc ccacaggggcg ctggtgaagg ctcgggggac acgcccattt 1620
gtgatctccc gctcgacctt tgctggccac ggccgatacg ccggccactg gacgggggac 1680gtgatctccc gctcgacctt tgctggccac ggccgatacg ccggccactg gacgggggac 1680
gtgtggagct cctgggagca gctcgcctcc tccgtgccag aaatcctgca gtttaacctg 1740gtgtggagct cctgggagca gctcgcctcc tccgtgccag aaatcctgca gtttaacctg 1740
ctgggggtgc ctctggtcgg ggccgacgtc tgcggcttcc tgggcaacac ctcagaggag 1800ctgggggtgc ctctggtcgg ggccgacgtc tgcggcttcc tgggcaacac ctcagaggag 1800
ctgtgtgtgc gctggaccca gctgggggcc ttctacccct tcatgcggaa ccacaacagc 1860ctgtgtgtgc gctggaccca gctgggggcc ttctacccct tcatgcggaa ccacaacagc 1860
ctgctcagtc tgccccagga gccgtacagc ttcagcgagc cggcccagca ggccatgagg 1920ctgctcagtc tgccccagga gccgtacagc ttcagcgagc cggcccagca ggccatgagg 1920
aaggccctca ccctgcgcta cgcactcctc ccccacctct acacactgtt ccaccaggcc 1980aaggccctca ccctgcgcta cgcactcctc ccccacctct acacactgtt ccaccaggcc 1980
cacgtcgcgg gggagaccgt ggcccggccc ctcttcctgg agttccccaa ggactctagc 2040cacgtcgcgg gggagaccgt ggcccggccc ctcttcctgg agttccccaa ggactctagc 2040
acctggactg tggaccacca gctcctgtgg ggggaggccc tgctcatcac cccagtgctc 2100acctggactg tggaccacca gctcctgtgg ggggaggccc tgctcatcac cccagtgctc 2100
caggccggga aggccgaagt gactggctac ttccccttgg gcacatggta cgacctgcag 2160caggccggga aggccgaagt gactggctac ttccccttgg gcacatggta cgacctgcag 2160
acggtgccag tagaggccct tggcagcctc ccacccccac ctgcagctcc ccgtgagcca 2220acggtgccag tagaggccct tggcagcctc ccacccccac ctgcagctcc ccgtgagcca 2220
gccatccaca gcgaggggca gtgggtgacg ctgccggccc ccctggacac catcaacgtc 2280gccatccaca gcgaggggca gtgggtgacg ctgccggccc ccctggacac catcaacgtc 2280
cacctccggg ctgggtacat catccccctg cagggccctg gcctcacaac cacagagtcc 2340cacctccggg ctgggtacat catccccctg cagggccctg gcctcacaac cacagagtcc 2340
cgccagcagc ccatggccct ggctgtggcc ctgaccaagg gtggggaggc ccgaggggag 2400cgccagcagc ccatggccct ggctgtggcc ctgaccaagg gtgggggaggc ccgaggggag 2400
ctgttctggg acgatggaga gagcctggaa gtgctggagc gaggggccta cacacaggtc 2460ctgttctggg acgatggaga gagcctggaa gtgctggagc gaggggccta cacacaggtc 2460
atcttcctgg ccaggaataa cacgatcgtg aatgagctgg tacgtgtgac cagtgaggga 2520atcttcctgg cgggaataa cacgatcgtg aatgagctgg tacgtgtgac cagtgaggga 2520
gctggcctgc agctgcagaa ggtgactgtc ctgggcgtgg ccacggcgcc ccagcaggtc 25802580
ctctccaacg gtgtccctgt ctccaacttc acctacagcc ccgacaccaa ggtcctggac 2640ctctccaacg gtgtccctgt ctccaacttc acctacagcc ccgacaccaa ggtcctggac 2640
atctgtgtct cgctgttgat gggagagcag tttctcgtca gctggtgtta g 2691atctgtgtct cgctgttgat gggagagcag tttctcgtca gctggtgtta g 2691
<210> 46<210> 46
<211> 2691<211> 2691
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> sp7+hGAAco1-дельта-47<223> sp7+hGAAco1-delta-47
<400> 46<400> 46
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccctaga 60atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggccctaga 60
gctgtgccta cccagtgtga cgtgcccccc aacagcagat tcgactgcgc ccctgacaag 120gctgtgccta cccagtgtga cgtgcccccc aacagcagat tcgactgcgc ccctgacaag 120
gccatcaccc aggaacagtg cgaggccaga ggctgctgct acatccctgc caagcaggga 180gccatcaccc aggaacagtg cgaggccaga ggctgctgct acatccctgc caagcaggga 180
ctgcagggcg ctcagatggg acagccctgg tgcttcttcc caccctccta ccccagctac 240ctgcagggcg ctcagatggg acagccctgg tgcttcttcc caccctccta ccccagctac 240
aagctggaaa acctgagcag cagcgagatg ggctacaccg ccaccctgac cagaaccacc 300aagctggaaa acctgagcag cagcgagatg ggctacaccg ccaccctgac cagaaccacc 300
cccacattct tcccaaagga catcctgacc ctgcggctgg acgtgatgat ggaaaccgag 360cccacattct tcccaaagga catcctgacc ctgcggctgg acgtgatgat ggaaaccgag 360
aaccggctgc acttcaccat caaggacccc gccaatcgga gatacgaggt gcccctggaa 420aaccggctgc acttcaccat caaggacccc gccaatcgga gatacgaggt gcccctggaa 420
accccccacg tgcactctag agcccccagc cctctgtaca gcgtggaatt cagcgaggaa 480accccccg tgcactctag agcccccagc cctctgtaca gcgtggaatt cagcgaggaa 480
cccttcggcg tgatcgtgcg gagacagctg gatggcagag tgctgctgaa caccaccgtg 540cccttcggcg tgatcgtgcg gagacagctg gatggcagag tgctgctgaa caccaccgtg 540
gcccctctgt tcttcgccga ccagttcctg cagctgagca ccagcctgcc cagccagtac 600gcccctctgt tcttcgccga ccagttcctg cagctgagca ccagcctgcc cagccagtac 600
atcacaggac tggccgagca cctgagcccc ctgatgctga gcacatcctg gacccggatc 660atcacaggac tggccgagca cctgagcccc ctgatgctga gcacatcctg gacccggatc 660
accctgtgga acagggatct ggcccctacc cctggcgcca atctgtacgg cagccaccct 720accctgtgga acagggatct ggcccctacc cctggcgcca atctgtacgg cagccaccct 720
ttctacctgg ccctggaaga tggcggatct gcccacggag tgtttctgct gaactccaac 780ttctacctgg ccctggaaga tggcggatct gcccacggag tgtttctgct gaactccaac 780
gccatggacg tggtgctgca gcctagccct gccctgtctt ggagaagcac aggcggcatc 840gccatggacg tggtgctgca gcctagccct gccctgtctt ggagaagcac aggcggcatc 840
ctggatgtgt acatctttct gggccccgag cccaagagcg tggtgcagca gtatctggat 900ctggatgtgt acatctttct gggccccgag cccaagagcg tggtgcagca gtatctggat 900
gtcgtgggct accccttcat gcccccttac tggggcctgg gattccacct gtgcagatgg 960gtcgtgggct accccttcat gcccccttac tggggcctgg gattccacct gtgcagatgg 960
ggctactcca gcaccgccat caccagacag gtggtggaaa acatgaccag agcccacttc 1020ggctactcca gcaccgccat caccagacag gtggtggaaa acatgaccag agcccacttc 1020
ccactggatg tgcagtggaa cgacctggac tacatggaca gcagacggga cttcaccttc 1080ccactggatg tgcagtggaa cgacctggac tacatggaca gcagacggga cttcaccttc 1080
aacaaggacg gcttccggga cttccccgcc atggtgcagg aactgcatca gggcggcaga 1140aacaaggacg gcttccggga cttccccgcc atggtgcagg aactgcatca gggcggcaga 1140
cggtacatga tgatcgtgga tcccgccatc agctcctctg gccctgccgg ctcttacaga 1200cggtacatga tgatcgtgga tcccgccatc agctcctctg gccctgccgg ctcttacaga 1200
ccctacgacg agggcctgcg gagaggcgtg ttcatcacca acgagacagg ccagcccctg 1260ccctacgacg agggcctgcg gagaggcgtg ttcatcacca acgagacagg ccagcccctg 1260
atcggcaaag tgtggcctgg cagcacagcc ttccccgact tcaccaatcc taccgccctg 1320atcggcaaag tgtggcctgg cagcacagcc ttccccgact tcaccaatcc taccgccctg 1320
gcttggtggg aggacatggt ggccgagttc cacgaccagg tgcccttcga cggcatgtgg 1380gcttggtggg aggacatggt ggccgagttc cacgaccagg tgcccttcga cggcatgtgg 1380
atcgacatga acgagcccag caacttcatc cggggcagcg aggatggctg ccccaacaac 1440atcgacatga acgagcccag caacttcatc cggggcagcg aggatggctg ccccaacaac 1440
gaactggaaa atccccctta cgtgcccggc gtcgtgggcg gaacactgca ggccgctaca 1500gaactggaaa atccccctta cgtgcccggc gtcgtgggcg gaacactgca ggccgctaca 1500
atctgtgcca gcagccacca gtttctgagc acccactaca acctgcacaa cctgtacggc 1560atctgtgcca gcagccacca gtttctgagc acccactaca acctgcacaa cctgtacggc 1560
ctgaccgagg ccattgccag ccaccgcgct ctcgtgaaag ccagaggcac acggcccttc 1620ctgaccgagg ccattgccag ccaccgcgct ctcgtgaaag ccagaggcac acggcccttc 1620
gtgatcagca gaagcacctt tgccggccac ggcagatacg ccggacattg gactggcgac 1680gtgatcagca gaagcacctt tgccggccac ggcagatacg ccggacattg gactggcgac 1680
gtgtggtcct cttgggagca gctggcctct agcgtgcccg agatcctgca gttcaatctg 1740gtgtggtcct cttgggagca gctggcctct agcgtgcccg agatcctgca gttcaatctg 1740
ctgggcgtgc cactcgtggg cgccgatgtg tgtggcttcc tgggcaacac ctccgaggaa 1800ctgggcgtgc cactcgtggg cgccgatgtg tgtggcttcc tgggcaacac ctccgaggaa 1800
ctgtgtgtgc ggtggacaca gctgggcgcc ttctaccctt tcatgagaaa ccacaacagc 1860ctgtgtgtgc ggtggacaca gctgggcgcc ttctaccctt tcatgagaaa ccacaacagc 1860
ctgctgagcc tgccccagga accctacagc tttagcgagc ctgcacagca ggccatgcgg 1920ctgctgagcc tgccccagga accctacagc tttagcgagc ctgcacagca ggccatgcgg 1920
aaggccctga cactgagata cgctctgctg ccccacctgt acaccctgtt tcaccaggcc 1980aaggccctga cactgagata cgctctgctg ccccacctgt acaccctgtt tcaccaggcc 1980
catgtggccg gcgagacagt ggccagacct ctgtttctgg aattccccaa ggacagcagc 2040catgtggccg gcgagacagt ggccagacct ctgtttctgg aattccccaa ggacagcagc 2040
acctggaccg tggaccatca gctgctgtgg ggagaggctc tgctgattac cccagtgctg 2100acctggaccg tggaccatca gctgctgtgg ggagaggctc tgctgattac cccagtgctg 2100
caggcaggca aggccgaagt gaccggctac tttcccctgg gcacttggta cgacctgcag 2160caggcaggca aggccgaagt gaccggctac tttcccctgg gcacttggta cgacctgcag 2160
accgtgcctg tggaagccct gggatctctg cctccacctc ctgccgctcc tagagagcct 2220accgtgcctg tggaagccct gggatctctg cctccacctc ctgccgctcc tagagagcct 2220
gccattcact ctgagggcca gtgggtcaca ctgcctgccc ccctggatac catcaacgtg 2280gccattcact ctgagggcca gtgggtcaca ctgcctgccc ccctggatac catcaacgtg 2280
cacctgaggg ccggctacat cataccactg cagggacctg gcctgaccac caccgagtct 2340cacctgaggg ccggctacat cataccactg cagggacctg gcctgaccac caccgagtct 2340
agacagcagc caatggccct ggccgtggcc ctgaccaaag gcggagaagc taggggcgag 2400agacagcagc caatggccct ggccgtggcc ctgaccaaag gcggagaagc taggggcgag 2400
ctgttctggg acgatggcga gagcctggaa gtgctggaaa gaggcgccta tacccaagtg 2460ctgttctggg acgatggcga gagcctggaa gtgctggaaa gaggcgccta tacccaagtg 2460
atcttcctgg cccggaacaa caccatcgtg aacgagctgg tgcgcgtgac ctctgaaggc 2520atcttcctgg ccgggaacaa caccatcgtg aacgagctgg tgcgcgtgac ctctgaaggc 2520
gctggactgc agctgcagaa agtgaccgtg ctgggagtgg ccacagcccc tcagcaggtg 2580gctggactgc agctgcagaa agtgaccgtg ctgggagtgg ccacagcccc tcagcaggtg 2580
ctgtctaatg gcgtgcccgt gtccaacttc acctacagcc ccgacaccaa ggtgctggac 2640ctgtctaatg gcgtgcccgt gtccaacttc acctacagcc ccgacaccaa ggtgctggac 2640
atctgcgtgt cactgctgat gggagagcag tttctggtgt cctggtgctg a 2691atctgcgtgt cactgctgat gggagagcag tttctggtgt cctggtgctg a 2691
<210> 47<210> 47
<211> 2691<211> 2691
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> sp7+hGAAco2-дельта-47<223> sp7+hGAAco2-delta-47
<400> 47<400> 47
atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt cggcccaaga 60atggcctttc tgtggctgct gagctgttgg gccctgctgg gcaccacctt
gctgtgccta cccaatgcga cgtgccaccc aactcccgat tcgactgcgc gccagataag 120gctgtgccta cccaatgcga cgtgccaccc aactcccgat
gctattaccc aagagcagtg tgaagccaga ggttgctgct acatcccagc gaagcaagga 180gctattaccc aagagcagtg tgaagccaga ggttgctgct acatcccagc gaagcaagga 180
ttgcaaggcg cccaaatggg acaaccttgg tgtttcttcc ccccttcgta cccatcatat 240ttgcaaggcg cccaaatggg acaaccttgg tgtttcttcc ccccttcgta cccatcatat 240
aaactcgaaa acctgtcctc ttcggaaatg ggttatactg ccaccctcac cagaactact 300aaactcgaaa acctgtcctc ttcggaaatg ggttatactg
cctactttct tcccgaaaga catcttgacc ttgaggctgg acgtgatgat ggagactgaa 360cctactttct tcccgaaaga catcttgacc ttgaggctgg acgtgatgat ggagactgaa 360
aaccggctgc atttcactat caaagatcct gccaatcggc gatacgaggt ccctctggaa 420aaccggctgc atttcactat caaagatcct gccaatcggc gatacgaggt ccctctggaa 420
acccctcacg tgcactcacg ggctccttct ccgctttact ccgtcgaatt ctctgaggaa 480acccctcacg tgcactcacg ggctccttct ccgctttact ccgtcgaatt ctctgaggaa 480
cccttcggag tgatcgttag acgccagctg gatggtagag tgctgttgaa cactactgtg 540cccttcggag tgatcgttag acgccagctg gatggtagag tgctgttgaa cactactgtg 540
gccccacttt tcttcgctga ccagtttctg caactgtcca cttccctgcc atcccagtac 600gccccacttt tcttcgctga ccagtttctg caactgtcca cttccctgcc atcccagtac 600
attactggac tcgccgaaca cctgtcgcca ctgatgctct cgacctcttg gactagaatc 660attactggac tcgccgaaca cctgtcgcca ctgatgctct cgacctcttg gactagaatc 660
actttgtgga acagagactt ggcccctact ccgggagcaa atctgtacgg aagccaccct 720actttgtgga acagagactt ggcccctact ccgggagcaa atctgtacgg aagccaccct 720
ttttacctgg cgctcgaaga tggcggatcc gctcacggag tgttcctgct gaatagcaac 780ttttacctgg cgctcgaaga tggcggatcc gctcacggag tgttcctgct gaatagcaac 780
gcaatggacg tggtgctgca accttcccct gcactcagtt ggagaagtac cgggggtatt 840gcaatggacg tggtgctgca accttcccct gcactcagtt ggagaagtac cgggggtatt 840
ctggacgtgt acatcttcct cggaccagaa cccaagagcg tggtgcagca atatctggac 900ctggacgtgt acatcttcct cggaccagaa cccaagagcg tggtgcagca atatctggac 900
gtggtcggat acccttttat gcctccttac tggggactgg gattccacct ttgccgttgg 960gtggtcggat acccttttat gcctccttac tggggactgg gattccacct ttgccgttgg 960
ggctactcat ccaccgccat taccagacag gtggtggaga atatgaccag agcccacttc 1020ggctactcat ccaccgccat taccagacag gtggtggaga atatgaccag agcccacttc 1020
cctctcgacg tgcagtggaa cgatctggac tatatggact cccggagaga tttcaccttc 1080cctctcgacg tgcagtggaa cgatctggac tatatggact cccggagaga tttcaccttc 1080
aacaaggacg ggttccgcga ttttcccgcg atggttcaag agctccacca gggtggtcga 11401140
agatatatga tgatcgtcga cccagccatt tcgagcagcg gacccgctgg atcttataga 1200agatatatga tgatcgtcga cccagccatt tcgagcagcg gacccgctgg atcttataga 1200
ccttacgacg aaggccttag gagaggagtg ttcatcacaa acgagactgg acagcctttg 1260ccttacgacg aaggccttag gagaggagtg ttcatcacaa acgagactgg acagcctttg 1260
atcggtaaag tgtggcctgg atcaaccgcc tttcctgact ttaccaatcc cactgccttg 1320atcggtaaag tgtggcctgg atcaaccgcc tttcctgact ttaccaatcc cactgccttg 1320
gcttggtggg aggacatggt ggccgaattc cacgaccaag tcccctttga tggaatgtgg 13801380
atcgatatga acgaaccaag caattttatc agaggttccg aagacggttg ccccaacaac 1440atcgatatga acgaaccaag caattttatc agaggttccg aagacggttg ccccaacaac 1440
gaactggaaa accctcctta tgtgcccgga gtcgtgggcg gaacattaca ggccgcgact 1500gaactggaaa accctcctta tgtgccggga gtcgtgggcg gaacattaca ggccgcgact 1500
atttgcgcca gcagccacca attcctgtcc actcactaca acctccacaa cctttatgga 1560atttgcgcca gcagccacca attcctgtcc actcactaca acctccacaa cctttatgga 1560
ttaaccgaag ctattgcaag tcacagggct ctggtgaagg ctagagggac taggcccttt 1620ttaaccgaag ctattgcaag tcacaggggct ctggtgaagg ctagagggac taggcccttt 1620
gtgatctccc gatccacctt tgccggacac gggagatacg ccggtcactg gactggtgac 1680gtgatctccc gatccacctt tgccggacac gggagatacg ccggtcactg gactggtgac 1680
gtgtggagct catgggaaca actggcctcc tccgtgccgg aaatcttaca gttcaacctt 1740gtgtggagct catgggaaca actggcctcc tccgtgccgg aaatcttaca gttcaacctt 1740
ctgggtgtcc ctcttgtcgg agcagacgtg tgtgggtttc ttggtaacac ctccgaggaa 1800ctgggtgtcc ctcttgtcgg agcagacgtg tgtgggtttc ttggtaacac ctccgaggaa 1800
ctgtgtgtgc gctggactca actgggtgca ttctacccat tcatgagaaa ccacaactcc 1860ctgtgtgtgc gctggactca actgggtgca ttctacccat tcatgagaaa ccacaactcc 1860
ttgctgtccc tgccacaaga gccctactcg ttcagcgagc ctgcacaaca ggctatgcgg 1920ttgctgtccc tgccacaaga gccctactcg ttcagcgagc ctgcacaaca ggctatgcgg 1920
aaggcactga ccctgagata cgccctgctt ccacacttat acactctctt ccatcaagcg 1980aaggcactga ccctgagata cgccctgctt ccacacttat acactctctt ccatcaagcg 1980
catgtggcag gagaaaccgt tgcaaggcct cttttccttg aattccccaa ggattcctcg 2040catgtggcag gagaaaccgt tgcaaggcct cttttccttg aattccccaa ggattcctcg 2040
acttggacgg tggatcatca gctgctgtgg ggagaagctc tgctgattac tccagtgttg 2100acttggacgg tggatcatca gctgctgtgg ggagaagctc tgctgattac tccagtgttg 2100
caagccggaa aagctgaggt gaccggatac tttccgctgg gaacctggta cgacctccag 2160caagccggaa aagctgaggt gaccggatac tttccgctgg gaacctggta cgacctccag 2160
actgtccctg ttgaagccct tggatcactg cctccgcctc cggcagctcc acgcgaacca 2220actgtccctg ttgaagccct tggatcactg cctccgcctc cggcagctcc acgcgaacca 2220
gctatacatt ccgagggaca gtgggttaca ttaccagctc ctctggacac aatcaacgtc 2280gctatacatt ccgagggaca gtgggttaca ttaccagctc ctctggacac aatcaacgtc 2280
cacttaagag ctggctacat tatccctctg caaggaccag gactgactac gaccgagagc 2340cacttaagag ctggctacat tatccctctg caaggaccag gactgactac gaccgagagc 2340
agacagcagc caatggcact ggctgtggct ctgaccaagg gaggggaagc tagaggagaa 2400agacagcagc caatggcact ggctgtggct ctgaccaagg gaggggaagc tagaggagaa 2400
ctcttctggg atgatgggga gtcccttgaa gtgctggaaa gaggcgctta cactcaagtc 2460ctcttctggg atgatgggga gtcccttgaa gtgctggaaa gaggcgctta cactcaagtc 2460
attttccttg cacggaacaa caccattgtg aacgaattgg tgcgagtgac cagcgaagga 2520attttccttg cacggaacaa caccattgtg aacgaattgg tgcgagtgac cagcgaagga 2520
gctggacttc aactgcagaa ggtcactgtg ctcggagtgg ctaccgctcc tcagcaagtg 2580gctggacttc aactgcagaa ggtcactgtg ctcggagtgg ctaccgctcc tcagcaagtg 2580
ctgtcgaatg gagtccccgt gtcaaacttt acctactccc ctgacactaa ggtgctcgac 2640ctgtcgaatg gagtccccgt gtcaaacttt acctactccc ctgacactaa ggtgctcgac 2640
atttgcgtgt ccctcctgat gggagagcag ttccttgtgt cctggtgttg a 2691atttgcgtgt ccctcctgat gggagagcag ttccttgtgt cctggtgttg a 2691
<210> 48<210> 48
<211> 2652<211> 2652
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> hGAAco1-дельта-42<223> hGAAco1-delta-42
<400> 48<400> 48
gcccaccccg gcagacctag agctgtgcct acccagtgtg acgtgccccc caacagcaga 60gcccaccccg gcagacctag agctgtgcct acccagtgtg acgtgccccc caacagcaga 60
ttcgactgcg cccctgacaa ggccatcacc caggaacagt gcgaggccag aggctgctgc 120ttcgactgcg cccctgacaa ggccatcacc caggaacagt gcgaggccag aggctgctgc 120
tacatccctg ccaagcaggg actgcagggc gctcagatgg gacagccctg gtgcttcttc 180tacatccctg ccaagcaggg actgcaggggc gctcagatgg gacagccctg gtgcttcttc 180
ccaccctcct accccagcta caagctggaa aacctgagca gcagcgagat gggctacacc 240ccaccctcct accccagcta caagctggaa aacctgagca gcagcgagat gggctacacc 240
gccaccctga ccagaaccac ccccacattc ttcccaaagg acatcctgac cctgcggctg 300gccaccctga ccagaaccac ccccacattc ttcccaaagg acatcctgac cctgcggctg 300
gacgtgatga tggaaaccga gaaccggctg cacttcacca tcaaggaccc cgccaatcgg 360gacgtgatga tggaaaccga gaaccggctg cacttcacca tcaaggaccc cgccaatcgg 360
agatacgagg tgcccctgga aaccccccac gtgcactcta gagcccccag ccctctgtac 420agatacgagg tgcccctgga aaccccccac gtgcactcta gagcccccag ccctctgtac 420
agcgtggaat tcagcgagga acccttcggc gtgatcgtgc ggagacagct ggatggcaga 480agcgtggaat tcagcgagga acccttcggc gtgatcgtgc ggagacagct ggatggcaga 480
gtgctgctga acaccaccgt ggcccctctg ttcttcgccg accagttcct gcagctgagc 540gtgctgctga acaccaccgt ggcccctctg ttcttcgccg accagttcct gcagctgagc 540
accagcctgc ccagccagta catcacagga ctggccgagc acctgagccc cctgatgctg 600accagcctgc ccagccagta catcacagga ctggccgagc acctgagccc cctgatgctg 600
agcacatcct ggacccggat caccctgtgg aacagggatc tggcccctac ccctggcgcc 660agcacatcct ggacccggat caccctgtgg aacagggatc tggcccctac ccctggcgcc 660
aatctgtacg gcagccaccc tttctacctg gccctggaag atggcggatc tgcccacgga 720aatctgtacg gcagccaccc tttctacctg gccctggaag atggcggatc tgccccggga 720
gtgtttctgc tgaactccaa cgccatggac gtggtgctgc agcctagccc tgccctgtct 780gtgtttctgc tgaactccaa cgccatggac gtggtgctgc agcctagccc tgccctgtct 780
tggagaagca caggcggcat cctggatgtg tacatctttc tgggccccga gcccaagagc 840tggagaagca caggcggcat cctggatgtg tacatctttc tgggccccga gcccaagagc 840
gtggtgcagc agtatctgga tgtcgtgggc taccccttca tgccccctta ctggggcctg 900gtggtgcagc agtatctgga tgtcgtgggc taccccttca tgccccctta ctggggcctg 900
ggattccacc tgtgcagatg gggctactcc agcaccgcca tcaccagaca ggtggtggaa 960ggattccacc tgtgcagatg gggctactcc agcaccgcca tcaccagaca ggtggtggaa 960
aacatgacca gagcccactt cccactggat gtgcagtgga acgacctgga ctacatggac 1020aacatgacca gagcccactt cccactggat gtgcagtgga acgacctgga ctacatggac 1020
agcagacggg acttcacctt caacaaggac ggcttccggg acttccccgc catggtgcag 1080agcagacggg acttcacctt caacaaggac ggcttccggg acttccccgc catggtgcag 1080
gaactgcatc agggcggcag acggtacatg atgatcgtgg atcccgccat cagctcctct 1140gaactgcatc agggcggcag acggtacatg atgatcgtgg atcccgccat cagctcctct 1140
ggccctgccg gctcttacag accctacgac gagggcctgc ggagaggcgt gttcatcacc 1200ggccctgccg gctcttacag accctacgac gagggcctgc ggagaggcgt gttcatcacc 1200
aacgagacag gccagcccct gatcggcaaa gtgtggcctg gcagcacagc cttccccgac 1260aacgagacag gccagcccct gatcggcaaa gtgtggcctg gcagcacagc cttccccgac 1260
ttcaccaatc ctaccgccct ggcttggtgg gaggacatgg tggccgagtt ccacgaccag 1320ttcaccaatc ctaccgccct ggcttggtgg gaggacatgg tggccgagtt ccacgaccag 1320
gtgcccttcg acggcatgtg gatcgacatg aacgagccca gcaacttcat ccggggcagc 1380gtgcccttcg acggcatgtg gatcgacatg aacgagccca gcaacttcat ccggggcagc 1380
gaggatggct gccccaacaa cgaactggaa aatccccctt acgtgcccgg cgtcgtgggc 1440gaggatggct gccccaacaa cgaactggaa aatccccctt acgtgcccgg cgtcgtggggc 1440
ggaacactgc aggccgctac aatctgtgcc agcagccacc agtttctgag cacccactac 1500ggaacactgc aggccgctac aatctgtgcc agcagccacc agtttctgag cacccactac 1500
aacctgcaca acctgtacgg cctgaccgag gccattgcca gccaccgcgc tctcgtgaaa 1560aacctgcaca acctgtacgg cctgaccgag gccattgcca gccaccgcgc tctcgtgaaa 1560
gccagaggca cacggccctt cgtgatcagc agaagcacct ttgccggcca cggcagatac 1620gccagaggca cacggccctt cgtgatcagc agaagcacct ttgccggcca cggcagatac 1620
gccggacatt ggactggcga cgtgtggtcc tcttgggagc agctggcctc tagcgtgccc 1680gccggacatt ggactggcga cgtgtggtcc tcttgggagc agctggcctc tagcgtgccc 1680
gagatcctgc agttcaatct gctgggcgtg ccactcgtgg gcgccgatgt gtgtggcttc 1740gagatcctgc agttcaatct gctgggcgtg ccactcgtgg gcgccgatgt gtgtggcttc 1740
ctgggcaaca cctccgagga actgtgtgtg cggtggacac agctgggcgc cttctaccct 1800ctgggcaaca cctccgagga actgtgtgtg cggtggacac agctgggcgc cttctaccct 1800
ttcatgagaa accacaacag cctgctgagc ctgccccagg aaccctacag ctttagcgag 1860ttcatgagaa accacaacag ctgctgagc ctgccccagg aaccctacag ctttagcgag 1860
cctgcacagc aggccatgcg gaaggccctg acactgagat acgctctgct gccccacctg 1920ccctgcacagc aggccatgcg gaaggccctg acactgagat acgctctgct gccccacctg 1920
tacaccctgt ttcaccaggc ccatgtggcc ggcgagacag tggccagacc tctgtttctg 1980tacaccctgt ttcaccaggc ccatgtggcc ggcgagacag tggccagacc tctgtttctg 1980
gaattcccca aggacagcag cacctggacc gtggaccatc agctgctgtg gggagaggct 2040gaattcccca aggacagcag cacctggacc gtggaccatc agctgctgtg gggagaggct 2040
ctgctgatta ccccagtgct gcaggcaggc aaggccgaag tgaccggcta ctttcccctg 2100ctgctgatta ccccagtgct gcaggcaggc aaggccgaag tgaccggcta ctttcccctg 2100
ggcacttggt acgacctgca gaccgtgcct gtggaagccc tgggatctct gcctccacct 2160ggcacttggt acgacctgca gaccgtgcct gtggaagccc tgggatctct gcctccacct 2160
cctgccgctc ctagagagcc tgccattcac tctgagggcc agtgggtcac actgcctgcc 2220cctgccgctc ctagagagcc tgccattcac tctgaggggcc agtgggtcac actgcctgcc 2220
cccctggata ccatcaacgt gcacctgagg gccggctaca tcataccact gcagggacct 2280cccctggata ccatcaacgt gcacctgagg gccggctaca tcataccact gcagggacct 2280
ggcctgacca ccaccgagtc tagacagcag ccaatggccc tggccgtggc cctgaccaaa 2340ggcctgacca ccaccgagtc tagacagcag ccaatggccc tggccgtggc cctgaccaaa 2340
ggcggagaag ctaggggcga gctgttctgg gacgatggcg agagcctgga agtgctggaa 2400ggcggagaag ctaggggcga gctgttctgg gacgatggcg agagcctgga agtgctggaa 2400
agaggcgcct atacccaagt gatcttcctg gcccggaaca acaccatcgt gaacgagctg 2460agaggcgcct atacccaagt gatcttcctg gccgggaaca acaccatcgt gaacgagctg 2460
gtgcgcgtga cctctgaagg cgctggactg cagctgcaga aagtgaccgt gctgggagtg 2520gtgcgcgtga cctctgaagg cgctggactg cagctgcaga aagtgaccgt gctgggagtg 2520
gccacagccc ctcagcaggt gctgtctaat ggcgtgcccg tgtccaactt cacctacagc 2580gccacagccc ctcagcaggt gctgtctaat ggcgtgcccg tgtccaactt cacctacagc 2580
cccgacacca aggtgctgga catctgcgtg tcactgctga tgggagagca gtttctggtg 2640cccgacacca aggtgctgga catctgcgtg tcactgctga tgggagagca gtttctggtg 2640
tcctggtgct ga 2652tcctggtgct ga 2652
<210> 49<210> 49
<211> 2652<211> 2652
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> hGAAco2-дельта-42<223> hGAAco2-delta-42
<400> 49<400> 49
gcccatcctg gtagaccaag agctgtgcct acccaatgcg acgtgccacc caactcccga 60gcccatcctg gtagaccaag agctgtgcct acccaatgcg acgtgccacc caactcccga 60
ttcgactgcg cgccagataa ggctattacc caagagcagt gtgaagccag aggttgctgc 120ttcgactgcg cgccagataa ggctattacc caagagcagt gtgaagccag aggttgctgc 120
tacatcccag cgaagcaagg attgcaaggc gcccaaatgg gacaaccttg gtgtttcttc 180tacatcccag cgaagcaagg attgcaaggc gcccaaatgg gacaaccttg gtgtttcttc 180
cccccttcgt acccatcata taaactcgaa aacctgtcct cttcggaaat gggttatact 240cccccttcgt acccatcata taaactcgaa aacctgtcct cttcggaaat gggttatact 240
gccaccctca ccagaactac tcctactttc ttcccgaaag acatcttgac cttgaggctg 300gccaccctca ccagaactac tcctactttc ttcccgaaag acatcttgac cttgaggctg 300
gacgtgatga tggagactga aaaccggctg catttcacta tcaaagatcc tgccaatcgg 360gacgtgatga tggagactga aaaccggctg catttcacta tcaaagatcc tgccaatcgg 360
cgatacgagg tccctctgga aacccctcac gtgcactcac gggctccttc tccgctttac 420cgatacgagg tccctctgga aacccctcac gtgcactcac gggctccttc tccgctttac 420
tccgtcgaat tctctgagga acccttcgga gtgatcgtta gacgccagct ggatggtaga 480tccgtcgaat tctctgagga acccttcgga gtgatcgtta gacgccagct ggatggtaga 480
gtgctgttga acactactgt ggccccactt ttcttcgctg accagtttct gcaactgtcc 540gtgctgttga accactactgt ggccccactt ttcttcgctg accagtttct gcaactgtcc 540
acttccctgc catcccagta cattactgga ctcgccgaac acctgtcgcc actgatgctc 600acttccctgc catcccagta cattactgga ctcgccgaac acctgtcgcc actgatgctc 600
tcgacctctt ggactagaat cactttgtgg aacagagact tggcccctac tccgggagca 660tcgacctctt ggactagaat cactttgtgg aacagagact tggcccctac tccgggagca 660
aatctgtacg gaagccaccc tttttacctg gcgctcgaag atggcggatc cgctcacgga 720aatctgtacg gaagccaccc tttttacctg gcgctcgaag atggcggatc cgctcacgga 720
gtgttcctgc tgaatagcaa cgcaatggac gtggtgctgc aaccttcccc tgcactcagt 780gtgttcctgc tgaatagcaa cgcaatggac gtggtgctgc aaccttcccc tgcactcagt 780
tggagaagta ccgggggtat tctggacgtg tacatcttcc tcggaccaga acccaagagc 840tggagaagta ccggggggtat tctggacgtg tacatcttcc tcggaccaga acccaagagc 840
gtggtgcagc aatatctgga cgtggtcgga taccctttta tgcctcctta ctggggactg 900gtggtgcagc aatatctgga cgtggtcgga taccctttta tgcctcctta ctggggactg 900
ggattccacc tttgccgttg gggctactca tccaccgcca ttaccagaca ggtggtggag 960ggattccacc tttgccgttg gggctactca tccaccgcca ttaccagaca ggtggtggag 960
aatatgacca gagcccactt ccctctcgac gtgcagtgga acgatctgga ctatatggac 1020aatatgacca gagcccactt ccctctcgac gtgcagtgga acgatctgga ctatatggac 1020
tcccggagag atttcacctt caacaaggac gggttccgcg attttcccgc gatggttcaa 1080tcccggagag atttcacctt caacaaggac gggttccgcg attttcccgc gatggttcaa 1080
gagctccacc agggtggtcg aagatatatg atgatcgtcg acccagccat ttcgagcagc 1140gagctccacc agggtggtcg aagatatatg atgatcgtcg acccagccat ttcgagcagc 1140
ggacccgctg gatcttatag accttacgac gaaggcctta ggagaggagt gttcatcaca 1200ggacccgctg gatcttatag accttacgac gaaggcctta ggagaggagt gttcatcaca 1200
aacgagactg gacagccttt gatcggtaaa gtgtggcctg gatcaaccgc ctttcctgac 1260aacgagactg gacagccttt gatcggtaaa gtgtggcctg gatcaaccgc ctttcctgac 1260
tttaccaatc ccactgcctt ggcttggtgg gaggacatgg tggccgaatt ccacgaccaa 1320tttaccaatc ccactgcctt ggcttggtgg gaggacatgg tggccgaatt ccacgaccaa 1320
gtcccctttg atggaatgtg gatcgatatg aacgaaccaa gcaattttat cagaggttcc 1380gtcccctttg atggaatgtg gatcgatatg aacgaaccaa gcaattttat cagaggttcc 1380
gaagacggtt gccccaacaa cgaactggaa aaccctcctt atgtgcccgg agtcgtgggc 1440gaagacggtt gccccaacaa cgaactggaa aaccctcctt atgtgcccgg agtcgtggggc 1440
ggaacattac aggccgcgac tatttgcgcc agcagccacc aattcctgtc cactcactac 1500ggaacattac aggccgcgac tatttgcgcc agcagccacc aattcctgtc cactcactac 1500
aacctccaca acctttatgg attaaccgaa gctattgcaa gtcacagggc tctggtgaag 1560aacctccaca acctttatgg attaaccgaa gctattgcaa gtcacagggc tctggtgaag 1560
gctagaggga ctaggccctt tgtgatctcc cgatccacct ttgccggaca cgggagatac 1620gctagaggga ctaggccctt tgtgatctcc cgatccacct ttgccggaca cgggagatac 1620
gccggtcact ggactggtga cgtgtggagc tcatgggaac aactggcctc ctccgtgccg 1680gccggtcact ggactggtga cgtgtggagc tcatgggaac aactggcctc ctccgtgccg 1680
gaaatcttac agttcaacct tctgggtgtc cctcttgtcg gagcagacgt gtgtgggttt 1740gaaatcttac agttcaacct tctgggtgtc cctcttgtcg gagcagacgt gtgtgggttt 1740
cttggtaaca cctccgagga actgtgtgtg cgctggactc aactgggtgc attctaccca 1800cttggtaaca cctccgagga actgtgtgtg cgctggactc aactgggtgc attctaccca 1800
ttcatgagaa accacaactc cttgctgtcc ctgccacaag agccctactc gttcagcgag 1860ttcatgagaa accacaactc cttgctgtcc ctgccacaag agccctactc gttcagcgag 1860
cctgcacaac aggctatgcg gaaggcactg accctgagat acgccctgct tccacactta 1920cctgcacaac aggctatgcg gaaggcactg accctgagat acgccctgct tccacactta 1920
tacactctct tccatcaagc gcatgtggca ggagaaaccg ttgcaaggcc tcttttcctt 1980tacactctct tccatcaagc gcatgtggca ggagaaaccg ttgcaaggcc tcttttcctt 1980
gaattcccca aggattcctc gacttggacg gtggatcatc agctgctgtg gggagaagct 2040gaattcccca aggattcctc gacttggacg gtggatcatc agctgctgtg gggagaagct 2040
ctgctgatta ctccagtgtt gcaagccgga aaagctgagg tgaccggata ctttccgctg 2100ctgctgatta ctccagtgtt gcaagccgga aaagctgagg tgaccggata ctttccgctg 2100
ggaacctggt acgacctcca gactgtccct gttgaagccc ttggatcact gcctccgcct 2160ggaacctggt acgacctcca gactgtccct gttgaagccc ttggatcact gcctccgcct 2160
ccggcagctc cacgcgaacc agctatacat tccgagggac agtgggttac attaccagct 2220ccggcagctc cacgcgaacc agctatacat tccgagggac agtgggttac attaccagct 2220
cctctggaca caatcaacgt ccacttaaga gctggctaca ttatccctct gcaaggacca 2280cctctggaca caatcaacgt ccacttaaga gctggctaca ttatccctct gcaaggacca 2280
ggactgacta cgaccgagag cagacagcag ccaatggcac tggctgtggc tctgaccaag 2340ggactgacta cgaccgagag cagacagcag ccaatggcac tggctgtggc tctgaccaag 2340
ggaggggaag ctagaggaga actcttctgg gatgatgggg agtcccttga agtgctggaa 2400ggaggggaag ctagaggaga actcttctgg gatgatgggg agtcccttga agtgctggaa 2400
agaggcgctt acactcaagt cattttcctt gcacggaaca acaccattgt gaacgaattg 2460agaggcgctt acactcaagt cattttcctt gcacggaaca acaccattgt gaacgaattg 2460
gtgcgagtga ccagcgaagg agctggactt caactgcaga aggtcactgt gctcggagtg 2520gtgcgagtga ccagcgaagg agctggactt caactgcaga aggtcactgt gctcggagtg 2520
gctaccgctc ctcagcaagt gctgtcgaat ggagtccccg tgtcaaactt tacctactcc 2580gctaccgctc ctcagcaagt gctgtcgaat ggagtccccg tgtcaaactt tacctactcc 2580
cctgacacta aggtgctcga catttgcgtg tccctcctga tgggagagca gttccttgtg 2640cctgacacta aggtgctcga catttgcgtg tccctcctga tgggagagca gttccttgtg 2640
tcctggtgtt ga 2652tcctggtgtt ga 2652
<210> 50<210> 50
<211> 2649<211> 2649
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> hGAAco1-дельта-43<223> hGAAco1-delta-43
<400> 50<400> 50
caccccggca gacctagagc tgtgcctacc cagtgtgacg tgccccccaa cagcagattc 60caccccggca gacctagagc tgtgcctacc cagtgtgacg tgccccccaa cagcagattc 60
gactgcgccc ctgacaaggc catcacccag gaacagtgcg aggccagagg ctgctgctac 120gactgcgccc ctgacaaggc catcacccag gaacagtgcg aggccagagg ctgctgctac 120
atccctgcca agcagggact gcagggcgct cagatgggac agccctggtg cttcttccca 180atccctgcca agcagggact gcagggcgct cagatgggac agccctggtg cttcttccca 180
ccctcctacc ccagctacaa gctggaaaac ctgagcagca gcgagatggg ctacaccgcc 240ccctcctacc ccagctacaa gctggaaaac ctgagcagca gcgagatgggg ctacaccgcc 240
accctgacca gaaccacccc cacattcttc ccaaaggaca tcctgaccct gcggctggac 300accctgacca gaaccacccc cacattcttc ccaaaggaca tcctgaccct gcggctggac 300
gtgatgatgg aaaccgagaa ccggctgcac ttcaccatca aggaccccgc caatcggaga 360gtgatgatgg aaaccgagaa ccggctgcac ttcaccatca aggaccccgc caatcggaga 360
tacgaggtgc ccctggaaac cccccacgtg cactctagag cccccagccc tctgtacagc 420tacgaggtgc ccctggaaac cccccacgtg cactctagag cccccagccc tctgtacagc 420
gtggaattca gcgaggaacc cttcggcgtg atcgtgcgga gacagctgga tggcagagtg 480gtggaattca gcgaggaacc cttcggcgtg atcgtgcgga gacagctgga tggcagagtg 480
ctgctgaaca ccaccgtggc ccctctgttc ttcgccgacc agttcctgca gctgagcacc 540ctgctgaaca ccaccgtggc ccctctgttc ttcgccgacc agttcctgca gctgagcacc 540
agcctgccca gccagtacat cacaggactg gccgagcacc tgagccccct gatgctgagc 600agcctgccca gccagtacat cacaggactg gccgagcacc tgagccccct gatgctgagc 600
acatcctgga cccggatcac cctgtggaac agggatctgg cccctacccc tggcgccaat 660acatcctgga cccggatcac cctgtggaac agggatctgg cccctacccc tggcgccaat 660
ctgtacggca gccacccttt ctacctggcc ctggaagatg gcggatctgc ccacggagtg 720ctgtacggca gccacccttt ctacctggcc ctggaagatg gcggatctgc ccacggagtg 720
tttctgctga actccaacgc catggacgtg gtgctgcagc ctagccctgc cctgtcttgg 780tttctgctga actccaacgc catggacgtg gtgctgcagc ctagccctgc cctgtcttgg 780
agaagcacag gcggcatcct ggatgtgtac atctttctgg gccccgagcc caagagcgtg 840agaagcacag gcggcatcct ggatgtgtac atctttctgg gccccgagcc caagagcgtg 840
gtgcagcagt atctggatgt cgtgggctac cccttcatgc ccccttactg gggcctggga 900gtgcagcagt atctggatgt cgtgggctac cccttcatgc ccccttactg gggcctggga 900
ttccacctgt gcagatgggg ctactccagc accgccatca ccagacaggt ggtggaaaac 960ttccacctgt gcagatgggg ctactccagc accgccatca ccagacaggt ggtggaaaac 960
atgaccagag cccacttccc actggatgtg cagtggaacg acctggacta catggacagc 1020atgaccagag cccacttccc actggatgtg cagtggaacg acctggacta catggacagc 1020
agacgggact tcaccttcaa caaggacggc ttccgggact tccccgccat ggtgcaggaa 1080agacgggact tcaccttcaa caaggacggc ttccgggact tccccgccat ggtgcaggaa 1080
ctgcatcagg gcggcagacg gtacatgatg atcgtggatc ccgccatcag ctcctctggc 1140ctgcatcagg gcggcagacg gtacatgatg atcgtggatc ccgccatcag ctcctctggc 1140
cctgccggct cttacagacc ctacgacgag ggcctgcgga gaggcgtgtt catcaccaac 1200cctgccggct cttacagacc ctacgacgag ggcctgcgga gaggcgtgtt catcaccaac 1200
gagacaggcc agcccctgat cggcaaagtg tggcctggca gcacagcctt ccccgacttc 1260gagacaggcc agcccctgat cggcaaagtg tggcctggca gcacagcctt ccccgacttc 1260
accaatccta ccgccctggc ttggtgggag gacatggtgg ccgagttcca cgaccaggtg 1320accaatccta ccgccctggc ttggtgggag gacatggtgg ccgagttcca cgaccaggtg 1320
cccttcgacg gcatgtggat cgacatgaac gagcccagca acttcatccg gggcagcgag 1380cccttcgacg gcatgtggat cgacatgaac gagcccagca acttcatccg gggcagcgag 1380
gatggctgcc ccaacaacga actggaaaat cccccttacg tgcccggcgt cgtgggcgga 1440gatggctgcc ccaacaacga actggaaaat cccccttacg tgcccggcgt cgtgggcgga 1440
acactgcagg ccgctacaat ctgtgccagc agccaccagt ttctgagcac ccactacaac 1500acactgcagg ccgctacaat ctgtgccagc agccaccagt ttctgagcac ccactacaac 1500
ctgcacaacc tgtacggcct gaccgaggcc attgccagcc accgcgctct cgtgaaagcc 1560ctgcacaacc tgtacggcct gaccgaggcc attgccagcc accgcgctct cgtgaaagcc 1560
agaggcacac ggcccttcgt gatcagcaga agcacctttg ccggccacgg cagatacgcc 1620agaggcacac ggcccttcgt gatcagcaga agcacctttg ccggccacgg cagatacgcc 1620
ggacattgga ctggcgacgt gtggtcctct tgggagcagc tggcctctag cgtgcccgag 1680ggacattgga ctggcgacgt gtggtcctct tgggagcagc tggcctctag cgtgcccgag 1680
atcctgcagt tcaatctgct gggcgtgcca ctcgtgggcg ccgatgtgtg tggcttcctg 1740atcctgcagt tcaatctgct gggcgtgcca ctcgtgggcg ccgatgtgtg tggcttcctg 1740
ggcaacacct ccgaggaact gtgtgtgcgg tggacacagc tgggcgcctt ctaccctttc 1800ggcaacacct ccgaggaact gtgtgtgcgg tggacacagc tgggcgcctt ctaccctttc 1800
atgagaaacc acaacagcct gctgagcctg ccccaggaac cctacagctt tagcgagcct 1860atgagaaacc acaacagcct gctgagcctg ccccaggaac cctacagctt tagcgagcct 1860
gcacagcagg ccatgcggaa ggccctgaca ctgagatacg ctctgctgcc ccacctgtac 1920gcacagcagg ccatgcggaa ggccctgaca ctgagatacg ctctgctgcc ccacctgtac 1920
accctgtttc accaggccca tgtggccggc gagacagtgg ccagacctct gtttctggaa 1980accctgtttc accaggccca tgtggccggc gagacagtgg ccagacctct gtttctggaa 1980
ttccccaagg acagcagcac ctggaccgtg gaccatcagc tgctgtgggg agaggctctg 2040ttccccaagg acagcagcac ctggaccgtg gaccatcagc tgctgtgggg agaggctctg 2040
ctgattaccc cagtgctgca ggcaggcaag gccgaagtga ccggctactt tcccctgggc 2100ctgattaccc cagtgctgca ggcaggcaag gccgaagtga ccggctactt tcccctgggc 2100
acttggtacg acctgcagac cgtgcctgtg gaagccctgg gatctctgcc tccacctcct 2160acttggtacg acctgcagac cgtgcctgtg gaagccctgg gatctctgcc tccacctcct 2160
gccgctccta gagagcctgc cattcactct gagggccagt gggtcacact gcctgccccc 2220gccgctccta gagagcctgc cattcactct gagggccagt gggtcacact gcctgccccc 2220
ctggatacca tcaacgtgca cctgagggcc ggctacatca taccactgca gggacctggc 2280ctggatacca tcaacgtgca cctgagggcc ggctacatca taccactgca gggacctggc 2280
ctgaccacca ccgagtctag acagcagcca atggccctgg ccgtggccct gaccaaaggc 2340ctgaccacca ccgagtctag acagcagcca atggccctgg ccgtggccct gaccaaaggc 2340
ggagaagcta ggggcgagct gttctgggac gatggcgaga gcctggaagt gctggaaaga 2400ggagaagcta ggggcgagct gttctgggac gatggcgaga gcctggaagt gctggaaaga 2400
ggcgcctata cccaagtgat cttcctggcc cggaacaaca ccatcgtgaa cgagctggtg 2460ggcgcctata cccaagtgat cttcctggcc cggaacaaca ccatcgtgaa cgagctggtg 2460
cgcgtgacct ctgaaggcgc tggactgcag ctgcagaaag tgaccgtgct gggagtggcc 2520cgcgtgacct ctgaaggcgc tggactgcag ctgcagaaag tgaccgtgct gggagtggcc 2520
acagcccctc agcaggtgct gtctaatggc gtgcccgtgt ccaacttcac ctacagcccc 2580acagcccctc agcaggtgct gtctaatggc gtgcccgtgt ccaacttcac ctacagcccc 2580
gacaccaagg tgctggacat ctgcgtgtca ctgctgatgg gagagcagtt tctggtgtcc 2640gacaccaagg tgctggacat ctgcgtgtca ctgctgatgg gagagcagtt tctggtgtcc 2640
tggtgctga 2649tggtgctga 2649
<210> 51<210> 51
<211> 2649<211> 2649
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> hGAAco2-дельта-43<223> hGAAco2-delta-43
<400> 51<400> 51
catcctggta gaccaagagc tgtgcctacc caatgcgacg tgccacccaa ctcccgattc 60catcctggta gaccaagagc tgtgcctacc caatgcgacg tgccacccaa ctcccgattc 60
gactgcgcgc cagataaggc tattacccaa gagcagtgtg aagccagagg ttgctgctac 120gactgcgcgc cagataaggc tattacccaa gagcagtgtg aagccagagg ttgctgctac 120
atcccagcga agcaaggatt gcaaggcgcc caaatgggac aaccttggtg tttcttcccc 180atcccagcga agcaaggatt gcaaggcgcc caaatgggac aaccttggtg tttcttcccc 180
ccttcgtacc catcatataa actcgaaaac ctgtcctctt cggaaatggg ttatactgcc 240ccttcgtacc catcatataa actcgaaaac ctgtcctctt cggaaatgggg ttatactgcc 240
accctcacca gaactactcc tactttcttc ccgaaagaca tcttgacctt gaggctggac 300accctcacca gaactactcc tactttcttc ccgaaagaca tcttgacctt gaggctggac 300
gtgatgatgg agactgaaaa ccggctgcat ttcactatca aagatcctgc caatcggcga 360gtgatgatgg agactgaaaa ccggctgcat ttcactatca aagatcctgc caatcggcga 360
tacgaggtcc ctctggaaac ccctcacgtg cactcacggg ctccttctcc gctttactcc 420tacgaggtcc ctctggaaac ccctcacgtg cactcacggg ctccttctcc gctttactcc 420
gtcgaattct ctgaggaacc cttcggagtg atcgttagac gccagctgga tggtagagtg 480gtcgaattct ctgaggaacc cttcggagtg atcgttagac gccagctgga tggtagagtg 480
ctgttgaaca ctactgtggc cccacttttc ttcgctgacc agtttctgca actgtccact 540ctgttgaaca ctactgtggc cccacttttc ttcgctgacc agtttctgca actgtccact 540
tccctgccat cccagtacat tactggactc gccgaacacc tgtcgccact gatgctctcg 600tccctgccat cccagtacat tactggactc gccgaacacc tgtcgccact gatgctctcg 600
acctcttgga ctagaatcac tttgtggaac agagacttgg cccctactcc gggagcaaat 660acctcttgga ctagaatcac tttgtggaac agagacttgg cccctactcc gggagcaaat 660
ctgtacggaa gccacccttt ttacctggcg ctcgaagatg gcggatccgc tcacggagtg 720ctgtacggaa gccacccttt ttacctggcg ctcgaagatg gcggatccgc tcacggagtg 720
ttcctgctga atagcaacgc aatggacgtg gtgctgcaac cttcccctgc actcagttgg 780ttcctgctga atagcaacgc aatggacgtg gtgctgcaac cttcccctgc actcagttgg 780
agaagtaccg ggggtattct ggacgtgtac atcttcctcg gaccagaacc caagagcgtg 840agaagtaccg ggggtattct ggacgtgtac atcttcctcg gaccagaacc caagagcgtg 840
gtgcagcaat atctggacgt ggtcggatac ccttttatgc ctccttactg gggactggga 900gtgcagcaat atctggacgt ggtcggatac ccttttatgc ctccttactg gggactggga 900
ttccaccttt gccgttgggg ctactcatcc accgccatta ccagacaggt ggtggagaat 960ttccaccttt gccgttgggg ctactcatcc accgccatta ccagacaggt ggtggagaat 960
atgaccagag cccacttccc tctcgacgtg cagtggaacg atctggacta tatggactcc 1020atgaccagag cccacttccc tctcgacgtg cagtggaacg atctggacta tatggactcc 1020
cggagagatt tcaccttcaa caaggacggg ttccgcgatt ttcccgcgat ggttcaagag 10801080
ctccaccagg gtggtcgaag atatatgatg atcgtcgacc cagccatttc gagcagcgga 1140ctccaccagg gtggtcgaag atatatgatg atcgtcgacc cagccatttc gagcagcgga 1140
cccgctggat cttatagacc ttacgacgaa ggccttagga gaggagtgtt catcacaaac 1200cccgctggat cttatagacc ttacgacgaa ggccttagga gaggagtgtt catcacaaac 1200
gagactggac agcctttgat cggtaaagtg tggcctggat caaccgcctt tcctgacttt 1260gagactggac agcctttgat cggtaaagtg tggcctggat caaccgcctt tcctgacttt 1260
accaatccca ctgccttggc ttggtgggag gacatggtgg ccgaattcca cgaccaagtc 1320accaatccca ctgccttggc ttggtgggag gacatggtgg ccgaattcca cgaccaagtc 1320
ccctttgatg gaatgtggat cgatatgaac gaaccaagca attttatcag aggttccgaa 1380ccctttgatg gaatgtggat cgatatgaac gaaccaagca attttatcag aggttccgaa 1380
gacggttgcc ccaacaacga actggaaaac cctccttatg tgcccggagt cgtgggcgga 14401440
acattacagg ccgcgactat ttgcgccagc agccaccaat tcctgtccac tcactacaac 1500acattacagg ccgcgactat ttgcgccagc agccaccaat tcctgtccac tcactacaac 1500
ctccacaacc tttatggatt aaccgaagct attgcaagtc acagggctct ggtgaaggct 1560ctccacaacc tttatggatt aaccgaagct attgcaagtc acagggctct ggtgaaggct 1560
agagggacta ggccctttgt gatctcccga tccacctttg ccggacacgg gagatacgcc 1620agagggacta ggccctttgt gatctcccga tccacctttg ccggacacgg gagatacgcc 1620
ggtcactgga ctggtgacgt gtggagctca tgggaacaac tggcctcctc cgtgccggaa 1680ggtcactgga ctggtgacgt gtggagctca tgggaacaac tggcctcctc cgtgccggaa 1680
atcttacagt tcaaccttct gggtgtccct cttgtcggag cagacgtgtg tgggtttctt 1740atcttacagt tcaaccttct gggtgtccct cttgtcggag cagacgtgtg tgggtttctt 1740
ggtaacacct ccgaggaact gtgtgtgcgc tggactcaac tgggtgcatt ctacccattc 1800ggtaacacct ccgaggaact gtgtgtgcgc tggactcaac tgggtgcatt ctacccattc 1800
atgagaaacc acaactcctt gctgtccctg ccacaagagc cctactcgtt cagcgagcct 1860atgagaaacc acaactcctt gctgtccctg ccacaagagc cctactcgtt cagcgagcct 1860
gcacaacagg ctatgcggaa ggcactgacc ctgagatacg ccctgcttcc acacttatac 1920gcacaacagg ctatgcggaa ggcactgacc ctgagatacg ccctgcttcc acacttatac 1920
actctcttcc atcaagcgca tgtggcagga gaaaccgttg caaggcctct tttccttgaa 1980actctcttcc atcaagcgca tgtggcagga gaaaccgttg caaggcctct tttccttgaa 1980
ttccccaagg attcctcgac ttggacggtg gatcatcagc tgctgtgggg agaagctctg 2040ttccccaagg attcctcgac ttggacggtg gatcatcagc tgctgtgggg agaagctctg 2040
ctgattactc cagtgttgca agccggaaaa gctgaggtga ccggatactt tccgctggga 2100ctgattactc cagtgttgca agccggaaaa gctgaggtga ccggatactt tccgctggga 2100
acctggtacg acctccagac tgtccctgtt gaagcccttg gatcactgcc tccgcctccg 2160acctggtacg acctccagac tgtccctgtt gaagcccttg gatcactgcc tccgcctccg 2160
gcagctccac gcgaaccagc tatacattcc gagggacagt gggttacatt accagctcct 2220gcagctccac gcgaaccagc tatacattcc gagggacagt gggttacatt accagctcct 2220
ctggacacaa tcaacgtcca cttaagagct ggctacatta tccctctgca aggaccagga 2280ctggacacaa tcaacgtcca cttaaagct ggctacatta tccctctgca aggacgga 2280
ctgactacga ccgagagcag acagcagcca atggcactgg ctgtggctct gaccaaggga 2340ctgactacga ccgagagcag acagcagcca atggcactgg ctgtggctct gaccaaggga 2340
ggggaagcta gaggagaact cttctgggat gatggggagt cccttgaagt gctggaaaga 2400ggggaagcta gaggagaact cttctgggat gatggggagt cccttgaagt gctggaaaga 2400
ggcgcttaca ctcaagtcat tttccttgca cggaacaaca ccattgtgaa cgaattggtg 2460ggcgcttaca ctcaagtcat ttttccttgca cggaacaaca ccattgtgaa cgaattggtg 2460
cgagtgacca gcgaaggagc tggacttcaa ctgcagaagg tcactgtgct cggagtggct 2520cgagtgacca gcgaaggagc tggacttcaa ctgcagaagg tcactgtgct cggagtggct 2520
accgctcctc agcaagtgct gtcgaatgga gtccccgtgt caaactttac ctactcccct 2580accgctcctc agcaagtgct gtcgaatgga gtccccgtgt caaactttac ctactcccct 2580
gacactaagg tgctcgacat ttgcgtgtcc ctcctgatgg gagagcagtt ccttgtgtcc 2640gacactaagg tgctcgacat ttgcgtgtcc ctcctgatgg gagagcagtt ccttgtgtcc 2640
tggtgttga 2649tggtgttga 2649
<210> 52<210> 52
<211> 2637<211> 2637
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> hGAAco1-дельта-47<223> hGAAco1-delta-47
<400> 52<400> 52
cctagagctg tgcctaccca gtgtgacgtg ccccccaaca gcagattcga ctgcgcccct 60cctagagctg tgcctaccca gtgtgacgtg ccccccaaca gcagattcga ctgcgcccct 60
gacaaggcca tcacccagga acagtgcgag gccagaggct gctgctacat ccctgccaag 120gacaaggcca tcaccagga acagtgcgag gccagaggct gctgctacat ccctgccaag 120
cagggactgc agggcgctca gatgggacag ccctggtgct tcttcccacc ctcctacccc 180cagggactgc agggcgctca gatgggacag ccctggtgct tcttcccacc ctcctacccc 180
agctacaagc tggaaaacct gagcagcagc gagatgggct acaccgccac cctgaccaga 240agctacaagc tggaaaacct gagcagcagc gagatgggct acaccgccac cctgaccaga 240
accaccccca cattcttccc aaaggacatc ctgaccctgc ggctggacgt gatgatggaa 300accaccccca cattcttccc aaaggacatc ctgaccctgc ggctggacgt gatgatggaa 300
accgagaacc ggctgcactt caccatcaag gaccccgcca atcggagata cgaggtgccc 360accgagaacc ggctgcactt caccatcaag gaccccgcca atcggagata cgaggtgccc 360
ctggaaaccc cccacgtgca ctctagagcc cccagccctc tgtacagcgt ggaattcagc 420ctggaaaccc cccacgtgca ctctagagcc cccagccctc tgtacagcgt ggaattcagc 420
gaggaaccct tcggcgtgat cgtgcggaga cagctggatg gcagagtgct gctgaacacc 480gaggaaccct tcggcgtgat cgtgcggaga cagctggatg gcagagtgct gctgaacacc 480
accgtggccc ctctgttctt cgccgaccag ttcctgcagc tgagcaccag cctgcccagc 540accgtggccc ctctgttctt cgccgaccag ttcctgcagc tgagcaccag cctgcccagc 540
cagtacatca caggactggc cgagcacctg agccccctga tgctgagcac atcctggacc 600cagtacatca caggactggc cgagcacctg agccccctga tgctgagcac atcctggacc 600
cggatcaccc tgtggaacag ggatctggcc cctacccctg gcgccaatct gtacggcagc 660cggatcaccc tgtggaacag ggatctggcc cctacccctg gcgccaatct gtacggcagc 660
caccctttct acctggccct ggaagatggc ggatctgccc acggagtgtt tctgctgaac 720caccctttct acctggccct ggaagatggc ggatctgccc acggagtgtt tctgctgaac 720
tccaacgcca tggacgtggt gctgcagcct agccctgccc tgtcttggag aagcacaggc 780tccaacgcca tggacgtggt gctgcagcct agccctgccc tgtcttggag aagcacaggc 780
ggcatcctgg atgtgtacat ctttctgggc cccgagccca agagcgtggt gcagcagtat 840ggcatcctgg atgtgtacat ctttctgggc cccgagccca agagcgtggt gcagcagtat 840
ctggatgtcg tgggctaccc cttcatgccc ccttactggg gcctgggatt ccacctgtgc 900ctggatgtcg tgggctaccc cttcatgccc ccttactggg gcctgggatt ccacctgtgc 900
agatggggct actccagcac cgccatcacc agacaggtgg tggaaaacat gaccagagcc 960agatggggct actccagcac cgccatcacc agacaggtgg tggaaaacat gacgagcc 960
cacttcccac tggatgtgca gtggaacgac ctggactaca tggacagcag acgggacttc 1020cacttcccac tggatgtgca gtggaacgac ctggactaca tggacagcag acgggacttc 1020
accttcaaca aggacggctt ccgggacttc cccgccatgg tgcaggaact gcatcagggc 1080accttcaaca aggacggctt ccgggacttc cccgccatgg tgcaggaact gcatcagggc 1080
ggcagacggt acatgatgat cgtggatccc gccatcagct cctctggccc tgccggctct 1140ggcagacggt acatgatgat cgtggatccc gccatcagct cctctggccc tgccggctct 1140
tacagaccct acgacgaggg cctgcggaga ggcgtgttca tcaccaacga gacaggccag 1200tacagaccct acgacgagggg cctgcggaga ggcgtgttca tcaccaacga gacaggccag 1200
cccctgatcg gcaaagtgtg gcctggcagc acagccttcc ccgacttcac caatcctacc 1260cccctgatcg gcaaagtgtg gcctggcagc acagccttcc ccgacttcac caatcctacc 1260
gccctggctt ggtgggagga catggtggcc gagttccacg accaggtgcc cttcgacggc 1320gccctggctt ggtgggagga catggtggcc gagttccacg accaggtgcc cttcgacggc 1320
atgtggatcg acatgaacga gcccagcaac ttcatccggg gcagcgagga tggctgcccc 1380atgtggatcg acatgaacga gccagcaac ttcatccggg gcagcgagga tggctgcccc 1380
aacaacgaac tggaaaatcc cccttacgtg cccggcgtcg tgggcggaac actgcaggcc 1440aacaacgaac tggaaaatcc cccttacgtg cccggcgtcg tgggcggaac actgcaggcc 1440
gctacaatct gtgccagcag ccaccagttt ctgagcaccc actacaacct gcacaacctg 1500gctacaatct gtgccagcag ccaccagttt ctgagcaccc actacaacct gcacaacctg 1500
tacggcctga ccgaggccat tgccagccac cgcgctctcg tgaaagccag aggcacacgg 1560tacggcctga ccgaggccat tgccagccac cgcgctctcg tgaaagccag aggcacacgg 1560
cccttcgtga tcagcagaag cacctttgcc ggccacggca gatacgccgg acattggact 1620cccttcgtga tcagcagaag cacctttgcc ggccacggca gatacgccgg acattggact 1620
ggcgacgtgt ggtcctcttg ggagcagctg gcctctagcg tgcccgagat cctgcagttc 1680ggcgacgtgt ggtcctcttg ggagcagctg gcctctagcg tgcccgagat cctgcagttc 1680
aatctgctgg gcgtgccact cgtgggcgcc gatgtgtgtg gcttcctggg caacacctcc 1740aatctgctgg gcgtgccact cgtgggcgcc gatgtgtgtg gcttcctggg caacacctcc 1740
gaggaactgt gtgtgcggtg gacacagctg ggcgccttct accctttcat gagaaaccac 1800gaggaactgt gtgtgcggtg gacacagctg ggcgccttct accctttcat gagaaaccac 1800
aacagcctgc tgagcctgcc ccaggaaccc tacagcttta gcgagcctgc acagcaggcc 1860aacagcctgc tgagcctgcc cggaaccc tacagcttta gcgagcctgc acagcaggcc 1860
atgcggaagg ccctgacact gagatacgct ctgctgcccc acctgtacac cctgtttcac 1920atgcggaagg ccctgacact gagatacgct ctgctgcccc acctgtacac cctgtttcac 1920
caggcccatg tggccggcga gacagtggcc agacctctgt ttctggaatt ccccaaggac 1980caggcccatg tggccggcga gacagtggcc agacctctgt ttctggaatt ccccaaggac 1980
agcagcacct ggaccgtgga ccatcagctg ctgtggggag aggctctgct gattacccca 2040agcagcacct ggaccgtgga ccatcagctg ctgtggggag aggctctgct gattacccca 2040
gtgctgcagg caggcaaggc cgaagtgacc ggctactttc ccctgggcac ttggtacgac 2100gtgctgcagg caggcaaggc cgaagtgacc ggctactttc ccctgggcac ttggtacgac 2100
ctgcagaccg tgcctgtgga agccctggga tctctgcctc cacctcctgc cgctcctaga 2160ctgcagaccg tgcctgtgga agccctggga tctctgcctc cacctcctgc cgctcctaga 2160
gagcctgcca ttcactctga gggccagtgg gtcacactgc ctgcccccct ggataccatc 2220gagcctgcca ttcactctga gggccagtgg gtcacactgc ctgcccccct ggataccatc 2220
aacgtgcacc tgagggccgg ctacatcata ccactgcagg gacctggcct gaccaccacc 2280aacgtgcacc tgagggccgg ctacatcata ccactgcagg gacctggcct gaccaccacc 2280
gagtctagac agcagccaat ggccctggcc gtggccctga ccaaaggcgg agaagctagg 2340gagtctagac agcagccaat ggccctggcc gtggccctga ccaaaggcgg agaagctagg 2340
ggcgagctgt tctgggacga tggcgagagc ctggaagtgc tggaaagagg cgcctatacc 2400ggcgagctgt tctgggacga tggcgagagc ctggaagtgc tggaaagagg cgcctatacc 2400
caagtgatct tcctggcccg gaacaacacc atcgtgaacg agctggtgcg cgtgacctct 2460caagtgatct tcctggcccg gaacaacacc atcgtgaacg agctggtgcg cgtgacctct 2460
gaaggcgctg gactgcagct gcagaaagtg accgtgctgg gagtggccac agcccctcag 2520gaaggcgctg gactgcagct gcagaaagtg accgtgctgg gagtggccac agcccctcag 2520
caggtgctgt ctaatggcgt gcccgtgtcc aacttcacct acagccccga caccaaggtg 2580caggtgctgt ctaatggcgt gcccgtgtcc aacttcacct acagccccga caccaaggtg 2580
ctggacatct gcgtgtcact gctgatggga gagcagtttc tggtgtcctg gtgctga 2637ctggacatct gcgtgtcact gctgatggga gagcagtttc tggtgtcctg gtgctga 2637
<210> 53<210> 53
<211> 2637<211> 2637
<212> ДНК<212> DNA
<213> искусственная<213> artificial
<220><220>
<223> hGAAco2-дельта-47<223> hGAAco2-delta-47
<400> 53<400> 53
ccaagagctg tgcctaccca atgcgacgtg ccacccaact cccgattcga ctgcgcgcca 60ccaagagctg tgcctaccca atgcgacgtg ccacccaact cccgattcga ctgcgcgcca 60
gataaggcta ttacccaaga gcagtgtgaa gccagaggtt gctgctacat cccagcgaag 120gataaggcta ttacccaaga gcagtgtgaa gccagaggtt gctgctacat cccagcgaag 120
caaggattgc aaggcgccca aatgggacaa ccttggtgtt tcttcccccc ttcgtaccca 180caaggattgc aaggcgccca aatgggacaa ccttggtgtt tcttcccccc ttcgtaccca 180
tcatataaac tcgaaaacct gtcctcttcg gaaatgggtt atactgccac cctcaccaga 240tcatataaac tcgaaaacct gtcctcttcg gaaatgggtt atactgccac cctcaccaga 240
actactccta ctttcttccc gaaagacatc ttgaccttga ggctggacgt gatgatggag 300actactccta ctttcttccc gaaagacatc ttgaccttga ggctggacgt gatgatggag 300
actgaaaacc ggctgcattt cactatcaaa gatcctgcca atcggcgata cgaggtccct 360actgaaaacc ggctgcattt cactatcaaa gatcctgcca atcggcgata cgaggtccct 360
ctggaaaccc ctcacgtgca ctcacgggct ccttctccgc tttactccgt cgaattctct 420ctggaaaccc ctcacgtgca ctcacgggct ccttctccgc tttactccgt cgaattctct 420
gaggaaccct tcggagtgat cgttagacgc cagctggatg gtagagtgct gttgaacact 480gaggaaccct tcggagtgat cgttagacgc cagctggatg gtagagtgct gttgaacact 480
actgtggccc cacttttctt cgctgaccag tttctgcaac tgtccacttc cctgccatcc 540actgtggccc cacttttctt cgctgaccag tttctgcaac tgtccacttc cctgccatcc 540
cagtacatta ctggactcgc cgaacacctg tcgccactga tgctctcgac ctcttggact 600cagtacatta ctggactcgc cgaacacctg tcgccactga tgctctcgac ctcttggact 600
agaatcactt tgtggaacag agacttggcc cctactccgg gagcaaatct gtacggaagc 660agaatcactt tgtggaacag agacttggcc cctactccgg gagcaaatct gtacggaagc 660
cacccttttt acctggcgct cgaagatggc ggatccgctc acggagtgtt cctgctgaat 720cacccttttt acctggcgct cgaagatggc ggatccgctc acggagtgtt cctgctgaat 720
agcaacgcaa tggacgtggt gctgcaacct tcccctgcac tcagttggag aagtaccggg 780agcaacgcaa tggacgtggt gctgcaacct tcccctgcac tcagttggag aagtaccgggg 780
ggtattctgg acgtgtacat cttcctcgga ccagaaccca agagcgtggt gcagcaatat 840ggtattctgg acgtgtacat cttcctcgga ccagaaccca agagcgtggt gcagcaatat 840
ctggacgtgg tcggataccc ttttatgcct ccttactggg gactgggatt ccacctttgc 900ctggacgtgg tcggataccc ttttatgcct ccttactgggg gactgggatt ccacctttgc 900
cgttggggct actcatccac cgccattacc agacaggtgg tggagaatat gaccagagcc 960cgttggggct actcatccac cgccattacc agacaggtgg tggagaatat gaccagagcc 960
cacttccctc tcgacgtgca gtggaacgat ctggactata tggactcccg gagagatttc 1020cacttccctc tcgacgtgca gtggaacgat ctggactata tggactcccg gagagatttc 1020
accttcaaca aggacgggtt ccgcgatttt cccgcgatgg ttcaagagct ccaccagggt 10801080
ggtcgaagat atatgatgat cgtcgaccca gccatttcga gcagcggacc cgctggatct 1140ggtcgaagat atatgatgat cgtcgaccca gccatttcga gcagcggacc cgctggatct 1140
tatagacctt acgacgaagg ccttaggaga ggagtgttca tcacaaacga gactggacag 1200tatagacctt acgacgaagg ccttaggaga ggagtgttca tcacaaacga gactggacag 1200
cctttgatcg gtaaagtgtg gcctggatca accgcctttc ctgactttac caatcccact 1260cctttgatcg gtaaagtgtg gcctggatca accgcctttc ctgactttac caatcccact 1260
gccttggctt ggtgggagga catggtggcc gaattccacg accaagtccc ctttgatgga 1320gccttggctt ggtgggagga catggtggcc gaattccacg accaagtccc ctttgatgga 1320
atgtggatcg atatgaacga accaagcaat tttatcagag gttccgaaga cggttgcccc 1380atgtggatcg atatgaacga accaagcaat tttatcagag gttccgaaga cggttgcccc 1380
aacaacgaac tggaaaaccc tccttatgtg cccggagtcg tgggcggaac attacaggcc 1440aacaacgaac tggaaaaccc tccttatgtg cccggagtcg tgggcggaac attacaggcc 1440
gcgactattt gcgccagcag ccaccaattc ctgtccactc actacaacct ccacaacctt 1500gcgactattt gcgccagcag ccaccaattc ctgtccactc actacaacct ccacaacctt 1500
tatggattaa ccgaagctat tgcaagtcac agggctctgg tgaaggctag agggactagg 1560tgcaagtcac agggctctgg tgaaggctag agggactagg 1560
ccctttgtga tctcccgatc cacctttgcc ggacacggga gatacgccgg tcactggact 1620ccctttgtga tctcccgatc cacctttgcc ggacacggga gatacgccgg tcactggact 1620
ggtgacgtgt ggagctcatg ggaacaactg gcctcctccg tgccggaaat cttacagttc 1680ggtgacgtgt ggagctcatg ggaacaactg gcctcctccg tgccggaaat cttacagttc 1680
aaccttctgg gtgtccctct tgtcggagca gacgtgtgtg ggtttcttgg taacacctcc 1740aaccttctgg gtgtccctct tgtcggagca gacgtgtgtg ggtttcttgg taacacctcc 1740
gaggaactgt gtgtgcgctg gactcaactg ggtgcattct acccattcat gagaaaccac 1800gaggaactgt gtgtgcgctg gactcaactg ggtgcattct acccattcat gagaaaccac 1800
aactccttgc tgtccctgcc acaagagccc tactcgttca gcgagcctgc acaacaggct 1860aactccttgc tgtccctgcc acaagagccc tactcgttca gcgagcctgc acaacaggct 1860
atgcggaagg cactgaccct gagatacgcc ctgcttccac acttatacac tctcttccat 1920atgcggaagg cactgaccct gagatacgcc ctgcttccac acttatacac tctcttccat 1920
caagcgcatg tggcaggaga aaccgttgca aggcctcttt tccttgaatt ccccaaggat 1980caagcgcatg tggcaggaga aaccgttgca aggcctcttt tccttgaatt ccccaaggat 1980
tcctcgactt ggacggtgga tcatcagctg ctgtggggag aagctctgct gattactcca 2040tcctcgactt ggacggtgga tcatcagctg ctgtggggag aagctctgct gattactcca 2040
gtgttgcaag ccggaaaagc tgaggtgacc ggatactttc cgctgggaac ctggtacgac 2100gtgttgcaag ccggaaaagc tgaggtgacc ggatactttc cgctgggaac ctggtacgac 2100
ctccagactg tccctgttga agcccttgga tcactgcctc cgcctccggc agctccacgc 2160ctccagactg tccctgttga agcccttgga tcactgcctc cgcctccggc agctccacgc 2160
gaaccagcta tacattccga gggacagtgg gttacattac cagctcctct ggacacaatc 2220gaaccagcta tacattccga gggacagtgg gttacattac cagctcctct ggacacaatc 2220
aacgtccact taagagctgg ctacattatc cctctgcaag gaccaggact gactacgacc 2280aacgtccact taagagctgg ctacattatc cctctgcaag gaccaggact gactacgacc 2280
gagagcagac agcagccaat ggcactggct gtggctctga ccaagggagg ggaagctaga 2340gagagcagac agcagccaat ggcactggct gtggctctga ccaagggagg ggaagctaga 2340
ggagaactct tctgggatga tggggagtcc cttgaagtgc tggaaagagg cgcttacact 2400ggagaactct tctgggatga tggggagtcc cttgaagtgc tggaaagagg cgcttacact 2400
caagtcattt tccttgcacg gaacaacacc attgtgaacg aattggtgcg agtgaccagc 2460caagtcattt tccttgcacg gaacaacacc attgtgaacg aattggtgcg agtgaccagc 2460
gaaggagctg gacttcaact gcagaaggtc actgtgctcg gagtggctac cgctcctcag 2520gaaggagctg gacttcaact gcagaaggtc actgtgctcg gagtggctac cgctcctcag 2520
caagtgctgt cgaatggagt ccccgtgtca aactttacct actcccctga cactaaggtg 2580caagtgctgt cgaatggagt ccccgtgtca aactttacct actcccctga cactaaggtg 2580
ctcgacattt gcgtgtccct cctgatggga gagcagttcc ttgtgtcctg gtgttga 2637ctcgacattt gcgtgtccct cctgatggga gagcagttcc ttgtgtcctg gtgttga 2637
<---<---
Claims (19)
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16306150.0 | 2016-09-12 | ||
EP16306150.0A EP3293260A1 (en) | 2016-09-12 | 2016-09-12 | Acid-alpha glucosidase variants and uses thereof |
EP16306187 | 2016-09-16 | ||
EP16306187.2 | 2016-09-16 | ||
PCT/EP2017/072944 WO2018046774A1 (en) | 2016-09-12 | 2017-09-12 | Acid-alpha glucosidase variants and uses thereof |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2022124093A Division RU2022124093A (en) | 2016-09-12 | 2017-09-12 | ACID ALPHA GLUCOSIDASE OPTIONS AND THEIR USE |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2019110773A RU2019110773A (en) | 2020-10-12 |
RU2019110773A3 RU2019110773A3 (en) | 2020-11-25 |
RU2780410C2 true RU2780410C2 (en) | 2022-09-22 |
Family
ID=
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005078077A2 (en) * | 2004-02-10 | 2005-08-25 | Zystor Therapeutics, Inc. | Acid alpha-glucosidase and fragments thereof |
EP2471929A1 (en) * | 2010-12-29 | 2012-07-04 | Algenics | Production of high mannose glycosylated proteins stored in the plastid of microalgae |
WO2014130723A1 (en) * | 2013-02-20 | 2014-08-28 | Valerion Therapeutics, Llc | Methods and compositions for treatment of pompe disease |
US9018001B2 (en) * | 2008-10-02 | 2015-04-28 | Unitargeting Research As | Kit for the optimisation of protein synthesis/secretion |
RU2014139953A (en) * | 2012-03-15 | 2016-05-20 | Оксирейн Юкей Лимитед | METHODS AND MATERIALS FOR TREATMENT OF POMPE DISEASE |
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005078077A2 (en) * | 2004-02-10 | 2005-08-25 | Zystor Therapeutics, Inc. | Acid alpha-glucosidase and fragments thereof |
US9018001B2 (en) * | 2008-10-02 | 2015-04-28 | Unitargeting Research As | Kit for the optimisation of protein synthesis/secretion |
EP2471929A1 (en) * | 2010-12-29 | 2012-07-04 | Algenics | Production of high mannose glycosylated proteins stored in the plastid of microalgae |
RU2014139953A (en) * | 2012-03-15 | 2016-05-20 | Оксирейн Юкей Лимитед | METHODS AND MATERIALS FOR TREATMENT OF POMPE DISEASE |
WO2014130723A1 (en) * | 2013-02-20 | 2014-08-28 | Valerion Therapeutics, Llc | Methods and compositions for treatment of pompe disease |
Non-Patent Citations (2)
Title |
---|
SUN B. ET AL, Enhanced Efficacy of an AAV Vector Encoding Chimeric, Highly Secreted Acid alpha-Glucosidase in Glycogen Storage Disease Type II, MOLECULAR THERAPY, 2006, v.14, n.6, p.822 - 830. * |
БД GenBank последовательность под номером CCC84733.1, размещенная 27.02.2015. БД GenBank последовательность под номером EDL34691.1, размещенная 26.07.2016. БД GenBank последовательность под номером AAA52506.1, размещенная 08.11.1994. YANG X.J.et al., High-level expression and deletion mutagenesis of human tryptophan hydroxylase, Proc Natl Acad Sci USA, 1994, v.91, n.14, p.6659-6663. FRANKEL A.E. et al., Characterization of diphtheria fusion proteins targeted to the human interleukin-3 receptor, Protein Eng., 2000, v.13, n.8, p.575-581. BURNS W. R. et al., A high molecular weight melanoma-associated antigen-specific chimeric antigen receptor redirects lymphocytes to target human melanomas, Cancer research, 2010, V. 70, N. 8, p.3027-3033. RICHMAN S. A. et al., High-affinity GD2-specific CAR T cells induce fatal encephalitis in a preclinical neuroblastoma model, Cancer immunology research, 2018, V. 6, N. 1, p.36-46. АРГЕНТОВА В.В. и др., Изучение влияния эукариотических векторов различных * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102617502B1 (en) | Acid-alpha glucosidase variants and uses thereof | |
CN109843930B (en) | Acid alpha-glucosidase variants and uses thereof | |
CN109790528B (en) | Acid alpha-glucosidase variants and uses thereof | |
RU2742352C2 (en) | Vectors of fviii factor based on adeno-associated viruses, corresponding virus particles and therapeutic compositions containing them | |
CN112424345A (en) | Stable expression of AAV vectors in adolescent subjects | |
KR20190100318A (en) | Gene therapy to treat phenylketonuria | |
CN113316639A (en) | Treatment of gonadal-associated viruses for the treatment of pompe disease | |
CN110914419A (en) | Treatment of glycogen storage disease III | |
JP2002501376A (en) | New LDL-receptor | |
KR20210053902A (en) | Mini-GDE for the treatment of glycogen storage disease III | |
CN114555808A (en) | Chimeric polypeptides and uses thereof | |
KR20210049833A (en) | Non-destructive gene therapy for the treatment of MMA | |
EP3293260A1 (en) | Acid-alpha glucosidase variants and uses thereof | |
CN113692411A (en) | Gene therapy for fibroblast growth factor 23-associated hypophosphatemia | |
RU2780410C2 (en) | Variants of acid alpha-glucosidase and their use | |
RU2780329C2 (en) | Options of acid alpha-glucosidase and their use | |
KR20220133248A (en) | Non-Human Animals Comprising Humanized PNPLA3 Locus and Methods of Use | |
RU2792432C2 (en) | Stable expression of vectors based on adeno-associated virus in minor patients | |
KR20230029624A (en) | Vectors encoding glucose-6-phosphatase (G6Pase-a) for gene therapy |