KR20230003569A - Cdkl5 결핍 장애 (cdd)의 치료에 유용한 조성물 - Google Patents
Cdkl5 결핍 장애 (cdd)의 치료에 유용한 조성물 Download PDFInfo
- Publication number
- KR20230003569A KR20230003569A KR1020227041749A KR20227041749A KR20230003569A KR 20230003569 A KR20230003569 A KR 20230003569A KR 1020227041749 A KR1020227041749 A KR 1020227041749A KR 20227041749 A KR20227041749 A KR 20227041749A KR 20230003569 A KR20230003569 A KR 20230003569A
- Authority
- KR
- South Korea
- Prior art keywords
- ser
- leu
- pro
- lys
- arg
- Prior art date
Links
- 208000027412 CDKL5-deficiency disease Diseases 0.000 title claims abstract description 81
- 239000000203 mixture Substances 0.000 title claims description 58
- 238000011282 treatment Methods 0.000 title description 25
- 239000013598 vector Substances 0.000 claims abstract description 205
- 101000945692 Homo sapiens Cyclin-dependent kinase-like 5 Proteins 0.000 claims abstract description 175
- 210000000234 capsid Anatomy 0.000 claims abstract description 117
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 75
- 238000000034 method Methods 0.000 claims abstract description 64
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 32
- 241000702421 Dependoparvovirus Species 0.000 claims abstract description 31
- 102000054946 human CDKL5 Human genes 0.000 claims description 168
- 230000014509 gene expression Effects 0.000 claims description 160
- 210000004027 cell Anatomy 0.000 claims description 97
- 108091026890 Coding region Proteins 0.000 claims description 91
- 108091070501 miRNA Proteins 0.000 claims description 87
- 239000002679 microRNA Substances 0.000 claims description 84
- 108010029485 Protein Isoforms Proteins 0.000 claims description 77
- 102000001708 Protein Isoforms Human genes 0.000 claims description 77
- 239000002773 nucleotide Substances 0.000 claims description 70
- 125000003729 nucleotide group Chemical group 0.000 claims description 70
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 50
- 108091029500 miR-183 stem-loop Proteins 0.000 claims description 48
- 230000001105 regulatory effect Effects 0.000 claims description 40
- 239000003623 enhancer Substances 0.000 claims description 35
- 108020004414 DNA Proteins 0.000 claims description 33
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 claims description 32
- 239000002245 particle Substances 0.000 claims description 23
- 108091023796 miR-182 stem-loop Proteins 0.000 claims description 21
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 claims description 19
- 210000003594 spinal ganglia Anatomy 0.000 claims description 18
- 210000003169 central nervous system Anatomy 0.000 claims description 16
- 108020004999 messenger RNA Proteins 0.000 claims description 16
- 210000002569 neuron Anatomy 0.000 claims description 15
- 239000013603 viral vector Substances 0.000 claims description 15
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 14
- 108090000565 Capsid Proteins Proteins 0.000 claims description 14
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 14
- 238000007913 intrathecal administration Methods 0.000 claims description 14
- 125000006850 spacer group Chemical group 0.000 claims description 14
- 238000009472 formulation Methods 0.000 claims description 13
- 238000004806 packaging method and process Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 12
- 239000000725 suspension Substances 0.000 claims description 12
- 238000004113 cell culture Methods 0.000 claims description 11
- 238000013322 recombinant adeno-associated virus production system Methods 0.000 claims description 11
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 10
- 102000001435 Synapsin Human genes 0.000 claims description 9
- 108050009621 Synapsin Proteins 0.000 claims description 9
- 238000007914 intraventricular administration Methods 0.000 claims description 6
- 238000001990 intravenous administration Methods 0.000 claims description 5
- 210000003734 kidney Anatomy 0.000 claims description 5
- 241000713666 Lentivirus Species 0.000 claims description 4
- 241000125945 Protoparvovirus Species 0.000 claims description 4
- 239000007900 aqueous suspension Substances 0.000 claims description 4
- 241000701161 unidentified adenovirus Species 0.000 claims description 4
- 229920001661 Chitosan Polymers 0.000 claims description 3
- 108091061960 Naked DNA Proteins 0.000 claims description 3
- 108091036066 Three prime untranslated region Proteins 0.000 claims description 3
- 239000010954 inorganic particle Substances 0.000 claims description 3
- 150000002632 lipids Chemical class 0.000 claims description 3
- 229920000642 polymer Polymers 0.000 claims description 3
- 230000009885 systemic effect Effects 0.000 claims description 3
- 230000008685 targeting Effects 0.000 claims description 3
- 241001430294 unidentified retrovirus Species 0.000 claims description 3
- 208000024891 symptom Diseases 0.000 abstract description 16
- 102100034746 Cyclin-dependent kinase-like 5 Human genes 0.000 abstract description 7
- 239000008194 pharmaceutical composition Substances 0.000 abstract description 3
- 208000003033 autosomal dominant craniodiaphyseal dysplasia Diseases 0.000 abstract 3
- 241000699670 Mus sp. Species 0.000 description 130
- 108090000623 proteins and genes Proteins 0.000 description 79
- 230000000694 effects Effects 0.000 description 53
- 102000004169 proteins and genes Human genes 0.000 description 50
- 235000018102 proteins Nutrition 0.000 description 47
- 108010050848 glycylleucine Proteins 0.000 description 43
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 40
- 108010018006 histidylserine Proteins 0.000 description 39
- 238000001415 gene therapy Methods 0.000 description 38
- 241000699666 Mus <mouse, genus> Species 0.000 description 37
- 108010093581 aspartyl-proline Proteins 0.000 description 35
- 210000004556 brain Anatomy 0.000 description 34
- 241000880493 Leptailurus serval Species 0.000 description 31
- 102000039446 nucleic acids Human genes 0.000 description 29
- 108020004707 nucleic acids Proteins 0.000 description 29
- 238000012360 testing method Methods 0.000 description 29
- 108010089804 glycyl-threonine Proteins 0.000 description 28
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 27
- 108010034529 leucyl-lysine Proteins 0.000 description 26
- 238000012384 transportation and delivery Methods 0.000 description 26
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 25
- -1 antisense molecules Proteins 0.000 description 25
- 239000013607 AAV vector Substances 0.000 description 24
- 108700019146 Transgenes Proteins 0.000 description 24
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 24
- 108010026333 seryl-proline Proteins 0.000 description 24
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 22
- 238000004519 manufacturing process Methods 0.000 description 22
- 108010031719 prolyl-serine Proteins 0.000 description 22
- 210000001519 tissue Anatomy 0.000 description 21
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 20
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 20
- 210000003141 lower extremity Anatomy 0.000 description 20
- 208000036632 Brain mass Diseases 0.000 description 19
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 19
- 238000002347 injection Methods 0.000 description 19
- 239000007924 injection Substances 0.000 description 19
- 108010009298 lysylglutamic acid Proteins 0.000 description 19
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 18
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 18
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 18
- 230000000295 complement effect Effects 0.000 description 18
- 238000010361 transduction Methods 0.000 description 18
- 230000026683 transduction Effects 0.000 description 18
- 101150032457 CDKL5 gene Proteins 0.000 description 17
- 101100439048 Homo sapiens CDKL5 gene Proteins 0.000 description 17
- 102100037935 Polyubiquitin-C Human genes 0.000 description 17
- 108010056354 Ubiquitin C Proteins 0.000 description 17
- 108010060035 arginylproline Proteins 0.000 description 17
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 17
- 108010085325 histidylproline Proteins 0.000 description 17
- 108010057821 leucylproline Proteins 0.000 description 17
- 108010054155 lysyllysine Proteins 0.000 description 17
- 230000001225 therapeutic effect Effects 0.000 description 17
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 16
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 16
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 16
- 239000000872 buffer Substances 0.000 description 16
- 238000010172 mouse model Methods 0.000 description 16
- 230000003612 virological effect Effects 0.000 description 16
- UOYGZBIPZYKGSH-SRVKXCTJSA-N His-Ser-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N UOYGZBIPZYKGSH-SRVKXCTJSA-N 0.000 description 15
- MPCKIRSXNKACRF-GUBZILKMSA-N Met-Pro-Asn Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O MPCKIRSXNKACRF-GUBZILKMSA-N 0.000 description 15
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 15
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 15
- 239000002953 phosphate buffered saline Substances 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 108010029020 prolylglycine Proteins 0.000 description 15
- 108010090894 prolylleucine Proteins 0.000 description 15
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 14
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 14
- 108010008355 arginyl-glutamine Proteins 0.000 description 14
- 230000037396 body weight Effects 0.000 description 14
- 108010077112 prolyl-proline Proteins 0.000 description 14
- 108010048818 seryl-histidine Proteins 0.000 description 14
- 239000004094 surface-active agent Substances 0.000 description 14
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 13
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 13
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 13
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 13
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 13
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 13
- 108010077515 glycylproline Proteins 0.000 description 13
- 108010017391 lysylvaline Proteins 0.000 description 13
- 239000003981 vehicle Substances 0.000 description 13
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 12
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 12
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 12
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 12
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 12
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 12
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 12
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 12
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 12
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 12
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 12
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 12
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 12
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 12
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 12
- LRZPRGJXAZFXCR-DCAQKATOSA-N Cys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N LRZPRGJXAZFXCR-DCAQKATOSA-N 0.000 description 12
- OXFOKRAFNYSREH-BJDJZHNGSA-N Cys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N OXFOKRAFNYSREH-BJDJZHNGSA-N 0.000 description 12
- 108010090461 DFG peptide Proteins 0.000 description 12
- ZXGLLNZQSBLQLT-SRVKXCTJSA-N Gln-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZXGLLNZQSBLQLT-SRVKXCTJSA-N 0.000 description 12
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 12
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 12
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 12
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 12
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 12
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 12
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 12
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 12
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 12
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 12
- HQKADFMLECZIQJ-HVTMNAMFSA-N His-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N HQKADFMLECZIQJ-HVTMNAMFSA-N 0.000 description 12
- XJFITURPHAKKAI-SRVKXCTJSA-N His-Pro-Gln Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CN=CN1 XJFITURPHAKKAI-SRVKXCTJSA-N 0.000 description 12
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 12
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 12
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 12
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 12
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 12
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 12
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 12
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 12
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 12
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 12
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 12
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 12
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 12
- HOZNVKDCKZPRER-XUXIUFHCSA-N Met-Lys-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HOZNVKDCKZPRER-XUXIUFHCSA-N 0.000 description 12
- 241001465754 Metazoa Species 0.000 description 12
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 12
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 12
- RVGRUAULSDPKGF-UHFFFAOYSA-N Poloxamer Chemical compound C1CO1.CC1CO1 RVGRUAULSDPKGF-UHFFFAOYSA-N 0.000 description 12
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 12
- XWYXZPHPYKRYPA-GMOBBJLQSA-N Pro-Asn-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XWYXZPHPYKRYPA-GMOBBJLQSA-N 0.000 description 12
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 12
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 12
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 12
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 12
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 12
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 12
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 12
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 12
- 108010047495 alanylglycine Proteins 0.000 description 12
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 12
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 12
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 12
- 108010037850 glycylvaline Proteins 0.000 description 12
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 12
- 108010003700 lysyl aspartic acid Proteins 0.000 description 12
- 108010064235 lysylglycine Proteins 0.000 description 12
- 108010038320 lysylphenylalanine Proteins 0.000 description 12
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 12
- 239000000523 sample Substances 0.000 description 12
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 12
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 11
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 11
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 11
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 11
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 11
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 11
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 11
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 11
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 11
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 11
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 11
- 238000011813 knockout mouse model Methods 0.000 description 11
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 11
- 108010051242 phenylalanylserine Proteins 0.000 description 11
- 229920001983 poloxamer Polymers 0.000 description 11
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 10
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 10
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 10
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 10
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 10
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 10
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 10
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 10
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 10
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 10
- VVQJGYPTIYOFBR-IHRRRGAJSA-N Leu-Lys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N VVQJGYPTIYOFBR-IHRRRGAJSA-N 0.000 description 10
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 10
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 10
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 10
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 10
- GZTKZDGIEBKZAH-XIRDDKMYSA-N Trp-Cys-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N GZTKZDGIEBKZAH-XIRDDKMYSA-N 0.000 description 10
- 238000003556 assay Methods 0.000 description 10
- 230000006399 behavior Effects 0.000 description 10
- 108010091617 pentalysine Proteins 0.000 description 10
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 10
- 238000011144 upstream manufacturing Methods 0.000 description 10
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 9
- 206010010904 Convulsion Diseases 0.000 description 9
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 9
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 9
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 9
- 101000575685 Homo sapiens Synembryn-B Proteins 0.000 description 9
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 9
- 102100026014 Synembryn-B Human genes 0.000 description 9
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 9
- 230000003542 behavioural effect Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 9
- 238000010276 construction Methods 0.000 description 9
- 231100000673 dose–response relationship Toxicity 0.000 description 9
- 108010025306 histidylleucine Proteins 0.000 description 9
- 108010092114 histidylphenylalanine Proteins 0.000 description 9
- ODWSTKXGQGYHSH-FXQIFTODSA-N Ala-Arg-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O ODWSTKXGQGYHSH-FXQIFTODSA-N 0.000 description 8
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 8
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 8
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 8
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 8
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 8
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 8
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 8
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 8
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 8
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 8
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 8
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 8
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 8
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 8
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 8
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 8
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 8
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 8
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 8
- 241000282326 Felis catus Species 0.000 description 8
- OETQLUYCMBARHJ-CIUDSAMLSA-N Gln-Asn-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OETQLUYCMBARHJ-CIUDSAMLSA-N 0.000 description 8
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 8
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 8
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 8
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 8
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 8
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 8
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 8
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 8
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 8
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 8
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 8
- KNNSUUOHFVVJOP-GUBZILKMSA-N His-Glu-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N KNNSUUOHFVVJOP-GUBZILKMSA-N 0.000 description 8
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 8
- IAYPZSHNZQHQNO-KKUMJFAQSA-N His-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N IAYPZSHNZQHQNO-KKUMJFAQSA-N 0.000 description 8
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 8
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 8
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 8
- SHVFUCSSACPBTF-VGDYDELISA-N Ile-Ser-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SHVFUCSSACPBTF-VGDYDELISA-N 0.000 description 8
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 8
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 8
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 8
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 8
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 8
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 8
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 8
- MIROMRNASYKZNL-ULQDDVLXSA-N Lys-Pro-Tyr Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MIROMRNASYKZNL-ULQDDVLXSA-N 0.000 description 8
- LKDXINHHSWFFJC-SRVKXCTJSA-N Lys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N LKDXINHHSWFFJC-SRVKXCTJSA-N 0.000 description 8
- 101710163270 Nuclease Proteins 0.000 description 8
- ISYSEOWLRQKQEQ-JYJNAYRXSA-N Phe-His-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISYSEOWLRQKQEQ-JYJNAYRXSA-N 0.000 description 8
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 8
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 8
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 8
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 8
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 8
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 8
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 8
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 8
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 8
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 8
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 8
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 8
- VFWQQZMRKFOGLE-ZLUOBGJFSA-N Ser-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O VFWQQZMRKFOGLE-ZLUOBGJFSA-N 0.000 description 8
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 8
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 8
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 8
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 8
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 8
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 8
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 8
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 8
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 8
- MCDVZTRGHNXTGK-HJGDQZAQSA-N Thr-Met-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O MCDVZTRGHNXTGK-HJGDQZAQSA-N 0.000 description 8
- ULHASJWZGUEUNN-XIRDDKMYSA-N Trp-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O ULHASJWZGUEUNN-XIRDDKMYSA-N 0.000 description 8
- JPBGMZDTPVGGMQ-ULQDDVLXSA-N Val-Tyr-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JPBGMZDTPVGGMQ-ULQDDVLXSA-N 0.000 description 8
- 235000001014 amino acid Nutrition 0.000 description 8
- 229940024606 amino acid Drugs 0.000 description 8
- 108010062796 arginyllysine Proteins 0.000 description 8
- 230000008901 benefit Effects 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 238000012937 correction Methods 0.000 description 8
- 239000002934 diuretic Substances 0.000 description 8
- 230000001882 diuretic effect Effects 0.000 description 8
- 108010078144 glutaminyl-glycine Proteins 0.000 description 8
- 230000006872 improvement Effects 0.000 description 8
- 108010053037 kyotorphin Proteins 0.000 description 8
- 229960000502 poloxamer Drugs 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 230000010076 replication Effects 0.000 description 8
- 238000001262 western blot Methods 0.000 description 8
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 7
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 7
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 7
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 7
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 7
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 7
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 7
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 7
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 7
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 7
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 7
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 7
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 7
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 7
- RNAQPBOOJRDICC-BPUTZDHNSA-N Asp-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N RNAQPBOOJRDICC-BPUTZDHNSA-N 0.000 description 7
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 7
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 7
- XMVLTPMCUJTJQP-FXQIFTODSA-N Glu-Gln-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N XMVLTPMCUJTJQP-FXQIFTODSA-N 0.000 description 7
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 7
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 7
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 7
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 7
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 7
- IDNNYVGVSZMQTK-IHRRRGAJSA-N His-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N IDNNYVGVSZMQTK-IHRRRGAJSA-N 0.000 description 7
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 7
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 7
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 7
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 7
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 7
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 7
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 7
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 7
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 7
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 7
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 7
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 7
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 7
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 7
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 7
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 7
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 7
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 7
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 7
- ZBLSZPYQQRIHQU-RCWTZXSCSA-N Met-Thr-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ZBLSZPYQQRIHQU-RCWTZXSCSA-N 0.000 description 7
- 108010079364 N-glycylalanine Proteins 0.000 description 7
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 7
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 7
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 7
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 7
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 7
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 7
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 7
- AQSMZTIEJMZQEC-DCAQKATOSA-N Pro-His-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O AQSMZTIEJMZQEC-DCAQKATOSA-N 0.000 description 7
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 7
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 7
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 7
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 7
- AXOHAHIUJHCLQR-IHRRRGAJSA-N Ser-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CO)N AXOHAHIUJHCLQR-IHRRRGAJSA-N 0.000 description 7
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 7
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 7
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 7
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 7
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 7
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 7
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 7
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 7
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 7
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 7
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 7
- BZKPWHYZMXOIDC-UHFFFAOYSA-N acetazolamide Chemical compound CC(=O)NC1=NN=C(S(N)(=O)=O)S1 BZKPWHYZMXOIDC-UHFFFAOYSA-N 0.000 description 7
- 108010011559 alanylphenylalanine Proteins 0.000 description 7
- 150000001413 amino acids Chemical class 0.000 description 7
- 108010013835 arginine glutamate Proteins 0.000 description 7
- 229940079593 drug Drugs 0.000 description 7
- 239000003814 drug Substances 0.000 description 7
- 108010015792 glycyllysine Proteins 0.000 description 7
- 108010078274 isoleucylvaline Proteins 0.000 description 7
- 108010018625 phenylalanylarginine Proteins 0.000 description 7
- 238000001890 transfection Methods 0.000 description 7
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 6
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 6
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 6
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 6
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 6
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- 108010067770 Endopeptidase K Proteins 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 6
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 6
- JDAYMLXPUJRSDJ-XIRDDKMYSA-N Glu-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 JDAYMLXPUJRSDJ-XIRDDKMYSA-N 0.000 description 6
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 6
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 6
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 6
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 6
- 108091092195 Intron Proteins 0.000 description 6
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 6
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 6
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 6
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 6
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 6
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 6
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 6
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 6
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 6
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 6
- 238000011529 RT qPCR Methods 0.000 description 6
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 6
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 6
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 6
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 6
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 6
- BEAFYHFQTOTVFS-VGDYDELISA-N Ser-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N BEAFYHFQTOTVFS-VGDYDELISA-N 0.000 description 6
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 6
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 6
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 6
- 108091023045 Untranslated Region Proteins 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 238000009098 adjuvant therapy Methods 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- 210000005013 brain tissue Anatomy 0.000 description 6
- 238000009933 burial Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 239000004579 marble Substances 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 229920001993 poloxamer 188 Polymers 0.000 description 6
- 108010004914 prolylarginine Proteins 0.000 description 6
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 6
- 229960002930 sirolimus Drugs 0.000 description 6
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 108020005345 3' Untranslated Regions Proteins 0.000 description 5
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 5
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 5
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 5
- LCBSSOCDWUTQQV-SDDRHHMPSA-N Arg-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LCBSSOCDWUTQQV-SDDRHHMPSA-N 0.000 description 5
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 5
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 5
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 5
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 5
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 5
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 5
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 5
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 5
- XBWGJWXGUNSZAT-CIUDSAMLSA-N Gln-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XBWGJWXGUNSZAT-CIUDSAMLSA-N 0.000 description 5
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 5
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 5
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 5
- SCJJPCQUJYPHRZ-BQBZGAKWSA-N Gly-Pro-Asn Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O SCJJPCQUJYPHRZ-BQBZGAKWSA-N 0.000 description 5
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 5
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 5
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 5
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 5
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 5
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 5
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 5
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 5
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 5
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 5
- 241000282553 Macaca Species 0.000 description 5
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 5
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 5
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 5
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 5
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 5
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 5
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 5
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 5
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 5
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 5
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 5
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 5
- HIZDHWHVOLUGOX-BPUTZDHNSA-N Trp-Ser-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O HIZDHWHVOLUGOX-BPUTZDHNSA-N 0.000 description 5
- UIDJDMVRDUANDL-BVSLBCMMSA-N Trp-Tyr-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UIDJDMVRDUANDL-BVSLBCMMSA-N 0.000 description 5
- YMUQBRQQCPQEQN-CXTHYWKRSA-N Tyr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YMUQBRQQCPQEQN-CXTHYWKRSA-N 0.000 description 5
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 5
- ZSZFTYVFQLUWBF-QXEWZRGKSA-N Val-Asp-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N ZSZFTYVFQLUWBF-QXEWZRGKSA-N 0.000 description 5
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 5
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 5
- 108010044940 alanylglutamine Proteins 0.000 description 5
- 239000007864 aqueous solution Substances 0.000 description 5
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 5
- 230000001054 cortical effect Effects 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 101150089730 gly-10 gene Proteins 0.000 description 5
- 108010010147 glycylglutamine Proteins 0.000 description 5
- 238000003306 harvesting Methods 0.000 description 5
- 210000001320 hippocampus Anatomy 0.000 description 5
- 208000013403 hyperactivity Diseases 0.000 description 5
- 208000015181 infectious disease Diseases 0.000 description 5
- 230000033001 locomotion Effects 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 108010034507 methionyltryptophan Proteins 0.000 description 5
- 230000001537 neural effect Effects 0.000 description 5
- 239000000546 pharmaceutical excipient Substances 0.000 description 5
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 5
- 230000026731 phosphorylation Effects 0.000 description 5
- 238000006366 phosphorylation reaction Methods 0.000 description 5
- 230000008488 polyadenylation Effects 0.000 description 5
- 108010079317 prolyl-tyrosine Proteins 0.000 description 5
- 238000012552 review Methods 0.000 description 5
- 210000002845 virion Anatomy 0.000 description 5
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 4
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 4
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 4
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 4
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 4
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 4
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 4
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 4
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 4
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 4
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 4
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 4
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 4
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 4
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 4
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 4
- 241000701022 Cytomegalovirus Species 0.000 description 4
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 4
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 4
- XOKGKOQWADCLFQ-GARJFASQSA-N Gln-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XOKGKOQWADCLFQ-GARJFASQSA-N 0.000 description 4
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 4
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 4
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 4
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 4
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 4
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 4
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 4
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 4
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 4
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 4
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 4
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 4
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 4
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 4
- RIUZKUJUPVFAGY-HOTGVXAUSA-N Gly-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)CN RIUZKUJUPVFAGY-HOTGVXAUSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- TVRMJKNELJKNRS-GUBZILKMSA-N His-Glu-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N TVRMJKNELJKNRS-GUBZILKMSA-N 0.000 description 4
- KHUFDBQXGLEIHC-BZSNNMDCSA-N His-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 KHUFDBQXGLEIHC-BZSNNMDCSA-N 0.000 description 4
- CHIAUHSHDARFBD-ULQDDVLXSA-N His-Pro-Tyr Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 CHIAUHSHDARFBD-ULQDDVLXSA-N 0.000 description 4
- FFKJUTZARGRVTH-KKUMJFAQSA-N His-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FFKJUTZARGRVTH-KKUMJFAQSA-N 0.000 description 4
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 4
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 4
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 4
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 4
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 4
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 4
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 4
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 4
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 4
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 4
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 4
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 4
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 4
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 4
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 4
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 4
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 4
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 4
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 4
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 4
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 4
- DNDVVILEHVMWIS-LPEHRKFASA-N Met-Asp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DNDVVILEHVMWIS-LPEHRKFASA-N 0.000 description 4
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 4
- 108091027559 Mir-96 microRNA Proteins 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 4
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 4
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 4
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 4
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 4
- 108091000080 Phosphotransferase Proteins 0.000 description 4
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 4
- VPFGPKIWSDVTOY-SRVKXCTJSA-N Pro-Glu-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O VPFGPKIWSDVTOY-SRVKXCTJSA-N 0.000 description 4
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 4
- FFSLAIOXRMOFIZ-GJZGRUSLSA-N Pro-Gly-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)O)C(=O)CNC(=O)[C@@H]1CCCN1 FFSLAIOXRMOFIZ-GJZGRUSLSA-N 0.000 description 4
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 4
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 4
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 4
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 4
- 241001068295 Replication defective viruses Species 0.000 description 4
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 4
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 4
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 4
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 4
- DSSOYPJWSWFOLK-CIUDSAMLSA-N Ser-Cys-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O DSSOYPJWSWFOLK-CIUDSAMLSA-N 0.000 description 4
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 4
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 4
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 4
- TVPQRPNBYCRRLL-IHRRRGAJSA-N Ser-Phe-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O TVPQRPNBYCRRLL-IHRRRGAJSA-N 0.000 description 4
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 4
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 4
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 4
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 4
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 4
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 4
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 4
- PAOYNIKMYOGBMR-PBCZWWQYSA-N Thr-Asn-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PAOYNIKMYOGBMR-PBCZWWQYSA-N 0.000 description 4
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 4
- CKKFTIQYURNSEI-IHRRRGAJSA-N Tyr-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CKKFTIQYURNSEI-IHRRRGAJSA-N 0.000 description 4
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 4
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 4
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 4
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 4
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 4
- 238000010171 animal model Methods 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 238000009227 behaviour therapy Methods 0.000 description 4
- 108010006025 bovine growth hormone Proteins 0.000 description 4
- 230000021615 conjugation Effects 0.000 description 4
- 229920001577 copolymer Polymers 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 229940099238 diamox Drugs 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010079547 glutamylmethionine Proteins 0.000 description 4
- 108010020688 glycylhistidine Proteins 0.000 description 4
- 210000002216 heart Anatomy 0.000 description 4
- 210000004185 liver Anatomy 0.000 description 4
- 108010056582 methionylglutamic acid Proteins 0.000 description 4
- 108091086713 miR-96 stem-loop Proteins 0.000 description 4
- 108091070961 miR-96-3 stem-loop Proteins 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- RTGDFNSFWBGLEC-SYZQJQIISA-N mycophenolate mofetil Chemical compound COC1=C(C)C=2COC(=O)C=2C(O)=C1C\C=C(/C)CCC(=O)OCCN1CCOCC1 RTGDFNSFWBGLEC-SYZQJQIISA-N 0.000 description 4
- 229960004866 mycophenolate mofetil Drugs 0.000 description 4
- 230000003188 neurobehavioral effect Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000007170 pathology Effects 0.000 description 4
- 102000020233 phosphotransferase Human genes 0.000 description 4
- 229940044519 poloxamer 188 Drugs 0.000 description 4
- 229920001451 polypropylene glycol Polymers 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 210000000278 spinal cord Anatomy 0.000 description 4
- 230000004083 survival effect Effects 0.000 description 4
- 231100000041 toxicology testing Toxicity 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 3
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 3
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 3
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 3
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 3
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 3
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 3
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 3
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 3
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 3
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 3
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 3
- SGAUXNZEFIEAAI-GARJFASQSA-N Asn-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)C(=O)O SGAUXNZEFIEAAI-GARJFASQSA-N 0.000 description 3
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 3
- QTIZKMMLNUMHHU-DCAQKATOSA-N Asp-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QTIZKMMLNUMHHU-DCAQKATOSA-N 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 3
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 3
- KVQOVQVGVKDZNW-GUBZILKMSA-N Gln-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KVQOVQVGVKDZNW-GUBZILKMSA-N 0.000 description 3
- OUBUHIODTNUUTC-WDCWCFNPSA-N Gln-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OUBUHIODTNUUTC-WDCWCFNPSA-N 0.000 description 3
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 3
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 3
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 3
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 3
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 3
- XDIVYNSPYBLSME-DCAQKATOSA-N His-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N XDIVYNSPYBLSME-DCAQKATOSA-N 0.000 description 3
- BFOGZWSSGMLYKV-DCAQKATOSA-N His-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N BFOGZWSSGMLYKV-DCAQKATOSA-N 0.000 description 3
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 3
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 3
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 3
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 3
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 3
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 3
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 3
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 3
- MKBIVWXCFINCLE-SRVKXCTJSA-N Lys-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N MKBIVWXCFINCLE-SRVKXCTJSA-N 0.000 description 3
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 3
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 3
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 3
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 3
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 3
- HLQWFLJOJRFXHO-CIUDSAMLSA-N Met-Glu-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O HLQWFLJOJRFXHO-CIUDSAMLSA-N 0.000 description 3
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 3
- 238000011887 Necropsy Methods 0.000 description 3
- 208000029726 Neurodevelopmental disease Diseases 0.000 description 3
- 108091093037 Peptide nucleic acid Proteins 0.000 description 3
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 3
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 3
- BVHFFNYBKRTSIU-MEYUZBJRSA-N Phe-His-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BVHFFNYBKRTSIU-MEYUZBJRSA-N 0.000 description 3
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 3
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 3
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 3
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 3
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 3
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 3
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 3
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 3
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 3
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 3
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 3
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 3
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 3
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 3
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 3
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 3
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 3
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 3
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 3
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 3
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 3
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 3
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 3
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 3
- VIWQOOBRKCGSDK-RYQLBKOJSA-N Trp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O VIWQOOBRKCGSDK-RYQLBKOJSA-N 0.000 description 3
- OEVJGIHPQOXYFE-SRVKXCTJSA-N Tyr-Asn-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OEVJGIHPQOXYFE-SRVKXCTJSA-N 0.000 description 3
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 3
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 3
- 239000013543 active substance Substances 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000007975 buffered saline Substances 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000002591 computed tomography Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 239000003085 diluting agent Substances 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000011304 droplet digital PCR Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 210000001508 eye Anatomy 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 230000005021 gait Effects 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010087823 glycyltyrosine Proteins 0.000 description 3
- 230000000971 hippocampal effect Effects 0.000 description 3
- 239000003018 immunosuppressive agent Substances 0.000 description 3
- 238000007901 in situ hybridization Methods 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 210000000088 lip Anatomy 0.000 description 3
- 238000009593 lumbar puncture Methods 0.000 description 3
- 229910001629 magnesium chloride Inorganic materials 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 210000000337 motor cortex Anatomy 0.000 description 3
- 230000007659 motor function Effects 0.000 description 3
- 210000000653 nervous system Anatomy 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 210000001428 peripheral nervous system Anatomy 0.000 description 3
- 239000003755 preservative agent Substances 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 241000701447 unidentified baculovirus Species 0.000 description 3
- 235000019786 weight gain Nutrition 0.000 description 3
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 2
- JVKUCNQGESRUCL-UHFFFAOYSA-N 2-Hydroxyethyl 12-hydroxyoctadecanoate Chemical compound CCCCCCC(O)CCCCCCCCCCC(=O)OCCO JVKUCNQGESRUCL-UHFFFAOYSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 2
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 2
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 2
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 2
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 2
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 2
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 2
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 2
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 2
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 2
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 2
- SXLCDCZHNCLFGZ-BPUTZDHNSA-N Asp-Pro-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SXLCDCZHNCLFGZ-BPUTZDHNSA-N 0.000 description 2
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 2
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 2
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 2
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- 101710178912 Cyclin-dependent kinase-like 5 Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 2
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 2
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 2
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 2
- CSTNMMIHMYJGFR-IHRRRGAJSA-N His-His-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CN=CN1 CSTNMMIHMYJGFR-IHRRRGAJSA-N 0.000 description 2
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 2
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 2
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 2
- SHBUUTHKGIVMJT-UHFFFAOYSA-N Hydroxystearate Chemical compound CCCCCCCCCCCCCCCCCC(=O)OO SHBUUTHKGIVMJT-UHFFFAOYSA-N 0.000 description 2
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 2
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 2
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 2
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 2
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 2
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 2
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 2
- GHOIOYHDDKXIDX-SZMVWBNQSA-N Lys-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 GHOIOYHDDKXIDX-SZMVWBNQSA-N 0.000 description 2
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- 102400001132 Melanin-concentrating hormone Human genes 0.000 description 2
- 101800002739 Melanin-concentrating hormone Proteins 0.000 description 2
- MUDYEFAKNSTFAI-JYJNAYRXSA-N Met-Tyr-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O MUDYEFAKNSTFAI-JYJNAYRXSA-N 0.000 description 2
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 2
- 208000007101 Muscle Cramp Diseases 0.000 description 2
- 206010052904 Musculoskeletal stiffness Diseases 0.000 description 2
- NWIBSHFKIJFRCO-WUDYKRTCSA-N Mytomycin Chemical compound C1N2C(C(C(C)=C(N)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 NWIBSHFKIJFRCO-WUDYKRTCSA-N 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 2
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 229920001214 Polysorbate 60 Polymers 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 2
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 2
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 2
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 2
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 2
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 2
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 2
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 2
- ZTHYODDOHIVTJV-UHFFFAOYSA-N Propyl gallate Chemical compound CCCOC(=O)C1=CC(O)=C(O)C(O)=C1 ZTHYODDOHIVTJV-UHFFFAOYSA-N 0.000 description 2
- 108091030071 RNAI Proteins 0.000 description 2
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 2
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 2
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 2
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 2
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- WOJYIMBIKTWKJO-KKUMJFAQSA-N Ser-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CO)N WOJYIMBIKTWKJO-KKUMJFAQSA-N 0.000 description 2
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 229920001304 Solutol HS 15 Polymers 0.000 description 2
- 208000005392 Spasm Diseases 0.000 description 2
- 208000010513 Stupor Diseases 0.000 description 2
- RAHZWNYVWXNFOC-UHFFFAOYSA-N Sulphur dioxide Chemical compound O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 2
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 2
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 2
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 2
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 2
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 2
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 2
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 2
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- QEJHHFFFCUDPDV-WDSOQIARSA-N Trp-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N QEJHHFFFCUDPDV-WDSOQIARSA-N 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 2
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 2
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 2
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 2
- 101150110932 US19 gene Proteins 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 2
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 2
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- RJURFGZVJUQBHK-UHFFFAOYSA-N actinomycin D Natural products CC1OC(=O)C(C(C)C)N(C)C(=O)CN(C)C(=O)C2CCCN2C(=O)C(C(C)C)NC(=O)C1NC(=O)C1=C(N)C(=O)C(C)=C2OC(C(C)=CC=C3C(=O)NC4C(=O)NC(C(N5CCCC5C(=O)N(C)CC(=O)N(C)C(C(C)C)C(=O)OC4C)=O)C(C)C)=C3N=C21 RJURFGZVJUQBHK-UHFFFAOYSA-N 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 230000000340 anti-metabolite Effects 0.000 description 2
- 229940100197 antimetabolite Drugs 0.000 description 2
- 239000002256 antimetabolite Substances 0.000 description 2
- 150000001507 asparagine derivatives Chemical class 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 230000001588 bifunctional effect Effects 0.000 description 2
- 229920001400 block copolymer Polymers 0.000 description 2
- 206010006514 bruxism Diseases 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000011072 cell harvest Methods 0.000 description 2
- 210000001638 cerebellum Anatomy 0.000 description 2
- OSASVXMJTNOKOY-UHFFFAOYSA-N chlorobutanol Chemical compound CC(C)(O)C(Cl)(Cl)Cl OSASVXMJTNOKOY-UHFFFAOYSA-N 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 230000006240 deamidation Effects 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 230000006735 deficit Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 229940126534 drug product Drugs 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- CBOQJANXLMLOSS-UHFFFAOYSA-N ethyl vanillin Chemical compound CCOC1=CC(C=O)=CC=C1O CBOQJANXLMLOSS-UHFFFAOYSA-N 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000002496 gastric effect Effects 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 239000003862 glucocorticoid Substances 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 229940072106 hydroxystearate Drugs 0.000 description 2
- 238000002650 immunosuppressive therapy Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- ORRDHOMWDPJSNL-UHFFFAOYSA-N melanin concentrating hormone Chemical compound N1C(=O)C(C(C)C)NC(=O)C(CCCNC(N)=N)NC(=O)CNC(=O)C(C(C)C)NC(=O)C(CCSC)NC(=O)C(NC(=O)C(CCCNC(N)=N)NC(=O)C(NC(=O)C(NC(=O)C(N)CC(O)=O)C(C)O)CCSC)CSSCC(C(=O)NC(CC=2C3=CC=CC=C3NC=2)C(=O)NC(CCC(O)=O)C(=O)NC(C(C)C)C(O)=O)NC(=O)C2CCCN2C(=O)C(CCCNC(N)=N)NC(=O)C1CC1=CC=C(O)C=C1 ORRDHOMWDPJSNL-UHFFFAOYSA-N 0.000 description 2
- 230000034217 membrane fusion Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 238000010984 neurological examination Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 230000003472 neutralizing effect Effects 0.000 description 2
- 239000002736 nonionic surfactant Substances 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 239000012188 paraffin wax Substances 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 239000000825 pharmaceutical preparation Substances 0.000 description 2
- 230000001766 physiological effect Effects 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 229920000136 polysorbate Polymers 0.000 description 2
- 239000001103 potassium chloride Substances 0.000 description 2
- 235000011164 potassium chloride Nutrition 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 239000013608 rAAV vector Substances 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000000384 rearing effect Effects 0.000 description 2
- 230000011514 reflex Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000029058 respiratory gaseous exchange Effects 0.000 description 2
- 238000009781 safety test method Methods 0.000 description 2
- 206010039722 scoliosis Diseases 0.000 description 2
- 210000001044 sensory neuron Anatomy 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 238000012289 standard assay Methods 0.000 description 2
- 210000002330 subarachnoid space Anatomy 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229940037128 systemic glucocorticoids Drugs 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 210000004885 white matter Anatomy 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- FFJCNSLCJOQHKM-CLFAGFIQSA-N (z)-1-[(z)-octadec-9-enoxy]octadec-9-ene Chemical compound CCCCCCCC\C=C/CCCCCCCCOCCCCCCCC\C=C/CCCCCCCC FFJCNSLCJOQHKM-CLFAGFIQSA-N 0.000 description 1
- CHHHXKFHOYLYRE-UHFFFAOYSA-M 2,4-Hexadienoic acid, potassium salt (1:1), (2E,4E)- Chemical compound [K+].CC=CC=CC([O-])=O CHHHXKFHOYLYRE-UHFFFAOYSA-M 0.000 description 1
- WXNZTHHGJRFXKQ-UHFFFAOYSA-N 4-chlorophenol Chemical compound OC1=CC=C(Cl)C=C1 WXNZTHHGJRFXKQ-UHFFFAOYSA-N 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 206010002091 Anaesthesia Diseases 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 241001212043 Aquita Species 0.000 description 1
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- 208000002109 Argyria Diseases 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 208000014644 Brain disease Diseases 0.000 description 1
- 208000013576 CDKL5 disease Diseases 0.000 description 1
- 101000600085 Caenorhabditis elegans Eukaryotic initiation factor 4A Proteins 0.000 description 1
- 101150044789 Cap gene Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 206010008164 Cerebrospinal fluid leakage Diseases 0.000 description 1
- 208000028698 Cognitive impairment Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 206010010774 Constipation Diseases 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- PMATZTZNYRCHOR-CGLBZJNRSA-N Cyclosporin A Chemical compound CC[C@@H]1NC(=O)[C@H]([C@H](O)[C@H](C)C\C=C\C)N(C)C(=O)[C@H](C(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)N(C)C(=O)CN(C)C1=O PMATZTZNYRCHOR-CGLBZJNRSA-N 0.000 description 1
- 108010036949 Cyclosporine Proteins 0.000 description 1
- GUKYYUFHWYRMEU-WHFBIAKZSA-N Cys-Gly-Asp Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O GUKYYUFHWYRMEU-WHFBIAKZSA-N 0.000 description 1
- QQAYIVHVRFJICE-AEJSXWLSSA-N Cys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N QQAYIVHVRFJICE-AEJSXWLSSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108010092160 Dactinomycin Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 208000032274 Encephalopathy Diseases 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- RGRMOYQUIJVQQD-SRVKXCTJSA-N Gln-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N RGRMOYQUIJVQQD-SRVKXCTJSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 1
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 1
- YZPVGIVFMZLQMM-YUMQZZPRSA-N Gly-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN YZPVGIVFMZLQMM-YUMQZZPRSA-N 0.000 description 1
- IDOGEHIWMJMAHT-BYPYZUCNSA-N Gly-Gly-Cys Chemical compound NCC(=O)NCC(=O)N[C@@H](CS)C(O)=O IDOGEHIWMJMAHT-BYPYZUCNSA-N 0.000 description 1
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 208000034308 Grand mal convulsion Diseases 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- TVQGUFGDVODUIF-LSJOCFKGSA-N His-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N TVQGUFGDVODUIF-LSJOCFKGSA-N 0.000 description 1
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 1
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101100220162 Homo sapiens CDKL4 gene Proteins 0.000 description 1
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 1
- 101000979333 Homo sapiens Neurofilament light polypeptide Proteins 0.000 description 1
- 101000821100 Homo sapiens Synapsin-1 Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 238000009015 Human TaqMan MicroRNA Assay kit Methods 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- 206010021118 Hypotonia Diseases 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- LNJLOZYNZFGJMM-DEQVHRJGSA-N Ile-His-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N LNJLOZYNZFGJMM-DEQVHRJGSA-N 0.000 description 1
- YTRFFJUOYBMLPN-UHFFFAOYSA-N Ile-Lys-Lys-Ser Chemical compound CCC(C)C(N)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CO)C(O)=O YTRFFJUOYBMLPN-UHFFFAOYSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102000000521 Immunophilins Human genes 0.000 description 1
- 108010016648 Immunophilins Proteins 0.000 description 1
- 206010021750 Infantile Spasms Diseases 0.000 description 1
- 201000006347 Intellectual Disability Diseases 0.000 description 1
- 102100026720 Interferon beta Human genes 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 208000036626 Mental retardation Diseases 0.000 description 1
- DZMGFGQBRYWJOR-YUMQZZPRSA-N Met-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O DZMGFGQBRYWJOR-YUMQZZPRSA-N 0.000 description 1
- 108010063312 Metalloproteins Proteins 0.000 description 1
- 102000010750 Metalloproteins Human genes 0.000 description 1
- 208000007379 Muscle Hypotonia Diseases 0.000 description 1
- 102000047918 Myelin Basic Human genes 0.000 description 1
- 108700028031 Myelin Basic Proteins 0.000 description 1
- 206010028570 Myelopathy Diseases 0.000 description 1
- 102000004868 N-Methyl-D-Aspartate Receptors Human genes 0.000 description 1
- 108090001041 N-Methyl-D-Aspartate Receptors Proteins 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 206010029350 Neurotoxicity Diseases 0.000 description 1
- 241000380800 Nordus Species 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 1
- 241000364051 Pima Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- KDIIENQUNVNWHR-JYJNAYRXSA-N Pro-Arg-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KDIIENQUNVNWHR-JYJNAYRXSA-N 0.000 description 1
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- QHSSUIHLAIWXEE-IHRRRGAJSA-N Pro-Tyr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O QHSSUIHLAIWXEE-IHRRRGAJSA-N 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 206010037213 Psychomotor retardation Diseases 0.000 description 1
- 239000012083 RIPA buffer Substances 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 241000555745 Sciuridae Species 0.000 description 1
- RZEQTVHJZCIUBT-WDSKDSINSA-N Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-WDSKDSINSA-N 0.000 description 1
- RZUOXAKGNHXZTB-GUBZILKMSA-N Ser-Arg-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RZUOXAKGNHXZTB-GUBZILKMSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- AXVNLRQLPLSIPQ-FXQIFTODSA-N Ser-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N AXVNLRQLPLSIPQ-FXQIFTODSA-N 0.000 description 1
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- ABBQHOQBGMUPJH-UHFFFAOYSA-M Sodium salicylate Chemical compound [Na+].OC1=CC=CC=C1C([O-])=O ABBQHOQBGMUPJH-UHFFFAOYSA-M 0.000 description 1
- 241000256248 Spodoptera Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- QJJXYPPXXYFBGM-LFZNUXCKSA-N Tacrolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1\C=C(/C)[C@@H]1[C@H](C)[C@@H](O)CC(=O)[C@H](CC=C)/C=C(C)/C[C@H](C)C[C@H](OC)[C@H]([C@H](C[C@H]2C)OC)O[C@@]2(O)C(=O)C(=O)N2CCCC[C@H]2C(=O)O1 QJJXYPPXXYFBGM-LFZNUXCKSA-N 0.000 description 1
- 206010057040 Temperature intolerance Diseases 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- 206010043994 Tonic convulsion Diseases 0.000 description 1
- 206010044221 Toxic encephalopathy Diseases 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- UPODKYBYUBTWSV-BZSNNMDCSA-N Tyr-Phe-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=C(O)C=C1 UPODKYBYUBTWSV-BZSNNMDCSA-N 0.000 description 1
- RGYCVIZZTUBSSG-JYJNAYRXSA-N Tyr-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O RGYCVIZZTUBSSG-JYJNAYRXSA-N 0.000 description 1
- 101150049278 US20 gene Proteins 0.000 description 1
- 208000003443 Unconsciousness Diseases 0.000 description 1
- 108020004417 Untranslated RNA Proteins 0.000 description 1
- 102000039634 Untranslated RNA Human genes 0.000 description 1
- 101150004676 VGF gene Proteins 0.000 description 1
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 1
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- OJPRSVJGNCAKQX-SRVKXCTJSA-N Val-Met-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OJPRSVJGNCAKQX-SRVKXCTJSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- 201000006791 West syndrome Diseases 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- ZVQOOHYFBIDMTQ-UHFFFAOYSA-N [methyl(oxido){1-[6-(trifluoromethyl)pyridin-3-yl]ethyl}-lambda(6)-sulfanylidene]cyanamide Chemical compound N#CN=S(C)(=O)C(C)C1=CC=C(C(F)(F)F)N=C1 ZVQOOHYFBIDMTQ-UHFFFAOYSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000003070 absorption delaying agent Substances 0.000 description 1
- 229960000571 acetazolamide Drugs 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- RJURFGZVJUQBHK-IIXSONLDSA-N actinomycin D Chemical compound C[C@H]1OC(=O)[C@H](C(C)C)N(C)C(=O)CN(C)C(=O)[C@@H]2CCCN2C(=O)[C@@H](C(C)C)NC(=O)[C@H]1NC(=O)C1=C(N)C(=O)C(C)=C2OC(C(C)=CC=C3C(=O)N[C@@H]4C(=O)N[C@@H](C(N5CCC[C@H]5C(=O)N(C)CC(=O)N(C)[C@@H](C(C)C)C(=O)O[C@@H]4C)=O)C(C)C)=C3N=C21 RJURFGZVJUQBHK-IIXSONLDSA-N 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 230000001919 adrenal effect Effects 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000010419 agar Nutrition 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 230000037005 anaesthesia Effects 0.000 description 1
- 238000003975 animal breeding Methods 0.000 description 1
- 239000003957 anion exchange resin Substances 0.000 description 1
- 229940045799 anthracyclines and related substance Drugs 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 229940045719 antineoplastic alkylating agent nitrosoureas Drugs 0.000 description 1
- 239000003972 antineoplastic antibiotic Substances 0.000 description 1
- 229940045985 antineoplastic platinum compound Drugs 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 230000036528 appetite Effects 0.000 description 1
- 235000019789 appetite Nutrition 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 230000003376 axonal effect Effects 0.000 description 1
- 230000007845 axonopathy Effects 0.000 description 1
- LMEKQMALGUDUQG-UHFFFAOYSA-N azathioprine Chemical compound CN1C=NC([N+]([O-])=O)=C1SC1=NC=NC2=C1NC=N2 LMEKQMALGUDUQG-UHFFFAOYSA-N 0.000 description 1
- 229960002170 azathioprine Drugs 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 210000002798 bone marrow cell Anatomy 0.000 description 1
- 230000004641 brain development Effects 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000008366 buffered solution Substances 0.000 description 1
- 239000004566 building material Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 210000005056 cell body Anatomy 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229960004926 chlorobutanol Drugs 0.000 description 1
- 229960001265 ciclosporin Drugs 0.000 description 1
- 238000011260 co-administration Methods 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 208000010877 cognitive disease Diseases 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000036461 convulsion Effects 0.000 description 1
- 210000003618 cortical neuron Anatomy 0.000 description 1
- 210000003792 cranial nerve Anatomy 0.000 description 1
- 238000009295 crossflow filtration Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 229930182912 cyclosporin Natural products 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 239000000824 cytostatic agent Substances 0.000 description 1
- 229960000640 dactinomycin Drugs 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 210000001787 dendrite Anatomy 0.000 description 1
- CFCUWKMKBJTWLW-UHFFFAOYSA-N deoliosyl-3C-alpha-L-digitoxosyl-MTM Natural products CC=1C(O)=C2C(O)=C3C(=O)C(OC4OC(C)C(O)C(OC5OC(C)C(O)C(OC6OC(C)C(O)C(C)(O)C6)C5)C4)C(C(OC)C(=O)C(O)C(C)O)CC3=CC2=CC=1OC(OC(C)C1O)CC1OC1CC(O)C(O)C(C)O1 CFCUWKMKBJTWLW-UHFFFAOYSA-N 0.000 description 1
- 229960003964 deoxycholic acid Drugs 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 208000030204 developmental and epileptic encephalopathy 2 Diseases 0.000 description 1
- 208000029702 developmental and epileptic encephalopathy, 2 Diseases 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 238000003366 endpoint assay Methods 0.000 description 1
- 238000002641 enzyme replacement therapy Methods 0.000 description 1
- 210000001339 epidermal cell Anatomy 0.000 description 1
- 206010015037 epilepsy Diseases 0.000 description 1
- 230000001037 epileptic effect Effects 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- HQPMKSGTIOYHJT-UHFFFAOYSA-N ethane-1,2-diol;propane-1,2-diol Chemical compound OCCO.CC(O)CO HQPMKSGTIOYHJT-UHFFFAOYSA-N 0.000 description 1
- BEFDCLMNVWHSGT-UHFFFAOYSA-N ethenylcyclopentane Chemical compound C=CC1CCCC1 BEFDCLMNVWHSGT-UHFFFAOYSA-N 0.000 description 1
- 229940073505 ethyl vanillin Drugs 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 239000013020 final formulation Substances 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 239000012537 formulation buffer Substances 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 210000005153 frontal cortex Anatomy 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- 210000003736 gastrointestinal content Anatomy 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000002518 glial effect Effects 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- 102000018146 globin Human genes 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 229960005150 glycerol Drugs 0.000 description 1
- 108010081985 glycyl-cystinyl-aspartic acid Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 239000011544 gradient gel Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002064 heart cell Anatomy 0.000 description 1
- 230000008543 heat sensitivity Effects 0.000 description 1
- 210000002767 hepatic artery Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 238000007489 histopathology method Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000003125 immunofluorescent labeling Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 229940125721 immunosuppressive agent Drugs 0.000 description 1
- 229940124589 immunosuppressive drug Drugs 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 210000004969 inflammatory cell Anatomy 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 229960004359 iodixanol Drugs 0.000 description 1
- NBQNWMBBSKPBAY-UHFFFAOYSA-N iodixanol Chemical compound IC=1C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C(I)C=1N(C(=O)C)CC(O)CN(C(C)=O)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NBQNWMBBSKPBAY-UHFFFAOYSA-N 0.000 description 1
- 229960001025 iohexol Drugs 0.000 description 1
- NTHXOOBQLCIOLC-UHFFFAOYSA-N iohexol Chemical compound OCC(O)CN(C(=O)C)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NTHXOOBQLCIOLC-UHFFFAOYSA-N 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 210000003140 lateral ventricle Anatomy 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 239000006194 liquid suspension Substances 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 239000003120 macrolide antibiotic agent Substances 0.000 description 1
- 229940041033 macrolides Drugs 0.000 description 1
- 238000013220 male mouse model Methods 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 229960004961 mechlorethamine Drugs 0.000 description 1
- HAWPXGHAZFHHAD-UHFFFAOYSA-N mechlorethamine Chemical class ClCCN(C)CCCl HAWPXGHAZFHHAD-UHFFFAOYSA-N 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 description 1
- 229960001428 mercaptopurine Drugs 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- CFCUWKMKBJTWLW-BKHRDMLASA-N mithramycin Chemical compound O([C@@H]1C[C@@H](O[C@H](C)[C@H]1O)OC=1C=C2C=C3C[C@H]([C@@H](C(=O)C3=C(O)C2=C(O)C=1C)O[C@@H]1O[C@H](C)[C@@H](O)[C@H](O[C@@H]2O[C@H](C)[C@H](O)[C@H](O[C@@H]3O[C@H](C)[C@@H](O)[C@@](C)(O)C3)C2)C1)[C@H](OC)C(=O)[C@@H](O)[C@@H](C)O)[C@H]1C[C@@H](O)[C@H](O)[C@@H](C)O1 CFCUWKMKBJTWLW-BKHRDMLASA-N 0.000 description 1
- 229960004857 mitomycin Drugs 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 230000037023 motor activity Effects 0.000 description 1
- 210000002161 motor neuron Anatomy 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 230000004118 muscle contraction Effects 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 238000009608 myelography Methods 0.000 description 1
- 239000002088 nanocapsule Substances 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 239000002077 nanosphere Substances 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000007472 neurodevelopment Effects 0.000 description 1
- 210000004498 neuroglial cell Anatomy 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 230000007658 neurological function Effects 0.000 description 1
- 230000007135 neurotoxicity Effects 0.000 description 1
- 231100000228 neurotoxicity Toxicity 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 229940005483 opioid analgesics Drugs 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 210000003254 palate Anatomy 0.000 description 1
- 210000002741 palatine tonsil Anatomy 0.000 description 1
- 229940090668 parachlorophenol Drugs 0.000 description 1
- 230000001936 parietal effect Effects 0.000 description 1
- 238000010827 pathological analysis Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 229960003742 phenol Drugs 0.000 description 1
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Substances [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 1
- 150000003058 platinum compounds Chemical class 0.000 description 1
- 229960003171 plicamycin Drugs 0.000 description 1
- 239000002574 poison Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 238000011886 postmortem examination Methods 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000001144 postural effect Effects 0.000 description 1
- 235000010241 potassium sorbate Nutrition 0.000 description 1
- 239000004302 potassium sorbate Substances 0.000 description 1
- 229940069338 potassium sorbate Drugs 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000009023 proprioceptive sensation Effects 0.000 description 1
- 239000000473 propyl gallate Substances 0.000 description 1
- 229940075579 propyl gallate Drugs 0.000 description 1
- 235000010388 propyl gallate Nutrition 0.000 description 1
- 210000005267 prostate cell Anatomy 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000010992 reflux Methods 0.000 description 1
- 101150066583 rep gene Proteins 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000036387 respiratory rate Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 210000004767 rumen Anatomy 0.000 description 1
- 210000003079 salivary gland Anatomy 0.000 description 1
- 239000011833 salt mixture Substances 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000012679 serum free medium Substances 0.000 description 1
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 210000004927 skin cell Anatomy 0.000 description 1
- 230000007958 sleep Effects 0.000 description 1
- 208000019116 sleep disease Diseases 0.000 description 1
- 208000022925 sleep disturbance Diseases 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 229960005480 sodium caprylate Drugs 0.000 description 1
- FHHPUSMSKHSNKW-SMOYURAASA-M sodium deoxycholate Chemical compound [Na+].C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC([O-])=O)C)[C@@]2(C)[C@@H](O)C1 FHHPUSMSKHSNKW-SMOYURAASA-M 0.000 description 1
- OABYVIYXWMZFFJ-ZUHYDKSRSA-M sodium glycocholate Chemical compound [Na+].C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCC([O-])=O)C)[C@@]2(C)[C@@H](O)C1 OABYVIYXWMZFFJ-ZUHYDKSRSA-M 0.000 description 1
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 1
- BYKRNSHANADUFY-UHFFFAOYSA-M sodium octanoate Chemical compound [Na+].CCCCCCCC([O-])=O BYKRNSHANADUFY-UHFFFAOYSA-M 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 229960004025 sodium salicylate Drugs 0.000 description 1
- JAJWGJBVLPIOOH-IZYKLYLVSA-M sodium taurocholate Chemical compound [Na+].C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 JAJWGJBVLPIOOH-IZYKLYLVSA-M 0.000 description 1
- FIWQZURFGYXCEO-UHFFFAOYSA-M sodium;decanoate Chemical compound [Na+].CCCCCCCCCC([O-])=O FIWQZURFGYXCEO-UHFFFAOYSA-M 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 235000010199 sorbic acid Nutrition 0.000 description 1
- 229940075582 sorbic acid Drugs 0.000 description 1
- 239000004334 sorbic acid Substances 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 238000012430 stability testing Methods 0.000 description 1
- 238000007447 staining method Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000012609 strong anion exchange resin Substances 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 229940044609 sulfur dioxide Drugs 0.000 description 1
- 235000010269 sulphur dioxide Nutrition 0.000 description 1
- 229960001967 tacrolimus Drugs 0.000 description 1
- QJJXYPPXXYFBGM-SHYZHZOCSA-N tacrolimus Natural products CO[C@H]1C[C@H](CC[C@@H]1O)C=C(C)[C@H]2OC(=O)[C@H]3CCCCN3C(=O)C(=O)[C@@]4(O)O[C@@H]([C@H](C[C@H]4C)OC)[C@@H](C[C@H](C)CC(=C[C@@H](CC=C)C(=O)C[C@H](O)[C@H]2C)C)OC QJJXYPPXXYFBGM-SHYZHZOCSA-N 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 230000001256 tonic effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000009752 translational inhibition Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- PIEPQKCYPFFYMG-UHFFFAOYSA-N tris acetate Chemical compound CC(O)=O.OCC(N)(CO)CO PIEPQKCYPFFYMG-UHFFFAOYSA-N 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
- 230000004584 weight gain Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0058—Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/11—Protein-serine/threonine kinases (2.7.11)
- C12Y207/11022—Cyclin-dependent kinase (2.7.11.22)
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0306—Animal model for genetic diseases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/42—Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/48—Vector systems having a special element relevant for transcription regulating transport or export of RNA, e.g. RRE, PRE, WPRE, CTE
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Virology (AREA)
- Veterinary Medicine (AREA)
- Epidemiology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicinal Preparation (AREA)
Abstract
AAV 캡시드, 및 기능적 CDKL5 (hCDKL5)를 인코딩하는 핵산 서열을 포함하는 벡터 게놈을 갖는 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. 또한, rAAV, rAAV를 포함하는 약제학적 조성물, 및 rAAV의 유효량을 이를 필요로 하는 대상체에게 투여하는 것에 의해 CDD에 걸린 대상체를 치료하거나, CDD의 증상을 완화시키거나, CDD의 진행을 지연시키는 방법이 제공된다.
Description
AAV 캡시드, 및 기능적 CDKL5 (hCDKL5)를 인코딩하는 핵산 서열을 포함하는 벡터 게놈을 갖는 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. 또한, rAAV, rAAV를 포함하는 약제학적 조성물, 및 rAAV의 유효량을 이를 필요로 하는 대상체에게 투여하는 것에 의해 CDD에 걸린 대상체를 치료하거나, CDD의 증상을 완화시키거나, CDD의 진행을 지연시키는 방법이 제공된다.
CDKL5 결핍 장애 (CDD)는 어린 아동을 침범하는 중증 신경발달 장애이다. 내재한 원인으로는 X-연관된 사이클린 의존성 키나제-유사 5 유전자의 돌연변이로 인한 CDKL5 단백질 발현의 결여 (남성의 멘델 유전, MIM: 300203; 이전에 STK9로서 알려짐)이고, EIEE2 (MIM: 300672), 영아 간질성 뇌병증의 형태 [Bahi-Buisson, N. et al.. Key clinical features to identify girls with CDKL5 mutations. Brain, 131: 2647-2661, doi:10.1093/brain/awn197 (2008)], 및 유아 연축 [Fehr, S. et al.. Eur. J. Hum. Genet., 21: 266-273, doi:10.1038/ejhg.2012.156 (2013); Kalscheuer, V. M. et al., American Journal of Human Genetics, 72: 1401-1411, doi:10.1086/375538 (2003); Tao, J. et al. American Journal of Human Genetics, 75: 1149-1154, doi:10.1086/426460 (2004); Weaving, L. S. et al., American Journal of Human Genetics, 75: 1079-1093, doi:10.1086/426462 (2004)]을 포함하는 일정 범위의 표현형을 유도한다. 특징적인 조기 발병 간질에 추가하여, 표현형은 반복적인 손 운동, 중증 정신운동 지체 및 일반 긴장저하증과 같은 많은 기타 특징도 포함할 수 있다. 출생 직후 증상의 발병은 CDKL5가 뇌 발달에서 중요한 역할을 담당함을 가리킨다. 또한, CDKL5는 성숙한 어른 신경계 내에서 발현된다. CDKL5는 세포 몸통의 핵과 세포질 및 수상돌기를 포함한 세포 전체에 걸쳐 발현된다.
CDKL5 유전자 돌연변이는 진행성 신경 발달 장애인 CDD의 대다수 사례의 원인, 및 여성에서 인지 무능의 가장 공통적인 원인 중 하나이다. CDD를 유발하는 유전적 돌연변이를 갖는 남성은 호된 방식으로 영향을 받는다. 이들 중 대부분은 출생 이전에 또는 영아 시절에 사망한다. 예로, ninds.nih.gov/Disorders/Patient-Caregiver-Education/Fact-Sheets/Rett-Syndrome-Fact-Sheet 및 omim.org/entry/312750 참조.
현재까지, CDD가 치유되지 않으며, 치료는 질환 증상을 완화시키는데 중점을 둔다. 많은 사례에서, 발작은 거의 통제되지 않고, 따라서 신규한 치료적 접근법을 찾아야 할 의학적 필요가 시급하다.
본원에서는 필요로 하는 대상체에서 CDKL5 결핍 장애 (CDD)를 치료하는데 유용한 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. rAAV는 역전된 말단 반복서열 (ITR), 및 표적 세포에서 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5 단백질을 인코딩하는 신규한 핵산 서열을 포함하고 벡터 게놈을 보유한다.
특정 구현예에서, CDD를 치료하는데 유용한 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. rAAV는 (a) AAV 캡시드; 및 (b) (a)의 AAV 캡시드에 포장된 벡터 게놈을 포함하고, 벡터 게놈은 역전된 말단 반복서열 (ITR), 및 중앙 신경계 세포에서 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5 (hCDKL5)를 인코딩하는 핵산 서열을 포함하며, hCDKL5 코딩 서열은 서열번호 3의 뉴클레오티드 699번 내지 3581번 (서열번호 22) 또는 서열번호 3의 뉴클레오티드 699번 내지 3581번 (서열번호 22)과 적어도 약 95% 일치하는 서열을 포함한다. 특정 구현예에서, 기능적 hCDKL5는 서열번호 2의 아미노산 서열을 갖는다. 특정 구현예에서, 조절 서열은 유비퀴틴 C (UbC) 프로모터를 포함한다. 일부 구현예에서, 조절 서열은 WPRE 요소를 포함한다.
특정 구현예에서, CDD를 치료하는데 유용한, 기능적 인간 CDKL5 (hCDKL5)가 hCDKL5 이소형 2인 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. 특정 구현예에서, CDD를 치료하는데 유용한, 기능적 인간 CDKL5 (hCDKL5)가 hCDKL5 이소형 3인 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. 특정 구현예에서, CDD를 치료하는데 유용한, 기능적 인간 CDKL5 (hCDKL5)가 hCDKL5 이소형 4인 재조합 아데노 관련 바이러스 (rAAV)가 제공된다.
특정 구현예에서, CDD를 치료하는데 유용한 rAAV는 AAV9 캡시드를 포함한다. 특정 구현예에서, CDD를 치료하는데 유용한 rAAV는 AAVhu68 캡시드를 포함한다. 특정 구현예에서, CDD를 치료하는데 유용한 rAAV는 AAVrh91 캡시드를 포함한다.
특정 구현예에서, CDKL5-2GS 코딩 서열은 서열번호 6을 인코딩하는 서열번호 24 또는 이와 적어도 95% 일치하는 서열이다. 특정 구현예에서, CDKL5-3GS 코딩 서열은 서열번호 8을 인코딩하는 서열번호 25 또는 이와 적어도 95% 일치하는 서열이다. 특정 구현예에서, CDKL5-4GS 코딩 서열은 서열번호 10을 인코딩하는 서열번호 26 또는 이와 적어도 95% 일치하는 서열이다.
특정 구현예에서, 벡터 게놈은 hCDKL5의 3' 미번역 영역에서 등쪽 뿌리 신경절 (drg) 특이적 miRNA 표적 서열의 적어도 2개의 일렬 반복서열을 포함하고, 적어도 2개의 일렬 반복서열은 동일하거나 상이하고, miR-183 또는 miR-182를 표적할 수 있는 적어도 제 1 miRNA 표적 서열 및 적어도 제 2 miRNA 표적 서열을 포함한다.
특정 구현예에서, rAAV 이외의 벡터가 본원에 기술된 발현 카세트의 전달에 사용된다. 벡터는 재조합 파보바이러스, 재조합 렌티바이러스, 재조합 레트로바이러스 또는 재조합 아데노바이러스; 또는 노출 DNA, 노출 RNA, 무기 입자, 지질 입자, 중합체 기반의 벡터 또는 키토산 기반의 제형물로부터 선택된 비-바이러스성 벡터일 수 있다.
특정 구현예에서, 본원에 기술된 rAAV의 스톡 또는 다른 바이러스성 벡터 및 수성 현탁 매질을 포함하는 조성물이 제공된다.
특정 구현예에서, CDD를 치료하는 방법으로서, 본원에 기술된 rAAV 또는 다른 벡터의 유효량을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는, 방법이 제공된다.
특정 구현예에서, 본원에 기술된 벡터를 생산하는데 유용한 rAAV 생산 시스템이 제공된다.
특정 구현예에서, 발현 카세트를 포함하는 벡터로서, 발현 카세트는 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5-co1 (hCDKL5)을 인코딩하는 핵산 서열을 포함하고, hCDKL5 코딩 서열은 서열번호 22 또는 서열번호 22와 적어도 약 95% 일치하는 서열인, 벡터가 제공된다. 특정 구현예에서, 발현 카세트를 포함하는 벡터로서, 발현 카세트는 hCDKL5-2GS 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5-2GS (hCDKL5-2GS)를 인코딩하는 핵산 서열을 포함하고, hCDKL5-2GS 코딩 서열은 서열번호 24 또는 서열번호 24와 적어도 약 95% 일치하는 서열인, 벡터가 제공된다. 특정 구현예에서, 발현 카세트를 포함하는 벡터로서, 발현 카세트는 hCDKL5-3GS 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5-3GS (hCDKL5-3GS)를 인코딩하는 핵산 서열을 포함하고, hCDKL5-3GS 코딩 서열은 서열번호 25 또는 서열번호 25와 적어도 약 95% 일치하는 서열인, 벡터가 제공된다. 특정 구현예에서, 발현 카세트를 포함하는 벡터로서, 발현 카세트는 hCDKL5-4GS 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5-4GS (hCDKL5-4GS)를 인코딩하는 핵산 서열을 포함하고, hCDKL5-2GS 코딩 서열은 서열번호 26 또는 서열번호 26과 적어도 약 95% 일치하는 서열인, 벡터가 제공된다.
특정 구현예에서, 벡터 게놈은 등쪽 뿌리 신경절 (drg) 특이적 miRNA 표적 서열의 적어도 2개의 일렬 반복서열을 추가로 포함한다. 특정 구현예에서, rAAV 또는 rAAV를 포함하는 조성물은 CDD의 증상을 완화시키고/거나 CDD의 진행을 지연시키도록 이를 필요로 하는 대상체에게 투여가능하다.
추가의 양태에서, 본원에 기술된 rAAV 또는 벡터 및 수성 현탁 매질을 포함하는 조성물이 본원에 제공된다.
또 다른 양태에서, CDD에 걸린 대상체를 치료하거나, CDD의 증상을 완화시키거나, CDD의 진행을 지연시키는 방법이 제공된다. 방법은 본원에 기술된 rAAV 또는 벡터의 유효량을 이를 필요로 하는 대상체에게 투여하는 것을 포함한다. 특정 구현예에서, 벡터 또는 rAAV는 대수조내 주사 (ICM)을 통해 환자에게 투여가능하다.
본 발명의 이들 및 다른 양태는 하기 본 발명의 상세한 설명으로부터 자명하다.
도 1a는 5' AAV 역전된 말단 반복서열 (ITR), 뉴런 프로모터, 조작된 인간 CDKL5 DNA 코딩 서열, 인핸서 및 폴리 A를 포함하는 발현 카세트, 및 3' AAV ITR을 포함하는 AAV CDKL5 벡터 게놈에 대한 AAV 벡터 설계를 나타낸다. 도 1b는 5' AAV ITR, 유니퀴틴 C (UbC) 프로모터, 조작된 인간 CDKL5 DNA 코딩 서열, drg 탈표적화 miRNA 및 폴리 A를 포함하는 발현 카세트, 및 3' AAV ITR을 포함하는 AAV CDKL5 벡터 게놈에 대한 AAV 벡터 설계를 나타낸다. 도 1c는 5' AAV ITR, 닭 베타-액틴 혼성 프로모터 (CBh), 조작된 인간 CDKL5 DNA 코딩 서열, drg 탈표적화 miRNA 및 폴리 A를 포함하는 발현 카세트, 및 3' AAV ITR을 포함하는 AAV CDKL5 벡터 게놈에 대한 AAV 벡터 설계를 나타낸다.
도 2a 및 도 2b는 CDKL5 항체 (S957D, 던디 대학교, UK)를 사용하여 평가된 바, 마우스 해마의 분석을 나타낸다. 마우스에게 신생아 뇌실내 주사를 통해 5 × 1010개 GC AAV-hSyn-CDKL5-1co.WPRE를 처리하였다. 도 2a는 PBS를 주사한 야생형 마우스, PBS를 주사한 KO 마우스 및 처리된 KO 마우스에서 CDKL5/튜불린 수준을 도시하는 웨스턴 블럿팅에 의해 CDKL5 발현을 나타낸다. 도 2b는 PBS를 주사한 야생형 마우스, PBS를 주사한 KO 마우스 및 처리된 KO 마우스에서 pS222EB2 (Baltussen et al., 2018) 수준을 사용하여 결정된 CDKL5 활성을 나타낸다.
도 3은 CDD 마우스 모델에서 AAV-hSyn-hCDKL5-1co.WPRE 주사 이후에 마우스 성숙 및 생존의 그래프를 나타낸다. 모든 주사된 마우스는 처리에서 생존하고, 체중이 증가하였다. 이들 마우스는 유해 결과의 명백한 징후를 드러내지 않았다.
도 4는 AAV-hSyn-CDKL5-1co.WPRE를 투여한 CDD 마우스에서 행동 평가로부터 나온 결과를 나타낸다. 이러한 도면은 위험 감수, 호기심 및 근심 사이의 균형감을 평가하는 상승된 제로 미로로부터 생성된다. 첫 번째 막대는 PBS를 주사한 야생형 마우스를 나타낸다. 야생형 마우스는 호기심이 많지만 주의력이 없고, 개방 시 제한된 시간을 보낸다. 중간 막대는 근심 감소를 나타내면서 개방 시 더 많은 시간을 보내는 PBS만 주사된 Cdkl5-ko 마우스를 나타내고, 이들은 개방 영역에 더 빈번하게 진입하였다. AAV-CDKL5 처리 이후, Cdkl5-ko 마우스의 행동은 야생형 행동으로 역전된다 (개방 영역에서 시간, 및 폐쇄 영역으로부터 개방 영역 내로 진입).
도 5a 및 도 5b는 AAV-hSyn-CDKL5-1co.WPRE를 투여한 CDD 마우스에서 행동 평가로부터 나온 결과를 나타낸다. 도 5a는 빔 파손/상자 대비 시간 (분)으로서 좌표화된, 개방 장소 운동장에서 마우스의 탐색 활동을 나타낸다. 점선은 호기심이 많지만 10분 이내에 장소를 탐색하고 진정하는 야생형 마우스를 나타내지만, 긴 대시선은 Cdkl5-ko 마우스가 탐색에 더 긴 시간이 걸리지만 궁극적으로 진정하는 것을 나타낸다. 대시선 및 점선은 AAV-CDKL5 처리 이후에 Cdkl5-ko 마우스의 활동이 감소되고, 전반적 활동 수준이 야생형을 닮아가는 것을 나타낸다. 도 5b는 마우스에 의한 총 빔 파손의 누적 활동 데이터를 나타내고, 이는 도 5a의 결과를 검증하고 있다.
도 6은 연속적 3일에 걸쳐 마우스의 운동 활동 및 민첩성 평가에서 측정된 하강까지의 잠복기 (초)의 그래프를 나타낸다. 야생형 마우스는 시간 경과 시 학습하면서 수행력을 증가시키는 것으로 관찰된다. Cdkl5-ko 마우스는 아마도 이전에 관찰된 초기 과다활동으로 인해 야생형 마우스와 비교하여 향상된 수행력을 나타낸다. AAV-hSyn-CDKL5-1co.WPRE. 처리 이후에, Cdkl5-ko 마우스의 행동은 야생형 행동으로 역전되지 않는다.
도 7a 및 도 7b는 해마 학습 및 기억 (Y-미로)의 결과를 나타낸다. 도 7a는 테스트 실험군 및 2가지 대조군에 대한 자발적인 변경 백분율을 나타난다. 도 7b는 테스트 실험군 및 2가지 대조군의 경우에 이동 거리 (m)을 나타낸다. 야생형 마우스는 최근에 방문하지 않은 미로 방면을 탐색하는 강한 경향성 (자발적인 변경 행동)을 나타낸다.
도 8a 내지 도 8d는 발현 이소형 1, 이소형 2, 이소형 3 또는 이소형 4에 대한 AAV.CDKL5 벡터 구조물의 CDKL5 발현 수준 또는 활성을 나타낸다. 도 8a는 비히클을 주사한 야생형 마우스 및 비히클을 주사한 녹아웃 마우스와 비교하여, AAV 벡터를 주사한 녹아웃 마우스 (5 × 1010개 GC, 신생 ICV)에서 CDKL5 이소형 1, 2, 3 및 4의 정량화된 발현 수준을 나타낸다. 도 8b는 처리된 야생형 마우스 (비히클 (PBS)이 주사됨), 녹아웃 마우스 (비히클 또는 AAV.CDKL5-1co가 주사됨)로부터 나온 조직의 웨스턴 블럿 분석에 의해 pS222EB2의 정량화된 신호로부터 결정된 CDKL5 활성을 나타낸다. 도 8c는 처리된 야생형 마우스 (비히클 (PBS)가 주사됨), 녹아웃 마우스 (비히클 또는 AAV.CDKL5 이소형 1, 2, 3 또는 4가 주사됨 (도 8a))로부터 나온 조직의 웨스턴 블럿 분석에 의해 pS222EB2의 정량화된 신호로부터 결정된 CDKL5 활성을 나타낸다. 도 8d는 KO 마우스에서 이소형 1의 정량화된 CDKL5 발현 수준을 나타낸다.
도 9a 내지 도 9f는 녹아웃 및 야생형 마우스에서 상이한 벡터 용량 (5 × 1010개 GC, 2.5 × 1010개 GC, 1 × 1010개 GC 및 5 × 109개 GC)을 비교하는 마우스 연구에서 AAV.CDKL5 유전자 요법의 치료 효능을 나타낸다. 도 9a는 5 × 1010개 GC 용량의 AAV.CDKL5 또는 PBS로 처리된 마우스에 대한 10주 기간에 걸친 체중 증가 (g)을 나타낸다. 도 9b는 2.5 × 1010개 GC 용량의 AAV.CDKL5 또는 PBS로 처리된 마우스에 대한 10주 기간에 걸친 체중 증가 (g)을 나타낸다. 도 9c는 미처리된 Cdkl5-ko 마우스와 비교하여 5 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 뒷다리 접기 테스트의 용량 의존적 결과를 나타낸다. 도 9d는 미처리된 Cdkl5-ko 마우스와 비교하여 2.5 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 뒷다리 접기 테스트의 용량 의존적 결과를 나타낸다. 도 9e는 미처리된 Cdkl5-ko 마우스와 비교하여 1 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 뒷다리 접기 테스트의 용량 의존적 결과를 나타낸다. 도 9c는 미처리된 Cdkl5-ko 마우스와 비교하여 6 × 109개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 뒷다리 접기 테스트의 용량 의존적 결과를 나타낸다. 야생형 마우스는 접기를 나타내지 않는 반면, KO 마우스는 현저한 접기를 나타내었다. 처리 이후에, KO 마우스는 접기의 유의한 감소를 나타내었다. 주사된 야생형 마우스는 영향을 받지 않았다.
도 10a 내지 도 10e는 CDD KO 마우스 연구에서 AAV.CDKL5 유전자 요법의 치료 효능을 나타낸다. 도 10a는 미처리된 Cdkl5-ko 마우스와 비교하여 5 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 둥지 건축 (둥지 품질/점수)의 결과를 나타낸다. 도 10b는 야생형 및 Cdkl5-ko 마우스와 비교하여 5 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에서 정규화 경향성의 대리석 매장 작업으로부터의 결과를 나타낸다. 도 10c는 미처리된 Cdkl5-ko 마우스와 비교하여 2.5 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 둥지 건축 (둥지 품질/점수)의 결과를 나타낸다. 도 10d는 야생형 및 미처리된 Cdkl5-ko 마우스와 비교하여 2.5 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에서 정규화된 대리석 매장 작업으로부터의 결과를 나타낸다. 도 10e는 미처리된 Cdkl5-ko 마우스와 비교하여 1 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 둥지 건축 (둥지 품질/점수)의 결과를 나타낸다.
도 11a 내지 도 11f는 개방 장소 활동 테스트에서 평가된 AAV.CDKL5가 처리된 KO 마우스에서 과다활동의 교정을 나타낸다. 도 11a는 5 × 1010개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 보행 활동/상자 대 시간 (5분 간격으로 30분)을 나타낸다. 도 11b는 5 × 1010개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 총 활동을 나타낸다. 도 11c는 2.5 × 1010개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 보행 활동/상자 대 시간 (5분 간격으로 30분)을 나타낸다. 도 11d는 2.5 × 1010개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 총 활동을 나타낸다. 도 11e는 6 × 109개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 보행 활동/상자 대 시간 (5분 간격으로 30분)을 나타낸다. 도 11f는 6 × 109개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 총 활동을 나타낸다. 위험 감수 증가의 정규화가 상승된 제로 미로에서 관찰되었으며, 해마 학습 결함의 정규화는 AAV.CDKL5 처리된 KO 마우스의 Y-미로에서 관찰된다.
도 12는 CDKL5 이소형 2 내지 4의 발현이 KO 마우스에서 5 × 1010개 GC 용량으로 평가될 때 뒷다리 접기 표현형의 유의한 교정을 제공함을 나타낸다.
도 13a 내지 도 13d는 5 × 1010개 GC 용량 이소형이 처리된 KO 마우스에서 강한 교정 경향성을 나타낸다. 도 13a는 5 × 1010개 GC 용량의 AAV.CDKL5 이소형 1로 처리된 KO 마우스에서 상승된 영역 활동을 나타낸다. 도 13b는 2.5 × 1010개 GC 용량의 AAV.CDKL5 이소형 1로 처리된 KO 마우스에서 상승된 영역 활동을 나타낸다. 도 13c는 5 × 1010개 GC 용량의 AAV.CDKL5 이소형 1로 처리된 KO 마우스에서 Y-미로에서의 활동을 나타낸다. 도 13d는 2.5 × 1010개 GC 용량의 AAV.CDKL5 이소형 1로 처리된 KO 마우스에서 Y-미로에서의 활동을 나타낸다.
도 14a 내지 도 14c는 녹아웃 마우스에 AAV.CDKL5-이소형 1로 처리한 이후에 뒷다리 접기의 성별 특이적 결과를 나타낸다. 도 14a는 수컷 녹아웃 마우스에게 AAV.CDKL5 이소형 1을 처리한 이후에 뒷다리 접기를 나타낸다. 도 14b는 암컷 녹아웃 마우스에게 AAV.CDKL5 이소형 1을 처리한 이후에 뒷다리 접기를 나타낸다. 반접합 수컷 및 이종접합 암컷은 둘 다 Cdkl5-ko 마우스에서 뒷다리 접기를 나타내었고, 이는 처리 이후에 유의하게 감소되었다. 야생형 실험군은 전혀 접기를 나타내지 않았다. 도 14c는 암컷 이종접합 마우스에서 고용량 (5 × 1010개 GC, 신생 ICV)으로 유의하게 개선된 보행 활동을 나타낸다.
도 15a 및 도 15b는 개방 장소에서 성별 특이적 결과 - 개방 장소 평가의 보행 활동을 나타낸다. 도 15a는 시간 경과 시 빔 파손으로서 X, Y축 좌표화된, AAV.CDKL5 이소형 1로 처리된 수컷 (KO) 마우스의 개방 장소 평가에서 보행 활동의 결과를 나타낸다. 도 15b는 시간 경과 시 빔 파손으로서 X, Y축 좌표화된, AAV.CDKL5 이소형 1로 처리된 암컷 (ht) 마우스의 개방 장소 평가에서 보행 활동의 결과를 나타낸다. 야생형으로 완전한 교정이 AAV.CDKL5 이소형 1로 처리된 수컷 (KO) 및 암컷 (ht) 마우스 둘 다의 경우 다수 시점에 대해 관찰되었다.
도 16a 및 도 16b는 AAV.CDKL5 이소형 1 벡터로 처리된 KO 마우스에서 성별 차이를 나타낸다. 도 16a는 개방 영역에서 소모 시간 (초)로서 좌표화된, AAV.CDKL5 이소형 1로 처리된 수컷 (KO) 마우스의 상승된 제로 미로 평가에서 개방 장소 - 보행 활동의 결과를 나타낸다. 도 16b는 개방 영역에서 소모 시간 (초)로서 좌표화된, AAV.CDKL5 이소형 1로 처리된 암컷 (ht) 마우스의 상승된 제로 미로 평가에서 개방 장소 - 보행 활동의 결과를 나타낸다. 위험 성향 행동이 수컷에서 관찰되고, 효과의 크기가 더욱 현저하다.
도 17은 NHP 연구로부터의 다양한 조직 시료에서 벡터 분포를 나타낸다 (1 × 1014개 GC 용량에 대한 예시). 그래프는 다양한 비-뉴런성 조직, 척수 경로 및 뇌 조직에서 gc/이배체 게놈의 rAAV.CDKL5를 제공한다. 등쪽 뿌리 신경절 (DRG)의 강한 형질도입이 관찰된다. 뇌 조직의 중간 내지 낮은 형질도입이 비-뉴런성 조직 내로의 일부 누출과 함께 관찰된다.
도 18은 NHP 연구에서 소뇌, 전두 피질, 후두 피질, 두정 피질 및 일시적 피질에서 관찰된 정량화된 hCDKL5 발현의 결과 (RT-qPCR에 의해 측정됨)를 나타낸다.
도 19a 및 도 19b는 야생형 마우스에게 CDKL5 유전자 요법 이후에 행동 변화를 측정하는 용량 증가의 연구 결과를 나타낸다. 도 19a는 PBS로 처리된 대조군 마우스와 비교하여, 7.5 × 1010개 GC 및 1 × 1011개 GC의 AAV로 주사된 야생형 마우스에서 뒷다리 접기 중증도의 유의한 점수 변화가 없음을 나타낸다. 도 19b는 PBS로 처리된 대조군 마우스와 비교하여, 7.5 × 1010개 GC 및 1 × 1011개 GC의 AAV로 주사된 야생형 마우스에서 뒷다리 접기 중증도의 유의한 점수 변화가 없음을 나타낸다.
도 2a 및 도 2b는 CDKL5 항체 (S957D, 던디 대학교, UK)를 사용하여 평가된 바, 마우스 해마의 분석을 나타낸다. 마우스에게 신생아 뇌실내 주사를 통해 5 × 1010개 GC AAV-hSyn-CDKL5-1co.WPRE를 처리하였다. 도 2a는 PBS를 주사한 야생형 마우스, PBS를 주사한 KO 마우스 및 처리된 KO 마우스에서 CDKL5/튜불린 수준을 도시하는 웨스턴 블럿팅에 의해 CDKL5 발현을 나타낸다. 도 2b는 PBS를 주사한 야생형 마우스, PBS를 주사한 KO 마우스 및 처리된 KO 마우스에서 pS222EB2 (Baltussen et al., 2018) 수준을 사용하여 결정된 CDKL5 활성을 나타낸다.
도 3은 CDD 마우스 모델에서 AAV-hSyn-hCDKL5-1co.WPRE 주사 이후에 마우스 성숙 및 생존의 그래프를 나타낸다. 모든 주사된 마우스는 처리에서 생존하고, 체중이 증가하였다. 이들 마우스는 유해 결과의 명백한 징후를 드러내지 않았다.
도 4는 AAV-hSyn-CDKL5-1co.WPRE를 투여한 CDD 마우스에서 행동 평가로부터 나온 결과를 나타낸다. 이러한 도면은 위험 감수, 호기심 및 근심 사이의 균형감을 평가하는 상승된 제로 미로로부터 생성된다. 첫 번째 막대는 PBS를 주사한 야생형 마우스를 나타낸다. 야생형 마우스는 호기심이 많지만 주의력이 없고, 개방 시 제한된 시간을 보낸다. 중간 막대는 근심 감소를 나타내면서 개방 시 더 많은 시간을 보내는 PBS만 주사된 Cdkl5-ko 마우스를 나타내고, 이들은 개방 영역에 더 빈번하게 진입하였다. AAV-CDKL5 처리 이후, Cdkl5-ko 마우스의 행동은 야생형 행동으로 역전된다 (개방 영역에서 시간, 및 폐쇄 영역으로부터 개방 영역 내로 진입).
도 5a 및 도 5b는 AAV-hSyn-CDKL5-1co.WPRE를 투여한 CDD 마우스에서 행동 평가로부터 나온 결과를 나타낸다. 도 5a는 빔 파손/상자 대비 시간 (분)으로서 좌표화된, 개방 장소 운동장에서 마우스의 탐색 활동을 나타낸다. 점선은 호기심이 많지만 10분 이내에 장소를 탐색하고 진정하는 야생형 마우스를 나타내지만, 긴 대시선은 Cdkl5-ko 마우스가 탐색에 더 긴 시간이 걸리지만 궁극적으로 진정하는 것을 나타낸다. 대시선 및 점선은 AAV-CDKL5 처리 이후에 Cdkl5-ko 마우스의 활동이 감소되고, 전반적 활동 수준이 야생형을 닮아가는 것을 나타낸다. 도 5b는 마우스에 의한 총 빔 파손의 누적 활동 데이터를 나타내고, 이는 도 5a의 결과를 검증하고 있다.
도 6은 연속적 3일에 걸쳐 마우스의 운동 활동 및 민첩성 평가에서 측정된 하강까지의 잠복기 (초)의 그래프를 나타낸다. 야생형 마우스는 시간 경과 시 학습하면서 수행력을 증가시키는 것으로 관찰된다. Cdkl5-ko 마우스는 아마도 이전에 관찰된 초기 과다활동으로 인해 야생형 마우스와 비교하여 향상된 수행력을 나타낸다. AAV-hSyn-CDKL5-1co.WPRE. 처리 이후에, Cdkl5-ko 마우스의 행동은 야생형 행동으로 역전되지 않는다.
도 7a 및 도 7b는 해마 학습 및 기억 (Y-미로)의 결과를 나타낸다. 도 7a는 테스트 실험군 및 2가지 대조군에 대한 자발적인 변경 백분율을 나타난다. 도 7b는 테스트 실험군 및 2가지 대조군의 경우에 이동 거리 (m)을 나타낸다. 야생형 마우스는 최근에 방문하지 않은 미로 방면을 탐색하는 강한 경향성 (자발적인 변경 행동)을 나타낸다.
도 8a 내지 도 8d는 발현 이소형 1, 이소형 2, 이소형 3 또는 이소형 4에 대한 AAV.CDKL5 벡터 구조물의 CDKL5 발현 수준 또는 활성을 나타낸다. 도 8a는 비히클을 주사한 야생형 마우스 및 비히클을 주사한 녹아웃 마우스와 비교하여, AAV 벡터를 주사한 녹아웃 마우스 (5 × 1010개 GC, 신생 ICV)에서 CDKL5 이소형 1, 2, 3 및 4의 정량화된 발현 수준을 나타낸다. 도 8b는 처리된 야생형 마우스 (비히클 (PBS)이 주사됨), 녹아웃 마우스 (비히클 또는 AAV.CDKL5-1co가 주사됨)로부터 나온 조직의 웨스턴 블럿 분석에 의해 pS222EB2의 정량화된 신호로부터 결정된 CDKL5 활성을 나타낸다. 도 8c는 처리된 야생형 마우스 (비히클 (PBS)가 주사됨), 녹아웃 마우스 (비히클 또는 AAV.CDKL5 이소형 1, 2, 3 또는 4가 주사됨 (도 8a))로부터 나온 조직의 웨스턴 블럿 분석에 의해 pS222EB2의 정량화된 신호로부터 결정된 CDKL5 활성을 나타낸다. 도 8d는 KO 마우스에서 이소형 1의 정량화된 CDKL5 발현 수준을 나타낸다.
도 9a 내지 도 9f는 녹아웃 및 야생형 마우스에서 상이한 벡터 용량 (5 × 1010개 GC, 2.5 × 1010개 GC, 1 × 1010개 GC 및 5 × 109개 GC)을 비교하는 마우스 연구에서 AAV.CDKL5 유전자 요법의 치료 효능을 나타낸다. 도 9a는 5 × 1010개 GC 용량의 AAV.CDKL5 또는 PBS로 처리된 마우스에 대한 10주 기간에 걸친 체중 증가 (g)을 나타낸다. 도 9b는 2.5 × 1010개 GC 용량의 AAV.CDKL5 또는 PBS로 처리된 마우스에 대한 10주 기간에 걸친 체중 증가 (g)을 나타낸다. 도 9c는 미처리된 Cdkl5-ko 마우스와 비교하여 5 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 뒷다리 접기 테스트의 용량 의존적 결과를 나타낸다. 도 9d는 미처리된 Cdkl5-ko 마우스와 비교하여 2.5 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 뒷다리 접기 테스트의 용량 의존적 결과를 나타낸다. 도 9e는 미처리된 Cdkl5-ko 마우스와 비교하여 1 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 뒷다리 접기 테스트의 용량 의존적 결과를 나타낸다. 도 9c는 미처리된 Cdkl5-ko 마우스와 비교하여 6 × 109개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 뒷다리 접기 테스트의 용량 의존적 결과를 나타낸다. 야생형 마우스는 접기를 나타내지 않는 반면, KO 마우스는 현저한 접기를 나타내었다. 처리 이후에, KO 마우스는 접기의 유의한 감소를 나타내었다. 주사된 야생형 마우스는 영향을 받지 않았다.
도 10a 내지 도 10e는 CDD KO 마우스 연구에서 AAV.CDKL5 유전자 요법의 치료 효능을 나타낸다. 도 10a는 미처리된 Cdkl5-ko 마우스와 비교하여 5 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 둥지 건축 (둥지 품질/점수)의 결과를 나타낸다. 도 10b는 야생형 및 Cdkl5-ko 마우스와 비교하여 5 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에서 정규화 경향성의 대리석 매장 작업으로부터의 결과를 나타낸다. 도 10c는 미처리된 Cdkl5-ko 마우스와 비교하여 2.5 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 둥지 건축 (둥지 품질/점수)의 결과를 나타낸다. 도 10d는 야생형 및 미처리된 Cdkl5-ko 마우스와 비교하여 2.5 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에서 정규화된 대리석 매장 작업으로부터의 결과를 나타낸다. 도 10e는 미처리된 Cdkl5-ko 마우스와 비교하여 1 × 1010개 GC 용량의 AAV.CDKL5 처리된 실험군에 대한 둥지 건축 (둥지 품질/점수)의 결과를 나타낸다.
도 11a 내지 도 11f는 개방 장소 활동 테스트에서 평가된 AAV.CDKL5가 처리된 KO 마우스에서 과다활동의 교정을 나타낸다. 도 11a는 5 × 1010개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 보행 활동/상자 대 시간 (5분 간격으로 30분)을 나타낸다. 도 11b는 5 × 1010개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 총 활동을 나타낸다. 도 11c는 2.5 × 1010개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 보행 활동/상자 대 시간 (5분 간격으로 30분)을 나타낸다. 도 11d는 2.5 × 1010개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 총 활동을 나타낸다. 도 11e는 6 × 109개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 보행 활동/상자 대 시간 (5분 간격으로 30분)을 나타낸다. 도 11f는 6 × 109개 GC 용량의 AAV.CDKL5 처리된 KO 마우스에서 총 활동을 나타낸다. 위험 감수 증가의 정규화가 상승된 제로 미로에서 관찰되었으며, 해마 학습 결함의 정규화는 AAV.CDKL5 처리된 KO 마우스의 Y-미로에서 관찰된다.
도 12는 CDKL5 이소형 2 내지 4의 발현이 KO 마우스에서 5 × 1010개 GC 용량으로 평가될 때 뒷다리 접기 표현형의 유의한 교정을 제공함을 나타낸다.
도 13a 내지 도 13d는 5 × 1010개 GC 용량 이소형이 처리된 KO 마우스에서 강한 교정 경향성을 나타낸다. 도 13a는 5 × 1010개 GC 용량의 AAV.CDKL5 이소형 1로 처리된 KO 마우스에서 상승된 영역 활동을 나타낸다. 도 13b는 2.5 × 1010개 GC 용량의 AAV.CDKL5 이소형 1로 처리된 KO 마우스에서 상승된 영역 활동을 나타낸다. 도 13c는 5 × 1010개 GC 용량의 AAV.CDKL5 이소형 1로 처리된 KO 마우스에서 Y-미로에서의 활동을 나타낸다. 도 13d는 2.5 × 1010개 GC 용량의 AAV.CDKL5 이소형 1로 처리된 KO 마우스에서 Y-미로에서의 활동을 나타낸다.
도 14a 내지 도 14c는 녹아웃 마우스에 AAV.CDKL5-이소형 1로 처리한 이후에 뒷다리 접기의 성별 특이적 결과를 나타낸다. 도 14a는 수컷 녹아웃 마우스에게 AAV.CDKL5 이소형 1을 처리한 이후에 뒷다리 접기를 나타낸다. 도 14b는 암컷 녹아웃 마우스에게 AAV.CDKL5 이소형 1을 처리한 이후에 뒷다리 접기를 나타낸다. 반접합 수컷 및 이종접합 암컷은 둘 다 Cdkl5-ko 마우스에서 뒷다리 접기를 나타내었고, 이는 처리 이후에 유의하게 감소되었다. 야생형 실험군은 전혀 접기를 나타내지 않았다. 도 14c는 암컷 이종접합 마우스에서 고용량 (5 × 1010개 GC, 신생 ICV)으로 유의하게 개선된 보행 활동을 나타낸다.
도 15a 및 도 15b는 개방 장소에서 성별 특이적 결과 - 개방 장소 평가의 보행 활동을 나타낸다. 도 15a는 시간 경과 시 빔 파손으로서 X, Y축 좌표화된, AAV.CDKL5 이소형 1로 처리된 수컷 (KO) 마우스의 개방 장소 평가에서 보행 활동의 결과를 나타낸다. 도 15b는 시간 경과 시 빔 파손으로서 X, Y축 좌표화된, AAV.CDKL5 이소형 1로 처리된 암컷 (ht) 마우스의 개방 장소 평가에서 보행 활동의 결과를 나타낸다. 야생형으로 완전한 교정이 AAV.CDKL5 이소형 1로 처리된 수컷 (KO) 및 암컷 (ht) 마우스 둘 다의 경우 다수 시점에 대해 관찰되었다.
도 16a 및 도 16b는 AAV.CDKL5 이소형 1 벡터로 처리된 KO 마우스에서 성별 차이를 나타낸다. 도 16a는 개방 영역에서 소모 시간 (초)로서 좌표화된, AAV.CDKL5 이소형 1로 처리된 수컷 (KO) 마우스의 상승된 제로 미로 평가에서 개방 장소 - 보행 활동의 결과를 나타낸다. 도 16b는 개방 영역에서 소모 시간 (초)로서 좌표화된, AAV.CDKL5 이소형 1로 처리된 암컷 (ht) 마우스의 상승된 제로 미로 평가에서 개방 장소 - 보행 활동의 결과를 나타낸다. 위험 성향 행동이 수컷에서 관찰되고, 효과의 크기가 더욱 현저하다.
도 17은 NHP 연구로부터의 다양한 조직 시료에서 벡터 분포를 나타낸다 (1 × 1014개 GC 용량에 대한 예시). 그래프는 다양한 비-뉴런성 조직, 척수 경로 및 뇌 조직에서 gc/이배체 게놈의 rAAV.CDKL5를 제공한다. 등쪽 뿌리 신경절 (DRG)의 강한 형질도입이 관찰된다. 뇌 조직의 중간 내지 낮은 형질도입이 비-뉴런성 조직 내로의 일부 누출과 함께 관찰된다.
도 18은 NHP 연구에서 소뇌, 전두 피질, 후두 피질, 두정 피질 및 일시적 피질에서 관찰된 정량화된 hCDKL5 발현의 결과 (RT-qPCR에 의해 측정됨)를 나타낸다.
도 19a 및 도 19b는 야생형 마우스에게 CDKL5 유전자 요법 이후에 행동 변화를 측정하는 용량 증가의 연구 결과를 나타낸다. 도 19a는 PBS로 처리된 대조군 마우스와 비교하여, 7.5 × 1010개 GC 및 1 × 1011개 GC의 AAV로 주사된 야생형 마우스에서 뒷다리 접기 중증도의 유의한 점수 변화가 없음을 나타낸다. 도 19b는 PBS로 처리된 대조군 마우스와 비교하여, 7.5 × 1010개 GC 및 1 × 1011개 GC의 AAV로 주사된 야생형 마우스에서 뒷다리 접기 중증도의 유의한 점수 변화가 없음을 나타낸다.
본원에서는 CDD를 치료하기 위한 조성물 및 방법이 제공된다. AAV 캡시드 (예로, AAVhu68 또는 AAV-PHP.B) 및 이에 포장된 기능적 인간 사이클린 의존성 키나제 유사 5 (hCDKL5)를 인코딩하는 벡터 게놈을 갖는 재조합 아데노 관련 바이러스 (rAAV)의 유효량이 필요로 하는 대상체에게 전달된다.
I. 인간 CDKL5
인간 사이클린 의존성 키나제 유사 5 (CDKL5, CFAP247, 세린/트레오닌 키나제 9, STK9으로도 알려짐; 유니프로트 #076039) 유전자는 X 염색체의 짧은 (p) 팔 상의 위치 22.13번에 원래 위치한다. CDKL5 단백질의 N-말단은 다른 단백질의 활성을 변화시키는 효소인, 키나제로서 작용한다. CDKL5에 대한 다수의 직접적 기질이 확인되어 왔다 (Baltussen et al., 2018; Munoz et al., 2018). CDKL5 C-말단의 기능은 알려져 있지 않다.
본원에 사용된 바, 기능적 hCDKL5 단백질은 동물 모델 또는 환자에서 CDD의 증상을 완화시키거나 이의 진행을 지연시킬 수 있는, CDD 및/또는 CDKL5 단백질의 전달 또는 발현과 연관되지 않는 CDKL5 단백질의 이소형, 천연 변이체, 변이체, 이형성, 절단을 말한다. OMIM #300203 참조, 각 웹페이지는 본원에 이의 전문이 참고문헌으로 통합된다. 특정 구현예에서, 기능적 hCDKL5는 서열번호 2의 아미노산 서열 (이소형 1) 또는 이와 적어도 약 90% (예로, 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%) 일치하는 아미노산 서열을 갖는다. 특정 구현예에서, 기능적 hCDKL5는 서열번호 19의 아미노산 서열 (이소형 2) 또는 이와 적어도 약 90% (예로, 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%) 일치하는 아미노산 서열을 갖는다. 특정 구현예에서, 기능적 hCDKL5는 서열번호 20의 아미노산 서열 (이소형 3) 또는 이와 적어도 약 90% (예로, 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%) 일치하는 아미노산 서열을 갖는다. 특정 구현예에서, 기능적 hCDKL5는 서열번호 21의 아미노산 서열 (이소형 4) 또는 이와 적어도 약 90% (예로, 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%) 일치하는 아미노산 서열을 갖는다. 특정 구현예에서, 기능적 hCDKL5는 메틸-CpG 결합 도메인 (MBD) 및 NCoR/SMRT 상호작용 도메인 (NID)의 서열을 포함하는 절단된 hCDKL5이다. 본원에 이의 전문이 참고문헌으로 통합되는 국제특허출원 제 WO 2018172795 A1호 참조.
특정 구현예에서, 기능적 hCDKL5 단백질은 동물 모델에서 CDD의 증상을 완화시키거나 이의 진행을 지연시킨다. 예시화된 동물 모델 중 하나는 CDKL5-ko 마우스이다. 다른 적합한 모델은 본원에 기술되어 있다.
CDD 증상 또는 진행은 생존 플롯 (예로, 카프란-마이어 생존 플롯), 체중의 모니터링 및 행동 변화의 관찰 (예를 들면, 뒷다리 접기, 개방 장소 검정법 (운동 기능), 상승된 영역 미로 (근심/위험 대 탐색), Y-미로 (학습 및 기억/해마), 대리석 매장 검정법 (타고난 행동 및 이동), 둥지 형성 (타고난 사회적 행동) 및 회전 막대 검정법 (운동 기능, 조정)을 포함하나 이에 한정되지 않는 다양한 검정법/방법을 사용하여 평가될 수 있다. 특정 구현예에서, 동물 모델에서 기능적 hCDKL5 단백질의 투여 또는 발현은, 상응하는 야생형 동물에서 획득된 결과의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 100% 또는 100% 이상인 검정 결과에 의해 확인된 CDD 증상의 완화 또는 CDD 진행의 지연을 유도한다. 특정 구현예에서, CDD 동물 모델에서 기능적 hCDKL5 단백질의 투여 또는 발현은, 상응하는 미처리된 CDD 동물로부터 획득된 결과의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 100% 또는 100% 이상인 개선된 검정 결과에 의해 확인된 CDD 증상의 완화 또는 CDD 진행의 지연을 유도한다.
본원에서는 hCDKL5 코딩 서열 또는 CDKL5 코딩 서열로 명명되는 기능적 hCDKL5 단백질을 인코딩하는 핵산 서열이 제공된다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 3 또는 서열번호 3과 적어도 약 95% 일치하는 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 2 (CDKL5, CDKL5co, CDKL5-1 또는 CDKL5-1co로 지칭됨) 또는 NCBI 기준 서열, 아미노산 서열 NP_001032420.1 (서열번호 19)을 인코딩하는 NM_ 001037343.1 (CDKL5 또는 CDKL5e1로 지칭됨; 서열번호 16), 아미노산 서열 NP_001310218.1 (서열번호 20)을 인코딩하는 NM_001323289.2 (서열번호 17), 및 아미노산 서열 NP_003150.1 (서열번호 21)을 인코딩하는 NM_003159.2 (서열번호 18), 또는 이와 적어도 약 70% (예로, 적어도 약 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%) 일치하는 핵산 서열로부터 선택된다. NCBI 기준 서열 각각은 본원에 이의 전문이 참고문헌으로 통합된다. 특정 구현예에서, hCDKL5 코딩 서열은 변형되거나 조작된다 (hCDKL5, hCDKL5co, CDKL5-1 또는 CDKL5-1co). 변형된 또는 조작된 서열은 NCBI 기준 서열과 약 70% 미만 (예로, 약 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%)의 일치도를 공유한다.
특정 구현예에서, hCDKL5 코딩 서열은 서열번호 22 또는 이와 적어도 약 70% (예로, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 적어도 약 99.9%) 일치하는 핵산 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 24 또는 이와 적어도 약 70% (예로, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 적어도 약 99.9%) 일치하는 핵산 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 25 또는 이와 적어도 약 70% (예로, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 적어도 약 99.9%) 일치하는 핵산 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 26 또는 이와 적어도 약 70% (예로, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 적어도 약 99.9%) 일치하는 핵산 서열이다.
특정 구현예에서, hCDKL5 코딩 서열은 서열번호 37 또는 서열번호 37과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 38 또는 서열번호 38과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 39 또는 서열번호 39와 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 40 또는 서열번호 40과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 41 또는 서열번호 41과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 42 또는 서열번호 42와 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 43 또는 서열번호 43과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 44 또는 서열번호 44와 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 45 또는 서열번호 45와 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 46 또는 서열번호 46과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 47 또는 서열번호 47과 적어도 약 95% 일치하는 서열의 조작된 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 48 또는 서열번호 48과 적어도 약 95% 일치하는 서열의 조작된 서열이다.
본원에 사용된 "핵산"은 RNA, DNA 또는 이들의 변형일 수 있고, 단일가닥 또는 이중가닥일 수 있으며, 예를 들면 관심있는 단백질을 인코딩하는 핵산, 올리고뉴클레오티드, 핵산 유사체, 예를 들면 펩티드-핵산 (PNA), 유사상보적 PNA (pc-PNA), 잠긴 핵산 (LNA) 등을 포함하는 군으로부터 선택될 수 있다. 예를 들면, 이러한 핵산 서열은 예로 전사 억제인자로서 작용하는 단백질을 인코딩하는 핵산, 안티센스 분자, 리보자임, 예로 RNAi, shRNAi, siRNA, 마이크로 RNAi (mRNAi), 안티센스 올리고뉴클레오티드 등에 한정되지 않는 작은 억제성 핵산 분자를 포함하나 이에 한정되지 않는다.
핵산 서열의 맥락에서 용어 "일치도 백분율 (%)", "서열 일치도", "서열 일치도 백분율" 또는 "일치하는 백분율"은 2가지 서열에서 상응성으로 정렬될 때 동일한 잔기를 말한다. 서열 일치도 비교의 길이는 바람직하게 게놈의 전장, 유전자 코딩 서열의 전장 또는 적어도 약 500개 내지 5,000개 뉴클레오티드의 단편에 걸쳐질 수 있다. 그러나, 더 작은 단편 중의 일치도, 예로 적어도 약 7개의 뉴클레오티드, 보통 적어도 약 20개 내지 24개의 뉴클레오티드, 적어도 약 28개 내지 32개의 뉴클레오티드, 적어도 약 36개 이상의 뉴클레오티드도 바람직할 수 있다.
일치도 백분율은 단백질의 전장, 폴리펩티드, 약 32개의 아미노산, 약 330개의 아미노산 또는 이들의 펩티드 단편에 걸친 아미노산 서열, 또는 상응하는 핵산 서열 코딩 서열에 대해 쉽게 결정될 수 있다. 적합한 아미노산 단편은 적어도 약 8개 아미노산의 길이일 수 있으며, 최대 약 700개의 아미노산일 수 있다. 일반적으로, 2가지의 상이한 서열 사이의 "일치도", "상동성" 또는 "유사도"를 언급할 때, "일치도", "상동성" 또는 "유사도"는 "정렬된" 서열을 기준으로 결정된다. "정렬된" 서열 또는 "정렬"은 기준 서열과 비교하여 염기 또는 아미노산을 결실하거나 첨가하는 교정을 종종 포함하는 다수의 핵산 서열 또는 단백질 (아미노산) 서열을 말한다.
정렬은 임의의 다양한 공개적으로 사용가능한 또는 구입가능한 다수의 서열 정렬 프로그램을 사용하여 수행된다. 서열 정렬 프로그램, 예로 "크러스탈 X", "크러스탈 오메가", "MAP", "PIMA", "MSA", "블록메이커", "MEME" 및 "매치-박스" 프로그램이 아미노산 서열에 사용가능하다. 일반적으로, 임의의 이들 프로그램은 당업자라면 필요한 경우 이들 설정을 변경시킬 수 있지만, 디폴트 설정으로 사용된다. 대안적으로, 당업자라면 기준이 된 알고리즘 및 프로그램에 의해 제공된 수준과 적어도 같은 일치도 또는 정렬을 제공하는 또 다른 알고리즘 또는 컴퓨터 프로그램을 사용할 수 있다. 예로, J. D. Thomson et al., Nucl. Acids Res., "A comprehensive comparison of multiple sequence alignments", 27(13): 2682-2690 (1999) 참조.
다수의 서열 정렬 프로그램이 핵산 서열에도 사용가능하다. 이러한 프로그램의 예는 "크러스탈 W", "크러스탈 오메가", "CAP 서열 어셈블리", "BLAST", "MAP" 및 "MEME"를 포함하고, 이는 인터넷 상의 웹 서버를 통해 접근가능하다. 이러한 프로그램의 다른 출처는 당업자에게 공지되어 있다. 대안적으로, 벡터 NTI도 사용될 수 있다. 또한, 뉴클레오티드 서열 일치도를 측정하는데 사용될 수 있는, 상기 설명된 프로그램에 포함된 것을 포함하는 당해 기술분야에 공지된 알고리즘이 많이 있다. 또 다른 예로서, 폴리뉴클레오티드 서열이 GCG 버전 6.1의 프로그램, FastaTM를 사용하여 비교될 수 있다. FastaTM은 질문 및 검색 서열 사이에 최고 중첩 영역의 정렬 및 서열 일치도 백분율을 제공한다. 예를 들면, 핵산 서열 사이의 서열 일치도 백분율은, 본원에 참고문헌으로 통합되는 GCG 버전 6.1에 제공되는 이의 디폴트 매개변수 (점수매김 매트릭스를 위한 단어 크기 6 및 NOPAM 인자)와 함께 FastaTM를 사용하여 결정될 수 있다.
Ⅱ. 발현 카세트
본원에서는 표적 세포에서 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 hCDKL5 코딩 서열을 포함하는, 발현 카세트로도 명명되는 핵산 서열이 제공된다. 본원에 사용된 바, "발현 카세트"는 코딩 서열 (예로, CDKL5 코딩 서열) 및 이와 작동가능하게 연결된 조절 서열을 포함하는 핵산 분자를 말한다. 특정 구현예에서, 벡터 게놈은 둘 이상의 발현 카세트를 포함한다. 용어 "트랜스 유전자"는 표적 세포 내에 삽입된 외인성 출처로부터 나온 DNA 서열을 말하고, 전형적으로 트랜스 유전자는 산물 (예로, CDKL5)를 인코딩한다. 전형적으로, 이러한 바이러스성 벡터 내에 포장되는 발현 벡터는 본원에 기술된 바이러스성 게놈의 포장화 신호에 의해 연접된 유전자 산물에 대한 코딩 서열 및 본원에 기술된 것과 같은 다른 발현 조절 서열을 포함한다. 필요한 조절 서열은 표적 세포에서 전사, 번역 및/또는 발현을 허용하는 방식으로 hCDKL5 코딩 서열에 작동가능하게 연결된자. 본원에 사용된 바, "작동가능하게 연결된" 서열은 hCDKL5 코딩 서열과 인접하는 전사, 번역 및/또는 발현을 조정하는 서열, 및 hCDKL5 코딩 서열을 조절하도록 트랜스로 또는 일정 거리에서 작동하는 조절 서열을 포함한다. 발현 카세트는 유전자 서열의 상류 (5') 조절 서열, 예로 프로모터, 인핸서, 인트론 등 중 하나 이상 및 하나 이상의 인핸서, 또는 유전자 서열의 하류 (3') 조절 서열, 예로 다른 요소 중에 특히 폴리아데닐화 부위를 포함하는 미번역 영역 (3' UTR)을 포함할 수 있다. 이러한 조절 서열은 전형적으로, 예로 프로모터, 인핸서, 인트론, 코작 서열, 폴리아데닐화 서열 및 TATA 신호 중 하나 이상을 포함한다. 특정 구현예에서, 프로모터는 조직 특이적 프로모터, 예로 CNS 특이적 또는 뉴런 특이적 프로모터이다. 특정 구현예에서, 프로모터는 인간 시냅신 프로모터 (서열번호 23)이다. 특정 구현예에서, 추가적인 또는 대안적인 뉴런 특이적 프로모터 서열은 뉴런 특이적 에놀라제 (NSE) 프로모터 (Andersen et al., (1993) Cell. Mol. Neurobiol., 13: 503-15), 신경필라멘트 경쇄 유전자 프로모터 (Piccioli et al., (1991) Proc. Natl. Acad. Sci. USA, 88: 5611-5), 뉴런 특이적 vgf 유전자 프로모터 (Piccioli et al., (1995) Neuron, 15: 373-84) 및/또는 기타로부터 선택될 수 있다.
특정 구현예에서, 인간 시냅신 프로모터는 본원에서 hSyn 또는 Syn으로서 명명된, 서열 (예로, 서열번호 1, 3, 5, 7, 9 또는 서열번호 23의 뉴클레오티드 213번 내지 678번)을 갖는다.
다른 구현예에서, 프로모터는 전신발현 프로모터, 예로 사이토메갈로바이러스 인핸서 (CB7) 프로모터, 인간 신장 개시인자 1 알파 (EF1a) 프로모터, 인간 유비퀴틴 C (UbC) 프로모터이다. 특정 구현예에서, 조절 서열은 중앙 신경계 (CNS) 세포에서 hCDKL5 발현을 안내한다.
특정 구현예에서, 표적 세포는 중앙 신경계 세포일 수 있다. 특정 구현예에서, 표적 세포는여기 뉴런, 억제성 뉴런, 교아 세포, 피질 세포, 전두 피질 세퍼, 뇌 피질 세퍼, 척수 세포 중 하나 이상이다. 특정 구현예에서, 표적 세포는 말단 신경계 (PNS) 세포, 예를 들면 망막 세포이다. 또한, 신경계로부터 나온 세포 이외의 기타 세포, 예컨대 단핵구, B 림프구, T 림프구, NK 세포, 림프절 세포, 편도 세포, 골수 중간엽 세포, 줄기 세포, 골수 줄기 세포, 심장 세포, 표피 세포, 식도 세포, 위 세포, 태아 절개 세포, 결장 세포, 직장 세포, 간 세포, 신장 세포, 폐 세포, 침샘 세포, 갑상샘 세포, 부신 세로 유방 세포, 췌장 세포, 랑게르한스샘 세포, 담낭 세포, 전립샘 세포, 뇨방광 세포, 피부 세포, 자궁 세포, 자궁경부 세포, 고환 세포 또는 CDD에 걸리지 않은 대상체에서 기능적 CDKL5 단백질을 발현하는 임의의 다른 세포로부터 선택될 수 있다.
특정 구현예에서, 추가적인 또는 대안적인 프로모터 서열이, 예로 선택된 5' ITR 서열 및 코딩 서열 사이에 위치하는 발현 제어 서열 (조절 서열)의 일부로서 포함될 수 있다. 전신발현 프로모터, 조절가능한 프로모터 (예로, 국제특허출원 제 WO 2011/126808호 및 제 WO 2013/04943호 참조), 조직 특이적 프로모터 또는 생리적 자극에 대해 반응하는 프로모터는 본원에 기술된 벡터에 사용될 수 있다. 프로모터(들)은 상이한 출처, 예로 인간 사이토메갈로바이러 (CMV) 극초기 인핸서/프로모터, SV40 초기 인핸서/프로모터, JC 폴리모바이러스 프로모터, 미엘린 염기성 프로모터 (MBP) 또는 교아 피브릴 산성 단백질 (GFAP) 프로모터, 헤르페스 심플렉스 바이러스 (HSV-1) 잠복 관련 프로모터 (LAP), 라우육종 바이러스 (RSV) 긴 말단 반복서열 (LTR) 프로모터, 뉴런 특이적 프로모터 (NSE), 혈소판 유래 성장인자 (PDGF) 프로모터, hSYN, 멜라닌 농축 호르몬 (MCH) 프로모터, CBA, 기질 금속단백질 프로모터 (MPP) 및 닭 베타-액틴 프로모터로부터 선택될 수 있다.
프로모터에 추가하여, 벡터는 하나 이상의 적절한 전사 개시 서열, 전사 종결 서열, 인핸서 서열, 효율적인 RNA 가공 신호, 예컨대 스플라이싱 및 폴리아데닐화 신호 (폴리 A), 세포질 mRNA를 안정화하는 서열, 예를 들면 WPRE, 번역 효율을 증진시키는 서열 (즉, 코작 공통 서열), 단백질 안정성을 증진시키는 서열, 및 바람직할 때 인코딩된 산물의 분비를 증진시키는 서열을 포함할 수 있다. 적합한 인핸서의 예는 CMV 인핸서이다. 다른 적합한 인핸서는 바람직한 표적 조직 적응증에 적절한 인핸서를 포함한다. 일 구현예에서, 조절 서열은 하나 이상의 발현 인핸서를 포함한다. 일 구현예에서, 조절 서열은 둘 이상의 발현 인핸서를 포함한다. 이들 인핸서는 서로 동일할 수 있거나, 상이할 수 있다. 예를 들면, 인핸서는 CMV 극초기 인핸서를 포함할 수 있다. 이러한 인핸서는 서로 인접하게 위치하는 2개의 사본으로 존재할 수 있다. 대안적으로, 인핸서의 이중 사본은 하나 이상의 서열에 의해 분리될 수 있다. 또 다른 구현예에서, 발현 카세트는 인트론, 예로 닭 베타-액틴 인트론을 추가로 포함한다. 특정 구현예에서, 인트론은 키메라 인트론 (CI) - 인간 베타-글로빈 스플라이싱 공여자 및 면역글로불린 스플라이싱 수여자 요소로 구성된 혼성 인트론이다. 다른 적합한 인트론은 예로 국제특허출원 제 WO 2011/126808호에 기술된 것과 같은 당해 기술분야에 공지된 인트론을 포함한다. 적합한 폴리 A의 예는 예로 토끼 글로빈 폴리 A, SV40, SV50, 소 성장호르몬 (bGH), 소 성장호르몬 (bGH) 및 합성 TK 폴리 A를 포함한다. 선택적으로, 하나 이상의 서열은 mRNA를 안정화하도록 선택될 수 있다. 이러한 서열의 예는 변형된 WPRE 서열이고, 이는 폴리 A 서열의 상류 및 코딩 서열의 하류에 조작될 수 있다 (예로, M. A. Zanta-Boussif, et al., Gene Therapy (2009), 16: 605-619 참조). 특정 구현예에서, WPRE 서열이 존재한다.
특정 구현예에서, 발현 카세트는 hCDKL5 (이소형 1; 서열번호 2)의 아미노산 서열을 인코딩하는 서열번호 1의 뉴클레오티드 213번 내지 4439번의 서열을 갖는 핵산 분자를 말한다. 특정 구현예에서, 발현 카세트는 hCDKL5 (이소형 2 또는 2GS; 서열번호 6)의 아미노산 서열을 인코딩하는 서열번호 5의 뉴클레오티드 213번 내지 4562번의 서열을 갖는 핵산 분자를 말한다. 특정 구현예에서, 발현 카세트는 hCDKL5 (이소형 3 또는 3GS; 서열번호 8)의 아미노산 서열을 인코딩하는 서열번호 7의 뉴클레오티드 213번 내지 4388번의 서열을 갖는 핵산 분자를 말한다. 특정 구현예에서, 발현 카세트는 hCDKL5 (이소형 4 또는 4GS; 서열번호 10)의 아미노산 서열을 인코딩하는 서열번호 9의 뉴클레오티드 213번 내지 4511번의 서열을 갖는 핵산 분자를 말한다. 특정 구현예에서, 발현 카세트는 서열번호 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47 또는 48로부터 선택되고, hCDKL5 (이소형 1; 서열번호 2)의 아미노산 서열을 인코딩하는 조작된 핵산 서열을 포함한다. 특정 구현예에서, 발현 카세트는 hCDKL5 (이소형 1; 서열번호 4)의 아미노산 서열을 인코딩하고 miRNA 183 (서열번호 11)을 포함하는, 서열번호 3의 뉴클레오티드 213번 내지 4555번의 서열을 갖는 핵산 서열을 말한다. 특정 구현예에서, 이들 발현 카세트는 1개, 2개, 3개 또는 4개 이상의 drg-탈표적화 서열 (즉, miRNA)를 추가로 포함한다. 예로, 2019년 12월 20일에 제출되고 현재 국제특허출원 제 WO 2020/132455호로 공개된 국제특허출원 PCT/US19/67872 참조.
Ⅲ. rAAV
본원에서는 CDD를 치료하는데 유용한 재조합 아데노 관련 바이러스 (rAAV)가 제공된다. rAAV는 (a) AAV 캡시드; 및 (b) (a)의 AAV 캡시드에 포장된 벡터 게놈을 포함한다. 적합하게, 선택된 AAV 캡시드는 치료될 세포를 표적한다. 특정 구현예에서, 캡시드는 클라드 F로부터 나온다. 그러나, 특정 구현예에서, 또 다른 AAV 캡시드 출처가 선택될 수 있다. 벡터 게놈은 역전된 말단 반복서열 (ITR), 및 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 사이클린 의존성 키나제 유사 5 (hCDKL5)를 인코딩하는 핵산 서열을 포함한다. 특정 구현예에서, CDKL5는 CDKL5 또는 hCDKL5, CDKL5-2GS 또는 hCDKL5-2GS, CDKL5-3GS 또는 hCDKL5-3GS, 및 CDKL5-4GS 또는 hCDKL5-4GS로 지칭될 수 있다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 22와 적어도 약 95% 일치한다 (CDKL5-1 또는 hCDKL5-1의 아미노산 서열, 서열번호 2를 인코딩함). 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 24와 적어도 약 95% 일치한다 (CDKL5-2GS 또는 hCDKL5-2GS의 아미노산 서열, 서열번호 6을 인코딩함). 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 25와 적어도 약 95% 일치한다 (CDKL5-3GS 또는 hCDKL5-3GS의 아미노산 서열, 서열번호 8을 인코딩함). 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 26과 적어도 약 95% 일치한다 (CDKL5-4GS 또는 hCDKL5-4GS의 아미노산 서열, 서열번호 10를 인코딩함). 특정 구현예에서, hCDKL5 코딩 서열은 hCDKL5 전사체 변이체 1 내지 3 (서열번호 16을 갖고 서열번호 19의 NP_001032420.1 아미노산 서열을 인코딩하는 NM_001037343.1; 서열번호 17을 갖고 서열번호 20의 NP_001310218.1 아미노산 서열을 인코딩하는 NM_001323289.2; 서열번호 18을 갖고 서열번호 21의 NP_003150.1 아미노산 서열을 인코딩하는 NM_003159.2) 중 어느 하나와 80% 미만으로 일치한다. 특정 구현예에서, hCDKL5 코딩 서열은 서열번호 37, 38, 39, 40, 41, 42, 43, 44, 45, 46 및 47, 또는 이와 적어도 약 95% 일치한다 (CDKL5-1 또는 hCDKL5-1의 아미노산 서열, 서열번호 2를 인코딩함). 특정 구현예에서, 기능적 hCDKL5는 서열번호 2의 아미노산 서열을 갖는다 (CDKL5-1 또는 hCDKL5-1). 특정 구현예에서, 기능적 hCDKL5는 서열번호 6의 아미노산 서열을 갖는다 (CDKL5-2GS 또는 hCDKL5-2GS). 특정 구현예에서, 기능적 hCDKL5는 서열번호 8의 아미노산 서열을 갖는다 (CDKL5-3GS 또는 hCDKL5-3GS). 특정 구현예에서, 기능적 hCDKL5는 서열번호 10의 아미노산 서열을 갖는다 (CDKL5-4GS 또는 hCDKL5-4GS). 특정 구현예에서, 조절 서열은 중앙 신경계에서 hCDKL5 발현을 안내한다. 특정 구현예에서, 조절 서열은 인간 시냅신 프로모터 (hSyn) 또는 CB7 프로모터를 포함한다. 특정 구현예에서, 조절 서열은 코작 서열, 폴리아데닐화 서열, 인트론, 인핸서 및 TATA 신호 중 하나 이상을 포함한다. 특정 구현예에서, 벡터 게놈은 등쪽 뿌리 신경절 (drg) 특이적 miRNA 표적 서열의 적어도 2개의 일렬 반복서열을 추가로 포함하고, 적어도 2개의 일렬 반복서열은 동일하거나 상이할 수 있는 적어도 제 1 miRNA 표적 서열 및 적어도 제 2 miRNA 표적 서열을 포함한다. 특정 구현예에서, 벡터 게놈은 서열번호 1의 뉴클레오티드 1번 내지 4634번, 서열번호 3의 뉴클레오티드 1번 내지 4750번, 서열번호 5의 뉴클레오티드 1번 내지 4757번, 서열번호 7의 뉴클레오티드 1번 내지 4583번 또는 서열번호 9의 뉴클레오티드 1번 내지 4706번, 또는 이들과 적어도 약 70% (예로, 적어도 약 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 99.9%) 일치하는 핵산 서열이다.
특정 구현예에서, 벡터 게놈은 hCDKL5 (이소형 1; 서열번호 2)의 아미노산 서열을 인코딩하는 서열번호 1을 포함하는 핵산 분자를 말한다. 특정 구현예에서, 벡터 게놈은 hCDKL5 (이소형 2 또는 2GS; 서열번호 6)의 아미노산 서열을 인코딩하는 서열번호 5를 포함하는 핵산 분자를 말한다. 특정 구현예에서, 벡터 게놈은 hCDKL5 (이소형 3 또는 3GS; 서열번호 8)의 아미노산 서열을 인코딩하는 서열번호 7을 포함하는 핵산 분자를 말한다. 특정 구현예에서, 벡터 게놈은 hCDKL5 (이소형 4 또는 4GS; 서열번호 10)의 아미노산 서열을 인코딩하는 서열번호 9를 포함하는 핵산 분자를 말한다. 특정 구현예에서, 벡터 게놈은 hCDKL5 (이소형 1; 서열번호 4)의 아미노산 서열을 인코딩하는 서열번호 3를 포함하고, miRNA 183 (서열번호 11)을 포함하는 핵산 분자를 말한다.
특정 구현예에서, hCDKL5 코딩 서열에 추가하여, 또 다른 비-AAV 코딩 서열, 예로 관심있는 펩티드, 폴리펩티드, 기능적 RNA 분자, (예로, miRNA, miRNA 저해제) 또는 기타 유전자 산물이 포함될 수 있다. 유용한 유전자 산물은 miRNA를 포함할 수 있다. miRNA 및 다른 소간섭 핵산은 표적 RNA 전사체 절단/분해 또는 표적 메신저 RNA (mRNA)의 번역 억제를 통해 유전자 발현을 조절한다. miRNA는 전형적인 최종 19개 내지 25개의 미번역되는 RNA 산물로서 자연적으로 발현된다. miRNA는 표적 mRNA의 3' 미번역 영역 (UTR)과 서열 특이적인 상호작용을 통해 이들의 활성을 나타낸다. 이들 내인성으로 발현된 miRNA는 후속으로 miRNA 이중체로, 추가로 "성숙한" 단일가닥 miRNA 분자로 가공되는 헤어핀 전구체를 형성한다. 이러한 성숙한 miRNA는 다중단백질 복합체, miRISC를 안내하고, 이는 성숙한 miRNA과 이들의 상보성을 기초로 하여 표적 miRNA의 표적 부위를 예로 3' UTR 영역에서 식별한다.
본원에 사용된 "miRNA 표적 서열"은 DNA 양성 가닥 (5' 내지 3') 상에 위치한 서열이고, miRNA 종자 서열을 포함한 miRNA 서열에 적어도 부분적으로 상보적이다. miRNA 표적 서열은 인코딩된 트랜스 유전자 산물의 미번역 영역에 외인성이고, 트랜스 유전자 발현의 억제가 바람직한 세포에서 miRNA를 특이적으로 표적하도록 설계된다. 용어 "miR-183 클러스터 표적 서열"은 miR-183, miR-96 및 miR-182 (본원에 참고문헌으로 통합되는 Dambal, S. et al., Nucleic Acids Res., 43: 7173-7188, 2015년에 기술됨)를 포함하는 miR-183 클러스터 (대안적으로 패밀리로 명명됨)의 하나 이상의 구성원에 반응하는 표적 서열을 말한다.
전형적으로, miRNA 표적 서열은 적어도 7개 뉴클레오티드 내지 약 28개 뉴클레오티드의 길이, 적어도 8개 뉴클레오티드 내지 약 28개 뉴클레오티드의 길이, 7개 뉴클레오티드 내지 28개 뉴클레오티드, 8개 뉴클레오티드 내지 18개 뉴클레오티드, 12개 뉴클레오티드 내지 28개 뉴클레오티드의 길이, 약 20개 내지 약 26개 뉴클레오티드, 약 22개 뉴클레오티드, 약 24개 뉴클레오티드 또는 약 26개 뉴클레오티드의 길이이고, miRNA 종자 서열에 상보적인 적어도 하나의 연속적인 영역 (예로, 7개 내지 8개 뉴클레오티드)를 포함한다. 특정 구현예에서, 표적 서열은 miRNA 종자 서열과 정확한 상보성 (100%) 또는 부분적 상보성을 일부 미스매칭와 함께 갖는 서열을 포함한다. 특정 구현예에서, 표적 서열은 miRNA 종자 서열에 100% 상보적인 적어도 7개 내지 8개 뉴클레오티드를 포함한다. 특정 구현예에서, 표적 서열은 miRNA 종자 서열에 100% 상보적인 서열로 구성된다. 특정 구현예에서, 표적 서열은 종자 서열에 100% 상보적인 서열의 다수의 사본 (예로, 2개 또는 3개의 사본)을 포함한다. 특정 구현예에서, 100% 상보성의 영역은 표적 서열의 적어도 30%의 길이를 포함한다. 특정 구현예에서, 표적 서열의 잔여부는 miRNA와 적어도 약 80% 내지 약 99% 상보성을 갖는다. 특정 구현예에서, DNA 양성 가닥을 포함하는 발현 카세트에서, miRNA 표적 서열은 miRNA의 역상보체이다.
본원에 사용된 바, "miRNA 표적 서열"은 DNA 양성 가닥 (5' 내지 3') 상에 위치한 서열이고, miRNA 종자 서열을 포함한 miRNA 서열에 적어도 부분적으로 상보적이다. miRNA 표적 서열은 인코딩된 트랜스 유전자 산물의 미번역 영역에 외인성이고, 트랜스 유전자 발현의 억제가 바람직한 세포에서 miRNA를 특이적으로 표적하도록 설계된다. 용어 "miR-183 클러스터 표적 서열"은 miR-183, miR-96 및 miR-182 (본원에 참고문헌으로 통합되는 Dambal, S. et al., Nucleic Acids Res., 43: 7173-7188, 2015년에 기술됨)를 포함하는 miR-183 클러스터 (대안적으로 패밀리로 명명됨)의 하나 이상의 구성원에 반응하는 표적 서열을 말한다. 이론에 얽매이지 않더라도, 트랜스 유전자 (유전자 산물을 인코딩함)에 대한 메신저 RNA (mRNA)는 miRNA를 포함하는 발현 카세트가 전달되는 세포 유형에 존재하여, 3' UTR miRNA 표적 서열에 대한 miRNA의 특이적인 결합이 mRNA 침묵화 및 절단을 유도함으로써 miRNA를 발현하는 세포에서만 트랜스 유전자의 발현을 감소시키거나 제거시킨다.
전형적으로, miRNA 표적 서열은 적어도 7개 뉴클레오티드 내지 약 28개 뉴클레오티드의 길이, 적어도 8개 뉴클레오티드 내지 약 28개 뉴클레오티드의 길이, 7개 뉴클레오티드 내지 28개 뉴클레오티드, 8개 뉴클레오티드 내지 18개 뉴클레오티드, 12개 뉴클레오티드 내지 28개 뉴클레오티드의 길이, 약 20개 내지 약 26개 뉴클레오티드, 약 22개 뉴클레오티드, 약 24개 뉴클레오티드 또는 약 26개 뉴클레오티드의 길이이고, miRNA 종자 서열에 상보적인 적어도 하나의 연속적인 영역 (예로, 7개 내지 8개 뉴클레오티드)를 포함한다. 특정 구현예에서, 표적 서열은 miRNA 종자 서열과 정확한 상보성 (100%) 또는 부분적 상보성을 일부 미스매칭와 함께 갖는 서열을 포함한다. 특정 구현예에서, 표적 서열은 miRNA 종자 서열에 100% 상보적인 적어도 7개 내지 8개 뉴클레오티드를 포함한다. 특정 구현예에서, 표적 서열은 miRNA 종자 서열에 100% 상보적인 서열로 구성된다. 특정 구현예에서, 표적 서열은 종자 서열에 100% 상보적인 서열의 다수의 사본 (예로, 2개 또는 3개의 사본)을 포함한다. 특정 구현예에서, 100% 상보성의 영역은 표적 서열의 적어도 30%의 길이를 포함한다. 특정 구현예에서, 표적 서열의 잔여부는 miRNA와 적어도 약 80% 내지 약 99% 상보성을 갖는다. 특정 구현예에서, DNA 양성 가닥을 포함하는 발현 카세트에서, miRNA 표적 서열은 miRNA의 역상보체이다.
특정 구현예에서, 발현 카세트 mRNA 또는 DNA 양성 가닥에 대한 적어도 제 1 및/또는 적어도 제 2 miRNA 표적 서열의 miRNA 표적 서열은 (1) AGTGAATTCTACCAGTGCCATA (miR-183, 서열번호 11); (ii) AGCAAAAATGTGCTAGTGCCAAA (miR-96, 서열번호 12); (iii) AGTGTGAGTTCTACCATTGCCAAA (miR-182, 서열번호 13)로부터 선택된다. 다른 구현예에서, AGGGATTCCTGGGAAAACTGGAC (서열번호 14)가 선택된다.
특정 구현예에서, 벡터 게놈 또는 발현 카세트는 miR-183 표적 서열인 적어도 하나의 miRNA 표적 서열을 포함한다. 특정 구현예에서, 벡터 게놈 또는 발현 카세트는 AGTGAATTCTACCAGTGCCATA (서열번호 11)를 포함하는 miRNA 표적 서열을 포함하고, 여기서 miR-183 종자 서열에 상보적인 서열은 GTGCCAT이다. 특정 구현예에서, 벡터 게놈 또는 발현 카세트는 miR-183 종자 서열에 100% 상보적인 서열의 하나 이상의 사본 (예로, 2개 또는 3개의 사본)을 포함한다. 특정 구현예에서, miR-183 표적 서열은 약 7개 뉴클레오티드 내지 약 28개 뉴클레오티드의 길이이고, miR-183 종자 서열에 적어도 100% 상보적인 적어도 하나의 영역을 포함한다. 특정 구현예에서, miR-183 표적 서열은 서열번호 11과 부분적 상보성을 갖는 서열을 포함하여, 서열번호 11과 정렬될 때 하나 이상의 미스매칭이 존재한다. 특정 구현예에서, miR-183 표적 서열은 서열번호 11과 정렬될 때 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 미스매칭을 갖는 서열을 포함하고, 여기서 미스매칭은 인접하지 않을 수 있다. 특정 구현예에서, miR-183 표적 서열은 miR-183 표적 서열의 적어도 30%의 길이도 포함하는 100% 상보성의 영역을 포함한다. 특정 구현예에서, 100% 상보성의 영역은 miR-183 종자 서열과 100% 상보성을 갖는 서열을 포함한다. 특정 구현예에서, miR-183 표적 서열의 잔여부는 miR-183과 적어도 약 80% 내지 약 99% 상보성을 갖는다. 특정 구현예에서, 발현 카세트 또는 벡터 게놈은 절단된 서열번호 11, 즉 서열번호 11의 5' 또는 3' 말단 또는 양쪽 말단에서 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 뉴클레오티드가 결여된 서열을 포함하는 miR-183 표적 서열을 포함한다. 특정 구현예에서, 발현 카세트 또는 벡터 게놈은 트랜스 유전자 및 하나의 miR-183 표적 서열을 포함한다. 또 다른 특정 구현예에서, 발현 카세트 또는 벡터 게놈은 적어도 2개, 3개 또는 4개의 miR-183 표적 서열을 포함한다. (i) AGTGAATTCTACCAGTGCCATA (miR-183, 서열번호 11); (ii) AGCAAAAATGTGCTAGTGCCAAA (miR-96, 서열번호 12).
특정 구현예에서, 벡터 게놈 또는 발현 카세트는 miR-182 표적 서열인 적어도 하나의 miRNA 표적 서열을 포함한다. 특정 구현예에서, 벡터 게놈 또는 발현 카세트는 AGTGTGAGTTCTACCATTGCCAAA (서열번호 13)를 포함하는 miR-182 표적 서열을 포함한다. 특정 구현예에서, 벡터 게놈 또는 발현 카세트는 miR-182 종자 서열에 100% 상보적인 서열의 하나 이상의 사본 (예로, 2개 또는 3개의 사본)을 포함한다. 특정 구현예에서, miR-182 표적 서열은 약 7개 뉴클레오티드 내지 약 28개 뉴클레오티드의 길이이고, miR-182 종자 서열에 적어도 100% 상보적인 적어도 하나의 영역을 포함한다. 특정 구현예에서, miR-182 표적 서열은 서열번호 13과 부분적 상보성을 갖는 서열을 포함하여, 서열번호 13과 정렬될 때 하나 이상의 미스매칭이 존재한다. 특정 구현예에서, miR-182 표적 서열은 서열번호 13과 정렬될 때 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 미스매칭을 갖는 서열을 포함하고, 여기서 미스매칭은 인접하지 않을 수 있다. 특정 구현예에서, miR-182 표적 서열은 miR-182 표적 서열의 적어도 30%의 길이도 포함하는 100% 상보성의 영역을 포함한다. 특정 구현예에서, 100% 상보성의 영역은 miR-182 종자 서열과 100% 상보성을 갖는 서열을 포함한다. 특정 구현예에서, miR-182 표적 서열의 잔여부는 miR-182와 적어도 약 80% 내지 약 99% 상보성을 갖는다. 특정 구현예에서, 발현 카세트 또는 벡터 게놈은 절단된 서열번호 13, 즉 서열번호 13의 5' 또는 3' 말단 또는 양쪽 말단에서 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 뉴클레오티드가 결여된 서열을 포함하는 miR-182 표적 서열을 포함한다. 특정 구현예에서, 발현 카세트 또는 벡터 게놈은 트랜스 유전자 및 하나의 miR-182 표적 서열을 포함한다. 또 다른 특정 구현예에서, 발현 카세트 또는 벡터 게놈은 적어도 2개, 3개 또는 4개의 miR-182 표적 서열을 포함한다.
본원에서 용어 "일렬 반복서열"은 둘 이상의 연속적인 miRNA 표적 서열의 존재를 말하는데 사용된다. 이들 miRNA 표적 서열은 연속적일 수 있고, 즉 서로 나란히 위치하여 하나의 3' 말단이 개입 서열이 없이 나머지의 5' 말단의 바로 상류이거나 이의 역이다. 또 다른 구현예에서, 둘 이상의 miRNA 표적 서열은 짧은 스페이서 서열에 의해 분리된다.
본원에 사용된 바, "스페이서"는 둘 이상의 연속적인 miRNA 표적 서열 사이에 위치하는, 예로 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 뉴클레오티드 길이의 임의의 선택된 핵산 서열이다. 특정 구현예에서, 스페이서는 1개 내지 8개 뉴클레오티드의 길이, 2개 내지 7개 뉴클레오티드의 길이, 3개 내지 6개 뉴클레오티드의 길이, 4개 뉴클레오티드의 길이, 4개 내지 9개 뉴클레오티드의 길이, 3개 내지 7개 뉴클레오티드의 길이, 또는 더 길어진 값이다. 적합하게, 스페이서는 비-코딩 서열이다. 특정 구현예에서, 스페이서는 4개의 뉴클레오티드일 수 있다. 특정 구현예에서, 스페이서는 GGAT이다. 특정 구현예에서, 스페이서는 6개의 뉴클레오티드이다. 특정 구현예에서, 스페이서는 CACGTG 또는 GCATGC이다.
특정 구현예에서, 일렬 반복서열은 2개, 3개 또는 4개 이상의 동일한 miRNA 표적 서열을 포함한다. 특정 구현예에서, 일렬 반복서열은 적어도 2개의 상이한 miRNA 표적 서열, 적어도 3개의 상이한 miRNA 표적 서열 또는 적어도 4개의 상이한 miRNA 표적 서열 등을 포함한다. 특정 구현예에서, 일렬 반복서열은 2개 또는 3개의 동일한 miRNA 표적 서열, 및 상이한 네 번째 miRNA 표적 서열을 포함할 수 있다.
특정 구현예에서, 발현 카세트에는 일렬 반복서열의 적어도 2가지 상이한 세트가 있을 수 있다. 예를 들면, 3' UTR은 트랜스 유전자의 바로 하류의 일렬 반복서열, UTR 서열 및 UTR 3' 말단에 더 근접한 둘 이상의 일렬 반복서열을 포함할 수 있다. 또 다른 예에서, 5' UTR은 1개, 2개 또는 3개의 miRNA 표적 서열을 포함할 수 있다. 또 다른 예에서, 3'은 일렬 반복서열을 포함할 수 있고, 5' UTR은 적어도 하나의 miRNA 표적 서열을 포함할 수 있다.
특정 구현예에서, 발현 카세트는 트랜스 유전자에 대한 종결 코돈의 약 0개 내지 20개 뉴클레오티드 내에서 시작하는 2개, 3개 또는 4개 이상의 일렬 반복서열을 포함한다. 또 다른 구현예에서, 발현 카세트는 트랜스 유전자의 종결 코돈으로부터 적어도 100개 내지 약 4,000개 뉴클레오티드의 miRNA 일렬 반복서열을 포함한다.
특정 구현예에서, miRNA 표적 서열 사이의 스페이서는 동일하다. 본원에서 사용된 바, CDKL5 또는 hCDKL5는 달리 명시되지 않은 경우라면 이소형 1을 말한다. 이소형 2 내지 4는 CDKL5-2GS 또는 hCDKL5-2GS, CDKL5-3GS 또는 hCDKL5-3GS, 및 CDKL5-4GS 또는 hCDKL5-4GS로서 특정될 수 있다. 이들 이소형을 갖는 발현 카세트 및 벡터 게놈은 이소형 1에 대해 기술된 바와 같이 제작될 수 있다.
본원에 참고문헌으로 통합되는 2019년 12월 20일에 제출된 국제출원 PCT/US19/67872, 현재 국제특허출원 WP 제 2020/132455호; 2020년 5월 12일에 제출된 미국 가특허출원 제 US 63/023,593호; 2020년 6월 12일에 제출된 미국 가특허출원 제 US 63/038,488호; 2020년 6월 24일에 제출된 미국 가특허출원 제 US 63/043,562호; 2020년 9월 16일에 제출된 미국 가특허출원 제 US 63/079,299호; 2011년 2월 22일에 제출된 미국 가특허출원 제 US 63/152,042호 참조, 이들은 본원에 참고문헌으로 통합된다.
특정 구현예에서, 클라드 F AAV 캡시드는 AAVhu68 캡시드, AAV9 캡시드, AAVhu31 캡시드, AAVhu32 캡시드, 또는 이들 캡시드 중 하나의 조작된 변이체 (예로, AAV-PHP.B)로부터 선택된다. AAVhu68 캡시드 단백질을 인코딩하는 핵산 서열은 하기 실시예에서 벡터 게놈을 보유하는 AAV.hCDKL5 재조합 AAV (rAAV)의 생산에 사용된다. AAVhu68 또는 AAV-PHP.B에 관한 추가적인 세부사항은 국제특허출원 제 WO 2018/160582호 및 미국 특허 제 US 2015/0079038호에 제공되고, 이들 각각은 본원에 이의 전문이 참고문헌으로 통합된다. 본원에 기술된 클라드 F 벡터는 뇌, 해마, 운동 피질, 소뇌 및 운동 뉴런을 포함한 중앙 신경계 내의 세포로 hCDKL5 코딩 서열을 포함하는 벡터 게놈의 전달에 매우 적합하다. 이들 벡터는 중앙 신경계 (CNS) 및 특정 다른 조직 내의 다른 세포 및 CNS 외부의 세포를 표적하는데 사용될 수 있다.
특정 구현예에서, 본원에 기술된 조성물 및 방법을 위한 AAV 캡시드는 표적 세포에 기초하여 선택된다. 특정 구현예에서, AAV 캡시드는 CNS 세포 및/또는 PNS 세포를 형질도입시킨다. 특정 구현예에서, AAV 캡시드는 cy02 캡시드, rh43 캡시드, AAV8 캡시드, rh01 캡시드, AAV9 캡시드, rh8 캡시드, rh10 캡시드, bb01 캡시드, hu37 캡시드, rh02 캡시드, rh20 캡시드, rh39 캡시드, rh64 캡시드, AAV6 캡시드, AAV1 캡시드, hu44 캡시드, hu48 캡시드, cy05 캡시드, hu11 캡시드, hu32 캡시드, pi2 캡시드, 또는 이들의 변이로부터 선택된다. 특정 구현예에서, AAV 캡시드는 AAV9 캡시드, AAVhu68 캡시드, hu31 캡시드, hu32 캡시드, 또는 이들의 변이와 같은 클라드 F 캡시드이다. 예로, 각각이 본원에 이들의 전문이 참고문헌으로 통합되는 2015년 4월 14일에 공개된 국제특허출원 제 WO 2005/033321호, 제 WO 2018/160582호 및 미국 특허 제 US 2015/0079038호 참조. 특정 구현예에서, AAV 캡시드는 비-클라드 F 캡시드, 예를 들면 클라드 A, B, C, D 또는 E 캡시드이다. 특정 구현예에서, 비-클라드 F 캡시드는 AAV1 또는 이들의 변이체이다. 특정 구현예에서, AAV 캡시드는 신경계 세포 이외의 표적 세포를 형질도입시킨다. 특정 구현예에서, AAV 캡시드는 클라드 A 캡시드 (예로, AAV1, AAV6, AAVrh91), 클라드 B 캡시드 (예로, AAV 2), 클라드 C 캡시드 (예로, hu53), 클라드 D 캡시드 (예로, AAV7), 또는 클라드 E 캡시드 (예로, rh10)이다. 특정 구현예에서, AAV 캡시드는 AAVrh91 캡시드 (서열번호 33 및 35의 핵산 서열)와 같은 클라드 A 캡시드이다. 본원에 참고문헌으로 통합되는 2020년 4월 29일에 제출된 국제출원 PCT/US20/030266호, 현재 국제특허출원 WP 제 WO2020/223231호; 본원에 참고문헌으로 통합되는 2019년 4월 29일에 제출된 미국 가특허출원 제 US 63/065,616호 참조. 또한, 본원에 참고문헌으로 통합되는 2020년 8월 14일에 제출된 미국 가특허출원 제 US 63/065,616호; 및 2020년 11월 4일에 제출된 미국 가특허출원 제 US 63/109,734호 참조. 또한, 다른 AAV 캡시드도 선택될 수 있다.
본원에 사용된 바, AAV 그룹과 관련된 용어 "클라드"는 AAV vp1 아미노산 서열의 정렬을 기초로 하여, 적어도 75%의 부트스트랩 값에 의한 근연 관계 알고리즘 및 0.05 이하의 포이즌 교정 거리 측정을 사용하여 결정된 계통유전학적으로 서로 연관된 AAV 그룹을 말한다. 근연 관계 알고리즘은 문헌에 설명되어 있다. 예로, M. Nei and S. Kumar, Molecular Evolution and Phylogenetics (뉴욕, 옥스포드 대학 출판사 (2000) 참조. 이러한 알고리즘을 실행하는데 사용될 수 있는 컴퓨터 프로그램이 입수가능하다. 예를 들면, MEGA v2.1 프로그램이 변형된 네이-고조보리 (Nei-Gojobori) 방법을 실행시킨다. 이들 기법 및 컴퓨터 프로그램, 및 AAV vp1 캡시드 단백질의 서열을 사용하여, 선택된 AAV가 본원에서 확인된 클라드 중 하나, 또 다른 클라드, 또는 이들 클라드 외부에 포함되는지 여부를 당업자라면 쉽게 결정할 수 있다. 예로, 클라드 A, B, C, D, E 및 F를 식별하고, 신규한 AAV, 진뱅크 기탁번호 AY530553 내지 AY530629의 핵산 서열을 제공하는, G. Gao, et al., J. Virol., 2004년 6월, 78(10): 6381-6388 참조. 또한, 국제특허출원 제 WO 2005/033321호 참조.
rAAV는 AAV 캡시드 및 벡터 게놈으로 구성된다. AAV 캡시드는 vp1의 이종유래 집단, vp2의 이종유래 집단 및 vp3의 이종유래 집단의 조립체이다. 본원에 사용된 바, vp 캡시드 단백질을 언급하는데 사용될 때, 용어 "이종유래" 또는 임의의 문법적 활용형은 동일하지 않는, 예를 들면 상이한 변형된 아미노산 서열을 갖는 vp1, vp2 또는 vp3 단량체 (단백질)를 갖는 요소로 구성된 집단을 말한다.
본원에 사용된 바, vp 캡시드 단백질의 언급에 사용될 때, 용어 "이종유래" 또는 임의의 문법적 활용형은 동일하지 않는, 예를 들면 상이한 변형된 아미노산 서열을 갖는 vp1, vp2 또는 vp3 단량체 (단백질)를 갖는 요소로 구성된 집단을 말한다. vp1, vp2 및 vp3 단백질 (대안적으로 이소형으로 명명됨)과 연결하여 사용되는 용어 "이종유래 집단"은 캡시드 내의 vp1, vp2 및 vp3 단백질의 아미노산 서열에서의 차이를 말한다. AAV 캡시드는 예측된 아미노산 잔기로부터의 변형을 갖는 vp1 단백질 내, vp2 단백질 내 및 vp3 단백질 내의 하위집단을 포함한다. 이들 하위집단은 최소한으로 특정 탈아미노화된 아스파라진 (N 또는 Asn) 잔기를 포함한다. 예를 들면, 특정 하위집단은 아스파라진 - 글리신 쌍에서 적어도 1개, 2개, 3개 또는 4개의 높게 탈아미노화된 아스파라진 (N) 위치를 포함하고, 선택적으로 다른 탈아미노화된 아미노산을 추가로 포함하며, 여기서 탈아미노화는 아미노산 변화 및 다른 선택적 변형을 유도한다.
특정 구현예에서, 다수의 높게 탈아미노화된 "NG" 위치를 포함하는 AAV 캡시드 이소형 (즉, VP1, VP2, VP3)의 이종유래 집단을 갖는 AAV 캡시드가 제공된다. 특정 구현예에서, 높게 탈아미노화된 위치는 예측된 전장의 VP1 아미노산 서열을 기준으로, 하기에 확인된 위치에 있다. 다른 구현예에서, 캡시드 유전자는 변형되어 언급된 "NG"는 제거되고 돌연변이체 "NG"가 또 다른 위치에 조작된다.
본원에 사용된 용어 "표적 세포" 및 "표적 조직"은 주제 AAV 벡터에 의해 형질도입되도록 의도된 임의의 세포 또는 조직을 말할 수 있다. 용어는 근육, 간, 폐, 기도 상피, 중앙 신경계, 뉴런, 눈 (안구 세포) 또는 심장 중 임의의 하나 이상을 말할 수 있다.
본원에 사용된 용어 "벡터 게놈"은 바이러스 캡시드, 예를 들면 AAV 캡시드에 포장되는 핵산 분자를 말하고, 숙주 세포 또는 환자의 세포에게 전달될 수 있다. 특정 구현예에서, 벡터 게놈은 5' 및 3' 최말단에 벡터 게놈을 AAV 캡시드 내로 포장하여, 유전자의 발현을 안내하는 서열에 작동가능하게 연결된 본원에 기술된 CDKL5 유전자를 이들 사이에 포함하는데 필요한 역전된 말단 반복서열 (ITR) 서열을 갖는 발현 카세트이다. 특정 구현예에서, 벡터 게놈은 5'부터 3' 말단으로 최소한의 AAV 5' ITR, 코딩 서열(들) 및 AAV 3' ITR을 포함할 수 있다. 특정 구현예에서, ITR은 AAV2, 캡시드과 상이한 출처의 AAV로부터 나오거나, 전장의 ITR 이외의 것이 선택될 수 있다. 특정 구현예에서, ITR은 생산 과정 동안 rep 기능을 제공하는 AAV와 동일한 AAV 출처 또는 상호보완하는 (transcomplementing) AAV로부터 나온다. 또한, 다른 ITR이 사용될 수 있다. 벡터 게놈은 때로 본원에서 "미니유전자"로도 지칭된다.
본원에 사용된 용어 "숙주 세포"는 rAAV가 플라스미드로부터 생산되는 포장화 세포를 말할 수 있다. 대안으로, 용어 "숙주 세포"는 미니유전자의 발현이 바람직한 표적 세포를 말할 수 있다.
상기에 지시된 바, 원하는 세포를 표적하는 AAV 캡시드, 및 최소한으로 벡터 게놈을 캡시드 내에 포장하는데 필요한 AAV ITR, hCDKL5 코딩 서열 및 이들의 발현을 안내하는 조절 서열을 포함하는 벡터 게놈을 갖는 rAAV가 제공된다. 특정 구현예에서, 벡터 게놈은 단일가닥 AAV 벡터 게놈이다. 특정 구현예에서, 자가-상보적인 (sc) AAV 벡터 게놈을 포함하는 rAAV 벡터가 본 발명에 사용될 수 있다.
벡터의 AAV 서열은 전형적으로 시스-작용하는 5' 및 3' 역전된 말단 반복서열 (ITR) 서열을 포함한다 (예로, B. J. Carter, in "Handbook of Parvoviruses" ed., P. Tijsser, CRC Press, pp 155 168 (1990) 참조). ITR 서열은 약 145개 염기쌍 (bp)의 길이이다. 바람직하게, 이들 서열의 소수 변형이 일정 정도로 허용가능하지만, ITR을 인코딩하는 전체 서열이 실질적으로 분자에 사용된다. 이들 ITR 서열을 변형시키는 능력은 당업계의 기술에 속한다 (예로, Sambrook et al., "Molecular Cloning. A Laboratory Manual" 제 2 개정판, Cold Spring Harbor Laboratory, New York (1989); 및 K. Fisher et al., J. Virol., 70: 520-532 (1996) 참조). 본 발명에 채용된 이러한 분자의 예는 트랜스 유전자를 포함하는 "시스 작용하는" 플라스미드이고, 여기서 선택된 트랜스 유전자 및 연관된 조절 요소는 5' 및 3' AAV ITR 서열에 의해 연접된다. 일 구현예에서, ITR은 캡시드를 공급하는 것과 상이한 AAV로부터 나온다. 일 구현예에서, ITR 서열은 AAV2로부터 나온다. D-서열 및 말단 분할 부위 (trs)가 결실되어 △ITR로 명명된 5' ITR의 단축된 버전이 기재되어 왔다. 다른 구현예에서, 전장의 AAV 5' 및 3' ITR이 사용된다. 특정 구현예에서, 벡터 게놈은 외부 A 요소가 결실된, 130개 염기쌍의 단축된 AAV2 ITR를 포함한다. 단축된 ITR은 내부 A 요소를 주형으로서 사용한 벡터 DNA의 증폭 과정 동안 145개 염기쌍의 야생형 길이로 재역전된다. 그러나, 다른 AAV 출처로부터의 ITR이 선택될 수 있다. ITR의 출처가 AAV2로부터 나오고, AAV 캡시드는 또 다른 AAV 출처로부터 나오는 경우에, 생성된 벡터는 슈도형으로 명명될 수 있다. 그러나, 이들 요소의 다른 입체구조가 적합할 수 있다.
특정 구현예에서, 5' AAV ITR - 프로모터 - 선택적 인핸서 - 선택적 인트론 - hCDKL5 코딩 서열 - 폴리 A - 3' ITR을 포함하는 벡터 게놈이 제작된다. 특정 구현예에서, 5' AAV ITR - 프로모터 - 선택적 인핸서 - 선택적 인트론 - hCDKL5 코딩 서열 - 선택적으로 반복되는 miR 탈표적화 서열 - 폴리 A - 3' ITR을 포함하는 벡터 게놈이 제작된다. 특정 구현예에서, 5' AAV ITR - 프로모터 - 선택적 인트론 - hCDKL5 코딩 서열 - 선택적 인핸서 - 폴리 A - 3' ITR을 포함하는 벡터 게놈이 제작된다. 특정 구현예에서, 5' AAV ITR - 프로모터 - 선택적 인핸서 - 선택적 인트론 - hCDKL5 코딩 서열 - 선택적 인핸서 - 선택적으로 반복되는 miR 탈표적화 서열 - 폴리 A - 3' ITR을 포함하는 벡터 게놈이 제작된다. 특정 구현예에서, ITR은 AAV2로부터 나온다. 특정 구현예에서, 하나 이상의 프로모터가 존재한다. 특정 구현예에서, 인핸서가 벡터 게놈에 존재한다. 특정 구현예에서, 하나 이상의 인핸서가 존재한다. 특정 구현예에서, 인트론이 벡터 게놈에 존재한다. 특정 구현예에서, 인핸서 및 인트론이 존재한다. 특정 구현예에서, 폴리 A는 SV40 폴리 A (즉, 시미안 바이러스 40 (SV 40) 후기 유전자로부터 유래한 폴리아데닐화 (폴리 A) 신호)이다. 특정 구현예에서, 폴리 A는 토끼 베타-글로빈 (RBG) 폴리 A이다. 특정 구현예에서, 벡터 게놈은 최소한으로 5' AAV ITR - hSyn 프로모터 - hCDKL5 코딩 서열 - 폴리 A - 3' ITR을 포함한다. 특정 구현예에서, 벡터 게놈은 최소한으로 5' AAV ITR - CB7 프로모터 - hCDKL5 코딩 서열 - RBG 폴리 A - 3' ITR을 포함한다. 특정 구현예에서, drg 탈표적화 서열은 본원에 기술된 1개, 2개, 3개 또는 4개 이상의 miR-183 서열이고, 발현 카세트에 포함된다. 특정 구현예에서, hCDKL5 코딩 서열은 CDKL5에 대한 것이다. 특정 구현예에서, hCDKL5 코딩 서열은 CDKL5-2GS에 대한 것이다. 특정 구현예에서, hCDKL5 코딩 서열은 CDKL5-3GS에 대한 것이다. 특정 구현예에서, hCDKL5 코딩 서열은 CDKL5-4GS에 대한 것이다. 선택적으로, 이들 벡터 게놈 중 하나 이상은 WPRE 요소를 포함한다.
본원에 사용된 바, 벡터 게놈 또는 벡터 게놈을 포함하는 rAAV는 본원에서 AAV. 프로모터 (조건부). 코작 (조건부). 인트론 (조건부). CDKL5 코딩 서열 (예로, hCDKL5, hCDKL5co, CDKL5, CDKL5co). miRNA (조건부). 폴리 A (조건부). 스투퍼 (조건부)로서 나타낸다. 특정 구현예에서, rAAV는 본원에서 AAV 캡시드. 프로모터 (조건부). 코작 (조건부). 인트론 (조건부). CDKL5 코딩 서열. miRNA (조건부). 폴리 A (조건부). 스투퍼 (조건부)로서 나타낸다. 선택적으로, 이들 벡터 게놈 중 하나 이상은 WPRE 요소를 포함한다.
특정 구현예에서, 벡터 게놈은 최소한으로 5' AAV ITR - 유비퀴틴 C 프로모터 - hCDKL5 코딩 서열 - 1개, 2개, 3개 또는 4개 이상의 miR-183 서열 - RBG 폴리 A - 3' ITR을 포함한다. 특정 구현예에서, 벡터 게놈은 최소한으로 5' AAV ITR - 닭 베타-액틴 혼성 프로모터 - hCDKL5 코딩 서열 - 1개, 2개, 3개 또는 4개 이상의 miR-183 서열 - RBG 폴리 A - 3' ITR을 포함한다. 선택적으로, 이들 벡터 게놈 중 하나 이상은 WPRE 요소를 포함한다.
추가적으로, 본원에 기술된 rAAV를 생산하는데 유용한 rAAV 생산 시스템이 본원에 제공된다. 생산 시스템은 (a) AAV 캡시드 단백질을 인코딩하는 핵산 서열; (b) 벡터 게놈; 및 (c) AAV 캡시드 내에 상기 벡터 게놈의 포장을 허용하기에 충분한 AAV rep 기능 및 헬퍼 기능을 포함하는 세포 배양물을 포함한다. 특정 구현예에서, 벡터 게놈은 서열번호 1, 3, 5, 7, 9, 29 또는 31이다. 특정 구현예에서, 세포 배양물은 인간 배아 신장 293 세포이다. 특정 구현예에서, AAV rep은 상이한 AAV로부터 나온다. 특정 구현예에서, AAV rep은 AAV2로부터 나온다. 특정 구현예에서, AAV rep 코딩 서열 및 cap 유전자는 동일한 핵산 분자 상에 있으며, 선택적으로 rep 서열 및 cap 서열 사이에 스페이서가 있다. 특정 구현예에서, 스페이서는 atgacttaaaccaggt (서열번호 15)이다.
AAV 바이러스성 벡터 (예로, 재조합 (r)AAV)를 생성하는데 사용하기 위해, 벡터 게놈은 포장하는 숙주 세포에게 전달된 임의의 적합한 벡터, 예로 플라스미드 상에서 운반될 수 있다. 본 발명에 유용한 플라스미드는 특히 원핵 세포, 곤충 세포, 포유동물 세포에서의 복제 및 포장에 적합하도록 조작될 수 있다. 적합한 형질감염 기법 및 숙주 세포를 포장하는 것은 공지되고/거나, 당업자에 의해 쉽게 설계될 수 있다.
벡터로서의 용도에 적합한 AAV를 생성하고 단리하는 방법은 당해 기술분야에 공지되어 있다. 일반적으로, 예로 본원에 각각의 전문이 참고문헌으로 통합되는, Grieger & Samulski, 2005, "Adeno-associated virus as a gene therapy vector: Vector development, production and clinical applications," Adv. Biochem. Engin/Biotechnol. 99: 119-145; Buning et al., 2008, "Recent developments in adeno-associated virus vector technology," J. Gene Med. 10: 717-733; 및 하기에 인용된 참고문헌 참조. 본원에 사용된 바, 유전자 요법 벡터는 환자를 치료하는데 용도하기에 적합한, 본원에 기술된 rAAV를 말한다. 유전자를 비리온 내에 포장하기 위해, ITR은 유전자를 포함하는 핵산 분자와 동일한 구조물에서 시스 형태로 요구되는 유일한 AAV 구성요소이다. cap 및 rep 유전자는 트랜스 형태로 공급될 수 있다.
일 구현예에서, 선택된 유전 요소는 형질감염, 전기천공, 리포좀 전달, 막 융합 기법, 고속 DNA 코팅된 펠렛, 바이러스성 감염 및 원형질체 융합을 포함하는 임의의 적합한 방법에 의해 전달될 수 있다. 안정한 AAV 포장화 세포도 만들어질 수 있다. 이러한 구조물을 제조하는데 사용된 방법은 핵산 조작 분야의 당업자에게 공지되어 있으며, 유전공학, 재조합 공학 및 합성 기법을 포함한다. 예로, Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참조.
용어 "AAV 중간물" 또는 "AAV 벡터 중간물"은 내부에 포장되는 원하는 게놈 서열이 결여된 조립된 rAAV 캡시드를 말한다. 또한, 이들은 "빈" 캡시드로도 명명될 수 있다. 이러한 캡시드는 발현 카세트의 검출가능한 게놈 서열이 없거나, 유전자 산물의 발현을 달성하기에 불충분한 단지 부분적으로 포장된 게놈 서열만을 포함할 수 있다. 이러한 빈 캡시드는 관심있는 유전자를 숙주 세포로 전달하는 기능이 없다.
본원에 기술된 재조합 아데노 관련 바이러스 (AAV)는 공지되어 있는 기법을 사용하여 생성될 수 있다. 예로, 국제특허출원 제 WO 2003/042397호; 제 WO 2005/033321호; 제 WO 2006/110689호; 미국 특허 제 US 7588772 B2호 참조. 이러한 방법은 AAV 캡시드 단백질을 인코딩하는 핵산 서열; 기능적 rep 유전자; 최소한으로 AAV 역전된 말단 반복서열 (ITR) 및 트랜스 유전자로 구성된 발현 카세트; 및 AAV 캡시드 단백질 내에 발현 카세트의 포장을 허용하는 충분한 헬퍼 기능을 포함하는 숙주 세포를 배양하는 것이 관여한다. 캡시드, 이에 따른 코딩 서열을 생성하는 방법, 및 rAAV 바이러스성 벡터의 생산 방법은 기술되어 왔다. 예로, Gao, et al., Proc. Natl. Acad. Sci. U.S.A. 100(10): 6081-6086 (2003) 및 미국 특허 제 US 2013/0045186A1호 참조.
일 구현예에서, 재조합 AAVhu68 또는 AAVrh91을 생산하는데 유용한 생산 세포 배양물이 제공된다. 이러한 세포 배양물은 숙주 세포에서 AAVhu68 캡시드 단백질을 발현하는 핵산; AAVhu68 캡시드 내로의 포장에 적합한 핵산 분자, 예로 AAV ITR 및 숙주 세포에서 산물의 발현을 안내하는 서열에 작동가능하게 연결된 유전자 산물을 인코딩하는 비-AAV 핵산 서열을 포함하는 벡터 게놈; 및 재조합 AAVhu68 또는 AAVrh91 캡시드 내로 벡터 게놈의 포장을 허용하기에 충분한 AAV rep 기능 및 아데노바이러스 헬퍼 기능을 포함한다. 일 구현예에서, 세포 배양물은 포유동물 세포 (예로, 특히 인간 배아 신장 293 세포) 또는 곤충 세포 (예로, 배쿨로바이러스)로 구성된다. 일 구현예에서, 세포 배양물은 포유동물 세포 (특히 예로, 인간 배아 신장 293 세포) 또는 곤충 세포 (예로, 스포도프테라 프루지퍼다 (Sf9) 세포)로 구성된다. 특정 구현예에서, 배큘로바이러스는 재조합 AAVhu68 또는 AAVrh91 캡시드 내로 벡터 게놈의 포장에 필요한 헬퍼 기능을 제공한다.
선택적으로, rep 기능은 hu68 또는 AAV-PHP.B 이외의 AAV에 의해 제공된다. 특정 구현예에서, 적어도 일부의 rep 기능은 AAVhu68 또는 AAVrh91로부터 나온다. 또 다른 구현예에서, rep 단백질은 AAVhu68 rep 이외의 이종유래 rep 단백질이고, 예를 들면 이에 한정되지는 않지만 AAV1 rep 단백질, AAV2 rep 단백질, AAV3 rep 단백질, AAV4 rep 단백질, AAV5 rep 단백질, AAV6 rep 단백질, AAV7 rep 단백질, AAV8 rep 단백질; 또는 rep 78, rep 68, rep 52, rep 40, rep 68/78 및 rep 40/52; 또는 이들의 단편; 또는 또 다른 출처이다. 임의의 이러한 AAVhu68 또는 돌연변이체 AAV 캡시드 서열은 숙주 세포에서 이들의 발현을 안내하는 외인성 조절 제어 서열의 통제 하에 있을 수 있다.
일 구현예에서, 세포는 적합한 세포 배양 (예로, HEK 293 또는 Sf9) 또는 현탁액으로 제조된다. 본원에 기술된 유전자 요법 벡터를 제조하는 방법은 유전자 요법 벡터의 생산에 사용되는 플라스미드 DNA의 생성, 벡터의 생성 및 벡터의 정제와 같은 당해 기술분야에서 널리 공지된 방법을 포함한다. 일부 구현예에서, 유전자 요법 벡터는 AAV 벡터이고, 생성된 플라스미드는 AAV 벡터 게놈 및 관심있는 유전자를 인코딩하는 AAV 시스-플라스미드, AAV rep 및 cap 유전자를 포함하는 AAV 트랜스-플라스미드, 및 아데노바이러스 헬퍼 플라스미드이다. 벡터 생성 공정은 세포 배양의 개시, 세포의 계대, 세포의 접종, 플라스미드 DNA를 사용한 세포의 형질감염, 형질감염-후 무-혈청 배지로의 배지 교환, 및 벡터 포함하는 세포 및 배양 배지의 수확과 같은 방법 단계를 포함할 수 있다. 수확된 벡터 포함하는 세포 및 배양 배지는 본원에서 미정제 세포 수확물로서 지칭된다. 또 다른 시스템에서, 유전자 요법 벡터는 배큘로바이러스 기반의 벡터를 사용한 감염에 의해 곤충 세포 내에 도입된다. 이러한 생산 시스템에 관한 리뷰를 위해, 일반적으로 예로 본원에 이의 전문이 참고문헌으로 통합되는 Zang et al., 2009, "Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production," Human Gene Therapy 20: 922-929 참조. 또한, 이들 및 기타 AAV 생산 시스템을 제조하고 사용하는 방법은 하기 미국 특허 제 US 5,139,941호; 제 US 5,741,683호; 제 US 6,057,152호; 제 US 6,204,059호; 제 US 6,268,213호; 제 US 6,491,907호; 제 US 6,660,514호; 제 US 6,951,753호; 제 US 7,094,604호; 제 US 7,172,893호; 제 US 7,201,898호; 제 US 7,229,823호; 및 제 US 7,439,065호에 기재되어 있으며, 이들 각각은 이의 전문이 본원에 참고문헌으로 통합된다.
미정제 세포 수확물은 이어서 벡터 수확물의 농축, 벡터 수확물의 투과여과, 벡터 수확물의 미세유동화, 벡터 수확물의 뉴클레아제 소화, 미세유동화된 중간물의 여과, 크로마토그래피에 의한 일반 정제, 초원심분리에 의한 일반 정제, 접면 유동 여과에 의한 완충액 교환, 및/또는 대량의 벡터를 준비하는 제형화 및 여과와 같은 방법 단계가 시행될 수 있다.
높은 염 농도에서 두 단계 친화 크로마토그래피 정제에 이어진 음이온 교환 레진 크로마토그래피는 벡터 약물 산물을 정제하고, 빈 캡시드를 제거하는데 사용된다. 이러한 방법은 본원에 참고문헌으로 통합되는, 2016년 12월 9일에 제출된 국제특허출원 제 WO 2017/160360호 및 이의 우선권 서류; 2016년 4월 13일에 제출된 미국 특허 제 US 62/322,071호; 및 2015년 12월 11일에 제출되고 ""Scalable Purification Method for AAV9"라는 제목의 제 US 62/226,357호에 더 자세하게 기재되어 있다. 특정 구현예에서, 벡터 약물 산물 (예로, AAVrh91)의 정제는 본원에 참고문헌으로 통합되는, 2016년 12월 9일에 제출된 국제특허출원 제 WO 2017/100674호 및 이의 우선권 서류; 2015년 12월 9일에 제출된 미국 가특허출원 제 US 62/266,351호; 및 2016년 4월 13일에 제출되고 "Scalable Purification Method for AAV1"이라는 제목의 제 US 62/322,082호에 더 자세하게 기술된 것을 포함한다.
비어있는 및 완전된 입자 내용물을 계산하기 위하여, 선택된 시료 (예로, 본원의 실시예에서, GC의 수 = 입자의 수인 이오딕산올 구배-정제된 제조물)에 대한 VP3 밴드 부피가 로딩된 GC 입자에 대응하여 좌표화된다. 결과로 나온 선형 방정식 (y = mx + c)이 테스트 항목 피크의 밴드 부피에서 입자의 수를 계산하는데 사용된다. 다음으로 로딩된 20 μL 당 입자의 수 (pt)에 50을 곱하여 입자 (pt)/mL을 수득한다. GC/mL로 나누기한 pt/mL은 입자 대 게놈 사본 (pt/GC) 비를 제공한다. Pt/mL - GC/mL은 비어있는 pt/mL를 수득한다. pt/mL로 나누기한 빈 pt/mL × 100은 비어있는 입자의 백분율을 제공한다.
일반적으로, 빈 캡시드 및 포장된 게놈을 갖는 AAV 벡터 입자를 검정하는 방법은 당해 기술분야에 공지되어 있다. 예로, Grimm et al., Gene Therapy (1999), 6: 1322-1330; Sommer et al., Molec. Ther. (2003), 7: 122-128 참조. 변성된 캡시드를 테스트하기 위해, 방법은 처리된 AAV 스톡을 3가지 캡시드 단백질을 분리할 수 있는 임의의 젤, 예를 들면 완충액 중 3% 내지 8% 트리스-아세테이트를 포함한 구배 젤로 구성되는 SDS-폴리아크릴아미드 젤 전기영동을 시행하고, 다음으로 시료 물질이 분리될 때까지 젤을 전개시키고, 나일론 또는 이트로셀룰로스 막, 바람직하게 나일론 상에 젤을 블럿팅하는 단계를 포함한다. 다음으로 항-AAV 캡시드 항체가 변성된 캡시드 단백질에 결합하는 일차 항체, 바람직하게 항-AAV 캡시드 단일클론 항체, 가장 바람직하게 B1 항-AAV-2 단일클론 항체로서 사용된다 (Wobus et al., J. Virol. (2000), 74: 9281-9293). 다음으로 이차 항체, 일차 항체에 결합하고, 일차 항체와의 결합을 검출하기 위한 수단, 더욱 바람직하게 이에 공유 결합하는 검출 분자를 포함하는 항-IgG 항체, 가장 바람직하게 호스래디쉬 퍼옥시다제에 공유 결합된 양 항-마우스 IgG 항체가 사용된다. 결합을 검출하는 방법은 일차 및 이차 항체 사이의 결합을 반정량적으로 결정하는데 사용되고, 바람직하게 방사성 동위원소 방출, 전자기적 방사선 조사 또는 비색측정 변화를 검출할 수 있는 검출 방법, 가장 바람직하게는 화학발광 검출 키트이다. 예를 들면, SDS-PAGE의 경우, 컬럼 분획으로부터의 시료는 채취되어 환원제 (예로, DTT)를 포함한 SDS-PAGE 로딩 완충액에서 가열될 수 있으며, 캡시드 단백질은 사전주입 구배 폴리아크릴아미드 젤 (예로, 노벡스사) 상에서 분리되었다. 은 염색이 제조사의 지침에 따른 실버엑스프레스 (인비트로겐사, CA) 또는 다른 적합한 염색 방법, 즉 SYPRO 루비 또는 쿠마시 염색을 사용하여 수행될 수 있다. 일 구현예에서, 컬럼 분획에서 AAV 벡터 게놈 (vg)의 농도는 정량적 실시간 PCR (Q-PCR)에 의해 측정될 수 있다. 시료는 외인성 DNA를 제거하도록 희석하여 DNase I (또는 또 다른 적합한 뉴클레아제)로 소화시킨다. 뉴클레아제의 불활성화 이후에, 시료는 추가로 희석되어 프라이머들 사이의 DNA 서열에 특이적인 TaqManTM 형광생성 프로브를 사용하여 증폭되었다. 정의된 수준의 형광에 도달하는데 필요한 주기의 횟수 (역치 주기, Ct)는 각 시료에 대해 어플라이드 바이오시스템 프리즘 7700 서열 검출 시스템 상에서 측정되었다. AAV 벡터에 포함된 서열과 동일한 서열을 포함하는 플라스미드 DNA는 Q-PCR 반응에서 표준 곡선을 생성하는데 채용되었다. 시료로부터 획득된 주기 역치 (Ct) 값은 벡터 게놈 역가를 플라스미드 표준 곡선의 Ct 값으로 정규화함으로써 이를 결정하는데 사용된다. 디지털 PCR을 기초로 한 종결점 검정법도 사용될 수 있다.
일 양태에서, 광범위 스펙트럼 세린 프로테아제, 예로 단백질분해효소 K (예컨대 퀴아젠사로부터 구입가능함)를 사용하는 최적화된 q-PCR 방법이 사용된다. 보다 구체적으로, 최적화된 q-PCR 게놈 역가 검정법은 DNAase I 소화 이후에 시료를 단백질분해효소 K 완충액으로 희석하여 단백질분해효소 K로 처리하고, 이어서 열 불활성화를 진행하는 점을 제외하고는 표준 검정법과 유사하다. 적합하게, 시료는 시료 크기와 동등한 양의 단백질분해효소 K 완충액으로 희석된다. 단백질분해효소 K 완충액은 2배 이상으로 농축될 수 있다. 전형적으로, 단백질분해효소 K 처리는 약 0.2 mg/mL이지만, 0.1 mg/mL 내지 약 1 mg/mL으로 변화될 수 있다. 처리 단계는 일반적으로 약 55℃에서 약 15분 동안 시행되지만, 더 낮은 온도 (예로, 약 37℃ 내지 약 50℃)에서 더 긴 시간 (예로, 약 20분 내지 약 30분) 동안, 또는 더 높은 온도 (예로, 최고 약 60℃)에서 더 짧은 시간 (예로, 약 5분 내지 10분) 동안 수행될 수 있다. 유사하게, 열 불활성화는 일반적으로 약 95℃에서 약 15분 동안이지만, 온도를 낮추고 (예로, 약 70℃ 내지 약 90℃) 시간을 연장할 수 있다 (예로, 약 20분 내지 30분). 다음으로 시료를 희석하고 (예로, 1,000배), 표준 검정법에서 설명된 바와 같이 TaqMan 분석을 시행한다.
추가적으로 또는 대안적으로, 비말 디지털 PCR (ddPCR)이 사용될 수 있다. 예를 들면, ddPCR에 의해 단일가닥 및 자가-상보적 AAV 벡터 게놈 역가를 결정하는 방법이 기재되어 있다. 예로, M. Lock et al., Hu Gene Therapy Methods, Hum Gene Ther Methods, 2014년 4월; 25(2): 115-25. doi: 10.1089/hgtb.2013.131. Epub 2014년 2월 14일 참조.
간략하게, 게놈 결함성 AAVhu68 (또는 AAVrh91) 중간물로부터 포장된 게놈 서열을 갖는 rAAVhu68 (또는 rAAVrh91) 입자를 분리하는 방법은 재조합 AAVhu68 (또는 rh91) 바이러스 입자 및 AAVhu68 (또는 AAVrh91) 캡시드 중간물을 포함하는 현탁액에 대해 신속 성능 액체 크로마토그래피를 시행하는 단계를 포함하고, 여기서 AAVhu68 (또는 AAVrh91) 바이러스 입자 및 AAVhu68 중간물은 pH 약 10.2 (AAVrh91의 경우 pH 약 9.8)에서 평형화된 강한 음이온 교환 레진에 결합시키고, 용리물을 약 260 nm 및 약 280 nm에서 자외선 흡광도에 대해 모니터링하면서 염 구배를 시행한다. rAAVhu68 또는 AAVrh91의 경우에 덜 적합하지만, pH 약 10 내지 10.4의 범위일 수 있다. 이러한 방법에서, AAV 완전한 캡시드는 A260/A280 비가 감염점에 도달할 때 용리되는 분획으로부터 수집된다. 일 예에서, 친화 크로마토그래피 단계의 경우, 투과여과된 산물은 AAVhu68 또는 AAVrh91 혈청형을 효율적으로 포획하는 친화 레진 (라이프 테크놀로지사)에 적용될 수 있다. 이들 이온 조건 하에, 유의한 백분율의 잔류 세포성 DNA 및 단백질은 컬럼을 통과하는 반면, AAV 입자는 효율적으로 포획된다.
rAAV.hCDKL5는 적합한 생리학적으로 적격한 조성물 (예로, 완충된 식염수)에 현탁된다. 이러한 조성물은 보관을 위해 냉동되고, 이후에 해동되며, 선택적으로 적합한 희석제로 희석될 수 있다. 대안적으로, 벡터는 냉동 및 해동 단계를 거치지 않고도 환자에게 전달에 적합한 조성물로서 제조될 수 있다.
본원에 사용된 용어 "NAb 역가"는 항체의 표적화된 에피토프 (예로, AAV)의 생리학적 효과를 중화시키는 중화 항체 (예로, 항-AAV NAb)가 생산되는 양의 측정이다. 항-AAV NAb 역가는, 예로 본원에 참고문헌으로 통합되는 Calcedo, R., et al., Worldwide Epidemiology of Neutralizing Antibodies to Adeno-Associated Viruses. Journal of Infectious Diseases, 2009, 199(3): 381-390에 기술된 바와같이 측정될 수 있다.
약어 "sc"는 자가-상보적임을 말한다. "자가-상보적인 AAV"는 재조합 AAV 핵산에 보유되는 코딩 영역이 분자내 이중가닥 DNA 주형을 형성하도록 설계되었던 구조물을 말한다. 감염 시, 세포 매개된 두 번째 가닥의 합성을 기다리기보다는, scAAV의 2개의 상보적인 절반이 회합하여 즉각적인 복제 및 전사가 준비된 하나의 이중가닥 DNA (dsDNA) 단위를 형성할 것이다. 예로, D.M. McCarty et al, "Self-complementary recombinant adeno-associated virus (scAAV) vectors promote efficient transduction independently of DNA synthesis", Gene Therapy, (2001년 8월), Vol 8, No. 16, pp 1248-1254 참조. 자가-상보적인 AAV는, 예로 미국 특허 제 US 6,596,535호; 제 US 7,125,717호; 및 제 US 7,456,683호에 기술되어 있으며, 이들 각각은 본원에 이들의 전문이 참고문헌으로 통합된다.
"복제 결함성 바이러스" 또는 "바이러스성 벡터"는 관심있는 유전자를 포함하는 발현 카세트가 바이러스 캡시드 또는 외피에 포장되는 합성 또는 인공 바이러스 입자로서, 바이러스 캡시드 또는 외피 내에 포장된 임의의 바이러스 게놈 서열도 복제 결함성이고, 즉 이들이 자손 비리온을 생성할 수는 없지만 표적 세포를 감염시키는 능력은 보유하는, 바이러스 입자를 말한다. 일 구현예에서, 바이러스성 벡터의 게놈은 복제하는데 필요한 효소를 인코딩하는 유전자를 포함하지 않지만 (게놈이 인공 게놈의 증폭 및 포장에 필요한 신호가 연접된 관심있는 유전자만을 포함하는 "내용물이 없음"으로 조작될 수 있음), 이들 유전자가 생산 과정 동안 공급될 수 있다. 따라서, 이것은 자손 비리온에 의한 복제 및 감염이 복제에 필요한 바이러스 효소가 존재하지 않고는 발생할 수 없기 때문에 유전자 요법에 사용되기에 안전한 것으로 간주된다.
많은 경우에, rAAV 입자는 DNAase 저항성으로 언급된다. 그러나, 이러한 엔도뉴클레아제 (DNAase)에 추가하여, 다른 엔도- 및 엑소- 뉴클레아제도 본원에 기술된 정제 단계에서 오염된 핵산을 제거하는데 사용될 수 있다. 이러한 뉴클레아제는 단일가닥 DNA 및/또는 이중가닥 DNA, 및 RNA를 분해하도록 선택될 수 있다. 이러한 단계는 단일한 뉴클레아제 또는 상이한 표적으로 유도되는 뉴클레아제의 혼합물을 포함할 수 있고, 엔도뉴클레아제 또는 엑소뉴클레아제일 수 있다.
용어 "뉴클레아제 - 저항성"은 AAV 캡시드가 유전자를 숙주 세포로 전달하도록 설계된 발현 카세트 주변에 완전하게 조립되고, 이들 포장된 게놈 서열이 생산 공정으로부터 생성될 수 있는 오염된 핵산을 제거하도록 설계된 뉴클레아제 배양 단계 동안 분해 (소화)로부터 보호하는 것을 가리킨다.
Ⅳ. 기타 벡터
본원에 기술된 발현 카세트를 포함하는 벡터가 본원에 제공된다. 특정 구현예에서, 발현 카세트는 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 사이클린 의존성 키나제 유사 5 (hCDKL5)를 인코딩하는 핵산 서열을 포함한다. 특정 구현예에서, hCDKL5 코딩 서열은
[MKIPNIGNVMNKFEILGVVGEGAYGVVLKCRHKETHEIVAIKKFKDSEENEEVKETTLRELKMLRTLKQENIVELKEAFRRRGKLYLVFEYVEKNMLELLEEMPNGVPPEKVKSYIYQLIKAIHWCHKNDIVHRDIKPENLLISHNDVLKLCDFGFARNLSEGNNANYTEYVATRWYRSPELLLGAPYGKSVDMWSVGCILGELSDGQPLFPGESEIDQLFTIQKVLGPLPSEQMKLFYSNPRFHGLRFPAVNHPQSLERRYLGILNSVLLDLMKNLLKLDPADRYLTEQCLNHPTFQTQRLLDRSPSRSAKRKPYHVESSTLSNRNQAGKSTALQSHHRSNSKDIQNLSVGLPRADEGLPANESFLNGNLAGASLSPLHTKTYQASSQPGSTSKDLTNNNIPHLLSPKEAKSKTEFDFNIDPKPSEGPGTKYLKSNSRSQQNRHSFMESSQSKAGTLQPNEKQSRHSYIDTIPQSSRSPSYRTKAKSHGALSDSKSVSNLSEARAQIAEPSTSRYFPSSCLDLNSPTSPTPTRHSDTRTLLSPSGRNNRNEGTLDSRRTTTRHSKTMEELKLPEHMDSSHSHSLSAPHESFSYGLGYTSPFSSQQRPHRHSMYVTRDKVRAKGLDGSLSIGQGMAARANSLQLLSPQPGEQLPPEMTVARSSVKETSREGTSSFHTRQKSEGGVYHDPHSDDGTAPKENRHLYNDPVPRRVGSFYRVPSPRPDNSFHENNVSTRVSSLPSESSSGTNHSKRQPAFDPWKSPENISHSEQLKEKEKQGFFRSMKKKKKKSQTVPNSDSPDLLTLQKSIHSASTPSSRPKEWRPEKISDLQTQSQPLKSLRKLLHLSSASNHPASSDPRFQPLTAQQTKNSFSEIRIHPLSQASGGSSNIRQEPAPKGRPALQLPGQMDPGWHVSSVTRSATEGPSYSEQLGAKSGPNGHPYNRTNRSRMPNLNDLKETAL] (서열번호 2)의 아미노산 서열을 포함하는 hCDKL5 단백질을 인코딩하고, 여기서 hCDKL5 코딩 서열은 서열번호 22의 또는 서열번호 22와 적어도 약 95% 일치하고 서열번호 2의 단백질을 인코딩하는 핵산 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은
[MKIPNIGNVMNKFEILGVVGEGAYGVVLKCRHKETHEIVAIKKFKDSEENEEVKETTLRELKMLRTLKQENIVELKEAFRRRGKLYLVFEYVEKNMLELLEEMPNGVPPEKVKSYIYQLIKAIHWCHKNDIVHRDIKPENLLISHNDVLKLCDFGFARNLSEGNNANYTEYVATRWYRSPELLLGAPYGKSVDMWSVGCILGELSDGQPLFPGESEIDQLFTIQKVLGPLPSEQMKLFYSNPRFHGLRFPAVNHPQSLERRYLGILNSVLLDLMKNLLKLDPADRYLTEQCLNHPTFQTQRLLDRSPSRSAKRKPYHVESSTLSNRNQAGKSTALQSHHRSNSKDIQNLSVGLPRADEGLPANESFLNGNLAGASLSPLHTKTYQASSQPGSTSKDLTNNNIPHLLSPKEAKSKTEFDFNIDPKPSEGPGTKYLKSNSRSQQNRHSFMESSQSKAGTLQPNEKQSRHSYIDTIPQSSRSPSYRTKAKSHGALSDSKSVSNLSEARAQIAEPSTSRYFPSSCLDLNSPTSPTPTRHSDTRTLLSPSGRNNRNEGTLDSRRTTTRHSKTMEELKLPEHMDSSHSHSLSAPHESFSYGLGYTSPFSSQQRPHRHSMYVTRDKVRAKGLDGSLSIGQGMAARANSLQLLSPQPGEQLPPEMTVARSSVKETSREGTSSFHTRQKSEGGVYHDPHSDDGTAPKENRHLYNDPVPRRVGSFYRVPSPRPDNSFHENNVSTRVSSLPSESSSGTNHSKRQPAFDPWKSPENISHSEQLKEKEKQGFFRSMKKKKKKSQTTDSTNGENPSIKKSLFPLFNSKNHLKHSSSLKKLPVVTPPMVPNSDSPDLLTLQKSIHSASTPSSRPKEWRPEKISDLQTQSQPLKSLRKLLHLSSASNHPASSDPRFQPLTAQQTKNSFSEIRIHPLSQASGGSSNIRQEPAPKGRPALQLPGQMDPGWHVSSVTRSATEGPSYSEQLGAKSGPNGHPYNRTNRSRMPNLNDLKETAL] (서열번호 6)의 아미노산 서열을 포함하는 hCDKL5-2GS 단백질을 인코딩하고, 여기서 hCDKL5 코딩 서열은 서열번호 24의 또는 서열번호 24와 적어도 약 95% 일치하고 서열번호 6의 단백질을 인코딩하는 핵산 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은
[MKIPNIGNVMNKFEILGVVGEGAYGVVLKCRHKETHEIVAIKKFKDSEENEEVKETTLRELKMLRTLKQENIVELKEAFRRRGKLYLVFEYVEKNMLELLEEMPNGVPPEKVKSYIYQLIKAIHWCHKNDIVHRDIKPENLLISHNDVLKLCDFGFARNLSEGNNANYTEYVATRWYRSPELLLGAPYGKSVDMWSVGCILGELSDGQPLFPGESEIDQLFTIQKVLGPLPSEQMKLFYSNPRFHGLRFPAVNHPQSLERRYLGILNSVLLDLMKNLLKLDPADRYLTEQCLNHPTFQTQRLLDRSPSRNQAGKSTALQSHHRSNSKDIQNLSVGLPRADEGLPANESFLNGNLAGASLSPLHTKTYQASSQPGSTSKDLTNNNIPHLLSPKEAKSKTEFDFNIDPKPSEGPGTKYLKSNSRSQQNRHSFMESSQSKAGTLQPNEKQSRHSYIDTIPQSSRSPSYRTKAKSHGALSDSKSVSNLSEARAQIAEPSTSRYFPSSCLDLNSPTSPTPTRHSDTRTLLSPSGRNNRNEGTLDSRRTTTRHSKTMEELKLPEHMDSSHSHSLSAPHESFSYGLGYTSPFSSQQRPHRHSMYVTRDKVRAKGLDGSLSIGQGMAARANSLQLLSPQPGEQLPPEMTVARSSVKETSREGTSSFHTRQKSEGGVYHDPHSDDGTAPKENRHLYNDPVPRRVGSFYRVPSPRPDNSFHENNVSTRVSSLPSESSSGTNHSKRQPAFDPWKSPENISHSEQLKEKEKQGFFRSMKKKKKKSQTVPNSDSPDLLTLQKSIHSASTPSSRPKEWRPEKISDLQTQSQPLKSLRKLLHLSSASNHPASSDPRFQPLTAQQTKNSFSEIRIHPLSQASGGSSNIRQEPAPKGRPALQLPGQMDPGWHVSSVTRSATEGPSYSEQLGAKSGPNGHPYNRTNRSRMPNLNDLKETAL] (서열번호 8)의 아미노산 서열을 포함하는 hCDKL5-3GS 단백질을 인코딩하고, 여기서 hCDKL5 코딩 서열은 서열번호 25의 또는 서열번호 25와 적어도 약 95% 일치하고 서열번호 8의 단백질을 인코딩하는 핵산 서열이다. 특정 구현예에서, hCDKL5 코딩 서열은
[MKIPNIGNVMNKFEILGVVGEGAYGVVLKCRHKETHEIVAIKKFKDSEENEEVKETTLRELKMLRTLKQENIVELKEAFRRRGKLYLVFEYVEKNMLELLEEMPNGVPPEKVKSYIYQLIKAIHWCHKNDIVHRDIKPENLLISHNDVLKLCDFGFARNLSEGNNANYTEYVATRWYRSPELLLGAPYGKSVDMWSVGCILGELSDGQPLFPGESEIDQLFTIQKVLGPLPSEQMKLFYSNPRFHGLRFPAVNHPQSLERRYLGILNSVLLDLMKNLLKLDPADRYLTEQCLNHPTFQTQRLLDRSPSRNQAGKSTALQSHHRSNSKDIQNLSVGLPRADEGLPANESFLNGNLAGASLSPLHTKTYQASSQPGSTSKDLTNNNIPHLLSPKEAKSKTEFDFNIDPKPSEGPGTKYLKSNSRSQQNRHSFMESSQSKAGTLQPNEKQSRHSYIDTIPQSSRSPSYRTKAKSHGALSDSKSVSNLSEARAQIAEPSTSRYFPSSCLDLNSPTSPTPTRHSDTRTLLSPSGRNNRNEGTLDSRRTTTRHSKTMEELKLPEHMDSSHSHSLSAPHESFSYGLGYTSPFSSQQRPHRHSMYVTRDKVRAKGLDGSLSIGQGMAARANSLQLLSPQPGEQLPPEMTVARSSVKETSREGTSSFHTRQKSEGGVYHDPHSDDGTAPKENRHLYNDPVPRRVGSFYRVPSPRPDNSFHENNVSTRVSSLPSESSSGTNHSKRQPAFDPWKSPENISHSEQLKEKEKQGFFRSMKKKKKKSQTTDSTNGENPSIKKSLFPLFNSKNHLKHSSSLKKLPVVTPPMVPNSDSPDLLTLQKSIHSASTPSSRPKEWRPEKISDLQTQSQPLKSLRKLLHLSSASNHPASSDPRFQPLTAQQTKNSFSEIRIHPLSQASGGSSNIRQEPAPKGRPALQLPGQMDPGWHVSSVTRSATEGPSYSEQLGAKSGPNGHPYNRTNRSRMPNLNDLKETAL] (서열번호 10)의 아미노산 서열을 포함하는 hCDKL5-4GS 단백질을 인코딩하고, 여기서 hCDKL5 코딩 서열은 서열번호 26의 또는 서열번호 26과 적어도 약 95% 일치하고 서열번호 10의 단백질을 인코딩하는 핵산 서열이다.
특정 구현예에서, 벡터는 재조합 파보바이러스, 재조합 렌티바이러스, 재조합 레트로바이러스 또는 재조합 아데노바이러스; 또는 노출 DNA, 노출 RNA, 무기 입자, 지질 입자, 중합체 기반의 벡터 또는 키토산 기반의 제형물로부터 선택된 바이러스성 벡터일 수 있다. 선택된 벡터는 형질감염, 전기천공, 리포좀 전달, 막 융합 기법, 고속 DNA 코팅된 펠렛, 바이러스성 감염 및 원형질체 융합을 포함하는 임의의 적합한 방법에 의해 전달될 수 있다. 이러한 구조물을 제조하는데 사용된 방법은 핵산 조작 분야의 당업자에게 공지되어 있으며, 유전공학, 재조합 공학 및 합성 기법을 포함한다. 예로, Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY 참조.
"복제 결함성 바이러스" 또는 "바이러스성 벡터"는 관심있는 유전자를 포함하는 발현 카세트가 바이러스 캡시드 또는 외피에 포장되는 합성 또는 인공 바이러스 입자로서, 바이러스 캡시드 또는 외피 내에 포장된 임의의 바이러스 게놈 서열도 복제 결함성이고, 즉 이들이 자손 비리온을 생성할 수는 없지만 표적 세포를 감염시키는 능력은 보유하는, 바이러스 입자를 말한다. 일 구현예에서, 바이러스성 벡터의 게놈은 복제하는데 필요한 효소를 인코딩하는 유전자를 포함하지 않지만 (게놈이 인공 게놈의 증폭 및 포장에 필요한 신호가 연접된 관심있는 유전자만을 포함하는 "내용물이 없음"으로 조작될 수 있음), 이들 유전자가 생산 과정 동안 공급될 수 있다. 따라서, 이것은 자손 비리온에 의한 복제 및 감염이 복제에 필요한 바이러스 효소가 존재하지 않고는 발생할 수 없기 때문에 유전자 요법의 사용에 안전한 것으로 간주된다. 이러한 복제 결함성 바이러스는 아데노 관련 바이러스 (AAV), 아데노바이러스, 렌티바이러스 (혼입 또는 비-혼입), 또는 또 다른 적합한 바이러스 출처일 수 있다.
Ⅴ. 조성물
본원에서는 본원에 기술된 rAAV 또는 벡터, 및 수성 현탁액 매질을 포함하는 조성물이 제공된다. 특정 구현예에서, 현탁액은 정맥내 전달, 경막내 투여 또는 뇌실내 투여를 위해 제형화된다.
본원에서는 적어도 하나의 rAAV 스톡, 및 선택적 담체, 부형제 및/또는 보존제를 포함하는 조성물이 제공된다. 본원에 사용된 바, rAAV의 "스톡"은 rAAV의 집단을 말한다. 탈아미드화로 인한 이들의 캡시드 단백질의 이종성에도 불구하고, 스톡에서 rAAV는 일치하는 벡터 게놈을 공유할 것으로 예상된다. 스톡은 예를 들면 선택된 AAV 캡시드 단백질 및 선택된 생산 시스템의 이종유래 탈아미드화 양상 특징으로의 캡시드를 갖는 rAAV를 포함할 수 있다. 스톡은 단일 생산 시스템으로부터 생산되거나, 생산 시스템의 다수의 전개로부터 풀링될 수 있다. 본원에 기술된 생산 시스템을 포함하나 이에 한정되지 않은 다양한 생산 시스템이 선택될 수 있다.
본원에 사용된 바, "담체"는 임의의 및 모든 용매, 분산 매질, 비히클, 코팅제, 희석제, 항균제 및 항진균제, 등장제 및 흡수 지연제, 완충액, 담체 용액, 현탁액 및 콜로이드 등을 포함한다. 약제학적 활성 물질의 위한 이러한 매질 및 제제의 사용은 당해 기술분야에 널리 공지되어 있다. 또한, 보조적 활성 성분이 조성물 내에 도입될 수 있다. 용어 "약제학적으로 허용가능한"은 숙주에게 투여될 때 알레르기 또는 유사한 유해 반응을 생성하지 않는 분자적 실체 및 조성물을 말한다. 리포좀, 나노캡슐, 미세입자, 미세구, 액체 입자 및 소포 등과 같은 전달 비히클은 적합한 숙주 세포 내로 본 발명의 조성물의 도입에 사용될 수 있다. 구체적으로, rAAV 벡터 전달된 벡터 게놈은 액체 입자, 리포좀, 소포, 나노구 또는 나노입자 등에 피막화된 전달을 위해 제형화될 수 있다.
일 구현예에서, 조성물은 대상체에게 전달에 적합한 최종 제형물을 포함하고, 예로 생리학적으로 적격한 pH 및 염 농도로 완충된 수성 액체 현탁액이다. 선택적으로, 하나 이상의 계면활성제가 제형물에 존재한다. 또 다른 구현예에서, 조성물은 대상체에게 투여를 위해 희석되는 농축물로서 운반될 수 있다. 다른 구현예에서, 조성물은 동결건조되고, 투여 시 재구성될 수 있다.
적합한 계면활성제 또는 계면활성제의 조합은 비-독성인 비-이온성 계면활성제부터 선택될 수 있다. 일 구현예에서, 일차 히드록시기로 종결되는 이중기능성 블록 공중합체 계면활성제가, 예로 중성 pH를 갖고 평균 분자량 8,400을 갖는 폴록사머 188로도 알려져 있는 플루로닉®F68 [바스프사]와 같이 선택된다. 다른 계면활성제 및 다른 폴록사머, 즉 폴리옥시에틸렌 (폴리(에틸렌 옥사이드))의 2개 친수성 사슬에 의해 연접된 폴리옥시프로필렌 (폴리(프로필렌 옥사이드))의 중앙 친수성 사슬로 구성된 비-이온성 삼중블록 공중합체, 솔루톨 HS 15 (마크로골-15 히드록시스테아레이트), 라브라졸 (폴리옥시 카프릴릭 글리세리드), 폴리옥시 10 올레일 에테르, 트윈 (폴리옥시에틸렌 소르비탄 지방산 에스테르), 에탄올 및 폴리에틸렌 글리콜이 선택될 수 있다. 일 구현예에서, 제형물은 폴록사머를 포함한다. 이들 공중합체는 공통적으로 문자 "P" (폴록사머)에 이어진 3개의 자리수로 명명되고, 처음 2개의 자리수 × 100은 폴리옥시프로필렌 코아의 대략적인 분자 질량을 나타내고, 마지막 자리수 × 10은 폴리옥시에틸렌 함량의 백분율을 나타낸다. 일 구현예에서, 폴록사머 188이 선택된다. 일 구현예에서, 계면활성제는 (중량비 w/w%를 기준으로 하여) 현탁액 중 최대 약 0.0005% 내지 약 0.001%의 양으로 존재할 수 있다. 또 다른 구현예에서, 계면활성제는 (부피비 v/v%를 기준으로 하여) 현탁액 중 최대 약 0.0005% 내지 약 0.001%의 양으로 존재할 수 있다. 또 다른 구현예에서, 계면활성제는 현탁액 중 최대 약 0.0005% 내지 약 0.001%의 양으로 존재할 수 있고, 여기서 n%는 100 mL의 현탁액 당 n 그램을 나타낸다.
또 다른 구현예에서, 조성물은 담체, 희석제, 부형제 및/또는 아쥬반트를 포함한다. 적합한 담체는 전달 바이러스가 유도하는 적응증의 관점에서 당업자라면 쉽게 선택할 수 있다. 예를 들면, 하나의 적합한 담체는 식염수이고, 이는 다양한 완충 용액으로 제형화될 수 있다 (예로, 포스페이트 완충된 식염수). 다른 예시적인 담체는 멸균 식염수, 락토스, 슈크로스, 칼슘 포스페이트, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩유, 참깨유 및 물을 포함한다. 완충액/담체는 rAAV의 주입 튜브에 대한 접착을 방지하지만 생체내에서 rAAV 결합 활성에 개입하지 않는다. 적합한 계면활성제 또는 계면활성제의 조합은 비-독성인 비-이온성 계면활성제부터 선택될 수 있다. 일 구현예에서, 일차 히드록시기로 종결되는 이중기능성 블록 공중합체 계면활성제가, 예로 중성 pH를 갖고 평균 분자량 8,400을 갖는 폴록사머 188 (상표명 플루로닉® F68 [바스프사], 루트롤® F68, 신페로닉® F68, 콜리포® P188으로도 알려져 있음)와 같이 선택된다. 다른 계면활성제 및 다른 폴록사머, 즉 폴리옥시에틸렌 (폴리(에틸렌 옥사이드))의 2개 친수성 사슬에 의해 연접된 폴리옥시프로필렌 (폴리(프로필렌 옥사이드))의 중앙 친수성 사슬로 구성된 비-이온성 삼중블록 공중합체, 솔루톨 HS 15 (마크로골-15 히드록시스테아레이트), 라브라졸 (폴리옥시 카프릴릭 글리세리드), 폴리옥시-올레일 에테르, 트윈 (폴리옥시에틸렌 소르비탄 지방산 에스테르), 에탄올 및 폴리에틸렌 글리콜이 선택될 수 있다. 일 구현예에서, 제형물은 폴록사머를 포함한다. 이들 공중합체는 공통적으로 문자 "P" (폴록사머)에 이어진 3개의 자리수로 명명되고, 처음 2개의 자리수 × 100은 폴리옥시프로필렌 코아의 대략적인 분자 질량을 나타내고, 마지막 자리수 × 10은 폴리옥시에틸렌 함량의 백분율을 나타낸다. 일 구현예에서, 폴록사머 188이 선택된다. 계면활성제는 현탁액 중 최대 약 0.0005% 내지 약 0.001%의 양으로 존재할 수 있다.
특정 구현예에서, rAAV.hCDKL5를 포함하는 조성물은 pH 6.8 내지 8, pH 7.2 내지 7.8, 또는 pH 7.5 내지 8의 범위에서 전달된다. 경막내 전달을 위해, pH 7.5 초과, 예로 pH 7.5 내지 8, 또는 pH 7.8이 바람직할 수 있다.
특정 구현예에서, 제형물은 소듐 바이카보네이트를 포함하지 않는 완충된 식염수 수성 용액을 포함할 수 있다. 이러한 제형물은 물에 소듐 포스페이트, 염화나트륨, 염화 칼륨, 염화 칼슘, 염화 마그네슘 및 이들의 혼합물 중 하나 이상을 포함하는 완충된 식염수 수성 용액, 예컨대 하바드 완충액을 포함할 수 있다. 수성 용액은 바스프사로부터 입수가능하고 이전에 상표명 루트롤® F68로 시판되었던 폴록사머, 콜리포® P188를 추가로 포함할 수 있다. 수성 용액은 pH 7.2일 수 있다.
또 다른 구현예에서, 제형물은 1 mM 소듐 포스페이트 (Na3PO4), 150 mM 염화나트륨 (NaCl), 3 mM 염화 칼륨 (KCl), 1.4 mM 염화 칼슘 (CaCl2), 0.8 mM 염화 마그네슘 (MgCl2) 및 0.001% 폴록사머 (예로, 콜리포®) 188, pH 7.2를 포함하는 완충된 식염수 수성 용액을 포함할 수 있다. 예로, harvardapparatus.com/harvard-apparatus-perfusion-fluid.html 참조. 특정 구현예에서, 하바드 완충액으로 관찰된 더 양호한 pH 안정성으로 인해 하바드 완충액이 바람직하다.
특정 구현예에서, 제형물 완충액은 플루로닉 F68을 갖는 인공 CSF이다. 다른 구현예에서, 제형물은 하나 이상의 투과 인핸서를 포함할 수 있다. 적합한 투과 인핸서의 예는 예로 만니톨, 소듐 글리코콜레이트, 소듐 타우로콜레이트, 소듐 데옥시콜레이트, 소듐 살리실레이트, 소듐 카프릴레이트, 소듐 카프레이트, 소듐 라우릴 설페이트, 폴리옥시에틸렌-9-라우렐 에테르 또는 EDTA를 포함할 수 있다.
선택적으로, 본 발명의 조성물은 rAAV 및 담체(들)에 추가하여, 다른 통상적인 약제학적 성분, 예컨대 보존제 또는 화학적 안정화를 포함할 수 있다. 적합한 예시적인 보존제는 클로로부탄올, 포타슘 소르베이트, 소르브산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀 및 파라클로로페놀을 포함한다. 적합한 화학적 안정화제는 젤라틴 및 알부민을 포함한다.
본 발명에 따른 조성물은 상기 정의된 것과 같은 약제학적으로 허용가능한 담체를 포함할 수 있다. 적합하게, 본원에 기술된 조성물은 약제학적으로 적합한 담체에 현탁되고/거나, 주사, 삼투 펌프, 경막내 카테터를 통한 대상체에게 전달을 위해 또는 또 다른 장치 또는 경로에 의한 전달을 위해 설계된 적합한 부형제와 혼합된 하나 이상의 AAV의 유효량을 포함한다. 일 예에서, 조성물은 경막내 전달을 위해 제형화된다. 일 예에서, 조성물은 정맥내 (iv) 전달을 위해 제형화된다.
Ⅵ. 용도
본원에서는 CDD를 치료하는 방법으로서, 본원에 기술된 rAAV 또는 벡터의 유효량을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는, 방법이 제공된다.
특정 구현예에서, 본원의 "유효량"은 CDD 증상의 완화 및/또는 CDD 진행의 지연을 달성하는 양이다.
벡터는 과도한 유해 효과가 없이 또는 의학적으로 허용가능한 생리학적 효과와 함께 치료적 유익을 제공하도록 세포를 형질감염시켜 충분한 수준의 유전자 전달 및 발현을 제공하기에 충분한 양으로 투여되고, 이는 의학 분야의 당업자에 의해 결정될 수 있다. 통상적인 및 약제학적으로 허용가능한 투여 경로는 원하는 장기 (예로, 뇌, CSF, 간 (선택적으로 간 동맥을 통해), 폐, 심장, 눈, 신장)에 대한 직접적 전달, 경구, 흡입, 비강내, 경막내, 기관내, 동맥내, 안구내, 정맥내, 근육내, 피하, 피부내, 실질내, 뇌실내, 경막내, ICM, 요추 천자, 및 기타 비경구 투여 경로를 포함하나 이에 한정되지 않는다. 투여 경로는 원하는 경우 조합될 수 있다.
바이러스성 벡터의 용량은 주로 치료되는 병태, 환자의 연령, 체중 및 건강과 같은 요인에 의존하고, 따라서 환자들에서 변화될 수 있다. 예를 들면, 바이러스성 벡터의 치료적으로 유효한 인간 용량은 일반적으로 약 1 × 109개 내지 1 × 1016개 벡터 게놈 사본의 농도를 포함하는 약 100 mL의 용액 중 약 25 μL 내지 약 1,000 μL 범위이다. 특정 구현예에서, 약 1 mL 내지 약 15 mL, 약 2.5 mL 내지 약 10 mL, 또는 약 5 mL 부피의 현탁액이 전달된다. 특정 구현예에서, 약 1 mL, 약 2 mL, 약 3 mL, 약 4 mL, 약 5 mL, 약 6 mL, 약 7 mL, 약 8 mL, 약 9 mL, 약 10 mL, 약 11 mL, 약 12 mL, 약 13 mL, 약 14 mL, 또는 약 15 mL 부피의 현탁액이 전달된다. 특정 구현예에서, 총 약 8.9 × 1012개 내지 2.7 × 1014개 GC의 용량이 이러한 부피로 투여된다. 특정 구현예에서, 총 약 1.1 × 1010개 GC/g 뇌 질량 내지 약 3.3 × 1011개 GC/g 뇌 질량의 용량이 이러한 부피로 투여된다. 특정 구현예에서, 약 3.0 × 109개 GC/g 뇌 질량, 약 4.0 × 109개, 약 5.0 × 109개, 약 6.0 × 109개, 약 7.0 × 109개, 약 8.0 × 109개, 약 9.0 × 109개, 약 1.0 × 1010개, 약 1.1 × 1010개, 약 1.5 × 1010개, 약 2.0 × 1010개, 약 2.5 × 1010개, 약 3.0 × 1010개, 약 3.3 × 1010개, 약 3.5 × 1010개, 약 4.0 × 1010개, 약 4.5 × 1010개, 약 5.0 × 1010개, 약 5.5 × 1010개, 약 6.0 × 1010개, 약 6.5 × 1010개, 약 7.0 × 1010개, 약 7.5 × 1010개, 약 8.0 × 1010개, 약 8.5.0 × 1010개, 약 9.0 × 1010개, 약 9.5 × 1010개, 약 1.0 × 1011개, 약 1.1 × 1011개, 약 1.5 × 1011개, 약 2.0 × 1011개, 약 2.5 × 1011개, 약 3.0 × 1011개, 약 3.3 × 1011개, 약 3.5 × 1011개, 약 4.0 × 1011개, 약 4.5 × 1011개, 약 5.0 × 1011개, 약 5.5 × 1011개, 약 6.0 × 1011개, 약 6.5 × 1011개, 약 7.0 × 1011개, 약 7.5 × 1011개, 약 8.0 × 1011개, 약 8.5 × 1011개, 약 9.0 × 1011개 GC/g 뇌 질량의 용량이 이러한 부피로 투여된다.
용량은 임의의 부작용에 대응한 치료적 이익을 균형 잡도록 조절되고, 이러한 용량은 재조합 벡터가 채용되는 치료적 적용에 따라 달라질 수 있다. 트랜스 유전자 산물의 발현 수준은 바이러스성 벡터, 바람직하게 미니유전자를 포함하는 AAV 벡터를 생성하는 용량의 빈도를 결정하도록 모니터링될 수 있다. 선택적으로, 치료적 목적으로 기술된 것과 유사한 용량 요법은 본 발명의 조성물을 사용한 면역화에 사용될 수 있다.
복제 결함성 바이러스 조성물은 (대상체를 치료하는데) 범위 내의 모든 정수 또는 분획 양을 포함하여 약 1 × 109개 내지 약 1 × 1016개 GC, 바람직하게 인간 환자의 경우 1 × 1012개 내지 약 1 × 1014개 GC의 범위에 있는 복제 결함성 바이러스의 양을 포함하도록 용량 단위로 제형화될 수 있다. 일 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 109개, 2 × 109개, 3 × 109개, 4 × 109개, 5 × 109개, 6 × 109개, 7 × 109개, 8 × 109개 또는 9 × 109개 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1010개, 2 × 1010개, 3 × 1010개, 4 × 1010개, 5 × 1010개, 6 × 1010개, 7 × 1010개, 8 × 1010개 또는 9 × 1010개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1011개, 2 × 1011개, 3 × 1011개, 4 × 1011개, 5 × 1011개, 6 × 1011개, 7 × 1011개, 8 × 1011개 또는 9 × 1011개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1012개, 2 × 1012개, 3 × 1012개, 4 × 1012개, 5 × 1012개, 6 × 1012개, 7 × 1012개, 8 × 1012개 또는 9 × 1012개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1013개, 2 × 1013개, 3 × 1013개, 4 × 1013개, 5 × 1013개, 6 × 1013개, 7 × 1013개, 8 × 1013개 또는 9 × 1013개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1014개, 2 × 1014개, 3 × 1014개, 4 × 1014개, 5 × 1014개, 6 × 1014개, 7 × 1014개, 8 × 1014개 또는 9 × 1014개의 GC를 포함하도록 제형화된다. 또 다른 구현예에서, 조성물은 범위 내의 모든 정수 또는 분획 양을 포함하여 용량 당 적어도 1 × 1015개, 2 × 1015개, 3 × 1015개, 4 × 1015개, 5 × 1015개, 6 × 1015개, 7 × 1015개, 8 × 1015개 또는 9 × 1015개의 GC를 포함하도록 제형화된다.
일 구현예에서, 인간 적용을 위해, 용량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 1010개 내지 약 1 × 1015개 GC의 범위를 갖을 수 있다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 109개, 2 × 109개, 3 × 109개, 4 × 109개, 5 × 109개, 6 × 109개, 7 × 109개, 8 × 109개 또는 9 × 109개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 1010개, 2 × 1010개, 3 × 1010개, 4 × 1010개, 5 × 1010개, 6 × 1010개, 7 × 1010개, 8 × 1010개 또는 9 × 1010개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 1011개, 2 × 1011개, 3 × 1011개, 4 × 1011개, 5 × 1011개, 6 × 1011개, 7 × 1011개, 8 × 1011개 또는 9 × 1011개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 1012개, 2 × 1012개, 3 × 1012개, 4 × 1012개, 5 × 1012개, 6 × 1012개, 7 × 1012개, 8 × 1012개 또는 9 × 1012개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 1013개, 2 × 1013개, 3 × 1013개, 4 × 1013개, 5 × 1013개, 6 × 1013개, 7 × 1013개, 8 × 1013개 또는 9 × 1013개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 1014개, 2 × 1014개, 3 × 1014개, 4 × 1014개, 5 × 1014개, 6 × 1014개, 7 × 1014개, 8 × 1014개 또는 9 × 1014개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 체중 kg 당 약 1 × 1015개, 2 × 1015개, 3 × 1015개, 4 × 1015개, 5 × 1015개, 6 × 1015개, 7 × 1015개, 8 × 1015개 또는 9 × 1015개 GC이다.
일 구현예에서, 인간 적용을 위해, 용량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 1010개 내지 약 1 × 1015개 GC의 범위를 갖을 수 있다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 109개, 2 × 109개, 3 × 109개, 4 × 109개, 5 × 109개, 6 × 109개, 7 × 109개, 8 × 109개 또는 9 × 109개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 1010개, 2 × 1010개, 3 × 1010개, 4 × 1010개, 5 × 1010개, 6 × 1010개, 7 × 1010개, 8 × 1010개 또는 9 × 1010개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 1011개, 2 × 1011개, 3 × 1011개, 4 × 1011개, 5 × 1011개, 6 × 1011개, 7 × 1011개, 8 × 1011개 또는 9 × 1011개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 1012개, 2 × 1012개, 3 × 1012개, 4 × 1012개, 5 × 1012개, 6 × 1012개, 7 × 1012개, 8 × 1012개 또는 9 × 1012개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 1013개, 2 × 1013개, 3 × 1013개, 4 × 1013개, 5 × 1013개, 6 × 1013개, 7 × 1013개, 8 × 1013개 또는 9 × 1013개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 1014개, 2 × 1014개, 3 × 1014개, 4 × 1014개, 5 × 1014개, 6 × 1014개, 7 × 1014개, 8 × 1014개 또는 9 × 1014개 GC이다. 일 구현예에서, 벡터의 유효량은 범위 내의 모든 정수 또는 분획 양을 포함하여 뇌 질량 그램 (g) 당 약 1 × 1015개, 2 × 1015개, 3 × 1015개, 4 × 1015개, 5 × 1015개, 6 × 1015개, 7 × 1015개, 8 × 1015개 또는 9 × 1015개 GC이다.
이러한 상기 용량은 치료될 영역의 크기, 사용된 바이러스 역가, 투여 경로 및 방법의 원하는 효과에 의존하여, 범위 내의 모든 숫자를 포함하는 약 25 μL 내지 약 1,000 μL 이상의 부피 범위를 갖는, 다양한 부피의 담체, 부형제 또는 완충액 제형물로 투여될 수 있다. 일 구현예에서, 담체, 부형제 또는 완충액의 부피는 적어도 약 25 μL이다. 또 다른 구현예에서, 부피는 약 50 μL이다. 또 다른 구현예에서, 부피는 약 75 μL이다. 또 다른 구현예에서, 부피는 약 100 μL이다. 또 다른 구현예에서, 부피는 약 125 μL이다. 또 다른 구현예에서, 부피는 약 150 μL이다. 또 다른 구현예에서, 부피는 약 175 μL이다. 또 다른 구현예에서, 부피는 약 200 μL이다. 또 다른 구현예에서, 부피는 약 225 μL이다. 또 다른 구현예에서, 부피는 약 250 μL이다. 또 다른 구현예에서, 부피는 약 275 μL이다. 또 다른 구현예에서, 부피는 약 300 μL이다. 또 다른 구현예에서, 부피는 약 325 μL이다. 또 다른 구현예에서, 부피는 약 350 μL이다. 또 다른 구현예에서, 부피는 약 375 μL이다. 또 다른 구현예에서, 부피는 약 400 μL이다. 또 다른 구현예에서, 부피는 약 450 μL이다. 또 다른 구현예에서, 부피는 약 500 μL이다. 또 다른 구현예에서, 부피는 약 550 μL이다. 또 다른 구현예에서, 부피는 약 600 μL이다. 또 다른 구현예에서, 부피는 약 650 μL이다. 또 다른 구현예에서, 부피는 약 700 μL이다. 또 다른 구현예에서, 부피는 약 700 μL 내지 약 1,000 μL이다.
특정 구현예에서, 용량은 약 1 × 109개 GC/g 뇌 질량 내지 약 1 × 1012개 GC/g 뇌 질량의 범위를 갖을 수 있다. 특정 구현예에서, 용량은 약 1 × 1010개 GC/g 뇌 질량 내지 약 3 × 1011개 GC/g 뇌 질량의 범위를 갖을 수 있다. 특정 구현예에서, 용량은 약 1 × 1010개 GC/g 뇌 질량 내지 약 2.5 × 1011개 GC/g 뇌 질량의 범위를 갖을 수 있다. 특정 구현예에서, 용량은 약 5 × 1010개 GC/g 뇌 질량일 수 있다.
일 구현예에서, 바이러스 구조물은 적어도 약 1 × 109개 GC 내지 약 1 × 1015개 GC, 또는 약 1 × 1011개 GC 내지 약 5 × 1013개 GC의 용량으로 전달될 수 있다. 이러한 용량 및 농도의 전달에 적합한 부피는 당업자에 의해 결정될 수 있다. 예를 들면, 약 1 μL 내지 150 mL의 부피가 선택될 수 있고, 성인의 경우 더 많은 부피가 선택된다. 전형적으로, 신생아의 경우 적합한 부피가 약 0.5 mL 내지 약 10 mL이고, 영아의 경우 약 0.5 mL 내지 약 15 mL이 선택될 수 있다. 유아의 경우 약 0.5 mL 내지 약 20 mL의 부피가 선택될 수 있다. 아동의 경우, 최대 약 30 mL의 부피가 선택될 수 있다. 십대 전후의 경우, 최대 약 50 mL의 부피가 선택될 수 있다. 또 다른 구현예에서, 환자는 선택된 약 5 mL 내지 약 15 mL, 또는 약 7.5 mL 내지 약 10 mL의 부피로 경막내 투여를 받을 수 있다. 다른 적합한 부피 및 용량이 결정될 수 있다. 용량은 임의의 부작용에 대응한 치료적 이익을 균형 잡도록 조절되고, 이러한 용량은 재조합 벡터가 채용되는 치료적 적용에 따라 달라질 수 있다.
상기 기술된 재조합 벡터는 공개된 방법에 따라 숙주 세포에게 전달될 수 있다. 바람직하게 생리학적으로 적격한 담체에 현탁된 rAAV는 인간 또는 비-인간 포유동물 환자에게 투여될 수 있다. 특정 구현예에서, 인간 환자에게 투여를 위해 rAAV는 식염수, 계면활성제 및 생리학적으로 적격한 염 또는 염 혼합물을 포함하는 수성 용액에 적합하게 현탁된다. 적합하게, 제형물은 생리학적으로 적격한 pH로, 예로 pH 6 내지 9, pH 6.5 내지 7.5, pH 7.0 내지 7.7 또는 pH 7.2 내지 7.8의 범위에서 조절된다. 뇌척수액의 pH가 약 7.28 내지 약 7.32이기 때문에, 경막내 전달을 위해 이러한 범위 이내의 pH가 바람직할 수 있는 한편, 정맥내 전달을 위해 pH 약 6.8 내지 약 7.2가 바람직할 수 있다. 그러나, 가장 넓은 범위 및 이들의 하위범위 이내의 다른 pH도 다른 전달 경로를 위해 선택될 수 있다.
본원에 사용된 용어 "경막내 전달" 또는 "경막내 투여"는 척수액 (CSF)에 도달하도록 척수관 내로, 보다 구체적으로 지주막하 공간 내로의 주사를 통한 약물의 투여 경로를 말한다. 경막내 전달은 요추 천자, 뇌실내 (뇌실내 (ICV)를 포함함), 후두하/수조내, 및/또는 C1-2 천자를 포함할 수 있다. 예를 들면, 물질은 요추 천자에 의한 지주막하 공간을 통과하는 확산을 위해 도입될 수 있다. 또 다른 예에서, 주사는 대수조 내로 시행될 수 있다. 특정 구현예에서, 본원에 기술된 rAAV 벡터 또는 조성물은 경막내 투여를 통해 이를 필요로 하는 대상체에게 투여된다. 특정 구현예에서, 경막내 투여는 2019년 11월 29일에 공개된 미국 특허 공개 제 US 2018-0339065 A1호에 기술된 바와 같이 수행되고, 본원에 이의 전문이 참고문헌으로 통합된다.
본원에 사용된 용어 "수조내 전달" 또는 "수조내 투여"는 소뇌수질 대수조의 뇌척수액 내로 직접적으로, 보다 구체적으로 후두하 천자를 통한, 대수조 내로 직접적 주사에 의한, 또는 영구적으로 위치시킨 튜브를 통한 약물의 투여를 말한다.
특정 구현예에서, 본원에 기술된 조성물의 치료는 동물 및/또는 인간 환자에서 DRG 감각 뉴런의 최소 내지 약한 무증상적 퇴화, 감각 신경 독성의 관점에서 양호한 내성화 및 무증상 감각 뉴런 병변을 보인다.
Ⅶ. 뇌척수액 내로 약제학적 조성물의 전달을 위한 장치 및 방법
일 양태에서, 본원에 제공된 벡터는 본 섹션에서 제공되고, 본원에 참고문헌으로 통합되는 국제특허출원 제 WO 2018/160582호에 기술된 방법 및 장치를 통해 경막내로 투여될 수 있다. 대안적으로, 다른 장치 및 방법이 선택될 수 있다. 특정 구현예에서, 방법은 환자의 대수조 내로 척수 바늘을 통한 CT 가이드 후두하 주사의 단계를 포함한다. 본원에 사용된 용어 컴퓨터 단층촬영 (CT)은 신체 구조의 삼차원적 영상이 컴퓨터에 의해 축을 따라 만들어진 일련의 평면 단층 영상으로부터 작성되는 방사선 촬영술이다. 특정 구현예에서, 장치는 본원에 이의 전문이 참고문헌으로 통합되는 2019년 11월 29일에 공개된 미국 특허 공개 제 US 2018-0339065 A1호에 기술된다.
Ⅷ. CDD
본원에 상호교환적으로 사용된 "환자" 또는 "대상체"는 인간, 수의학 관련 동물 또는 가축, 애완동물 또는 펫, 및 임상 연구에 정상적으로 사용되는 동물을 포함하는, 수컷 또는 암컷 포유동물을 의미한다. 일 구현예에서, 본 발명의 방법 및 조성물의 대상체는 여성 또는 남성 인간이다. 특정 구현예에서, 본 방법 및 조성물의 대상체는 CDD로 및/또는 CDD의 증상으로 진단된다.
방법 및 조성물은 임의의 CDD 병기의 치료에 사용될 수 있다. 특정 구현예에서, 환자는 연령이 약 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 7개월, 8개월, 9개월, 10개월, 11개월이거나, 약 1세, 1.5세, 2세, 2.5세, 1.5세, 2세, 2.5세, 3세, 3.5세, 4세, 4.5세, 5세, 5.5세, 6세, 6.5세, 7세, 7.5세, 8세, 8.5세, 9세, 9.5세, 10세, 10.5세, 11세, 12세, 13세, 14세, 15세, 16세, 17세, 18세이다. 특정 구현예에서, 환자는 예로 18개월 내지 3세 연령의 유아이다. 특정 구현예에서, 환자는 3세 내지 6세의 연령, 3세 내지 12세의 연령, 3세 내지 18세의 연령, 3세 내지 30세의 연령이다. 특정 구현예에서, 환자는 18세 이상의 연령이다.
CDD의 증상은 보통 처음으로 생애 3개월 이내에 시작되는 발작을 포함하고, 생후 첫 주 정도에 조기 출현할 수 있다. 발작의 유형은 연령과 함께 변화되고, 예측가능한 양상을 따를 수 있다. 가장 보편적인 유형은 의식 상실, 근육 경직 및 경련이 관여하는 일반화된 긴장성 대발작; 비정상적 근육 수축을 특징으로 하는 긴장성 발작; 및 근육 반사의 짧은 에피소드가 관여하는 간질성 연축이다. CDKL5 결핍 장애에 걸린 대부분의 사람에서 발작이 없는 기간이 있을 수 있지만, 발작은 매일 발생한다. CDKL5 결핍 장애에서 발작은 전형적으로 치료에 대한 저항성을 갖는다.
CDKL5 결핍 장애에 걸린 아동은 발달 과정이 손상된다. 대부분은 중증 지능 장애를 갖고 거의 또는 전혀 말하지 못한다. 앉기, 서기 및 걷기와 같은 육안적 운동 기능의 발달이 지연되거나 달성되지 못한다. 침범받은 개인 중 약 삼분의 일은 독립적으로 걸을 수 있다. 손가락으로 작은 물체를 뽑는 것과 같은 세밀한 운동 기능도 손상되어, 침범받은 개인 중 약 절반은 손의 고의적인 사용이 가능하다. 이러한 병태를 갖는 대부분의 사람은 시력 문제 (피질 시력 손상)를 갖는다.
기타 CDKL5 결핍 장애의 공통적인 특징은 박수치기, 손 핥기 및 손 빨기와 같은 반복적인 손 운동 (자동반복); 이 갈기 (이갈기증); 수면 교란; 섭식 곤란; 및 변비 및 산성 위 내용물의 식도로 역류 (위식도성 재유동)를 포함한 위창자 문제를 포함한다. 일부 침범받은 개인은 불규칙한 호흡의 에피소드를 갖는다. CDKL5 결핍 장애에 걸린 사람에서 구분되는 얼굴 특징은 높고 넓은 이미, 크고 깊이 박힌 눈, 코와 윗입술 사이의 매우 뚜렷한 공간 (인중), 두터운 입술, 넓게 벌어진 이빨, 및 높은 입 천장 (입천장)을 포함한다. 특별히 작은 머리 크기 (소두), 척추의 측만 (척추측만증), 및 첨형 손가락과 같은 다른 신체적 차이도 발생할 수 있다.
상기 기술된 용어 "증가시키다", "감소시키다", "감소시키다", "완화시키다", "개선하다", "지연시키다" 또는 임의의 이들의 문법적 활용형, 또는 임의의 유사한 용어 표기는, 달리 명시되지 않은 경우라면 상응하는 기준 (예로, 미처리된 대조군 또는 CDD에 걸리지 않은 정상 병태의 대상체)과 비교하여 약 5배, 약 2배, 약 1배, 약 90%, 약 80%, 약 70%, 약 60%, 약 50%, 약 40%, 약 30%, 약 20%, 약 10%, 약 5%의 변동을 의미한다.
특정 구현예에서, 환자는 발작, 근육 경직, 또는 호흡, 수면, 위창자관 또는 심장의 문제와 같은 CDD와 관련된 일부 징후 및 증상을 조절하는 의약을 투여 받는다.
특정 구현예에서, 이뇨제가 보조-요법으로 이를 필요로 하는 대상체에서 사용될 수 있다. 사용된 이뇨제는 아세트아졸아민 (디아목스) 또는 기타 적합한 이뇨제일 수 있다. 일부 구현예에서, 이뇨제는 유전자 요법 투여 시 투여된다. 일부 구현예에서, 이뇨제는 유전자 요법 투여 이전에 투여된다. 일부 구현예에서, 주사 부피가 3 mL인 이뇨제가 투여된다.
특정 구현예에서, CDKL5 이소형 1, 이소형 1, 이소형 3 및/또는 이소형 4 발현하는 벡터, 또는 이들의 다양한 2개 또는 3개 방식 조합을 포함하는 보조-요법이 사용될 수 있다. 선택적으로, 보조-요법은 또 다른 활성 제제의 투여를 추가로 포함할 수 있다. 특정 구현예에서, 보조-요법은 효소 대체 요법을 포함할 수 있다.
선택적으로, 면역억압 보조-요법이 이를 필요로 하는 대상체에서 사용될 수 있다. 이러한 보조-요법을 위한 면역억제제는 글루코코르티코이드, 스테로이드, 항-대사물, T 세포 저해제, 마크롤리드 (예로, 라파마이신 또는 라파로그), 및 알킬화제, 항-대사물, 세포독성 항생제, 항체 또는 이뮤노필린 상의 활성 제제를 포함하는 세포증식 억제제를 포함하나 이에 한정되지 않는다. 면역억제제는 질소 머스타드, 니트로소우레아, 백금 화합물, 메토크렉세이트, 아자티오프린, 머캅토퓨린, 플루오로우라실, 닥티노마이신, 안트라사이클린, 미토마이신 C, 블레오마이신, 미트라마이신, IL-2 수용체- (CD25-) 또는 CD3-안내된 항체, 항-IL-2 항체, 시클로스포린, 타크롤리무스, 시롤리무스, IFN-β, IFN-γ, 아편, 또는 TNF-α (종양 괴사인자-알파) 결합제를 포함할 수 있다. 특정 구현예에서, 면역억압 요법은 유전자 요법의 투여 0일, 1일, 2일, 3일, 4일, 5일, 6일 또는 7일 이상 이전 또는 이후에 시작될 수 있다. 이러한 면역억압 요법은 하나 또는 둘 이상의 약물 (예로, 글루코코르티코이드, 프레드넬리손, 미코페놀레이트 모페틸 (MMF) 및/또는 시롤리무스 (즉, 라파마이신))의 투여가 관여할 수 있다. 이러한 면역억압성 약물은 이를 필요로 하는 대상체에게 동일한 용량 또는 조정된 용량으로 1회 또는 2회 이상투여될 수 있다. 이러한 요법은 동일한 날에 둘 이상의 약물 (예로, 프레드넬리손, 미코페놀레이트 모페틸 (MMF) 및/또는 시롤리무스 (즉, 라파마이신))의 공동-투여가 관여할 수 있다. 하나 이상의 이들 약물은 유전자 요법 이후에 동일한 용량 또는 조정된 용량으로 계속 투여될 수 있다. 이러한 요법은 필요한 경우 약 1주 (7일) 또는 약 60일 이상 계속될 수 있다. 특정 구현예에서, 타크롤리무스가 없는 섭생이 선택된다.
단어 "포함하다", "포함하다 (comprises)" 및 "포함하는"은 배타적이지 않은 함축적으로 해석되어야 한다. 단어 "구성되는" 및 이의 활용형은 함축적이 지 않은 배타적으로 해석되어야 한다. 본 명세서의 다양한 구현예가 다른 상황 하에 "포함하는" 언어를 사용하여 제사되는 반면, 관련 구현예는 또한 "구성되는" 또는 "필수적으로 구성되는" 언어를 사용하여 해석되고 설명되도록 의도된다.
용어 "발현"은 본원에서 가장 광범위한 의미로 사용되고, RNA의 또는 RNA 및 단백질의 생산을 포함한다. 구체적으로 RNA와 관련하여, 용어 "발현" 또는 "번역"은 펩티드 또는 단백질의 생산에 관한 것이다. 발현은 일시적일 수 있거나, 안정할 수 있다.
용어 "a" 또는 "an"은 하나 이상을 말하는 것으로 언급되어야 하고, 예를 들면 "하나의 인핸서"는 하나 이상의 인핸서(들)를 나타내는 것으로 이해된다. 이와 같이, 용어 "a" (또는 "an"), "하나 이상" 및 "적어도 하나"는 본원에서 상호교환적으로 사용된다,
본 명세서 전체에 걸쳐, 지수는 용어 "e"와 이어진 수치 값 (n)을 사용하여 언급된다. 이것은 "× 10n"을 언급하는 것으로 이해될 것이다. 예를 들면, "3e9"는 3 × 109과 동일하고, "1e13"은 1 × 1013과 동일하다.
상기 기술된 용어 "약"은 수치 값을 변형하는데 사용될 때, 달리 명시되지 않는 경우라면 ± 10%의 변동을 의미한다.
본 명세서에서 달리 정의되지 않은 경우라면, 본원에 사용된 기술 및 과학 용어는 당업자에게 본 출원에 사용된 많은 용어에 대한 일반적인 내용을 제공하는 출간된 교과서를 참조하여 당업자라면 공통적으로 이해하는 바와 동일한 의미를 갖는다.
Ⅸ. 실시예
하기 실시예는 단지 예시적이고, 본 발명을 제한하도록 의도되지 않는다.
CDD에 대한 여러 모델이 개발되었으며, 치료 효과를 평가하는데 사용되도록 선택될 수 있다. 이러한 하기 모델은 CDKL5 발현이 없다: 예로, 엑손 6번의 결실 (△엑손 6)을 갖는 Cdkl5-ko 마우스 (Wang et al., Proceedings of the National Academy of Sciences Dec 2012, 109 (52): 21516-21521; DOI: 10.1073/pnas.1216988110); 엑손 4번의 결실 (△엑손 4)을 갖는 Cdkl5-ko 마우스 (Amendola et al., (2014) Mapping Pathological Phenotypes in a Mouse Model of CDKL5 Disorder, PLoS ONE 9(5); e91613. doi.org/10.1371/journal.pone.0091613 (2014) 참조); Cdkl5 (R59X 녹인) 모델 (잭슨 연구소로부터 입수가능함; Tang et al., (2019); Tang S, et al., Altered NMDAR signaling underlies autistic-like features in mouse models of CDKL5 deficiency disorder. Nat. Commun. 2019, 10(1): 2655. 2019년 6월 14일 공개; doi:10.1038/s41467-019-10689-w); 및 Cdkl5 (D471fs) 모델 (Rodney Samaco, 베일러 의과대학, 휴스턴, TX).
본 연구에서 본 발명자들은 3가지 CDD 마우스 모델 (Cdkl5-ko (엑손 6번), Cdkl5 (R59X). Cdkl5 (D471fs))의 CNS에서 CDKL5 발현을 회복시키는 것이 질환 증상을 유의하게 개선하는 것을 보여준다. 본 발명자들은 AAVhu68 캡시드, 및 인간 시냅신 프로모터 및 조작된 인간 CDKL5 트랜스 유전자를 갖는 발현 카세트를 포함하는 AAV 유전자 요법 벡터를 개발하였다. 본 발명자들은 AAV-CDKL5 벡터가 측면 뇌 측실 내로 Cdkl5 녹아웃 마우스 내로 신생 마우스 주사를 통해 투여될 때, 뇌 전체에 걸쳐 최대 50%의 뉴런에서 명백한 발현을 검출하였다. AAV 및 인간 CDKL5 발현은 잘 내성화되었다. 인간 CDKL5은 세포질에 대부분 국소화되고, 단백질 발현 및 키나제 활성을 4개월 동안 지속하였다. 본 발명자들은 처리된 Cdkl5-ko 마우스의 코호트에게 종합 신경행동 테스트를 시행하고, 미처리된 Cdkl5-ko 표현형으로부터 야생형 마우스의 관찰된 행동 성과로 진행하는 유의한 개선을 확인하였다. 다음으로 우리는 유전자 녹아웃 대신에 환자 유래 프레임이동 돌연변이를 보유하는 2가지 상이한 CDD 마우스 모델 (Cdkl5 (R59X) 및 CDKL5 (D471fs) 모델)에서 동일한 연구를 반복하였다. 본 발명자들은 매우 유사한 결과를 획득하여, 우리의 CDKL5 유전자 요법 벡터의 치유 효과를 재연하였다.
CDKL5는 인간 뇌에서 적어도 4가지 이소형으로서 발현된다. 본 발명자들은 형질도입된 마우스 뇌에서 모두 발현되고 키나제 활성을 나타내는 것으로 확인된 3가지의 대안적으로 스플라이싱된 이소형에 대해 유사한 AAV 유전자 요법 벡터를 생성하였다.
더 큰 동물에서 AAV-CDKL5 유전자 요법 벡터의 발현에 대해 테스트하기 위하여, 본 발명자들은 레서스 머커크를 사용한 연구를 시행하였다. 대수조에 의한 뇌척수액 내로의 주입을 통하여, 우리는 뇌 전체에 걸쳐 이배체 게놈 당 0.1개 내지 1개의 벡터 사본의 벡터 분포를 달성할 수 있었다. 훨씬 더 많은 벡터 형질을입이 등쪽 뿌리 신경절 (DRG)에서 관찰하였다. 따라서, 인간 CDKL5 서열에 특이적인 프로브를 사용한 제자리 혼성화는 DRG 뉴런에서 풍부한 발현이지만, 회색 피질 뉴런에서는 훨씬 희박한 발현을 보여주었다. CDKL5 투여 및 발현은 일반적으로 6마리 레서스 머커크 모두에서 60일 동안 잘 내성화되지만, 우리는 척수 백질관의 경미한 축삭병을 주목하였다.
요약하면, 본 발명자들은 CDKL5 유전자 요법이 마우스 모델에게 지속적인 치유 효과를 제공하고, 비-인간 영장류에서 잘 내성화되는 것의 유망한 증거를 보여주고 있다. 또한, 이러한 접근법의 최적화는 궁극적으로 CCD에 걸린 아동에서 임상적 개입을 위한 옵션을 제시할 수 있다.
실시예 1. 재료 및 방법
플라스미드. 인간 뇌1에서 발현되는 4가지 CDKL5 (사이클린 의존성 키나제 유사 5, 유니프로트 ID O76039)의 아미노산 서열을 DNA 서열로 역으로 번역하였다. 코딩 서열은, 예로 인간 게놈에서 발견되는 코돈 빈도, 숨은 RNA 스플라이싱 부위 및 대안의 해독틀을 고려하여 추가로 조작하였다. 조작된 서열은 인간 시냅신 프로모터2의 조절 하에 AAV 발현 플라스미드 내로 클로닝하였다. 코딩 서열은 코작 서열이 선행하고, WPRE 인핸서 카세트 (마못류 간염 바이러스 전사후 조절 요소), SV40 폴리 A 서열로 이어지며, AAV 역전된 말단 반복서열 (ITR)에 의한 프레임을 갖는다. 일부 실험에서는 등쪽 뿌리 신경절 (DRG)에서 발현을 억제하기 위하여, 상기 플라스미드를 CDKL5 코딩 서열 직후 및 WPRE 서열 이전에 miR-183 결합 부위 (agtgaattctaccagtgccata) (서열번호 11)의 4개 반복서열을 포함하도록 변형하였다. AAV CDKL5 벡터는 펜실베니아 대학교 벡터 코아에서, 캡시드로서 마우스 연구의 경우 PHP.B3, 또는 마우스 및 비-인간 영장류 연구의 경우 AAV9hu684 또는 AAVrh91를 사용하여 생산하였다.
마우스 연구. 마우스가 관여된 모든 연구는 펜실베니아 대학교 IACUC에 의해 승인을 받았다. 본 발명자들은 잭슨 연구소로부터 Cdkl5-ko 마우스 (B6.129(FVB)-Cdkl5tm1.1Joez/J, 균주 #021967)로부터 획득하여 이종접합 암컷 KO 마우스를 야생형 C57Bl6 수컷과 교배하여 하기 유전형의 한배 새끼 마우스를 획득하였다: 수컷 반접합 Cdkl5-ko (KO 마우스 또는 마우스로도 언급됨), 수컷 야생형, 암컷 이종접합 Cdkl5-ko 및 암컷 야생형. 마우스에게 AAV Cdkl5 벡터 (1 × 1011개 GC 내지 5 × 1011개 GC의 용량 범위) 또는 비히클 대조군 (멸균 포스페이트 완충된 식염수)을 총 100 μL의 부피의 안구후방 주사로 18일 내지 21일 동안 투여하였다. 대안적으로, 마우스에게 출생 일에 뇌실내로 총 2 μL의 부피의 1 × 1010개 GC 내지 5 × 1010개 GC의 용량을 주사하였다. 마우스를 유전형 및 주사 산물을 고려하여 혼합하여 사육하고, 체중을 측정하면서 적어도 매주 2회 관찰하고, 행동 테스트를 시행할 때 수컷의 경우 11주령 또는 암컷의 경우 14주령이 되었다.
웨스턴 블럿팅 및 조직 염색. 마취 이후에, 하나의 피질 반구를 급냉동시키고, 우속으로 단백질 용출물을 RIPA 완충액을 사용하여 생성하였다. 웨스턴 블럿팅은 인간 Cdkl5 (S957D, 던디 대학교, UK), EB2 (ab45767, 앱캠사) 또는 EB2 포스포22 (pab01032-P, 코바랩사, UK)에 대한 항체를 사용하여 수행하였다. 나머지 뇌 절반은 포르말린에 밤샘 고정시켜 파라핀에 포매하고, 얇은 절편을 동일한 CDKL5 항체를 사용한 면역형광 염색을 위해 처리하였다.
행동 테스트. 마우스는 매일 한 가지 테스트를 거쳤다. 해당일의 테스트 시점에, 작업자 및 환경을 동일하게 유지하였다 (60 dB 백색 소음 배경 및 1,000 루멘 간접 백열등 조명). 마우스를 각 테스트 이전에 홈 사육상자에 30분 동안 거주시켰다. 개방 장소 검정법을 위해, 최소량의 베딩이 있는 새로운 사육상자를 적외선 빔 어레이 (메드어소시에이트사) 내에 배치하였다. 단일 마우스를 사육상자의 중앙에 추가하고, 이후 30분 동안 빔 파손의 수를 자동적으로 기록하여 바닥에 근접 (일반 활동) 및 바닥 위의 3인치 (양육 활동) 빔 파손으로 구분하였다. 상승된 제로 미로 (EZM, 스토엘팅사)를 위해, 2개 대향 밀폐 사분역 및 2개 개방 사분역을 갖는 상승된 원형 플랫폼을 사용하여 방해받지 않은 탐색을 허용하였다. 단일 마우스를 개방 사분역의 중앙에 배치하고, 운동을 비디오로 15분 동안 기록하였다. Y-미로 (스토엘팅사) 연구를 위해, Y 모양의 일치하는 3가지 위치를 포함하는 밀폐된 플랫폼을 사용하였다. 단일 마우스를 작업자로부터 가장 근접한 자리에 배치하고, 이의 운동을 비디오로 5분 동안 기록하였다. 대리석 매장 검정법을 위해, 신선한 사육상자를 3인치의 알파드리 베딩 (쉐퍼드 특수 종이)으로 충전하고, 가만히 밀착하였다. 12개의 고형 청색 대리석을 베딩 위에 동등하게 이격시키고, 단일 마우스를 사육상자의 중앙에 배치하였다. 적어도 절반이 베딩으로 덮힌 대리석의 수를 30분 동안 기록하였다.
데이터 분석. 데이터를 그래프로 작성하고, 그래프패드 프리즘 소프트웨어를 사용하여 분석하였다. 비디오 파일을 20 fps의 mp4 포맷으로 기록하고, 에토비전 XT 소프트웨어 (버전 14, 놀두스 인포메이션 테크놀로지사)를 사용하여 분석하였다. 네스트 건축 검정법을 위해, 마우스를 새로운 사육상자에 밤샘 단일 사육하고, 표준화된 2 × 2 인치 사각 둥지 (면을 기초로 함)를 공급하였다. 24시간 후에, 둥지의 품질을 1 내지 5의 척도로 점수 매기고, 임의의 남은 건들지 않은 둥지 재료를 무게 측정하였다.
비-인간 영장류 실험. 비-인간 영장류가 관여된 모든 연구는 펜실베니아 대학교 IACUC에 의해 승인을 받았으며, USDA 규정에 따라 수행하였다. 마카카 물라타 (레서스 머커크) 종의 비-인간 영장류 (NHP)를 코반스 리서치 물산으로부터 획득하였다. 검역 및 동물 사육을 유전자 요법 프로그램 SOP에 따라 수행하였다. AAV 벡터 투여 1개월 이전에 및 연구 전체에 걸쳐, 체중, 온도, 호흡 속도 및 심장 박동을 정기적으로 모니터링하고, 혈액 및 CSF 시료를 채취하였다. 전혈을 세포 계수 및 감별, 및 임상 혈액 화학 패널에 사용하였다. CSF 시료는 혈액 계수 및 감별, 및 총 단백질 정량화에 사용하였다. 대수조의 천자를 통한 CSF 내로의 AAV 벡터 전달을 위해, 마취된 머카크를 머리는 앞을 보는 옆으로 누운 자세로 실험대 위에 배치하였다. 무균 기법을 사용하여, 21 내지 27 게이지, 1 내지 1.5 인치 퀸케 척수 바늘 (벡튼 디킨슨사)을 후두하 공간 내로 CSF 유출이 관찰될 때까지 진행시켰다. 바늘은 혈액 오염 및 잠재적인 뇌줄기 손상을 회피하도록 대수조의 더 넓은 바람직한 갭에서 시도될 것이다. 바늘 천자의 정확한 배치는 형광현미경을 사용한 골수조영술을 통해 검증될 것이다. 1 mL의 CSF를 투약 이전에 기저선 분석을 위해 수집하였다. CSF 수집 이후에, 접근 연장 카테터를 척수 바늘에 연결하여 1 mL 이오헥솔 (상표명: 옴니파크 180 mg/mL, 제너럴 엘렉트릭 헬스케어사) 조영 매질의 투약을 용이하게 하였다. 바늘 배치를 확인한 이후에, 테스트 항목을 포함하는 주사기 (1 mL 동등한 부피에 주사기 부피와 링커 무용 공간을 더함)를 유연한 링커에 연결하고, 30 ± 5초 동안 주사하였다. 바늘을 제거하고, 천자 부위에 직접적 압력을 적용하였다. AAVhu68.hSyn.Cdkl5-1co 및 AAVhu68.hSyn.Cdkl5-1co 벡터를 최대 3 × 1013개 GC/NHP 용량으로 주사하였다. 연구 0일, 14일, 18일, 41일째 및 최종 연구일에, 신경학적 기능의 자세한 평가를 위해 모든 머커크에게 신경학적 평가가 주어졌다. 간략하게, 평가는 자세 및 보행 평가, 두개 신경 평가, 고유감각 평가 및 척수/신경 반사를 포함하였다. 연구 56일째, 머카크를 마취시키고, 육안 사후 검사 및 부검을 수행하였다. 25개의 주요 조직을 급냉동 또는 포르말린 고정화를 위해 각 머카크로부터 두 벌씩 수확하였다. DNA 또는 RNA를 급냉동 조직으로부터 정제하고, 벡터 생체분포 또는 트랜스 유전자 분석에 각각 사용하였다. 벡터 생체분포 조사를 위해, 총 DNA 중량 당 게놈 사본 (GC)은 트랜스 유전자 카세트 및 내부 표준의 폴리 A 영역으로 안내되는 프로브를 사용한 TaqMan qPCR 검정법을 사용하여 결정하였다. 트랜스 유전자 발현을 정량하기 위하여, 총 RNA를 사용하여 폴리 A 올리고뉴클레오티드로의 제 1 가닥 합성, 이어서 내인성 레서스 CDKL5 서열과 교차반응하지 않는 트랜스 유전자에 특이적인 프로브를 사용한 TaqMan qPCR에 의해 cDNA를 생성하였다. 조직병리학적 분석을 위해, 머카크 조직을 파라핀에 포매시키고, 이들 절편을 H & E 용액 또는 CDKL5 항체로 각각 염색하였다. 모든 염색된 조작 절편은 위원회 인증을 받은 수의 병리학자에 의한 검토를 받고, 비정상적 결과는 동료 연구자의 검토에 의해 검증하였다.
참고문헌
1. Hector, R. D. et al., Characterization of CDKL5 Transcript Isoforms in Human and Mouse. PloS one 11, e0157758, (2016).
2. Thiel, G., Greengard, P. & Sudhof, T. C. Characterization of tissue-specific transcription by the human synapsin I gene promoter. Proc. Natl. Acad. Sci. U S A, 88: 3431-3435, (1991).
3. Deverman, B. E. et al., Cre-dependent selection yields AAV variants for widespread gene transfer to the adult brain. Nat. Biotechnol., 34: 204-209, (2016).
4. Hinderer, C. et al., Severe Toxicity in Nonhuman Primates and Piglets Following High-Dose Intravenous Administration of an Adeno-Associated Virus Vector Expressing Human SMN. Human Gene Therapy, 29: 285-298, (2018).
실시예 2: 유전자 요법 AAV 벡터
ITR 사이의 발현 구조물은 인간 시냅신 프로모터 (서열번호 23), 인간 CDKL5, 이소형 1 (서열번호 22)의 조작된 코딩 서열, WPRE 발현 인핸서 (서열번호 27) 및 SV40 폴리 A 서열 (서열번호 28)을 포함한다 (도 1a). 유사하게, 대안의 발현 구조물은 이소형 1 대신에 인간 CDKL5, 이소형 2 (CDKL5-2GS 또는 hCDKL5-2GS; 서열번호 24), 3 (CDKL5-3GS 또는 hCDKL5-3GS; 서열번호 25), 또는 4 (CDKL5-4GS 또는 hCDKL5-4GS; 서열번호 26)에 대한 조작된 코딩 서열을 각각 포함한다. 테스트된 플라스미드 모두가 마우스 뇌에서 잘 발현되었으며, EB2를 인산화하는 능력 (CDKL5 키나제 활성의 측정)에서 적은 차이를 나타낸다. 본 발명자들은 WPRE 인핸서가 마우스 뇌에서 야생형 마우스 Cdkl5 발현을 닮은 인간 CDKL5 발현 수준을 획득하는데 요구되는 것을 확인하였다 (도 2). CDKL5는 이의 내인성 표적 EB2 단백질을 인산화하는 이의 능력에 의해 결정된 바, 완전한 활성이 있었다 (도 2). CDKL5의 발현 및 국소화는 IHC에 의해 검증하였다. 또한, 본 발명자들은 인간 시냅신을 인간 유비퀴틴 C 프로모터 (Ubc)로 또는 닭 베타-액틴 혼성 프로모터로 교체함으로써 대안의 발현 구조물을 생성하였다 (도 1b). AAVrh91 캡시드에서 AAV 벡터 AAVrh91.UbC.CDKL5-1co.miR183 및 AAVrh91.CBh.CDKL5-1co.miR183은 Cdkl5-ko 마우스에게 3 × 1010개 GC의 용량으로 신생 마우스 ICV를 통해 투여하고, 부검을 P14일째 수행하였다. 마우스 뇌조직의 웨스턴 블럿 분석은 UbC 또는 CBh 프로모터를 포함하는 AAV 벡터 게놈으로의 형질도입에 이어진 CDKL5의 발현을 검증하였다. 본 발명자들은 AAVrh91.UbC.CDKL5-1co.miR183 및 AAVrh91.CBh.CDKL5-1co.miR183로의 형질도입에 이어진 마우스 뇌에서 CDKL5 트랜스 유전자의 발현을 관찰하였다. 세포 당 더 높은 CDKL5 발현을 AAVrh91.UbC.CDKL5-1co.miR183로의 형질도입 이후에 마우스 뇌의 해마에서 관찰하였다. 반면, 세포 당 더 낮은 CDKL5 발현을 AAVrh91.CBh.CDKL5-1co.miR183로의 형질도입 이후에 마우스 뇌의 해마에서 관찰하였다. 세포 당 더 높은 CDKL5 발현을 AAVrh91.UbC.CDKL5-1co.miR183로의 형질도입 이후에 마우스 뇌의 피질에서 관찰하였다. 세포 당 더 낮은 CDKL5 발현을 AAVrh91.CBh.CDKL5-1co.miR183로의 형질도입 이후에 마우스 뇌의 피질에서 관찰하였다. 또한, 본 발명자들은 Cdkl5-ko 마우스 뇌에서 AAVrh91.UbC.CDKL5-1co.miR183 (3 × 1010개 GC, 신생 마우스 ICV) 및 AAVhu68.hSyn.CDKL5-1co.miR183 (2.5 × 1010개 GC)의 투여에 이어지는 CDKL5 발현을 비교하였다. 매우 유사한 발현 양상을 특정된 AAV 투여에 이어서 마우스 뇌에서 관찰하였다. CDKL5 발현은 AAVrh91.UbC.CDKL5-1co.miR183 (AAVrh91 캡시드; 유비퀴틴 C 프로모터) 또는 AAVhu68.hSyn.CDKL5-1co.miR183 (AAVhu68 캡시드; 시냅신 프로모터) 둘 중 하나로의 형질도입 이후에 마우스 뇌에서 관찰하였다. 추가적으로, 1 × 1010개 GC, 3 × 1010개 GC 및 6 × 1010개 GC의 다양한 용량의 AAVrh91.UbC.CDKL5-1co.miR183 및 AAVrh91.CBh.CDKL5-1co.miR183는 행동 효과에 대해 Cdkl5-ko 마우스에서 조사하였다.
AAV.UbC.CDKL5-1co.miR183 벡터는 CDKL5 발현이 hSyn에 의해 유도될 때와 유사하게 마우스에서 치료적 유용성을 보여주었다. AAVrh91 캡시드는 조작된 핵산 서열을 포함하는 AAV 벡터와 함께 사용될 때 AAVhu68의 발현과 유사한 CDKL5 ㅂ바발현을 달성하였다. 마우스 뇌에서 CDKL5 단백질 수준은 hSyn 프로모터와 비교하여 UbC 프로모터를 사용하여 더 높았다.
실시예 3: CDD 마우스 모델에서 CDKL5 유전자 요법의 전임상 치료 이익
Cdkl5 결핍 마우스에 미치는 CDKL5 유전자 요법의 치료 이익을 테스트하기 위하여, 본 발명자들은 어린 Cdkl5-ko (KO 마우스 또는 마우스로도 언급됨) 및 야생형 (wt) 한배 새끼 마우스의 코호트를 5 × 1011개 GC (5e11 gc)의 AAV9-PHP.B-hSyn-hCDKL5-1co.WPRE 벡터를 안구후방 Ⅳ 주사에 의해 처리하였다. 처리된 실험군 모두는 동일한 속도로 계속 성장하였으며, 처리 관련된 사망은 관찰되지 않았다. 10주령에서 마우스에게 종합 행동 테스트를 시행하였다. 본 발명자들은 상승된 제로 미로 및 개방 장소 활동 테스트에서 처리된 실험군에 대한 명백하고 통계적으로 유의한 정규화를 관찰하였다. 동일한 실험군의 회전막대 및 Y-미로 테스트에서 외연의 개선이 있었으며, 열 민감성의 개선은 없었다.
Cdkl5가 신경발달에 중요한 경우라면, 본 발명자들은 유전자 요법의 조기 투여가 마우스에서 치료 성과를 개선할 수 있을지 궁금하였다. 다음으로 우리는 신생 Cdkl5-ko 마우스 또는 야생형 한배 새끼의 코호트를 마우스 당 6 × 109개 GC 내지 5 × 1010개 GC의 용량 범위의 AAVhu68-hSyn-hCDKL5-1co.WPRE 벡터를 안구후방 Ⅳ 주사에 의해 처리하였다. 행동 테스트는 지시된 바와 같이 10주령 또는 11주 내지 14주령에서 진술하였다. 모든 실험군에 걸친 종합적 관찰은 잘 내성화되고, 처리 관련된 사망이 없으며, 정상적인 체중 증가 (도 9a 및 도 9b) 및 종합적 발달을 관찰하였다. Cdkl5 마우스에서 CDKL5 트랜스 유전자의 용량 의존적 발현은 5 × 1010개 GC 용량, 2.5 × 1010개 GC 용량 및 1 × 1010개 GC 용량에서 관찰하였다. 10주령에서, KO 마우스는 특징적인 뒷다리 접기 표현형을 나타내고, 이는 처리된 KO 마우스에서 실질적으로 완화되었다. CDKL5 유전자 요법의 치료 효능은 뒷다리 접기 테스에 의해 측정하였다. 용량 의존적 개선은 처리된 CDKL5-ko 마우스에서 중증도 점수로 관찰하였다 (도 9c 내지 도 9f). 마찬가지로, KO 마우스에서 발견된 지속적인 과다활동 및 양육 표현형을 야생형 활동으로 정규화하였다. 해마의 학습 및 기억은 Y-미로 테스트 (자발적 변경 인덱스)에서의 처리된 KO 마우스에서높게 개선되었다. CDKL5 유전자 요법의 치료 효능은 개방 장소 활동 테스트에 의해 추가로 측정하고, 이는 KO 및 AAV 처리된 마우스에서 과다활동의 교정에 대해 측정한다. 처리된 Cdkl5-ko 마우스에서 과다활동의 용량 의존적 구분을 관찰하였다 (도 11a 내지 도 11f). KO 마우스는 신선한 사육상자에 밤샘 단일 사육될 때 빈약한 둥지 건축자이고, 모든 둥지 형성 재료를 절단하지 못한다. 처리된 KO 마우스는 용량 의존적 방식으로 이들의 둥지 건축 능력을 극적으로 개선하였다 (도 10a, 도 10c, 도 10e). 추가적인 2가지 다른 신경행동 검정법 (대리석 매장 및 Y-미로)은 처리된 Cdkl5-ko 마우스에서 표현형 개선에 대한 강한 경향성을 보여주었다 (도 10b 및 도 10d). EEG 표현형은 예비적 협력 연구에서 회복되었으며, 번역 바이오마커로서 유용할 수 있다. 핵심 검정법 (뒷다리 접기, 보행 활동)의 성과 입증은 독립적인 실험 코호트를 사용하여 추가적으로 수행하였다. 더 큰 코호트 크기 (N = 18/실험군)가 더 명백한 통계학적 유의성을 생성한다. 대안의 CDD 마우스 모델 (R59X, D471fs)을 사용한 핵심 검정법 (뒷다리 접기, 보행 활동)의 성과 입증도 수행한다. 요약하면, CDKL5 유전자 요법은 기능적 CDKL5 단백질을 마우스 뇌로 전달하고, CDD 수컷 마우스 모델에서 여러 신경행동 성과를 위한 용량 의존적 치료 효과를 갖는다.
행동 테스트를 마친 이후에, 마우스가 약 3개월령이 될 때 뇌를 수확하였다. 웨스턴 블럿팅은 AAV 투여 3개월 이후에도 Cdkl5-ko 뇌에서 인간 CDKL5의 명백한 발현을 나타내었다. 마지막으로, 인간 CDKL5는 인산화된 EB2 단백질에 대해 블럿팅할 때 명백한 키나제 활성을 나타내었다.
본 발명자들은 또한 대안의 CDD 마우스 모델을 사용한 CDKL5 유전자 요법의 성과를 조사하였다. Cdkl5 (D471fs)는 미성숙한 종결 코돈을 유도하는 환자 점 돌연변이를 보유한다. 환자에서와 같이, 이들 마우스의 뇌에서 CDKL5 단백질의 부재 및 매우 감소된 EB 인산화 수준을 발견하였다. 따라서, Cdkl5 (D471fs)는 Cdkl5-ko 단백질의 부재를 이전에 사용된 Cdkl5-ko 마우스와 공유하지만, 유전적 배경이 마우스 모델의 생성 방법으로 인해 약간 상이하다. 신생 마우스에게 이전과 동일한 농도 (5 × 1010개 GC, 신생 ICV)로 주사하고, 3개월 이후에 분명한 hCDKL5 단백질 발현 및 EB2 인산화가 나타났다. 소규모 예비 코호트를 사용한 행동 테스트를 시행하였다. AAV 처리는 잘 내성화되고, 이환이 관찰되지 않았다. 뒷다리 접기는 처리된 돌연변이체 마우스에서 유의하게 교정되고, 마찬가지로 상승된 제로 미로 테스트에서 돌연변이체 표현형도 처리된 돌연변이체 마우스에서 야생형 행동으로 유의하게 교정되었다 (개방 영역에서, 개방 영역 진입). 돌연변이체 마우스는 새로운 사육상자에서 유리 대리석 배열과의 빈약한 상호작용 및 매장 행동을 나타내는 반면, 야생형 마우스는 전형적으로 거의 모두를 매장시킨다. 처리된 돌연변이체 마우스는 야생형 마우스를 향한 이들 행동의 강력한 교정을 나타낸다. 처리된 실험군의 Cdkl5-ko 마우스에서 5 × 1010개 GC/마우스의 더 높은 용량으로 유의한 개선을 관찰하였다.
또한, 본 발명자들은 대안의 CDD 마우스 모델을 사용한 CDKL5 유전자 요법의 성과를 조사하였다. Cdkl5 (R59X)는 미성숙한 종결 코돈을 도입한 환자 점 돌연변이를 보유한다. 환자에서와 같이, 이들 마우스의 뇌에서 CDKL5 단백질의 부재 및 매우 감소된 EB 인산화 수준을 발견하였다. 따라서, Cdkl5 (R59X)는 Cdkl5-ko 단백질의 부재를 이전에 사용된 Cdkl5-ko 마우스와 공유하지만, 유전적 배경이 마우스 모델의 생성 방법으로 인해 약간 상이하다. 신생 마우스에게 이전과 동일한 농도 (5 × 1010개 GC, 신생 ICV)로 주사하고, 3개월 이후 명백한 hCDKL5 단백질 발현 및 EB2 인산화가 나타났다. 소규모 예비 코호트로 행동 테스트를 시행하였다. AAV 처리는 잘 내성화되고, 이환이 관찰되지 않았다. 뒷다리 접기는 처리된 돌연변이체 마우스에서 유의하게 교정되었다.
또한, 본 발명자들은 이종접합 암컷 Cdkl5-ko 마우스에서 대안의 CDD 마우스 모델을 사용한 CDKL5 유전자 요법의 성과를 조사하였다. 이러한 모델은 대부분 CDD 환자 (CDD 암컷)를 반영한다. 종합 평가는 이종접합 암컷 Cdkl5-ko 마우스 신경행동 표현형이 나중의 발병과 함께 훨씬 더 경미하여 치료 성과의 명확한 평가를 어렵게 하는 것을 확인하였다. 그러나, 고용량 (5 × 1010개 GC, 신생 ICV)에서 뒷다리 접기 및 보행 활동에 대한 대표적인 데이터는 유의한 개선을 나타낸다 (도 14b 및 도 14c).
추가적으로, 본 발명자들은 야생형 마우스에서 CDKL5 유전자 요법의 용량 증가를 조사하였다. 야생형 (C57Bl6/J) 마우스에게 신생 ICV를 통해 7.5 × 1010개 GC 및 1 × 1011개 GC (즉, 이전에 사용된 최고 용량의 1.5배 또는 2배)를 주사하였다. 체중, 발달 및 생존에 미치는 외부적 효과가 관찰되지 않았다. 마우스는 정상으로 보이고, 뒷다리 접기 또는 활동 변화를 나타내지 않았다. CNS 조직의 병리학자 검토에서 관찰된 효과가 없었다 (도 19a 및 도 19b).
실시예 4: 인간 CDKL5 이소형 2 내지 4의 유용성
인간 및 마우스 뇌에는 적어도 4가지의 검출가능한 Cdkl5 mRNA 스플라이싱 변이체가 있는 것으로 밝혀졌지만, 이소형 2 내지 4가 안정한 단백질로서 존재하는지 확립되지 않고 있었다. 이소형 1은 뇌 CDKL5의 > 85%를 차지한다.
본 발명자들은 인간 CDKL4 이소형 1 내지 4의 코딩 서열을 코돈 조작하고, 이전과 동일한 AAV 벡터 내에 클로닝하였다. Cdkl5-ko 마우스에게 이소형 1 내지 4를 코딩하는 AAV9-PHP.B 벡터를 어른 꼬리 정맥으로 주사하고, 2주 후에 뇌를 웨스턴 블럿 분석을 위해 수확하였다. 본 발명자들은 모두 4가지 이소형이 명백하게 발현하고 예상된 젤 이동 양상을 나타내는 것을 확인하였다. 이소형 1의 발현량과 매우 닮은 이소형 2 내지 4의 발현을 수득하는 조작된 서열을 추적을 위해 선택하였다. 이소형 2에 의해 생성된 EB2 인산화 수준은 이소형 1과 비교하여 약간 더 높았으며, 이소형 3 또는 4에 의해 약간 더 낮았다.
대안의 3가지 CDKL5 이소형을 신생 Cdkl5-ko 마우스에게 주사하여 이소형 1의 이익과 비교하여 잠재적인 치료 이익을 테스트하였다. 도 12는 대안의 CDKL5 이소형 (2, 3 및 4)을 처리한 접기 표현형의 유의한 교정을 나타낸다. 도 8a 내지 도 8d는 발현 이소형 1, 이소형 2, 이소형 3 또는 이소형 4에 대한 AAV.CDKL5 벡터 구조물의 CDKL5 발현 수준 또는 활성을 나타낸다. 도 8a는 비히클을 주사한 야생형 마우스 및 비히클을 주사한 녹아웃 마우스와 비교하여, AAV 벡터를 주사한 (5 × 1010개 GC, 신생 ICV) 녹아웃 마우스에서 발현 수준을 나타낸다. 도 8b는 pS222EB2를 사용하여 결정된 바, 비히클 (PBS)을 주사한 야생형 마우스, 비히클 또는 AAV.CDKL5-1co를 주사한 녹아웃 마우스에서 CDKL5 활성을 나타낸다. 도 8c는 pS222EB2를 사용하여 결정된 바, 도 8a의 실험군에 대한 CDKL5 활성을 나타낸다. 도 8d는 도 8b의 실험군에 대한 CDKL5 발현 수준을 나타낸다.
요약하면, 모든 이소형은 단백질로서 발현되고, 비슷한 촉매 활성을 갖는다. CDD 마우스 모델에서 이소형 2, 3 또는 4로의 치료 성과는 차례로 테스트될 때 (5 × 1010개 GC, 신생 ICV), 이소형 1과 비슷하다. 종합하면, CDKL5 이소형 1로의 CDKL5 유전자 요법은 수컥 CDD 마우스 모델에서 유의한 치료 이익을 갖는 유망하고 안전한 접근법이다.
실시예 5: hCDKL5 유전자 요법의 독성 및 안전성 테스트를 위한 예비 NHP 연구
본 발명자들은 NHP 에서 AAVhu68 캡시드에 포장된 AAV-hSyn-CDKL5-1co.WPRE 구조물의 발현 양상 및 안전성 프로파일을 조사하길 원하였다. 벡터는 본원에 기술된 벡터 게놈 및 이전에 기술된 생산 방법을 사용하여 생성하였다. 예로, 본원에 참고문헌으로 통합되는 국제특허출원 제 WO 2018/160582호 참조. 6마리의 레서스 머커크의 실험군에게 대수조 (ICM)을 통해 주사하였다. 본 발명자들은 상이한 조건을 테스트하였다:
A. 1 mL 완충액 중 1 × 1014개 GC 용량이 주사됨
B. 3 또는 5 mL 완충액 중 1 × 1014개 GC 용량이 주사됨
C. 3 mL 완충액 중 3 × 1014개 GC 용량이 주사됨
D. CSF 생산을 감소시키는 이뇨제 아세트아졸아민 (디아목스®)의 전처리 2일 이후에 1 mL 완충액 중 1 × 1014개 GC 용량이 주사됨.
간략하게, 비-인간 영장류 (NHP) 연구를 위해 hCDKL5 유전자 용법의 독성 및 안전성 테스트를 AAVhu68-hSyn-Cdkl5-1co-WPRE 벡터를 사용하여 수행하였다. 예비 연구에서, 3가지 용량 3 × 1012개 GC/동물, 1 × 1013개 GC/동물 및 3 × 1013개 GC/동물을 평가하였다. 예비 연구를 위해, 1 × 1014개 GC/동물의 용량을 선택하고, 2가지 상이한 부피 (3 mL 및 5 mL)로 대수조를 통해 뇌척수액 (CSF)으로 AAV 벡터의 전달을 평가하였다. 다른 연구 방면은 이뇨제 (예로, 디아목스 상표명의 아세트아졸아미드)와 함께 1 × 1014개 GC/동물, 또는 3 × 1014개 GC/동물 (대상체)을 사용하였다.
추가적으로, 본 발명자들은 2 × 1012개, 1 × 1013개 및 3 × 1013개 GC/동물 (대상체)의 용량을 테스트하였다. CDKL5 벡터로의 처리는 잘 내성화되고, 임상 혈액에서 변화의 징후는 관찰되지 않았다. 사육상자 측면의 신경학적 검사로부터의 관찰은 기저선으로부터 변화를 나타내지 않았다.
부검은 주사 이후 28일째 수행하고, 이어서 분자적 분석, 조직학 및 병리학 검토를 진행하였다. 전반적으로, CNS 외부의 주요 장기에서 주요한 형질도입 차이를 발견하지 못하였다 (예로, 간의 형질도입이 이미 최대에 도달할 것 같음). 척수 및 DRG에서 주요한 형질도입 차이를 관찰하지 못하지만 (매우 높은 형질도입율을 유지함), 주사 매개변수에 따라 뇌 조직의 유의한 변화는 명백하다. 형질도입의 최고의 증가는 피질에서 관찰하였다. 디아목스는 뇌를 통한 형질전환 효율의 약간의 증가를 유도한다.
도 17은 각 NHP의 비-뉴런성 조직, 척수관 조직 및 뇌 조직에서 벡터 생체분포를 나타낸다. 도 18에서, 단지 뇌의 벡터 생체분포 데이터를 나타낸다. 결과는 등쪽 뿌리 신경절 (DRG)의 강한 형질도입, 뇌 조직의 중간 내지 낮은 형질도입이 있음을 나타내고, 뉴런성 조직 내로의 일부 형질도입 누출을 제시한다. 병리학 결과는 등쪽 백질관에서 경미한 축삭병증을 나타내었다. hCDKL5 mRNA 수준의 약간의 차이도 관찰하였다. 3 mL의 주사 부피가 사용될 때 더 높은 mRNA 발현의 경향성이 있다. 또한, 본 발명자들은 제자리 혼성화 (ISH)에 의해 hCDKL5 mRNA 분포를 영상화하였다. 등쪽 뿌리 신경절 (DRG)은 6마리 NHP 모두에서 매우 강한 mRNA 발현을 나타내었다. 운동 피질에서는, 적은 수의 형질도입된 뉴런을 관찰하였다 (< 10%). 때로, 작은 군집의 형질도입된 뉴런을 발견하였다. 본 연구의 NHP에서 운동 피질의 hCDKL5 mRNA 양성 뉴런에서는 유의한 차이가 없었다.
병리학 검토는 조직 및 NHP에서 육안적 병변을 발견하지 못하였다. 최고 용량을 투여받은 NHP는 간에서 염증성 세포 침윤의 경미한 징후를 나타내었다. 추가적으로, 모든 NHP에서 경미한 내지 중간의 척수 축삭병증 및 DRG 위성증을 나타내었다.
추가적으로, 본 발명자들은 AAVrh91.UbC.CDKL5-1co.miR183 및 AAVrh91.CBh.CDKL5-1co.miR183 벡터의 NHP에서 벡터 발현 및 안정성 테스트를 조사한다. 벡터를 C. 머카크에게 ICM 경로를 통해 3 × 1010개 GC 용량으로 투여한다. 병리학 분석 및 신경검사를 수행하여 AAV 벡터 투여 이후에 CDKL5 발현의 효과를 평가한다.
결론적으로, 우리의 연구에서 조사한 AAV-CDKL5 벡터 (서열번호 1)은 뉴런에서 안정한 CDKL5 단백질 발현을 달성하는데 사용될 수 있다. AAV-CDKL5 유전자 요법은 CDD 마우스 모델의 표현형을 유의하게 개선할 수 있다. 추가적으로, AAV-CDKL5 벡터는 대수조를 통해 비-인간 영장류에게 효율적으로 전달되어 CNS 전체를 통해 발현될 수 있다.
참고문헌
1. Bahi-Buisson, N. et al., Key clinical features to identify girls with CDKL5 mutations. Brain, 131: 2647-2661, (2008).
2. Fehr, S. et al., The CDKL5 disorder is an independent clinical entity associated with early-onset encephalopathy. Eur. J. Hum. Genet., 21: 266-273, (2013).
3. Kalscheuer, V. M. et al., Disruption of the serine/threonine kinase 9 gene causes severe X-linked infantile spasms and mental retardation. American Journal of Human Genetics, 72: 1401-1411, (2003).
4. Tao, J. et al., Mutations in the X-linked cyclin-dependent kinase-like 5 (CDKL5/STK9) gene are associated with severe neurodevelopmental retardation. American journal of human genetics. 75: 1149-1154, (2004).
5. Weaving, L. S. et al., Mutations of CDKL5 cause a severe neurodevelopmental disorder with infantile spasms and mental retardation. American journal of human genetics, 75: 1079-1093, (2004).
6. Hector, R. D. et al., Characterization of CDKL5 Transcript Isoforms in Human and Mouse. PloS one 11: e0157758, (2016).
7. Baltussen, L. L., et al., (2018). "Chemical genetic identification of CDKL5 substrates reveals its role in neuronal microtubule dynamics." EMBO Journal, 37(24).
8. Munoz, I. M., et al., (2018). "Phosphoproteomic screening identifies physiological substrates of the CDKL5 kinase." EMBO Journal.
본 명세서에서 인용된 모든 문서는 2020년 4월 27일에 제출된 미국 가특허출원 제 63/016,036호, 2020년 10월 13일에 제출된 미국 가특허출원 제 63/091,032호 및 2020년 11월 4일에 제출된 미국 가특허출원 제 63/109,608호와 같이 본원에 참고문헌으로 통합된다. 본원과 함께 제출된, "20-9196PCT_SeqListing_ST25.txt"로 표기된 서열목록, 및 이의 서열 및 텍스트는 본원에 참고문헌으로 통합된다. 본 발명이 구체적인 구현예를 언급하여 기술되는 한편, 변형은 본 발명의 정신을 벗어나지 않고도 만들어질 수 있음이 이해될 것이다. 이러한 변형은 첨부된 청구항의 범주 내에 속하도록 의도된다.
SEQUENCE LISTING
<110> THE TRUSTEES OF THE UNIVERSITY OF PENNSYLVANIA
<120> Composition useful in treatment of CDKL5 deficiency disorder
(CDD)
<130> UPN-20-9196.PCT
<150> US 63/016,036
<151> 2020-04-27
<150> US 63/091,032
<151> 2020-10-13
<150> US 63/109,608
<151> 2020-11-04
<160> 48
<170> PatentIn version 3.5
<210> 1
<211> 4634
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression cassette
<220>
<221> repeat_region
<222> (1)..(130)
<223> 5'ITR
<220>
<221> misc_feature
<222> (130)..(168)
<223> AAV 2 seq upstream of 3'ITR
<220>
<221> promoter
<222> (213)..(678)
<223> hSynapsin
<220>
<221> CDS
<222> (699)..(3581)
<223> hCDKL5_1
<220>
<221> misc_feature
<222> (3596)..(4183)
<223> WRPE
<220>
<221> polyA_signal
<222> (4201)..(4439)
<223> SV40 polyA
<220>
<221> misc_feature
<222> (4467)..(44505)
<223> AAV2 seq upstream of 3'ITR
<220>
<221> repeat_region
<222> (4505)..(4634)
<223> 3'ITR
<400> 1
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240
gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300
ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360
aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420
ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480
tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540
gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600
ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660
gtgtcgtgcc tgagagcgca gtcgaattcg ccgccacc atg aag atc ccc aac atc 716
Met Lys Ile Pro Asn Ile
1 5
ggc aac gtg atg aac aag ttc gag atc ctg ggc gtt gtc gga gaa ggc 764
Gly Asn Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly
10 15 20
gct tat ggc gtg gtg ctg aag tgc aga cac aaa gaa acc cac gag atc 812
Ala Tyr Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile
25 30 35
gtg gcc atc aag aag ttc aag gac agc gaa gag aac gag gaa gtg aaa 860
Val Ala Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys
40 45 50
gag aca acc ctg cgc gag ctg aag atg ctg aga acc ctg aag caa gag 908
Glu Thr Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu
55 60 65 70
aac atc gtg gaa ctg aaa gag gcc ttc cgg cgg aga ggc aag ctg tac 956
Asn Ile Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr
75 80 85
ctg gtg ttc gag tac gtg gaa aag aac atg ctc gag ctg ctg gaa gag 1004
Leu Val Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu
90 95 100
atg ccc aat ggc gtg cca cct gag aaa gtg aag tcc tac atc tac cag 1052
Met Pro Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln
105 110 115
ctg atc aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac aga 1100
Leu Ile Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg
120 125 130
gac atc aag ccc gag aac ctg ctg atc tcc cac aac gac gtg ctg aag 1148
Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys
135 140 145 150
ctg tgc gac ttc ggc ttc gcc aga aat ctg agc gag ggc aac aac gcc 1196
Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala
155 160 165
aac tac acc gag tat gtg gcc acc aga tgg tac aga agc cct gaa ctg 1244
Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu
170 175 180
ctg ctg gga gcc cct tac ggc aag tct gtg gat atg tgg tcc gtg ggc 1292
Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly
185 190 195
tgt atc ctg gga gag ctg tct gat ggc caa cct ctg ttt cct ggc gag 1340
Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu
200 205 210
tcc gag atc gac cag ctg ttc aca atc cag aag gtg ctg ggc cct ctg 1388
Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu
215 220 225 230
cct agc gag cag atg aag ctg ttc tac agc aac ccc aga ttc cac ggc 1436
Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly
235 240 245
ctg aga ttc cct gcc gtg aat cac cct cag agc ctg gaa aga aga tac 1484
Leu Arg Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr
250 255 260
ctg ggc atc ctg aac agc gtg ctg ctg gac ctg atg aag aat ctg ctg 1532
Leu Gly Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu
265 270 275
aaa ctg gac ccc gcc gac aga tac ctg acc gag cag tgt ctg aac cat 1580
Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His
280 285 290
cct acc ttt cag acc cag aga ctg ctg gat aga agc ccc agc aga agc 1628
Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Ser
295 300 305 310
gcc aag aga aag ccc tac cac gtg gaa agc agc acc ctg agc aat aga 1676
Ala Lys Arg Lys Pro Tyr His Val Glu Ser Ser Thr Leu Ser Asn Arg
315 320 325
aac cag gcc gga aag agc act gcc ctg cag agc cac cac aga agc aac 1724
Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn
330 335 340
agc aag gac atc cag aac ctg agc gtg ggc ctg cct aga gct gat gaa 1772
Ser Lys Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu
345 350 355
gga ctg cct gcc aac gag agc ttc ctg aat gga aat ctg gct ggc gcc 1820
Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala
360 365 370
tct ctg agc cct ctg cac aca aag aca tac cag gcc agc agc cag cct 1868
Ser Leu Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro
375 380 385 390
ggc agc aca agc aag gac ctg acc aac aac aac atc cct cat ctg ctg 1916
Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu
395 400 405
agc ccc aaa gag gcc aag agc aag acc gag ttc gac ttc aac atc gac 1964
Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp
410 415 420
ccc aag cct agc gaa ggc cct ggc acc aag tac ctg aag tcc aac tcc 2012
Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser
425 430 435
aga agc cag cag aac cgg cac tcc ttc atg gaa agc tct cag agc aag 2060
Arg Ser Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys
440 445 450
gcc ggc aca ctg cag cct aac gag aag cag agc aga cac agc tac atc 2108
Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile
455 460 465 470
gac aca atc cct cag tcc tct cgg agc ccc agc tac aga aca aag gcc 2156
Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala
475 480 485
aaa tct cac ggc gcc ctg agc gat agc aag agc gtg tcc aat ctg tcc 2204
Lys Ser His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser
490 495 500
gag gct aga gcc cag atc gcc gag cct agc acc agc aga tac ttc cct 2252
Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro
505 510 515
agc agc tgc ctg gat ctg aac agc cct aca agc ccc aca cct acc agg 2300
Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg
520 525 530
cac agc gat acc aga aca ctg ctg tcc cca agc ggc cgg aac aac aga 2348
His Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg
535 540 545 550
aat gag ggc acc ctg gac agc aga cgg acc acc aca aga cac agc aag 2396
Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys
555 560 565
acc atg gaa gaa ctg aag ctg ccc gag cac atg gac tct agc cac tct 2444
Thr Met Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser
570 575 580
cat tct ctg agc gcc cct cac gag tcc ttt agc tac ggc ctg ggc tac 2492
His Ser Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr
585 590 595
aca agc cca ttt tcc agt cag cag cgg ccc cac aga cac tct atg tac 2540
Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr
600 605 610
gtg acc aga gac aaa gtc cgc gcc aaa ggc ctg gat ggc tct ctg tct 2588
Val Thr Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser
615 620 625 630
att gga caa ggc atg gcc gcc aga gcc aat agc ctg caa ctt ctg tct 2636
Ile Gly Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser
635 640 645
cct cag cct ggc gaa cag ctg cct cct gaa atg aca gtg gcc cgg tcc 2684
Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser
650 655 660
agc gtg aaa gaa acc agc aga gag ggc acc tcc agc ttc cac acc aga 2732
Ser Val Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg
665 670 675
cag aaa agc gaa ggc ggc gtg tac cac gat cct cac tct gat gat ggc 2780
Gln Lys Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly
680 685 690
aca gcc cct aaa gag aac aga cac ctg tac aac gac ccc gtg cct aga 2828
Thr Ala Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg
695 700 705 710
aga gtg ggc tcc ttc tac aga gtg cct tct cct aga cct gac aac tcc 2876
Arg Val Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser
715 720 725
ttc cac gag aac aac gtg tca acc cgg gtg tcc agc ctg cct tct gag 2924
Phe His Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu
730 735 740
agc agc tct ggc aca aac cac tcc aag agg cag ccc gcc ttc gat cct 2972
Ser Ser Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro
745 750 755
tgg aag tcc cct gag aat atc agc cac tcc gag cag ctg aaa gag aaa 3020
Trp Lys Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys
760 765 770
gag aag cag ggc ttt ttc cgg tcc atg aag aag aag aaa aag aag tcc 3068
Glu Lys Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser
775 780 785 790
cag aca gtc ccc aac agc gac agc cct gat ctc ctg aca ctg cag aag 3116
Gln Thr Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys
795 800 805
tcc atc cac agc gcc agc aca cct agc agc aga cct aaa gag tgg cgg 3164
Ser Ile His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg
810 815 820
cca gag aag atc agc gac ctg caa aca cag agc cag cct ctg aag tcc 3212
Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser
825 830 835
ctg agg aag ctg ctg cat ctg tcc tcc gcc tct aat cac cct gcc agc 3260
Leu Arg Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser
840 845 850
agc gat ccc aga ttt cag cca ctg aca gcc cag cag acc aag aac tcc 3308
Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser
855 860 865 870
ttc agc gag atc cgg att cac cca ctg tct cag gcc agc ggc ggc agc 3356
Phe Ser Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser
875 880 885
tct aat atc aga caa gag ccc gct cct aag ggc aga cct gct ctc caa 3404
Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln
890 895 900
ctg cct gga cag atg gat cct ggc tgg cac gtg tcc tct gtg aca aga 3452
Leu Pro Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg
905 910 915
tct gcc acc gag gga cct agc tat tct gag cag ctg ggc gcc aag tct 3500
Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser
920 925 930
ggc ccc aat gga cac ccc tac aac cgg acc aat cgg agc aga atg ccc 3548
Gly Pro Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro
935 940 945 950
aac ctg aac gac ctc aaa gaa aca gcc ctc tga gagcttatcg ataatcaacc 3601
Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu
955 960
tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac 3661
gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt 3721
cattttctcc tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt 3781
tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg 3841
cattgccacc acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac 3901
ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac 3961
tgacaattcc gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt 4021
tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc 4081
ggaccttcct tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg 4141
ccctcagacg agtcggatct ccctttgggc cgcctccccg catcgatacc gtcgatcgag 4201
gccgcttcga gcagacatga taagatacat tgatgagttt ggacaaacca caactagaat 4261
gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 4321
tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 4381
gggggagatg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatcga 4441
taaggatctt cctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact 4501
acaaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 4561
aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 4621
agcgagcgcg cag 4634
<210> 2
<211> 960
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 2
Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu
1 5 10 15
Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His
20 25 30
Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu
35 40 45
Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu
50 55 60
Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg
65 70 75 80
Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met
85 90 95
Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val
100 105 110
Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys
115 120 125
Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser
130 135 140
His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu
145 150 155 160
Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp
165 170 175
Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val
180 185 190
Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln
195 200 205
Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln
210 215 220
Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser
225 230 235 240
Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln
245 250 255
Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp
260 265 270
Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr
275 280 285
Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp
290 295 300
Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser
305 310 315 320
Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln
325 330 335
Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly
340 345 350
Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn
355 360 365
Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr
370 375 380
Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn
385 390 395 400
Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu
405 410 415
Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys
420 425 430
Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met
435 440 445
Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln
450 455 460
Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro
465 470 475 480
Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys
485 490 495
Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser
500 505 510
Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr
515 520 525
Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro
530 535 540
Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr
545 550 555 560
Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His
565 570 575
Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe
580 585 590
Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro
595 600 605
His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly
610 615 620
Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn
625 630 635 640
Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu
645 650 655
Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr
660 665 670
Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp
675 680 685
Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr
690 695 700
Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser
705 710 715 720
Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val
725 730 735
Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg
740 745 750
Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser
755 760 765
Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys
770 775 780
Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp
785 790 795 800
Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser
805 810 815
Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln
820 825 830
Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala
835 840 845
Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala
850 855 860
Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser
865 870 875 880
Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys
885 890 895
Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His
900 905 910
Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu
915 920 925
Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr
930 935 940
Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu
945 950 955 960
<210> 3
<211> 4750
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression Cassette
<220>
<221> repeat_region
<222> (1)..(130)
<223> 5'ITR
<220>
<221> misc_feature
<222> (130)..(168)
<223> AAV2 seq usptream of 3'ITR
<220>
<221> promoter
<222> (213)..(678)
<223> hSynapsin
<220>
<221> CDS
<222> (699)..(3581)
<223> hCDKL5-1
<220>
<221> misc_binding
<222> (3590)..(3705)
<223> miR183
<220>
<221> misc_feature
<222> (3712)..(4299)
<223> WRPE
<220>
<221> polyA_signal
<222> (4317)..(4555)
<223> SV40 polyA
<220>
<221> misc_feature
<222> (4583)..(4621)
<223> AAV2 seq upstream of 3'ITR
<220>
<221> repeat_region
<222> (4621)..(4750)
<223> 3'ITR
<400> 3
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240
gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300
ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360
aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420
ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480
tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540
gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600
ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660
gtgtcgtgcc tgagagcgca gtcgaattcg ccgccacc atg aag atc ccc aac atc 716
Met Lys Ile Pro Asn Ile
1 5
ggc aac gtg atg aac aag ttc gag atc ctg ggc gtt gtc gga gaa ggc 764
Gly Asn Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly
10 15 20
gct tat ggc gtg gtg ctg aag tgc aga cac aaa gaa acc cac gag atc 812
Ala Tyr Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile
25 30 35
gtg gcc atc aag aag ttc aag gac agc gaa gag aac gag gaa gtg aaa 860
Val Ala Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys
40 45 50
gag aca acc ctg cgc gag ctg aag atg ctg aga acc ctg aag caa gag 908
Glu Thr Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu
55 60 65 70
aac atc gtg gaa ctg aaa gag gcc ttc cgg cgg aga ggc aag ctg tac 956
Asn Ile Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr
75 80 85
ctg gtg ttc gag tac gtg gaa aag aac atg ctc gag ctg ctg gaa gag 1004
Leu Val Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu
90 95 100
atg ccc aat ggc gtg cca cct gag aaa gtg aag tcc tac atc tac cag 1052
Met Pro Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln
105 110 115
ctg atc aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac aga 1100
Leu Ile Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg
120 125 130
gac atc aag ccc gag aac ctg ctg atc tcc cac aac gac gtg ctg aag 1148
Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys
135 140 145 150
ctg tgc gac ttc ggc ttc gcc aga aat ctg agc gag ggc aac aac gcc 1196
Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala
155 160 165
aac tac acc gag tat gtg gcc acc aga tgg tac aga agc cct gaa ctg 1244
Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu
170 175 180
ctg ctg gga gcc cct tac ggc aag tct gtg gat atg tgg tcc gtg ggc 1292
Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly
185 190 195
tgt atc ctg gga gag ctg tct gat ggc caa cct ctg ttt cct ggc gag 1340
Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu
200 205 210
tcc gag atc gac cag ctg ttc aca atc cag aag gtg ctg ggc cct ctg 1388
Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu
215 220 225 230
cct agc gag cag atg aag ctg ttc tac agc aac ccc aga ttc cac ggc 1436
Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly
235 240 245
ctg aga ttc cct gcc gtg aat cac cct cag agc ctg gaa aga aga tac 1484
Leu Arg Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr
250 255 260
ctg ggc atc ctg aac agc gtg ctg ctg gac ctg atg aag aat ctg ctg 1532
Leu Gly Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu
265 270 275
aaa ctg gac ccc gcc gac aga tac ctg acc gag cag tgt ctg aac cat 1580
Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His
280 285 290
cct acc ttt cag acc cag aga ctg ctg gat aga agc ccc agc aga agc 1628
Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Ser
295 300 305 310
gcc aag aga aag ccc tac cac gtg gaa agc agc acc ctg agc aat aga 1676
Ala Lys Arg Lys Pro Tyr His Val Glu Ser Ser Thr Leu Ser Asn Arg
315 320 325
aac cag gcc gga aag agc act gcc ctg cag agc cac cac aga agc aac 1724
Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn
330 335 340
agc aag gac atc cag aac ctg agc gtg ggc ctg cct aga gct gat gaa 1772
Ser Lys Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu
345 350 355
gga ctg cct gcc aac gag agc ttc ctg aat gga aat ctg gct ggc gcc 1820
Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala
360 365 370
tct ctg agc cct ctg cac aca aag aca tac cag gcc agc agc cag cct 1868
Ser Leu Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro
375 380 385 390
ggc agc aca agc aag gac ctg acc aac aac aac atc cct cat ctg ctg 1916
Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu
395 400 405
agc ccc aaa gag gcc aag agc aag acc gag ttc gac ttc aac atc gac 1964
Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp
410 415 420
ccc aag cct agc gaa ggc cct ggc acc aag tac ctg aag tcc aac tcc 2012
Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser
425 430 435
aga agc cag cag aac cgg cac tcc ttc atg gaa agc tct cag agc aag 2060
Arg Ser Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys
440 445 450
gcc ggc aca ctg cag cct aac gag aag cag agc aga cac agc tac atc 2108
Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile
455 460 465 470
gac aca atc cct cag tcc tct cgg agc ccc agc tac aga aca aag gcc 2156
Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala
475 480 485
aaa tct cac ggc gcc ctg agc gat agc aag agc gtg tcc aat ctg tcc 2204
Lys Ser His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser
490 495 500
gag gct aga gcc cag atc gcc gag cct agc acc agc aga tac ttc cct 2252
Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro
505 510 515
agc agc tgc ctg gat ctg aac agc cct aca agc ccc aca cct acc agg 2300
Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg
520 525 530
cac agc gat acc aga aca ctg ctg tcc cca agc ggc cgg aac aac aga 2348
His Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg
535 540 545 550
aat gag ggc acc ctg gac agc aga cgg acc acc aca aga cac agc aag 2396
Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys
555 560 565
acc atg gaa gaa ctg aag ctg ccc gag cac atg gac tct agc cac tct 2444
Thr Met Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser
570 575 580
cat tct ctg agc gcc cct cac gag tcc ttt agc tac ggc ctg ggc tac 2492
His Ser Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr
585 590 595
aca agc cca ttt tcc agt cag cag cgg ccc cac aga cac tct atg tac 2540
Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr
600 605 610
gtg acc aga gac aaa gtc cgc gcc aaa ggc ctg gat ggc tct ctg tct 2588
Val Thr Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser
615 620 625 630
att gga caa ggc atg gcc gcc aga gcc aat agc ctg caa ctt ctg tct 2636
Ile Gly Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser
635 640 645
cct cag cct ggc gaa cag ctg cct cct gaa atg aca gtg gcc cgg tcc 2684
Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser
650 655 660
agc gtg aaa gaa acc agc aga gag ggc acc tcc agc ttc cac acc aga 2732
Ser Val Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg
665 670 675
cag aaa agc gaa ggc ggc gtg tac cac gat cct cac tct gat gat ggc 2780
Gln Lys Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly
680 685 690
aca gcc cct aaa gag aac aga cac ctg tac aac gac ccc gtg cct aga 2828
Thr Ala Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg
695 700 705 710
aga gtg ggc tcc ttc tac aga gtg cct tct cct aga cct gac aac tcc 2876
Arg Val Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser
715 720 725
ttc cac gag aac aac gtg tca acc cgg gtg tcc agc ctg cct tct gag 2924
Phe His Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu
730 735 740
agc agc tct ggc aca aac cac tcc aag agg cag ccc gcc ttc gat cct 2972
Ser Ser Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro
745 750 755
tgg aag tcc cct gag aat atc agc cac tcc gag cag ctg aaa gag aaa 3020
Trp Lys Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys
760 765 770
gag aag cag ggc ttt ttc cgg tcc atg aag aag aag aaa aag aag tcc 3068
Glu Lys Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser
775 780 785 790
cag aca gtc ccc aac agc gac agc cct gat ctc ctg aca ctg cag aag 3116
Gln Thr Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys
795 800 805
tcc atc cac agc gcc agc aca cct agc agc aga cct aaa gag tgg cgg 3164
Ser Ile His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg
810 815 820
cca gag aag atc agc gac ctg caa aca cag agc cag cct ctg aag tcc 3212
Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser
825 830 835
ctg agg aag ctg ctg cat ctg tcc tcc gcc tct aat cac cct gcc agc 3260
Leu Arg Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser
840 845 850
agc gat ccc aga ttt cag cca ctg aca gcc cag cag acc aag aac tcc 3308
Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser
855 860 865 870
ttc agc gag atc cgg att cac cca ctg tct cag gcc agc ggc ggc agc 3356
Phe Ser Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser
875 880 885
tct aat atc aga caa gag ccc gct cct aag ggc aga cct gct ctc caa 3404
Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln
890 895 900
ctg cct gga cag atg gat cct ggc tgg cac gtg tcc tct gtg aca aga 3452
Leu Pro Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg
905 910 915
tct gcc acc gag gga cct agc tat tct gag cag ctg ggc gcc aag tct 3500
Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser
920 925 930
ggc ccc aat gga cac ccc tac aac cgg acc aat cgg agc aga atg ccc 3548
Gly Pro Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro
935 940 945 950
aac ctg aac gac ctc aaa gaa aca gcc ctc tga gagcttatac cggtagtgaa 3601
Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu
955 960
ttctaccagt gccataggat agtgaattct accagtgcca tacacgtgag tgaattctac 3661
cagtgccata gcatgcagtg aattctacca gtgccatagg tacccgataa tcaacctctg 3721
gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc ttttacgcta 3781
tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat ggctttcatt 3841
ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg gcccgttgtc 3901
aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg ttggggcatt 3961
gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat tgccacggcg 4021
gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt gggcactgac 4081
aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc 4141
acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa tccagcggac 4201
cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg ccttcgccct 4261
cagacgagtc ggatctccct ttgggccgcc tccccgcatc gataccgtcg atcgaggccg 4321
cttcgagcag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 4381
tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 4441
agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 4501
gagatgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtaa aatcgataag 4561
gatcttccta gagcatggct acgtagataa gtagcatggc gggttaatca ttaactacaa 4621
ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4681
cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg 4741
agcgcgcag 4750
<210> 4
<211> 960
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 4
Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu
1 5 10 15
Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His
20 25 30
Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu
35 40 45
Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu
50 55 60
Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg
65 70 75 80
Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met
85 90 95
Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val
100 105 110
Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys
115 120 125
Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser
130 135 140
His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu
145 150 155 160
Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp
165 170 175
Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val
180 185 190
Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln
195 200 205
Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln
210 215 220
Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser
225 230 235 240
Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln
245 250 255
Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp
260 265 270
Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr
275 280 285
Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp
290 295 300
Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser
305 310 315 320
Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln
325 330 335
Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly
340 345 350
Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn
355 360 365
Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr
370 375 380
Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn
385 390 395 400
Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu
405 410 415
Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys
420 425 430
Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met
435 440 445
Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln
450 455 460
Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro
465 470 475 480
Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys
485 490 495
Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser
500 505 510
Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr
515 520 525
Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro
530 535 540
Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr
545 550 555 560
Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His
565 570 575
Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe
580 585 590
Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro
595 600 605
His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly
610 615 620
Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn
625 630 635 640
Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu
645 650 655
Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr
660 665 670
Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp
675 680 685
Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr
690 695 700
Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser
705 710 715 720
Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val
725 730 735
Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg
740 745 750
Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser
755 760 765
Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys
770 775 780
Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp
785 790 795 800
Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser
805 810 815
Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln
820 825 830
Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala
835 840 845
Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala
850 855 860
Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser
865 870 875 880
Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys
885 890 895
Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His
900 905 910
Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu
915 920 925
Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr
930 935 940
Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu
945 950 955 960
<210> 5
<211> 4757
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression Cassette
<220>
<221> repeat_region
<222> (1)..(130)
<223> 5'ITR
<220>
<221> misc_feature
<222> (130)..(168)
<223> AAV2 seq usptream of 3'ITR
<220>
<221> promoter
<222> (213)..(678)
<223> hSynapsin
<220>
<221> misc_feature
<222> (690)..(695)
<223> Kozak
<220>
<221> CDS
<222> (696)..(3704)
<223> hCDKL5-2GS
<220>
<221> misc_feature
<222> (3719)..(4306)
<223> WRPE
<220>
<221> polyA_signal
<222> (4324)..(4562)
<223> SV40 polyA
<220>
<221> misc_feature
<222> (4590)..(4628)
<223> AAV2 seq usptream of 3'ITR
<220>
<221> repeat_region
<222> (4628)..(4757)
<223> 3'ITR
<400> 5
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240
gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300
ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360
aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420
ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480
tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540
gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600
ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660
gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg aag atc ccc aat atc 713
Met Lys Ile Pro Asn Ile
1 5
ggc aac gtg atg aat aag ttc gag atc ctg gga gtg gtg gga gag gga 761
Gly Asn Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly
10 15 20
gca tac ggc gtg gtg ctg aag tgc aga cac aag gag aca cac gag atc 809
Ala Tyr Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile
25 30 35
gtg gcc atc aag aag ttt aag gat agc gag gag aat gag gag gtg aag 857
Val Ala Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys
40 45 50
gag aca acc ctg cgc gag ctg aag atg ctg cgg aca ctg aag cag gag 905
Glu Thr Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu
55 60 65 70
aac atc gtg gag ctg aag gag gcc ttc cgg aga agg ggc aag ctg tac 953
Asn Ile Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr
75 80 85
ctg gtg ttt gag tac gtg gag aag aac atg ctg gag ctg ctg gag gag 1001
Leu Val Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu
90 95 100
atg cct aat ggc gtg ccc cct gag aag gtg aag agc tac atc tat cag 1049
Met Pro Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln
105 110 115
ctg atc aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac cgc 1097
Leu Ile Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg
120 125 130
gat atc aag cca gag aac ctg ctg atc agc cac aat gac gtg ctg aag 1145
Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys
135 140 145 150
ctg tgc gat ttc ggc ttt gcc cgg aac ctg tcc gag ggc aac aac gcc 1193
Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala
155 160 165
aat tac aca gag tac gtg gca acc agg tgg tac cgg tcc cct gag ctg 1241
Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu
170 175 180
ctg ctg gga gca cca tac ggc aag tct gtg gac atg tgg agc gtg ggc 1289
Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly
185 190 195
tgc atc ctg gga gag ctg tcc gac gga cag cca ctg ttc cct ggc gag 1337
Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu
200 205 210
tct gag atc gat cag ctg ttt acc atc cag aag gtg ctg ggc ccc ctg 1385
Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu
215 220 225 230
cct tcc gag cag atg aag ctg ttc tac tct aac cca agg ttc cac ggc 1433
Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly
235 240 245
ctg agg ttt cca gcc gtg aat cac ccc cag tct ctg gag cgc cgg tat 1481
Leu Arg Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr
250 255 260
ctg ggc atc ctg aac agc gtg ctg ctg gat ctg atg aag aat ctg ctg 1529
Leu Gly Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu
265 270 275
aag ctg gac cct gcc gat cgc tac ctg acc gag cag tgt ctg aat cac 1577
Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His
280 285 290
cca aca ttt cag acc cag aga ctg ctg gac agg agc ccc tcc cgc tct 1625
Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Ser
295 300 305 310
gcc aag agg aag cct tat cac gtg gag agc tcc acc ctg agc aat cgc 1673
Ala Lys Arg Lys Pro Tyr His Val Glu Ser Ser Thr Leu Ser Asn Arg
315 320 325
aac cag gcc ggc aag tcc aca gcc ctg cag tct cac cac cgg agc aac 1721
Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn
330 335 340
tcc aag gac atc cag aat ctg agc gtg ggc ctg cca agg gca gac gag 1769
Ser Lys Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu
345 350 355
ggc ctg cct gcc aac gag tcc ttc ctg aat gga aac ctg gca gga gcc 1817
Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala
360 365 370
tct ctg agc cca ctg cac aca aag acc tac cag gcc tct agc cag cct 1865
Ser Leu Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro
375 380 385 390
ggc tcc aca tct aag gac ctg acc aac aat aac atc cct cac ctg ctg 1913
Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu
395 400 405
agc cca aag gag gcc aag tcc aag acc gag ttc gac ttt aat atc gat 1961
Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp
410 415 420
cca aag ccc agc gag ggc cca ggc aca aag tat ctg aag agc aac tcc 2009
Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser
425 430 435
aga tct cag cag aat agg cac tct ttc atg gag tcc tct cag agc aag 2057
Arg Ser Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys
440 445 450
gcc ggc acc ctg cag ccc aac gag aag cag agc agg cac tcc tac atc 2105
Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile
455 460 465 470
gat acc atc cca cag agc tcc cgc agc ccc tcc tat cgg aca aag gcc 2153
Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala
475 480 485
aag agc cac ggc gcc ctg tct gac agc aag tcc gtg tct aat ctg tcc 2201
Lys Ser His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser
490 495 500
gag gca aga gca cag atc gca gag cca agc acc tcc agg tac ttt ccc 2249
Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro
505 510 515
tct tcc tgt ctg gac ctg aac tct cca aca agc cct aca cca acc aga 2297
Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg
520 525 530
cac agc gat aca agg acc ctg ctg tct ccc agc ggc aga aat aac agg 2345
His Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg
535 540 545 550
aac gag ggc acc ctg gat agc aga agg acc aca acc aga cac tcc aag 2393
Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys
555 560 565
aca atg gag gag ctg aag ctg ccc gag cac atg gac tcc tct cac tcc 2441
Thr Met Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser
570 575 580
cac tct ctg agc gcc cct cac gag tcc ttc tct tac ggc ctg ggc tat 2489
His Ser Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr
585 590 595
acc agc cct ttt agc tcc cag cag cgc cca cac agg cac tcc atg tac 2537
Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr
600 605 610
gtg aca aga gac aag gtg agg gcc aag ggc ctg gac ggc agc ctg tcc 2585
Val Thr Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser
615 620 625 630
atc gga cag gga atg gca gca agg gca aat agc ctg cag ctg ctg tcc 2633
Ile Gly Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser
635 640 645
cca cag cct gga gag cag ctg cca cca gag atg acc gtg gcc aga tct 2681
Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser
650 655 660
agc gtg aag gag aca agc agg gag ggc acc tcc tct ttc cac aca aga 2729
Ser Val Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg
665 670 675
cag aag agc gag ggc ggc gtg tat cac gac cca cac tcc gac gac gga 2777
Gln Lys Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly
680 685 690
acc gca ccc aag gag aac agg cac ctg tac aac gat cca gtg ccc cgc 2825
Thr Ala Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg
695 700 705 710
cgg gtg ggc tct ttc tat cgg gtg cct agc cca cgg ccc gac aac tcc 2873
Arg Val Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser
715 720 725
ttt cac gag aat aac gtg tct acc aga gtg agc tcc ctg cct agc gag 2921
Phe His Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu
730 735 740
tct agc tcc ggc aca aac cac tcc aag agg cag cca gcc ttt gat ccc 2969
Ser Ser Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro
745 750 755
tgg aag tct cct gag aat atc tct cac agc gag cag ctg aag gag aag 3017
Trp Lys Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys
760 765 770
gag aag cag ggc ttc ttt cgc agc atg aag aag aag aag aag aag agc 3065
Glu Lys Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser
775 780 785 790
cag aca acc gac agc acc aac ggc gag aat cct agc atc aag aag tcc 3113
Gln Thr Thr Asp Ser Thr Asn Gly Glu Asn Pro Ser Ile Lys Lys Ser
795 800 805
ctg ttc cca ctg ttt aac tcc aag aat cac ctg aag cac tct agc tcc 3161
Leu Phe Pro Leu Phe Asn Ser Lys Asn His Leu Lys His Ser Ser Ser
810 815 820
ctg aag aag ctg ccc gtg gtg aca cct cca atg gtg ccc aat tcc gac 3209
Leu Lys Lys Leu Pro Val Val Thr Pro Pro Met Val Pro Asn Ser Asp
825 830 835
tct cct gat ctg ctg acc ctg cag aag agc atc cac agc gcc tcc aca 3257
Ser Pro Asp Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr
840 845 850
cca tct agc aga ccc aag gag tgg agg cca gag aag atc tcc gat ctg 3305
Pro Ser Ser Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu
855 860 865 870
cag acc cag tcc cag ccc ctg aag tct ctg cgg aag ctg ctg cac ctg 3353
Gln Thr Gln Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu
875 880 885
tcc tct gcc agc aac cac cct gca agc tcc gac cct agg ttc cag cca 3401
Ser Ser Ala Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro
890 895 900
ctg aca gcc cag cag acc aag aac tct ttt agc gag atc aga atc cac 3449
Leu Thr Ala Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His
905 910 915
cca ctg tcc cag gcc tct gga ggc tct agc aac atc cgc cag gag cct 3497
Pro Leu Ser Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro
920 925 930
gcc cca aag ggc cgg cca gcc ctg cag ctg cca gga cag atg gac ccc 3545
Ala Pro Lys Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro
935 940 945 950
ggc tgg cac gtg tcc tct gtg aca aga tcc gcc acc gag gga cca tcc 3593
Gly Trp His Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser
955 960 965
tac tct gag cag ctg gga gca aag tct gga cca aac gga cac cct tat 3641
Tyr Ser Glu Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr
970 975 980
aac agg acc aat aga tcc agg atg cct aat ctg aac gac ctg aag gag 3689
Asn Arg Thr Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu
985 990 995
aca gcc ctg tga tag aagcttatcg ataatcaacc tctggattac aaaatttgtg 3744
Thr Ala Leu
1000
aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt 3804
taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata 3864
aatcctggtt gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg 3924
tgtgcactgt gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc 3984
tcctttccgg gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct 4044
gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt 4104
cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg attctgcgcg 4164
ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc 4224
tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg agtcggatct 4284
ccctttgggc cgcctccccg catcgatacc gtcgatcgag gccgcttcga gcagacatga 4344
taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 4404
tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 4464
ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggagatg tgggaggttt 4524
tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatcga taaggatctt cctagagcat 4584
ggctacgtag ataagtagca tggcgggtta atcattaact acaaggaacc cctagtgatg 4644
gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc 4704
gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cag 4757
<210> 6
<211> 1001
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 6
Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu
1 5 10 15
Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His
20 25 30
Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu
35 40 45
Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu
50 55 60
Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg
65 70 75 80
Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met
85 90 95
Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val
100 105 110
Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys
115 120 125
Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser
130 135 140
His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu
145 150 155 160
Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp
165 170 175
Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val
180 185 190
Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln
195 200 205
Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln
210 215 220
Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser
225 230 235 240
Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln
245 250 255
Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp
260 265 270
Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr
275 280 285
Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp
290 295 300
Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser
305 310 315 320
Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln
325 330 335
Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly
340 345 350
Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn
355 360 365
Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr
370 375 380
Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn
385 390 395 400
Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu
405 410 415
Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys
420 425 430
Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met
435 440 445
Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln
450 455 460
Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro
465 470 475 480
Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys
485 490 495
Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser
500 505 510
Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr
515 520 525
Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro
530 535 540
Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr
545 550 555 560
Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His
565 570 575
Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe
580 585 590
Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro
595 600 605
His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly
610 615 620
Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn
625 630 635 640
Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu
645 650 655
Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr
660 665 670
Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp
675 680 685
Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr
690 695 700
Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser
705 710 715 720
Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val
725 730 735
Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg
740 745 750
Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser
755 760 765
Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys
770 775 780
Lys Lys Lys Lys Lys Ser Gln Thr Thr Asp Ser Thr Asn Gly Glu Asn
785 790 795 800
Pro Ser Ile Lys Lys Ser Leu Phe Pro Leu Phe Asn Ser Lys Asn His
805 810 815
Leu Lys His Ser Ser Ser Leu Lys Lys Leu Pro Val Val Thr Pro Pro
820 825 830
Met Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys Ser
835 840 845
Ile His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg Pro
850 855 860
Glu Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser Leu
865 870 875 880
Arg Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser Ser
885 890 895
Asp Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser Phe
900 905 910
Ser Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser Ser
915 920 925
Asn Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln Leu
930 935 940
Pro Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg Ser
945 950 955 960
Ala Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser Gly
965 970 975
Pro Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro Asn
980 985 990
Leu Asn Asp Leu Lys Glu Thr Ala Leu
995 1000
<210> 7
<211> 4583
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression Cassette
<220>
<221> repeat_region
<222> (1)..(130)
<223> 5'ITR
<220>
<221> misc_feature
<222> (130)..(168)
<223> AAV2 seq upstream of 3'ITR
<220>
<221> promoter
<222> (213)..(678)
<223> hSynapsin
<220>
<221> misc_feature
<222> (690)..(695)
<223> Kozak
<220>
<221> CDS
<222> (696)..(3530)
<223> hCDKL5-3GS
<220>
<221> misc_feature
<222> (3545)..(4132)
<223> WRPE
<220>
<221> polyA_signal
<222> (4150)..(4388)
<223> SV40 polyA
<220>
<221> misc_feature
<222> (4416)..(4454)
<223> AAV2 seq upstream of 3'ITR
<220>
<221> repeat_region
<222> (4454)..(4583)
<223> 3'ITR
<400> 7
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240
gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300
ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360
aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420
ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480
tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540
gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600
ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660
gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg aag atc ccc aat atc 713
Met Lys Ile Pro Asn Ile
1 5
ggc aac gtg atg aat aag ttc gag atc ctg gga gtg gtg gga gag gga 761
Gly Asn Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly
10 15 20
gca tac gga gtg gtg ctg aag tgc cgg cac aag gag aca cac gag atc 809
Ala Tyr Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile
25 30 35
gtg gcc atc aag aag ttt aag gat agc gag gag aat gag gag gtg aag 857
Val Ala Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys
40 45 50
gag aca acc ctg agg gag ctg aag atg ctg cgc aca ctg aag cag gag 905
Glu Thr Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu
55 60 65 70
aac atc gtg gag ctg aag gag gcc ttc cgg aga agg ggc aag ctg tac 953
Asn Ile Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr
75 80 85
ctg gtg ttt gag tac gtg gag aag aac atg ctg gag ctg ctg gag gag 1001
Leu Val Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu
90 95 100
atg cct aat ggc gtg ccc cct gag aag gtg aag agc tac atc tat cag 1049
Met Pro Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln
105 110 115
ctg atc aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac agg 1097
Leu Ile Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg
120 125 130
gat atc aag cca gag aac ctg ctg atc agc cac aat gac gtg ctg aag 1145
Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys
135 140 145 150
ctg tgc gat ttc ggc ttt gcc cgc aac ctg tcc gag ggc aac aac gcc 1193
Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala
155 160 165
aat tac aca gag tac gtg gca acc agg tgg tac cgg tcc cca gag ctg 1241
Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu
170 175 180
ctg ctg gga gca cca tac ggc aag agc gtg gac atg tgg tcc gtg ggc 1289
Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly
185 190 195
tgc atc ctg ggc gag ctg tct gac ggc cag cct ctg ttc cca ggc gag 1337
Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu
200 205 210
agc gag atc gat cag ctg ttt acc atc cag aag gtg ctg ggc cct ctg 1385
Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu
215 220 225 230
cca agc gag cag atg aag ctg ttc tac tcc aac cct agg ttc cac ggc 1433
Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly
235 240 245
ctg cgc ttt ccc gcc gtg aat cac cct cag agc ctg gag cgc cgg tat 1481
Leu Arg Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr
250 255 260
ctg ggc atc ctg aac tcc gtg ctg ctg gat ctg atg aag aat ctg ctg 1529
Leu Gly Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu
265 270 275
aag ctg gac ccc gcc gat agg tac ctg acc gag cag tgt ctg aac cac 1577
Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His
280 285 290
ccc aca ttc cag acc cag aga ctg ctg gac agg tcc cct tct cgc aat 1625
Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Asn
295 300 305 310
cag gcc ggc aag tct aca gcc ctg cag agc cac cac agg agc aac tcc 1673
Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn Ser
315 320 325
aag gac atc cag aat ctg agc gtg ggc ctg cct agg gca gac gag ggc 1721
Lys Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu Gly
330 335 340
ctg cca gca aac gag tcc ttt ctg aat gga aac ctg gca gga gcc tct 1769
Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala Ser
345 350 355
ctg agc cca ctg cac aca aag acc tac cag gcc agc tcc cag cca ggc 1817
Leu Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro Gly
360 365 370
tcc aca tct aag gat ctg acc aac aat aac atc cca cac ctg ctg tct 1865
Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu Ser
375 380 385 390
ccc aag gag gcc aag agc aag acc gag ttc gac ttt aat atc gat ccc 1913
Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp Pro
395 400 405
aag cct agc gag ggc cca ggc aca aag tat ctg aag agc aac tcc cgg 1961
Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser Arg
410 415 420
agc cag cag aat aga cac tcc ttc atg gag tct agc cag tct aag gcc 2009
Ser Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys Ala
425 430 435
ggc acc ctg cag ccc aac gag aag cag agc cgc cac tcc tac atc gat 2057
Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile Asp
440 445 450
acc atc ccc cag tcc tct agg agc cct tcc tat cgc aca aag gcc aag 2105
Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala Lys
455 460 465 470
agc cac ggc gcc ctg tct gac agc aag tcc gtg tct aat ctg tcc gag 2153
Ser His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser Glu
475 480 485
gca agg gca cag atc gca gag ccc agc acc tcc aga tac ttt cct agc 2201
Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro Ser
490 495 500
tcc tgt ctg gac ctg aac tct cca aca agc cca aca ccc acc cgg cac 2249
Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg His
505 510 515
agc gat aca aga acc ctg ctg tct ccc agc ggc aga aat aac agg aac 2297
Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg Asn
520 525 530
gag ggc acc ctg gat tct aga agg acc aca acc cgg cac agc aag aca 2345
Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys Thr
535 540 545 550
atg gag gag ctg aag ctg ccc gag cac atg gac tct agc cac tcc cac 2393
Met Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser His
555 560 565
tct ctg agc gcc cct cac gag tcc ttc tct tac ggc ctg ggc tat acc 2441
Ser Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr Thr
570 575 580
tcc cca ttt tcc tct caa cag cgc ccc cac cgg cac tct atg tac gtg 2489
Ser Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr Val
585 590 595
aca cgg gac aag gtg aga gcc aag ggc ctg gac ggc agc ctg tcc atc 2537
Thr Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser Ile
600 605 610
gga cag gga atg gca gca aga gca aac tcc ctg cag ctg ctg tct cct 2585
Gly Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser Pro
615 620 625 630
cag cca gga gag cag ctg cca cca gag atg acc gtg gca cgg agc tcc 2633
Gln Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser Ser
635 640 645
gtg aag gag aca agc aga gag ggc acc tct agc ttc cac aca cgg cag 2681
Val Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg Gln
650 655 660
aag tcc gag ggc ggc gtg tat cac gac cct cac tct gac gac ggc acc 2729
Lys Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly Thr
665 670 675
gcc cca aag gag aac aga cac ctg tac aac gat cca gtg cct agg agg 2777
Ala Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg Arg
680 685 690
gtg ggc tcc ttc tat cgg gtg cca tct ccc cgc cct gac aat agc ttt 2825
Val Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser Phe
695 700 705 710
cac gag aat aac gtg tcc acc cgg gtg tcc tct ctg ccc tct gag agc 2873
His Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu Ser
715 720 725
tcc tct ggc aca aac cac tct aag aga cag ccc gcc ttt gac cct tgg 2921
Ser Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro Trp
730 735 740
aag agc cca gag aat atc tct cac agc gag cag ctg aag gag aag gag 2969
Lys Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys Glu
745 750 755
aag cag ggc ttc ttt agg agc atg aag aag aag aag aag aag agc cag 3017
Lys Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser Gln
760 765 770
acc gtg cct aac tcc gac tct ccc gat ctg ctg acc ctg cag aag agc 3065
Thr Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys Ser
775 780 785 790
atc cac agc gcc tcc aca cca agc tcc cgg cct aag gag tgg cgg ccc 3113
Ile His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg Pro
795 800 805
gag aag atc tcc gat ctg cag acc cag agc cag cca ctg aag tcc ctg 3161
Glu Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser Leu
810 815 820
cgc aag ctg ctg cac ctg tct agc gcc agc aac cac cct gcc tcc tct 3209
Arg Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser Ser
825 830 835
gac cca agg ttc cag ccc ctg aca gcc cag cag acc aag aac tct ttt 3257
Asp Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser Phe
840 845 850
agc gag atc cgc atc cac cca ctg tcc caa gcc tct gga ggc agc tcc 3305
Ser Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser Ser
855 860 865 870
aac atc agg cag gag cca gca cca aag ggc cgc ccc gcc ctg cag ctg 3353
Asn Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln Leu
875 880 885
cct gga cag atg gac ccc gga tgg cac gtg tct agc gtg aca cgg tcc 3401
Pro Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg Ser
890 895 900
gcc acc gag gga cca tcc tac tct gag cag ctg gga gca aag agc gga 3449
Ala Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser Gly
905 910 915
cct aac gga cac cca tat aac aga acc aat aga tcc agg atg cct aat 3497
Pro Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro Asn
920 925 930
ctg aac gac ctg aag gag aca gcc ctg tga tag aagcttatcg ataatcaacc 3550
Leu Asn Asp Leu Lys Glu Thr Ala Leu
935 940
tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac 3610
gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt 3670
cattttctcc tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt 3730
tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg 3790
cattgccacc acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac 3850
ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac 3910
tgacaattcc gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt 3970
tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc 4030
ggaccttcct tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg 4090
ccctcagacg agtcggatct ccctttgggc cgcctccccg catcgatacc gtcgatcgag 4150
gccgcttcga gcagacatga taagatacat tgatgagttt ggacaaacca caactagaat 4210
gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 4270
tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 4330
gggggagatg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatcga 4390
taaggatctt cctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact 4450
acaaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 4510
aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 4570
agcgagcgcg cag 4583
<210> 8
<211> 943
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 8
Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu
1 5 10 15
Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His
20 25 30
Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu
35 40 45
Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu
50 55 60
Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg
65 70 75 80
Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met
85 90 95
Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val
100 105 110
Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys
115 120 125
Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser
130 135 140
His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu
145 150 155 160
Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp
165 170 175
Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val
180 185 190
Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln
195 200 205
Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln
210 215 220
Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser
225 230 235 240
Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln
245 250 255
Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp
260 265 270
Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr
275 280 285
Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp
290 295 300
Arg Ser Pro Ser Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser
305 310 315 320
His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly Leu
325 330 335
Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly
340 345 350
Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr Gln
355 360 365
Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn
370 375 380
Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe
385 390 395 400
Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr
405 410 415
Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met Glu
420 425 430
Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser
435 440 445
Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser
450 455 460
Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys Ser
465 470 475 480
Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr
485 490 495
Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser
500 505 510
Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser
515 520 525
Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr
530 535 540
Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His Met
545 550 555 560
Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe Ser
565 570 575
Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro His
580 585 590
Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly Leu
595 600 605
Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn Ser
610 615 620
Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu Met
625 630 635 640
Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr Ser
645 650 655
Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp Pro
660 665 670
His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr Asn
675 680 685
Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser Pro
690 695 700
Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val Ser
705 710 715 720
Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg Gln
725 730 735
Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser Glu
740 745 750
Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys Lys
755 760 765
Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp Leu
770 775 780
Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser Arg
785 790 795 800
Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln Ser
805 810 815
Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala Ser
820 825 830
Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala Gln
835 840 845
Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser Gln
850 855 860
Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys Gly
865 870 875 880
Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His Val
885 890 895
Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu Gln
900 905 910
Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr Asn
915 920 925
Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu
930 935 940
<210> 9
<211> 4706
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression Cassette
<220>
<221> repeat_region
<222> (1)..(130)
<223> 5'ITR
<220>
<221> misc_feature
<222> (130)..(168)
<223> AAV2 seq upstream of 3'ITR
<220>
<221> promoter
<222> (213)..(678)
<223> hSynapsin
<220>
<221> misc_feature
<222> (690)..(695)
<223> Kozak
<220>
<221> CDS
<222> (696)..(3653)
<223> hCDKL5-4GS
<220>
<221> misc_feature
<222> (3668)..(4255)
<223> WRPE
<220>
<221> polyA_signal
<222> (4273)..(4511)
<223> SV40 PolyA
<220>
<221> misc_feature
<222> (4539)..(4577)
<223> AAV2 seq upstream of 3'ITR
<220>
<221> repeat_region
<222> (4577)..(4706)
<223> 3'ITR
<400> 9
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcc tctagaacta tagctagcat gcctgcagag ggccctgcgt atgagtgcaa 240
gtgggtttta ggaccaggat gaggcggggt gggggtgcct acctgacgac cgaccccgac 300
ccactggaca agcacccaac ccccattccc caaattgcgc atcccctatc agagaggggg 360
aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag cttcagcacc gcggacagtg 420
ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca gcactgaagg cgcgctgacg 480
tcactcgccg gtcccccgca aactcccctt cccggccacc ttggtcgcgt ccgcgccgcc 540
gccggcccag ccggaccgca ccacgcgagg cgcgagatag gggggcacgg gcgcgaccat 600
ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg cggtgggcag cggaggagtc 660
gtgtcgtgcc tgagagcgca gtcgaattcg ccacc atg aag atc ccc aat atc 713
Met Lys Ile Pro Asn Ile
1 5
ggc aac gtg atg aat aag ttc gag atc ctg gga gtg gtg gga gag gga 761
Gly Asn Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly
10 15 20
gca tac gga gtg gtg ctg aag tgc cgg cac aag gag aca cac gag atc 809
Ala Tyr Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile
25 30 35
gtg gcc atc aag aag ttt aag gat agc gag gag aat gag gag gtg aag 857
Val Ala Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys
40 45 50
gag aca acc ctg agg gag ctg aag atg ctg cgc aca ctg aag cag gag 905
Glu Thr Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu
55 60 65 70
aac atc gtg gag ctg aag gag gcc ttc cgg aga agg ggc aag ctg tac 953
Asn Ile Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr
75 80 85
ctg gtg ttt gag tac gtg gag aag aac atg ctg gag ctg ctg gag gag 1001
Leu Val Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu
90 95 100
atg cca aat ggc gtg ccc cct gag aag gtg aag tcc tac atc tat cag 1049
Met Pro Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln
105 110 115
ctg atc aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac agg 1097
Leu Ile Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg
120 125 130
gat atc aag ccc gag aac ctg ctg atc tcc cac aat gac gtg ctg aag 1145
Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys
135 140 145 150
ctg tgc gat ttc ggc ttt gcc cgc aac ctg agc gag ggc aac aac gcc 1193
Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala
155 160 165
aat tac aca gag tac gtg gca acc agg tgg tac cgg agc cct gag ctg 1241
Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu
170 175 180
ctg ctg gga gca cca tac ggc aag tct gtg gac atg tgg agc gtg ggc 1289
Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly
185 190 195
tgc atc ctg gga gag ctg tcc gac gga cag cca ctg ttc cct ggc gag 1337
Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu
200 205 210
tct gag atc gat cag ctg ttt acc atc cag aag gtg ctg ggc ccc ctg 1385
Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu
215 220 225 230
cct tcc gag cag atg aag ctg ttc tac tct aac cct agg ttc cac ggc 1433
Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly
235 240 245
ctg cgc ttt cca gcc gtg aat cac ccc cag tct ctg gag cgc cgg tat 1481
Leu Arg Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr
250 255 260
ctg ggc atc ctg aac agc gtg ctg ctg gat ctg atg aag aat ctg ctg 1529
Leu Gly Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu
265 270 275
aag ctg gac ccc gcc gat agg tac ctg acc gag cag tgt ctg aac cac 1577
Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His
280 285 290
cct aca ttc cag acc cag aga ctg ctg gac agg tcc cca tct cgc aat 1625
Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Asn
295 300 305 310
cag gcc ggc aag tcc aca gcc ctg cag tct cac cac agg agc aac tcc 1673
Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn Ser
315 320 325
aag gac atc cag aat ctg tcc gtg ggc ctg cca agg gca gac gag ggc 1721
Lys Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu Gly
330 335 340
ctg cct gcc aac gag agc ttt ctg aat gga aac ctg gca gga gcc tct 1769
Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala Ser
345 350 355
ctg agc cca ctg cac aca aag acc tac cag gcc agc tcc cag cct ggc 1817
Leu Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro Gly
360 365 370
tcc aca tct aag gac ctg acc aac aat aac atc cct cac ctg ctg agc 1865
Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu Ser
375 380 385 390
cca aag gag gcc aag tcc aag acc gag ttc gac ttt aat atc gat cca 1913
Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp Pro
395 400 405
aag cca tcc gag gga cca gga aca aag tat ctg aag agc aac tcc cgg 1961
Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser Arg
410 415 420
agc cag cag aat aga cac tct ttc atg gag tct agc cag agc aag gcc 2009
Ser Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys Ala
425 430 435
ggc acc ctg cag cct aac gag aag cag agc cgc cac tcc tac atc gat 2057
Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile Asp
440 445 450
acc atc cca cag tcc tct agg agc ccc tcc tat cgc aca aag gcc aag 2105
Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala Lys
455 460 465 470
tcc cac ggc gcc ctg tct gac agc aag tcc gtg tct aat ctg agc gag 2153
Ser His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser Glu
475 480 485
gca agg gca cag atc gca gag cca agc acc tcc aga tac ttt ccc agc 2201
Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro Ser
490 495 500
tcc tgt ctg gac ctg aac tct ccc aca agc cct aca cca acc cgg cac 2249
Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg His
505 510 515
agc gat aca aga acc ctg ctg tct cct agc ggc aga aat aac agg aac 2297
Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg Asn
520 525 530
gag ggc acc ctg gat agc aga agg acc aca acc agg cac tcc aag aca 2345
Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys Thr
535 540 545 550
atg gag gag ctg aag ctg cct gag cac atg gac tct agc cac tcc cac 2393
Met Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser His
555 560 565
tct ctg agc gcc cca cac gag tcc ttc tct tac ggc ctg ggc tat acc 2441
Ser Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr Thr
570 575 580
agc cct ttt tcc tct caa caa cgc cca cac cgg cac tcc atg tac gtg 2489
Ser Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr Val
585 590 595
aca cgg gac aag gtg aga gcc aag ggc ctg gac ggc agc ctg tcc atc 2537
Thr Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser Ile
600 605 610
gga cag gga atg gca gca agg gca aat agc ctg cag ctg ctg tcc cca 2585
Gly Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser Pro
615 620 625 630
cag cct gga gag cag ctg cca cca gag atg acc gtg gca cgg agc tcc 2633
Gln Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser Ser
635 640 645
gtg aag gag aca agc aga gag ggc acc tct agc ttc cac aca cgg cag 2681
Val Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg Gln
650 655 660
aag agc gag ggc ggc gtg tat cac gac cca cac tcc gac gac gga acc 2729
Lys Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly Thr
665 670 675
gca cct aag gag aac aga cac ctg tac aac gat cca gtg ccc cgc cgg 2777
Ala Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg Arg
680 685 690
gtg ggc tct ttc tat cgg gtg cct agc cca cgc ccc gac aac tcc ttt 2825
Val Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser Phe
695 700 705 710
cac gag aat aac gtg tct acc cgg gtg tcc tct ctg ccc agc gag agc 2873
His Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu Ser
715 720 725
tcc tct ggc aca aac cac tcc aag aga cag cca gcc ttt gat ccc tgg 2921
Ser Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro Trp
730 735 740
aag tct cct gag aat atc tct cac agc gag cag ctg aag gag aag gag 2969
Lys Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys Glu
745 750 755
aag cag ggc ttc ttt cgg tcc atg aag aag aag aag aag aag agc cag 3017
Lys Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser Gln
760 765 770
aca acc gac agc acc aac ggc gag aat cca agc atc aag aag tcc ctg 3065
Thr Thr Asp Ser Thr Asn Gly Glu Asn Pro Ser Ile Lys Lys Ser Leu
775 780 785 790
ttc ccc ctg ttt aac agc aag aat cac ctg aag cac agc tcc tct ctg 3113
Phe Pro Leu Phe Asn Ser Lys Asn His Leu Lys His Ser Ser Ser Leu
795 800 805
aag aag ctg ccc gtg gtg aca cct cca atg gtg ccc aat tcc gac tct 3161
Lys Lys Leu Pro Val Val Thr Pro Pro Met Val Pro Asn Ser Asp Ser
810 815 820
cct gat ctg ctg acc ctg cag aag tcc atc cac agc gcc tcc aca cca 3209
Pro Asp Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro
825 830 835
agc tcc cgg ccc aag gag tgg cgg ccc gag aag atc agc gat ctg cag 3257
Ser Ser Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln
840 845 850
acc cag tcc cag ccc ctg aag tct ctg aga aag ctg ctg cac ctg tct 3305
Thr Gln Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser
855 860 865 870
agc gcc tcc aac cac cca gcc tcc tct gac cct cgg ttc cag cca ctg 3353
Ser Ala Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu
875 880 885
aca gcc cag cag acc aag aac tct ttt agc gag atc cgc atc cac cca 3401
Thr Ala Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro
890 895 900
ctg tcc caa gcc tct gga ggc agc tcc aac atc agg cag gag cct gcc 3449
Leu Ser Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala
905 910 915
cca aag ggc cgc cca gcc ctg cag ctg cca gga cag atg gac ccc ggc 3497
Pro Lys Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly
920 925 930
tgg cac gtg tct agc gtg aca cgg agc gcc acc gag gga cct tcc tac 3545
Trp His Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr
935 940 945 950
tct gag cag ctg gga gca aag tct gga cca aac gga cac cct tat aac 3593
Ser Glu Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn
955 960 965
aga acc aat aga agc agg atg cca aat ctg aac gac ctg aag gag aca 3641
Arg Thr Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr
970 975 980
gcc ctg tga tag aagcttatcg ataatcaacc tctggattac aaaatttgtg 3693
Ala Leu
aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt 3753
taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata 3813
aatcctggtt gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg 3873
tgtgcactgt gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc 3933
tcctttccgg gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct 3993
gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt 4053
cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg attctgcgcg 4113
ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc 4173
tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg agtcggatct 4233
ccctttgggc cgcctccccg catcgatacc gtcgatcgag gccgcttcga gcagacatga 4293
taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 4353
tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 4413
ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggagatg tgggaggttt 4473
tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatcga taaggatctt cctagagcat 4533
ggctacgtag ataagtagca tggcgggtta atcattaact acaaggaacc cctagtgatg 4593
gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc 4653
gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cag 4706
<210> 10
<211> 984
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 10
Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu
1 5 10 15
Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His
20 25 30
Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu
35 40 45
Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu
50 55 60
Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg
65 70 75 80
Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met
85 90 95
Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val
100 105 110
Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys
115 120 125
Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser
130 135 140
His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu
145 150 155 160
Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp
165 170 175
Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val
180 185 190
Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln
195 200 205
Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln
210 215 220
Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser
225 230 235 240
Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln
245 250 255
Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp
260 265 270
Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr
275 280 285
Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp
290 295 300
Arg Ser Pro Ser Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser
305 310 315 320
His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly Leu
325 330 335
Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly
340 345 350
Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr Gln
355 360 365
Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn
370 375 380
Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe
385 390 395 400
Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr
405 410 415
Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met Glu
420 425 430
Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser
435 440 445
Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser
450 455 460
Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys Ser
465 470 475 480
Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr
485 490 495
Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser
500 505 510
Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser
515 520 525
Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr
530 535 540
Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His Met
545 550 555 560
Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe Ser
565 570 575
Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro His
580 585 590
Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly Leu
595 600 605
Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn Ser
610 615 620
Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu Met
625 630 635 640
Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr Ser
645 650 655
Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp Pro
660 665 670
His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr Asn
675 680 685
Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser Pro
690 695 700
Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val Ser
705 710 715 720
Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg Gln
725 730 735
Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser Glu
740 745 750
Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys Lys
755 760 765
Lys Lys Lys Lys Ser Gln Thr Thr Asp Ser Thr Asn Gly Glu Asn Pro
770 775 780
Ser Ile Lys Lys Ser Leu Phe Pro Leu Phe Asn Ser Lys Asn His Leu
785 790 795 800
Lys His Ser Ser Ser Leu Lys Lys Leu Pro Val Val Thr Pro Pro Met
805 810 815
Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys Ser Ile
820 825 830
His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg Pro Glu
835 840 845
Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser Leu Arg
850 855 860
Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser Ser Asp
865 870 875 880
Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser Phe Ser
885 890 895
Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser Ser Asn
900 905 910
Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln Leu Pro
915 920 925
Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg Ser Ala
930 935 940
Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser Gly Pro
945 950 955 960
Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro Asn Leu
965 970 975
Asn Asp Leu Lys Glu Thr Ala Leu
980
<210> 11
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> targeting site
<400> 11
agtgaattct accagtgcca ta 22
<210> 12
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> targeting site
<400> 12
agcaaaaatg tgctagtgcc aaa 23
<210> 13
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> targeting sequence
<400> 13
agtgtgagtt ctaccattgc caaa 24
<210> 14
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> targeting sequence
<400> 14
agggattcct gggaaaactg gac 23
<210> 15
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer
<400> 15
atgacttaaa ccaggt 16
<210> 16
<211> 3430
<212> DNA
<213> Artificial Sequence
<220>
<223> transcript variant
<400> 16
gggggagttg gaggaggaag accctacagg aagttgagct gtactctcca acaggcgagc 60
acatggtcgt ctcctctctc ccttcaggga gtcatttaat acttcatgat tagaacaaat 120
atgtgaaagt tcccaccaac cagtgagaat ttcttccttc agacggtttt ggatcttact 180
gcacagcttt ctgagaagtt cttttggtgc catgttttgt ggcttgcatc aaaagaggag 240
tttgtcttca tgaagattcc taacattggt aatgtgatga ataaatttga gatccttggg 300
gttgtaggtg aaggagccta tggagttgta cttaaatgca gacacaagga aacacatgaa 360
attgtggcga tcaagaaatt caaggacagt gaagaaaatg aagaagtcaa agaaacgact 420
ttacgagagc ttaaaatgct tcggactctc aagcaggaaa acattgtgga gttgaaggaa 480
gcatttcgtc ggaggggaaa gttgtacttg gtgtttgagt atgttgaaaa aaatatgctc 540
gaattgctgg aagaaatgcc aaatggagtt ccacctgaga aagtaaaaag ctacatctat 600
cagctaatca aggctattca ctggtgccat aagaatgata ttgtccatcg agatataaaa 660
ccagaaaatc tcttaatcag ccacaatgat gtcctaaaac tgtgtgactt tggttttgct 720
cgtaatctgt cagaaggcaa taatgctaat tacacagagt acgttgccac cagatggtat 780
cggtccccag aactcttact tggcgctccc tatggaaagt ccgtggacat gtggtcggtg 840
ggctgtattc ttggggagct tagcgatgga cagcctttat ttcctggaga aagtgaaatt 900
gaccaacttt ttactattca gaaggtgcta ggaccacttc catctgagca gatgaagctt 960
ttctacagta atcctcgctt ccatgggctc cggtttccag ctgttaacca tcctcagtcc 1020
ttggaaagaa gataccttgg aattttgaat agtgttctac ttgacctaat gaagaattta 1080
ctgaagttgg acccagctga cagatacttg acagaacagt gtttgaatca ccctacattt 1140
caaacccaga gacttctgga tcgttctcct tcaaggtcag caaaaagaaa accttaccat 1200
gtggaaagca gcacattgtc taatagaaac caagccggca aaagtactgc tttgcagtct 1260
caccacagat ctaacagcaa ggacatccag aacctgagtg taggcctgcc ccgggctgac 1320
gaaggtctcc ctgccaatga aagcttccta aatggaaacc ttgctggagc tagtcttagt 1380
ccactgcaca ccaaaaccta ccaagcaagc agccagcctg ggtctaccag caaagatctc 1440
accaacaaca acataccaca ccttcttagc ccaaaagaag ccaagtcaaa aacagagttt 1500
gattttaata ttgacccaaa gccttcagaa ggcccaggga caaagtacct caagtcaaac 1560
agcagatctc agcagaaccg ccactcattc atggaaagct ctcaaagcaa agctgggaca 1620
ctgcagccca atgaaaagca gagtcggcat agctatattg acacaattcc ccagtcctct 1680
aggagtccct cctacaggac caaggccaaa agccatgggg cactgagtga ctccaagtct 1740
gtgagcaacc tttctgaagc cagggcccaa attgcggagc ccagtaccag taggtacttc 1800
ccatctagct gcttagactt gaattctccc accagcccaa cccccaccag acacagtgac 1860
acgagaactt tgctcagccc ttctggaaga aataaccgaa atgagggaac gctggactca 1920
cgtcgaacca caaccagaca ttctaagacg atggaggaat tgaagctgcc ggagcacatg 1980
gacagtagcc attcccattc actgtctgca cctcacgaat ctttttctta tggactgggc 2040
tacaccagcc ccttttcttc ccagcaacgt cctcataggc attctatgta tgtgacccgt 2100
gacaaagtga gagccaaggg cttggatgga agcttgagca tagggcaagg gatggcagct 2160
agagccaaca gcctgcaact cttgtcaccc cagcctggag aacagctccc tccagagatg 2220
actgtggcaa gatcttcggt caaagagacc tccagagaag gcacctcttc cttccataca 2280
cgccagaagt ctgagggtgg agtgtatcat gacccacact ctgatgatgg cacagccccc 2340
aaagaaaata gacacctata caatgatcct gtgccaagga gagttggtag cttttacaga 2400
gtgccatctc cacgtccaga caattctttc catgaaaata atgtgtcaac tagagtttct 2460
tctctaccat cagagagcag ttctggaacc aaccactcaa aaagacaacc agcattcgat 2520
ccatggaaaa gtcctgaaaa tattagtcat tcagagcaac tcaaggaaaa agagaagcaa 2580
ggatttttca ggtcaatgaa aaagaaaaag aagaaatctc aaacagtacc caattccgac 2640
agccctgatc ttctgacgtt gcagaaatcc attcattctg ctagcactcc aagcagcaga 2700
ccaaaggagt ggcgccccga gaagatctca gatctgcaga cccaaagcca gccattaaaa 2760
tcactgcgca agttgttaca tctctcttcg gcctcaaatc acccggcttc ctcagatccc 2820
cgcttccagc ccttaacagc tcaacaaacc aaaaattcct tctcagaaat tcggattcac 2880
cccctgagcc aggcctctgg cgggagcagc aacatccggc aggaacccgc accgaagggc 2940
aggccagccc tccagctgcc agacggtgga tgtgatggca gaagacagag acaccattct 3000
ggaccccaag atagacgctt catgttaagg acgacagaac aacaaggaga atacttctgc 3060
tgtggtgacc caaagaagcc tcacactccg tgcgtcccaa accgagccct tcatcgtcca 3120
atctccagtc ctgctcccta tccagtactc caggtccgag gcacttccat gtgcccgaca 3180
ctccaggtcc gaggcactga tgctttcagc tgcccaaccc agcaatccgg gttctctttc 3240
ttcgtgagac acgttatgag ggaagccctg attcacaggg cccaggtaaa ccaagctgcg 3300
ctcctgacat accatgagaa tgcggcactg acgggcaagt gacttctgca agcctgcggc 3360
tggtcccaat gccctgaatc acctctctca tggaagaacc aattaacacc aatgaatcaa 3420
ccattaaaaa 3430
<210> 17
<211> 14572
<212> DNA
<213> Artificial Sequence
<220>
<223> transcript variant
<400> 17
agttgtctct gccgctgggg aaggtaaagc ggcgacggcg tcctcaggag ctgtggggtc 60
ccctgctaga agtgggggac tcggcggggg agtcatttaa tacttcatga ttagaacaaa 120
tatgtgaaag ttcccaccaa ccagtgagaa tttcttcctt cagacggttt tggatcttac 180
tgcacagctt tctgagaagt tcttttggtg ccatgttttg tggcttgcat caaaagagga 240
gtttgtcttc atgaagattc ctaacattgg taatgtgatg aataaatttg agatccttgg 300
ggttgtaggt gaaggagcct atggagttgt acttaaatgc agacacaagg aaacacatga 360
aattgtggcg atcaagaaat tcaaggacag tgaagaaaat gaagaagtca aagaaacgac 420
tttacgagag cttaaaatgc ttcggactct caagcaggaa aacattgtgg agttgaagga 480
agcatttcgt cggaggggaa agttgtactt ggtgtttgag tatgttgaaa aaaatatgct 540
cgaattgctg gaagaaatgc caaatggagt tccacctgag aaagtaaaaa gctacatcta 600
tcagctaatc aaggctattc actggtgcca taagaatgat attgtccatc gagatataaa 660
accagaaaat ctcttaatca gccacaatga tgtcctaaaa ctgtgtgact ttggttttgc 720
tcgtaatctg tcagaaggca ataatgctaa ttacacagag tacgttgcca ccagatggta 780
tcggtcccca gaactcttac ttggcgctcc ctatggaaag tccgtggaca tgtggtcggt 840
gggctgtatt cttggggagc ttagcgatgg acagccttta tttcctggag aaagtgaaat 900
tgaccaactt tttactattc agaaggtgct aggaccactt ccatctgagc agatgaagct 960
tttctacagt aatcctcgct tccatgggct ccggtttcca gctgttaacc atcctcagtc 1020
cttggaaaga agataccttg gaattttgaa tagtgttcta cttgacctaa tgaagaattt 1080
actgaagttg gacccagctg acagatactt gacagaacag tgtttgaatc accctacatt 1140
tcaaacccag agacttctgg atcgttctcc ttcaaggtca gcaaaaagaa aaccttacca 1200
tgtggaaagc agcacattgt ctaatagaaa ccaagccggc aaaagtactg ctttgcagtc 1260
tcaccacaga tctaacagca aggacatcca gaacctgagt gtaggcctgc cccgggctga 1320
cgaaggtctc cctgccaatg aaagcttcct aaatggaaac cttgctggag ctagtcttag 1380
tccactgcac accaaaacct accaagcaag cagccagcct gggtctacca gcaaagatct 1440
caccaacaac aacataccac accttcttag cccaaaagaa gccaagtcaa aaacagagtt 1500
tgattttaat attgacccaa agccttcaga aggcccaggg acaaagtacc tcaagtcaaa 1560
cagcagatct cagcagaacc gccactcatt catggaaagc tctcaaagca aagctgggac 1620
actgcagccc aatgaaaagc agagtcggca tagctatatt gacacaattc cccagtcctc 1680
taggagtccc tcctacagga ccaaggccaa aagccatggg gcactgagtg actccaagtc 1740
tgtgagcaac ctttctgaag ccagggccca aattgcggag cccagtacca gtaggtactt 1800
cccatctagc tgcttagact tgaattctcc caccagccca acccccacca gacacagtga 1860
cacgagaact ttgctcagcc cttctggaag aaataaccga aatgagggaa cgctggactc 1920
acgtcgaacc acaaccagac attctaagac gatggaggaa ttgaagctgc cggagcacat 1980
ggacagtagc cattcccatt cactgtctgc acctcacgaa tctttttctt atggactggg 2040
ctacaccagc cccttttctt cccagcaacg tcctcatagg cattctatgt atgtgacccg 2100
tgacaaagtg agagccaagg gcttggatgg aagcttgagc atagggcaag ggatggcagc 2160
tagagccaac agcctgcaac tcttgtcacc ccagcctgga gaacagctcc ctccagagat 2220
gactgtggca agatcttcgg tcaaagagac ctccagagaa ggcacctctt ccttccatac 2280
acgccagaag tctgagggtg gagtgtatca tgacccacac tctgatgatg gcacagcccc 2340
caaagaaaat agacacctat acaatgatcc tgtgccaagg agagttggta gcttttacag 2400
agtgccatct ccacgtccag acaattcttt ccatgaaaat aatgtgtcaa ctagagtttc 2460
ttctctacca tcagagagca gttctggaac caaccactca aaaagacaac cagcattcga 2520
tccatggaaa agtcctgaaa atattagtca ttcagagcaa ctcaaggaaa aagagaagca 2580
aggatttttc aggtcaatga aaaagaaaaa gaagaaatct caaacagtac ccaattccga 2640
cagccctgat cttctgacgt tgcagaaatc cattcattct gctagcactc caagcagcag 2700
accaaaggag tggcgccccg agaagatctc agatctgcag acccaaagcc agccattaaa 2760
atcactgcgc aagttgttac atctctcttc ggcctcaaat cacccggctt cctcagatcc 2820
ccgcttccag cccttaacag ctcaacaaac caaaaattcc ttctcagaaa ttcggattca 2880
ccccctgagc caggcctctg gcgggagcag caacatccgg caggaacccg caccgaaggg 2940
caggccagcc ctccagctgc caggtcagat ggatcctggt tggcatgtgt cctctgtgac 3000
caggagtgcc acagagggcc cttcctactc tgaacagctg ggtgccaaaa gtgggccaaa 3060
tgggcacccc tataacagaa caaatcgctc acgaatgcca aatctgaatg atttaaaaga 3120
gacagccttg taatttgtgc tggtaggggg gaggggtgga cagacaagcc agtggggagg 3180
ggtgggaaag ggtgggctgg gcttggggca tgggccgggc caagtggtga gccaatattt 3240
tcagctttat gaaggtgtgt gcaatattgc atgtgttggg gccgttgagc tcctcgcggc 3300
cacaaatgct agtcagggat cttagagcca caggagttcc ttagggatcg ccactcccca 3360
caggtcttgt gtgagaatag atagagtgtg ccattgagga agaagaaatt cttgccagtt 3420
tctccccttt acattccagc tttagtgcaa tctctgttga acttgggaat gccaggatgt 3480
gtcctggcac tgcaagggat aggaaagtcg tgttgaccga tgcccttact acatattttt 3540
ttctgcctag agtaaatgtg gggtttattg taatccaaga gtatcccttt gaagggttag 3600
cagatgaact gtatgtctta aattgttttc taaacttcca tatttgatag gatttgtaac 3660
atttatttat aattaatatt gtactgttaa aatcatatct tttatgttat aatgtaaagt 3720
tattttgagc tgtttgaaac attgtgaagc agtgggacag ctacagtagt ttctataaaa 3780
actaaacagt aacatttata tattgcatca ggagtatttt attctatata taatatatat 3840
atatggtaaa tatctgtttt ataaatatat tcatttaaag aaagtatcgt tatgacacta 3900
tctgccatat ttttatacat ttgtgatatg aagtgagtat tatacttcta ctaaagggag 3960
ttgaattgtg gctacacgtg actgtaacag tatgaacctt gctcaacttt gaggccccag 4020
cagtagcctc tagacatgat ccttggtagc agacgagatg cagcatctct ttccaaacct 4080
gcaggggaag aaagtcagat aggccagtga gaattccagc aggcctggtt tccgtcctca 4140
cacacttggc tcctgtttgt gtccagggac gttacttgca cacaggggag aatagattga 4200
ggcgttactc gtgggtcttt gtagagagaa tgtgctcttc cacttagcat tagtgtagag 4260
cgtagaccaa agatttgcca gtgaacattc cttgttgtga gatcataaga ggtacctgtc 4320
tgcagatctt gcaaaccatc tctatgctcc tgaatattgt ccactgtccc ggagactctt 4380
ggctgatggg gtgtgagata tatgtgtggc atttctattt ctgaatgcct tttttgctat 4440
tgctctctcc aataccatat ttaaaaggct cctggagcaa ttccagatag ataaaaaatt 4500
actctatcca tttttttctt cctggggctg tccacttatg acaagatttt catgcacacc 4560
tgttacgcac acaaccccca tcagaacagg acctatcttc ccctcatctg atctctttca 4620
gctcccaagt tactcccaag tatcatcaaa ccctttggcc atcaagtgtt atcctcccat 4680
gcctctgggt catccttgag ggaagtcacc tcagcaccat catctatcag tagtagtaga 4740
tttttggaat tagtctctga gcaataatac ttttaaaggt ccctcccacc cctcaaagag 4800
ataacttctc agtatttatt acttgtcctc aaattctgag tgtcagcccc tgcatcaagt 4860
cagctatgat caaaatgtgc tgttactgtt aaccctcccc cgagattttg agaatcatag 4920
ctctgatgat tatgaagatt ataaagacta aggtcctagt ttccctgaag cttaaattgt 4980
gcacatattg catttttata taaatactat aatgtgtatt gattatatag ataggtcatt 5040
ttaaggtgct ttttatttaa ttttaatgag tgtaataggc actaaaatga aactcgactg 5100
ggtactatta ctgaaaaaat ttgactcaaa ccaatagttt tgcatgctct ttagttcttt 5160
ttctgtctta cttctttcac cagttcagta ctgtttgggt agctctgaat tctggctttt 5220
ccaggcagct gcttgatgat acaaatgagg tggaccatca gcagttttgc ctggacacta 5280
atgactctaa aagggtgtgt atttaactct tctttttcat actagatctc taccttgtat 5340
tccccccttg caaaccagaa actacacttt ttttctctgg aaagacttct cactgtgcta 5400
tgcgcttagg aactgcacgg tcccgttgcc atgctgtggc attcgaggct cgtcacctag 5460
gggctggttt cccatgttgt catccttgct aacactggga tctcagatgt ttgcagaaca 5520
tttctattca tgacggttct tcaaagaagg gctagaatat ttgccttcta cctagagcaa 5580
agtaaaccta attgttgaag agtcaatacg tactttttgt actttcccag atttgagcca 5640
gaaaatacct acagatatct acaaatgttt tcaaccagtg ttttcgaggt agctctttaa 5700
tcctcttctc agcttttgtc tgttctgact tttcatccaa taagctgtaa gtgaactaca 5760
atctgcattt ccagcatgca attctcttcc tgctcacgga gggggatgca aaagttttct 5820
ctcacaccta atgggccctc tcttagcttt taactgttgt tttcccctgt tgatgaaaaa 5880
ttactgacat cacaaagatt gccatccatg gtagaaagga cttgatttaa agtcagaaaa 5940
atttgccttt tctttaggaa ggggaattca tgacatccat gtcctattat cggccgtaac 6000
ttcctaaaga agaaaaaggg tgaatgaaag cttatgttac ttttatgaaa gtatcactga 6060
tctcctttgg aaaagaaact ctgcttcact gtttttctac ctttatttct ctgccatcct 6120
cgtttttcct ctctgaagtt ctaaataccc tttaactgaa ccttgttggt cttgctctaa 6180
aatttagcct ctttctagag cccaagacca aaagggagtg cttcatgctg aggggctcaa 6240
gtgagctgac tctacaactg tggttctcaa ctaggggcag atttaccccc aagggtacat 6300
ttggcaatgt ctggggacat ttggttgtca tagctggggg ggaggtgatg gtatgctact 6360
ggcatcaagt ggttagaggc cacagatgct actaaacacc ctgccatgca caggacagcc 6420
ccccaaacaa acagtggtcc agccccaagc actactagtg ctgaggttga gaaaccctgc 6480
cctacaccat cccaagccca ccagtctgca gagcttggct ctggccttgt tctgtccagg 6540
ctacagtact gcaggtgtga tttcttcaac atcacattct cttaagagtc ttcaaccact 6600
atgcctgaat ccttggaatc ctattgttcg tttccattgt cttgggcctg ctaaaaggtg 6660
catactttgg aaggagacca gagttacttt ataggtgttg gagaacttaa attctaggtt 6720
agcatcctta gaaaatcttt catagagcca tgaggcttat atttagaagc aagcaacagc 6780
ctggcagatt ggcatgattt ttaccaactg ctcaaaggca tccgtggctt tcagctgtgt 6840
ctcccgaaag aaaatgtctt tgttttttat tcaagtcatt taatagctct ttacaaatat 6900
tagcatatgg cagaccaatt agaagcaaaa aagtccgtat tggtggttgt gatgtggctg 6960
ttatagaagt atttgtgctg tatgctttgg ttaaatctgt tttaaaacat gctttaagat 7020
tcaccttacg cagttgtact ttaattctaa gctcagagct atgctgtcag tctctagtca 7080
cgccatgtat tataaagtat gttgtggttg tagagttagc cagtttagca tgttcctaat 7140
ctgagaatta gtggactata ctaggaaatg ctatcccatt ttccctttcc agcccctctt 7200
agttaagatc atagtatcct cacttcttaa actagtcttt agagtaaata aggaaaaaag 7260
ccatttattt tcttctagcc atgtattatt gagaatgact catagtacaa ctttttttca 7320
aaggccagag gattactttg caagtgtgta gaaagatctg tctatttctg ttcacctggg 7380
acctggtggt gactgaactc tttcagcaag ggcaatggct caatgtgatt cggtgctgga 7440
gctcagctgg gactcagtaa atctgcacgt tctctgctgg tcagaacatg tttcctggag 7500
agcattgctt ttctatctag aagttcgtta cctcctgcat gatagtggga tattgagatg 7560
tgggttctaa gatccacaga ctcatacttt tgtgaacttt ggaatgtggt agggtacact 7620
gaaccaagtc agaaaatagt gaaatatttc cttgcctcct tcagttcatc actaagaaag 7680
tgtgtaggca gagaaaactt acttatggtt tgaagaacca caattgtttt tgaaagggga 7740
catagaaaag acagtacaaa ggttgtaagt gtcctgtcgc taattcccag ggccagaatc 7800
tcacaagaag atcctctcaa agacttaaaa gcctggctta caaaaataac cagaaaccaa 7860
acttgtaagc agttacaatt tcttcctttt gcttcttgac cagctgagat acagaatatc 7920
ttgaggtctg gttcagctga tgaaaaattc tgtctcagaa acgatgagta agaaaccata 7980
caagaaaaag aagtccctca tctatctgca tacacgcaat gtgggagaag tggggtggct 8040
aggaaactct gggcctgctg cccccttcga ttcttttttt ttttctttgt gaattgaatg 8100
tacgatacaa atggtaggcc ttcatgtgag ccagttacta catgaatctt catttcccac 8160
agtggtttgt tcattcatca gcgttaggct tggtcctggc tccacctttc tcctctccgg 8220
gcactgaccc cacctttccg tgtatttact gtaggctatt aaatatgatc atgacccgcc 8280
ttgcattttc attcatcacc tgtttatgcc caaatttaaa ggaagtttgt ctcattttgc 8340
cagaaaaaaa ttgtaatagt cggcacgctg gatttgtagg gccagcaaaa ttgcggcagt 8400
gaaactagtt tcacttctaa agcccttcat ttcccacaag gttaagctct cgaaacccca 8460
tttgatcctt ggttcctatt tcgatcctcc tttggaatct gaaaatcggt ctccatgttg 8520
tatgcagatt agaagttgcc ttgtttgtta ctcttccaac acagggtatc agggagaaag 8580
aggccttatc tgttcctcca tcccccctgt tttgacagac tgctaagaat tcctcaggac 8640
ttcctttggt tggggatttt actttcccaa aagtctgatc tgatttcttt caggggtaga 8700
caagcttgtc ctagtgctct gcttcaggtc ttatcagaag aaacccagga atagaaaagg 8760
tagatgcctt gacttttgtc cctgttgtgg ggactaaagt gttttttgcc agaattgtca 8820
aaagctccgg ttcaaactct gtagagtttc atggaaaaac aaaacaaaac aaaaaagatg 8880
cttatcgtcc cggagaatgt gtaagtaagt tctccagcac ggcttaggtt ttccaaaatg 8940
gaaagcaaag cttgcagaca acctgttttc tctagagaca cacaatgatt ctggccctca 9000
gtctgtttcc ctccccttgt ttactctttg gtcaccgatc gagtcaggct agaggggtaa 9060
tacggtgatt aaaagaagta aattctcact gtaaacttgg attgattaac agaaacaatt 9120
aaaccaaaca aaatcattgc cccaaatttc tatctccaag aattgctttg tgccattttg 9180
aattcaggta gttattctgt atatacttag ctaactattc agagcttctt caatctctag 9240
taagcttgaa ggtggtgtct gggaagacac agggcagggt gacatttaga ctctgttcat 9300
tcttaaaaat agggataagc cagaatgatg tgacatctag tatgtggtag atgaagaatc 9360
agtggaaatt cttaattgca cagactttat aatccattat ataaagtgta attccatact 9420
ttttactgtg gcaagggtgt gatgtgattg ttaatctttt taatttttga atccaaactg 9480
aatttaaagt gttgaatact taaatcctca caagtgaatt atgaaccatt tgtaaagtgt 9540
ttctataact ctttgtatca tgtgttggta catcttatca agttttttct ggcatgtaat 9600
tccattctaa acttatgtaa aatttctatt gttgctgtaa atattacaca aatatctatt 9660
ccgtgataac cttcattatc agcatgaaat ggttaatttt tactgagcac aatgtatttt 9720
tgaatggatc ttcccaaatg tctttaataa aatgcagatt ttgcactgac tgatgtgact 9780
gccaggccgt cccaatcttg agcactgtgg tccttcgtgt ttgaactgcg aacagctcca 9840
ttttagttcc ttcttgggaa gaaagaatgc attcgaattc aaatgaggga tgatgggcct 9900
ttgaggttgt aatcagtttg agacagaaat taatgtaaaa ctaggcaaat cctgtaactt 9960
aatgatgttg atctttgttt tcctatttat aaagcttttt tccccttacg gcattttgaa 10020
aactttggtt tgttttatac ttgagtgttg tcacctttgc acgtcgctag acactcacgt 10080
ggtagtttga ggaggatggg aagagaggcc aatcttgtgc taagtgctat ggagaaagca 10140
aagatgcaca gcttaataag ggttttttga ttctagagga gaggtgggca agcttttcct 10200
gtaaagggcc agatggtaaa tattgggggc tctgtggccc atcagttccc tgtcaacatt 10260
actcagctct gcctttgtat tgcagaggct gcatggataa tatgtaaatc agtaagtgtg 10320
gctgtggtcc cgtaaaactt tacttataga aacaggccat agtttactaa cccgttttag 10380
gccctcagtt tcatcattta gggtaacacc aaccgagtac atgttcaatc aggagggaaa 10440
gaacttagct tttgtgataa cttatagatg aaatattccc cagttttctt tctctttcta 10500
aacaaagggt aggagctgaa agtcagtgct ctccattctt aaaagtcctc tgtcaaccac 10560
ctcttcactc tatctcctta agtgacatgg aaacttgtgg cctgtgcttt caactataat 10620
cttaccaaga ctgaatgaaa gtatttggtg cttatacttt ttaatgttca tagcacttac 10680
tatggccagg cacaatgccc aagtgttttg ctttattatt attattatta ttattattat 10740
tattattatt attattattt tcacaacaac ccagcgaaac aggtactatt attatcccct 10800
ttttgtaaat gaggaaacag atttccatac ttgacattaa cctgcccaag gtcacccagt 10860
ttggaagtgg cagggccagg atttgaagcc gaatatgttc attgtaaagc ccatataccc 10920
ttaaaagtca ctgcacgtcc acgtatggta atgtggtcac aatcagtatt gtttctcttt 10980
agtaattcag atttattcaa gtaactccaa ggttcaaatt ttcaaaaaca gtttccaaca 11040
caggttatat taaaaacttt gcctgaagtt tactctaggt gcagaaataa agacaactta 11100
gtcaagtgaa ggaaagggta acagacttag aaatggctat ctacactgat ggaataagta 11160
tactaattag agcaggtaac aagtccccac gatgtataac atattcttct ctaaaagctc 11220
acaacaattt atgtgccacc ttccatcccc tttcccagca gatggtaatt gatgcaattt 11280
gagaatagaa cacttcattg aaacaagtca ctggaggtcc tctggggatg cagcttaaaa 11340
gcccaggatc aggccaggtg tggtggctca cgcctgtaat cccagcactg tgggagactg 11400
agacgggcag atcacctgaa gtcaggagtt cgagaccagc ctggccaata tagagaaacc 11460
ccgtctgtac taaaaataca aaaattaggt ctgggcggtg gctcacgccc gtaatcctag 11520
cactttggga ggccaaggtg ggtggatcac gaggtcagga gttcgagacc agcctggcca 11580
acatggtgaa accccgtctc tactaaaaat acaaaaattg ggtgtggtgg tacatgcctg 11640
taatcccagc tgcttaggag gctgaggcag gagaatcact tgaacccaaa aggcagaggt 11700
tgcagtgagc cgagatcacg ccactgcact ccagcctggc aacagagcga gactctgtct 11760
caaaaaaaaa aaaaaaaaaa tacaaaaatt agccgggaat ggtggtgaat gtctataatc 11820
ccagccactc gggaggctga ggcaggagaa tcacttgaac ccaaaaggca gaggttgcag 11880
tgagccaaga tcgcaccact gcactcccac ctggacgaca gagcgagacg ccatctcaaa 11940
aataaataaa taaataaatc cctaggatat agagtccgct tgcctgggtg gagtcttggc 12000
tccatctcct acatctcatg tgacttgaag caaggcactt cactatgcct cagtttcctt 12060
atctttaaat ggaggtaatc acagtaccta cctcagtgtt gttgtgaaga tttaatgaga 12120
taataacctg cagagcactt gagagtctca agaaatatga gctcttataa cattattgct 12180
attgtaaaac attgctatta cttctgtccc aatttggcag tttcaggaaa ttgagaagga 12240
atgtcactga atctttaatg ccagttacac agagctcagt aggtgtccgc acagcccttt 12300
agatgcacgt agcctatttg atcttcgtat cagccctgta aggttgggct taagaatgac 12360
ccagcatgga agtactcttg ggaccacagg ggaagcaaca gtccttgtaa gctgtttgtc 12420
agtgggcctt agcaaccaag ccccaagtgg acagaaagat ggggttctgt gagcatccat 12480
tccaagggtc actttagggg tgcaatcttc tgggctctga gaatggattc acagcagcat 12540
ctctatctgg aaataccttt gctttgtcca agtaacctcc tcccacacag agtacccgaa 12600
tcagctcaga ttttttttcc ttaatattgg caacacttaa tgctacttct ttgttcgtaa 12660
catttcattt aattatttaa aaatctgcaa atgttgtgta tattttaccg caatttttaa 12720
acaaactcca gtgtagaccg tgctctagca tttctaaaaa taaaagtaaa tatgttaaaa 12780
taaggtaaga gtgagttttt cctacactat gtataatttt taattgaaag tttcccccac 12840
aaaagaaatg atacttggaa gcatagtttg tgtgtttgac agcaagattc tattaggctt 12900
cagatttccc tcaataaaag ttttagtttt tatacattct gtcatgaatt gaatgaagta 12960
aataatatgc tgttgtaagc aaattatctg cagataaatg tcttatgaat cgtatatctt 13020
actgtttatt aaattctgaa gtattgagca gtttccaatg tgaaatccca gctggcttct 13080
ttgcaatgat ggacaagtta gttataattc atatggaaat tcaaggaacc cagaatagcc 13140
aaaacaatcc cgaagagcaa agttggagga ctcacatgcc ccaatttcaa aacttactac 13200
aaagctacaa taatgaagaa agtgaggtaa tagaatttgg agtccagaaa taaaccctct 13260
cacatttatg gtcaattgtt ttttgacaag ggtgccaaga tcattcaatg ggggaaagaa 13320
tagtcttttc agcaaatagt ggtgggacaa ctggatatcc acatgcaaaa gaatgacgtt 13380
ggactcctat ttcacaccat atacaaaaat taactcaaaa tggaacaaag atctaactgt 13440
aagaggtaga actataaaac tcatagaaga aaacataggg gtaaatcttc atgaccttgg 13500
atttggcagt ggtttctcag atatgacacc aaaggcacaa gcaaagagaa aaataaattg 13560
gacttcatca aatatttaaa attttgtgct taagaggact ctatcgagag ggttaaaaag 13620
atccacagaa tgggagaaaa tatttgcaaa tcatatccaa taagggaatt agaatataca 13680
aagaattctt aaactcagta agttgtaagc cgatttaaaa tgggcagagg atctgaaaaa 13740
cctttatcca aagatgtaca aatggccagt aaacacatga aaagatgctc aacatcatta 13800
gtcactaggg aaatgcaaat caaaaccaca gttgagatgc aacttcacac attatgggta 13860
tagtcaaaga tggacagtaa caagtgttgc tgaggatgtg gagaaagtgg aagcctccta 13920
cattgctggt ggaaatgtaa aatgatgcag ccacttggga taatagttcc tccaaagatt 13980
aaacaagagt gactgtgtgt cccagcagtt ttactcctaa gtatataccc aagataaatg 14040
aaaacacaca tccgcacaaa aacttataca caaatgttca tagcagcatt attcataata 14100
gctaaagagt ggaaacccaa atatccatca atggatgaat ggataaataa caatgtgctc 14160
ttgacatgat actgaacaat gatgttcagc aataaaaagg agtgacaagt gacatagtga 14220
tacacatgtt ataacgtgga tgaactttaa aacactatgc taagtgaaag aagccagtca 14280
cgaaatacca catactatat gatttcattt atgtagaacg tccagaaggc caatctacag 14340
agacagtcga ttcgtggttg cagagggctt ggggtggccg atgggttggg gagtgttggc 14400
tgatgggtgc aggatttctc tttggggtga taaactttct aaaattgatc tagtgataat 14460
ggttgcacaa ctctgaatat accaaaagtc atcaaattgt acactttaaa tggatacaaa 14520
ttgtatgtga acttaatctc aataaagccg tgacaaaagt ttccaacatg aa 14572
<210> 18
<211> 3434
<212> DNA
<213> Artificial Sequence
<220>
<223> transcript variant
<400> 18
attagttgtc tctgccgctg gggaaggtaa agcggcgacg gcgtcctcag gagctgtggg 60
gtcccctgct agaagtgggg gactcggcgg gggagtcatt taatacttca tgattagaac 120
aaatatgtga aagttcccac caaccagtga gaatttcttc cttcagacgg ttttggatct 180
tactgcacag ctttctgaga agttcttttg gtgccatgtt ttgtggcttg catcaaaaga 240
ggagtttgtc ttcatgaaga ttcctaacat tggtaatgtg atgaataaat ttgagatcct 300
tggggttgta ggtgaaggag cctatggagt tgtacttaaa tgcagacaca aggaaacaca 360
tgaaattgtg gcgatcaaga aattcaagga cagtgaagaa aatgaagaag tcaaagaaac 420
gactttacga gagcttaaaa tgcttcggac tctcaagcag gaaaacattg tggagttgaa 480
ggaagcattt cgtcggaggg gaaagttgta cttggtgttt gagtatgttg aaaaaaatat 540
gctcgaattg ctggaagaaa tgccaaatgg agttccacct gagaaagtaa aaagctacat 600
ctatcagcta atcaaggcta ttcactggtg ccataagaat gatattgtcc atcgagatat 660
aaaaccagaa aatctcttaa tcagccacaa tgatgtccta aaactgtgtg actttggttt 720
tgctcgtaat ctgtcagaag gcaataatgc taattacaca gagtacgttg ccaccagatg 780
gtatcggtcc ccagaactct tacttggcgc tccctatgga aagtccgtgg acatgtggtc 840
ggtgggctgt attcttgggg agcttagcga tggacagcct ttatttcctg gagaaagtga 900
aattgaccaa ctttttacta ttcagaaggt gctaggacca cttccatctg agcagatgaa 960
gcttttctac agtaatcctc gcttccatgg gctccggttt ccagctgtta accatcctca 1020
gtccttggaa agaagatacc ttggaatttt gaatagtgtt ctacttgacc taatgaagaa 1080
tttactgaag ttggacccag ctgacagata cttgacagaa cagtgtttga atcaccctac 1140
atttcaaacc cagagacttc tggatcgttc tccttcaagg tcagcaaaaa gaaaacctta 1200
ccatgtggaa agcagcacat tgtctaatag aaaccaagcc ggcaaaagta ctgctttgca 1260
gtctcaccac agatctaaca gcaaggacat ccagaacctg agtgtaggcc tgccccgggc 1320
tgacgaaggt ctccctgcca atgaaagctt cctaaatgga aaccttgctg gagctagtct 1380
tagtccactg cacaccaaaa cctaccaagc aagcagccag cctgggtcta ccagcaaaga 1440
tctcaccaac aacaacatac cacaccttct tagcccaaaa gaagccaagt caaaaacaga 1500
gtttgatttt aatattgacc caaagccttc agaaggccca gggacaaagt acctcaagtc 1560
aaacagcaga tctcagcaga accgccactc attcatggaa agctctcaaa gcaaagctgg 1620
gacactgcag cccaatgaaa agcagagtcg gcatagctat attgacacaa ttccccagtc 1680
ctctaggagt ccctcctaca ggaccaaggc caaaagccat ggggcactga gtgactccaa 1740
gtctgtgagc aacctttctg aagccagggc ccaaattgcg gagcccagta ccagtaggta 1800
cttcccatct agctgcttag acttgaattc tcccaccagc ccaaccccca ccagacacag 1860
tgacacgaga actttgctca gcccttctgg aagaaataac cgaaatgagg gaacgctgga 1920
ctcacgtcga accacaacca gacattctaa gacgatggag gaattgaagc tgccggagca 1980
catggacagt agccattccc attcactgtc tgcacctcac gaatcttttt cttatggact 2040
gggctacacc agcccctttt cttcccagca acgtcctcat aggcattcta tgtatgtgac 2100
ccgtgacaaa gtgagagcca agggcttgga tggaagcttg agcatagggc aagggatggc 2160
agctagagcc aacagcctgc aactcttgtc accccagcct ggagaacagc tccctccaga 2220
gatgactgtg gcaagatctt cggtcaaaga gacctccaga gaaggcacct cttccttcca 2280
tacacgccag aagtctgagg gtggagtgta tcatgaccca cactctgatg atggcacagc 2340
ccccaaagaa aatagacacc tatacaatga tcctgtgcca aggagagttg gtagctttta 2400
cagagtgcca tctccacgtc cagacaattc tttccatgaa aataatgtgt caactagagt 2460
ttcttctcta ccatcagaga gcagttctgg aaccaaccac tcaaaaagac aaccagcatt 2520
cgatccatgg aaaagtcctg aaaatattag tcattcagag caactcaagg aaaaagagaa 2580
gcaaggattt ttcaggtcaa tgaaaaagaa aaagaagaaa tctcaaacag tacccaattc 2640
cgacagccct gatcttctga cgttgcagaa atccattcat tctgctagca ctccaagcag 2700
cagaccaaag gagtggcgcc ccgagaagat ctcagatctg cagacccaaa gccagccatt 2760
aaaatcactg cgcaagttgt tacatctctc ttcggcctca aatcacccgg cttcctcaga 2820
tccccgcttc cagcccttaa cagctcaaca aaccaaaaat tccttctcag aaattcggat 2880
tcaccccctg agccaggcct ctggcgggag cagcaacatc cggcaggaac ccgcaccgaa 2940
gggcaggcca gccctccagc tgccagacgg tggatgtgat ggcagaagac agagacacca 3000
ttctggaccc caagatagac gcttcatgtt aaggacgaca gaacaacaag gagaatactt 3060
ctgctgtggt gacccaaaga agcctcacac tccgtgcgtc ccaaaccgag cccttcatcg 3120
tccaatctcc agtcctgctc cctatccagt actccaggtc cgaggcactt ccatgtgccc 3180
gacactccag gtccgaggca ctgatgcttt cagctgccca acccagcaat ccgggttctc 3240
tttcttcgtg agacacgtta tgagggaagc cctgattcac agggcccagg taaaccaagc 3300
tgcgctcctg acataccatg agaatgcggc actgacgggc aagtgacttc tgcaagcctg 3360
cggctggtcc caatgccctg aatcacctct ctcatggaag aaccaattaa caccaatgaa 3420
tcaaccatta aaaa 3434
<210> 19
<211> 1030
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence
<400> 19
Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu
1 5 10 15
Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His
20 25 30
Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu
35 40 45
Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu
50 55 60
Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg
65 70 75 80
Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met
85 90 95
Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val
100 105 110
Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys
115 120 125
Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser
130 135 140
His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu
145 150 155 160
Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp
165 170 175
Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val
180 185 190
Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln
195 200 205
Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln
210 215 220
Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser
225 230 235 240
Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln
245 250 255
Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp
260 265 270
Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr
275 280 285
Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp
290 295 300
Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser
305 310 315 320
Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln
325 330 335
Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly
340 345 350
Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn
355 360 365
Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr
370 375 380
Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn
385 390 395 400
Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu
405 410 415
Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys
420 425 430
Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met
435 440 445
Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln
450 455 460
Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro
465 470 475 480
Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys
485 490 495
Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser
500 505 510
Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr
515 520 525
Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro
530 535 540
Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr
545 550 555 560
Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His
565 570 575
Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe
580 585 590
Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro
595 600 605
His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly
610 615 620
Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn
625 630 635 640
Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu
645 650 655
Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr
660 665 670
Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp
675 680 685
Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr
690 695 700
Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser
705 710 715 720
Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val
725 730 735
Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg
740 745 750
Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser
755 760 765
Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys
770 775 780
Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp
785 790 795 800
Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser
805 810 815
Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln
820 825 830
Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala
835 840 845
Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala
850 855 860
Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser
865 870 875 880
Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys
885 890 895
Gly Arg Pro Ala Leu Gln Leu Pro Asp Gly Gly Cys Asp Gly Arg Arg
900 905 910
Gln Arg His His Ser Gly Pro Gln Asp Arg Arg Phe Met Leu Arg Thr
915 920 925
Thr Glu Gln Gln Gly Glu Tyr Phe Cys Cys Gly Asp Pro Lys Lys Pro
930 935 940
His Thr Pro Cys Val Pro Asn Arg Ala Leu His Arg Pro Ile Ser Ser
945 950 955 960
Pro Ala Pro Tyr Pro Val Leu Gln Val Arg Gly Thr Ser Met Cys Pro
965 970 975
Thr Leu Gln Val Arg Gly Thr Asp Ala Phe Ser Cys Pro Thr Gln Gln
980 985 990
Ser Gly Phe Ser Phe Phe Val Arg His Val Met Arg Glu Ala Leu Ile
995 1000 1005
His Arg Ala Gln Val Asn Gln Ala Ala Leu Leu Thr Tyr His Glu
1010 1015 1020
Asn Ala Ala Leu Thr Gly Lys
1025 1030
<210> 20
<211> 960
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence
<400> 20
Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu
1 5 10 15
Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His
20 25 30
Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu
35 40 45
Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu
50 55 60
Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg
65 70 75 80
Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met
85 90 95
Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val
100 105 110
Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys
115 120 125
Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser
130 135 140
His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu
145 150 155 160
Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp
165 170 175
Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val
180 185 190
Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln
195 200 205
Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln
210 215 220
Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser
225 230 235 240
Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln
245 250 255
Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp
260 265 270
Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr
275 280 285
Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp
290 295 300
Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser
305 310 315 320
Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln
325 330 335
Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly
340 345 350
Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn
355 360 365
Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr
370 375 380
Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn
385 390 395 400
Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu
405 410 415
Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys
420 425 430
Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met
435 440 445
Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln
450 455 460
Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro
465 470 475 480
Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys
485 490 495
Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser
500 505 510
Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr
515 520 525
Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro
530 535 540
Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr
545 550 555 560
Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His
565 570 575
Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe
580 585 590
Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro
595 600 605
His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly
610 615 620
Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn
625 630 635 640
Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu
645 650 655
Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr
660 665 670
Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp
675 680 685
Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr
690 695 700
Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser
705 710 715 720
Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val
725 730 735
Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg
740 745 750
Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser
755 760 765
Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys
770 775 780
Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp
785 790 795 800
Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser
805 810 815
Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln
820 825 830
Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala
835 840 845
Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala
850 855 860
Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser
865 870 875 880
Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys
885 890 895
Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His
900 905 910
Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu
915 920 925
Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr
930 935 940
Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu
945 950 955 960
<210> 21
<211> 1030
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence
<400> 21
Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu
1 5 10 15
Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His
20 25 30
Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu
35 40 45
Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu
50 55 60
Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg
65 70 75 80
Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met
85 90 95
Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val
100 105 110
Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys
115 120 125
Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser
130 135 140
His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu
145 150 155 160
Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp
165 170 175
Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val
180 185 190
Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln
195 200 205
Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln
210 215 220
Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser
225 230 235 240
Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln
245 250 255
Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp
260 265 270
Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr
275 280 285
Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp
290 295 300
Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser
305 310 315 320
Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln
325 330 335
Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly
340 345 350
Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn
355 360 365
Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr
370 375 380
Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn
385 390 395 400
Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu
405 410 415
Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys
420 425 430
Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met
435 440 445
Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln
450 455 460
Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro
465 470 475 480
Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys
485 490 495
Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser
500 505 510
Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr
515 520 525
Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro
530 535 540
Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr
545 550 555 560
Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His
565 570 575
Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe
580 585 590
Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro
595 600 605
His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly
610 615 620
Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn
625 630 635 640
Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu
645 650 655
Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr
660 665 670
Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp
675 680 685
Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr
690 695 700
Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser
705 710 715 720
Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val
725 730 735
Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg
740 745 750
Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser
755 760 765
Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys
770 775 780
Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp
785 790 795 800
Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser
805 810 815
Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln
820 825 830
Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala
835 840 845
Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala
850 855 860
Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser
865 870 875 880
Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys
885 890 895
Gly Arg Pro Ala Leu Gln Leu Pro Asp Gly Gly Cys Asp Gly Arg Arg
900 905 910
Gln Arg His His Ser Gly Pro Gln Asp Arg Arg Phe Met Leu Arg Thr
915 920 925
Thr Glu Gln Gln Gly Glu Tyr Phe Cys Cys Gly Asp Pro Lys Lys Pro
930 935 940
His Thr Pro Cys Val Pro Asn Arg Ala Leu His Arg Pro Ile Ser Ser
945 950 955 960
Pro Ala Pro Tyr Pro Val Leu Gln Val Arg Gly Thr Ser Met Cys Pro
965 970 975
Thr Leu Gln Val Arg Gly Thr Asp Ala Phe Ser Cys Pro Thr Gln Gln
980 985 990
Ser Gly Phe Ser Phe Phe Val Arg His Val Met Arg Glu Ala Leu Ile
995 1000 1005
His Arg Ala Gln Val Asn Gln Ala Ala Leu Leu Thr Tyr His Glu
1010 1015 1020
Asn Ala Ala Leu Thr Gly Lys
1025 1030
<210> 22
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence
<400> 22
atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgttgtcgga 60
gaaggcgctt atggcgtggt gctgaagtgc agacacaaag aaacccacga gatcgtggcc 120
atcaagaagt tcaaggacag cgaagagaac gaggaagtga aagagacaac cctgcgcgag 180
ctgaagatgc tgagaaccct gaagcaagag aacatcgtgg aactgaaaga ggccttccgg 240
cggagaggca agctgtacct ggtgttcgag tacgtggaaa agaacatgct cgagctgctg 300
gaagagatgc ccaatggcgt gccacctgag aaagtgaagt cctacatcta ccagctgatc 360
aaggccatcc actggtgcca caagaacgac atcgtgcaca gagacatcaa gcccgagaac 420
ctgctgatct cccacaacga cgtgctgaag ctgtgcgact tcggcttcgc cagaaatctg 480
agcgagggca acaacgccaa ctacaccgag tatgtggcca ccagatggta cagaagccct 540
gaactgctgc tgggagcccc ttacggcaag tctgtggata tgtggtccgt gggctgtatc 600
ctgggagagc tgtctgatgg ccaacctctg tttcctggcg agtccgagat cgaccagctg 660
ttcacaatcc agaaggtgct gggccctctg cctagcgagc agatgaagct gttctacagc 720
aaccccagat tccacggcct gagattccct gccgtgaatc accctcagag cctggaaaga 780
agatacctgg gcatcctgaa cagcgtgctg ctggacctga tgaagaatct gctgaaactg 840
gaccccgccg acagatacct gaccgagcag tgtctgaacc atcctacctt tcagacccag 900
agactgctgg atagaagccc cagcagaagc gccaagagaa agccctacca cgtggaaagc 960
agcaccctga gcaatagaaa ccaggccgga aagagcactg ccctgcagag ccaccacaga 1020
agcaacagca aggacatcca gaacctgagc gtgggcctgc ctagagctga tgaaggactg 1080
cctgccaacg agagcttcct gaatggaaat ctggctggcg cctctctgag ccctctgcac 1140
acaaagacat accaggccag cagccagcct ggcagcacaa gcaaggacct gaccaacaac 1200
aacatccctc atctgctgag ccccaaagag gccaagagca agaccgagtt cgacttcaac 1260
atcgacccca agcctagcga aggccctggc accaagtacc tgaagtccaa ctccagaagc 1320
cagcagaacc ggcactcctt catggaaagc tctcagagca aggccggcac actgcagcct 1380
aacgagaagc agagcagaca cagctacatc gacacaatcc ctcagtcctc tcggagcccc 1440
agctacagaa caaaggccaa atctcacggc gccctgagcg atagcaagag cgtgtccaat 1500
ctgtccgagg ctagagccca gatcgccgag cctagcacca gcagatactt ccctagcagc 1560
tgcctggatc tgaacagccc tacaagcccc acacctacca ggcacagcga taccagaaca 1620
ctgctgtccc caagcggccg gaacaacaga aatgagggca ccctggacag cagacggacc 1680
accacaagac acagcaagac catggaagaa ctgaagctgc ccgagcacat ggactctagc 1740
cactctcatt ctctgagcgc ccctcacgag tcctttagct acggcctggg ctacacaagc 1800
ccattttcca gtcagcagcg gccccacaga cactctatgt acgtgaccag agacaaagtc 1860
cgcgccaaag gcctggatgg ctctctgtct attggacaag gcatggccgc cagagccaat 1920
agcctgcaac ttctgtctcc tcagcctggc gaacagctgc ctcctgaaat gacagtggcc 1980
cggtccagcg tgaaagaaac cagcagagag ggcacctcca gcttccacac cagacagaaa 2040
agcgaaggcg gcgtgtacca cgatcctcac tctgatgatg gcacagcccc taaagagaac 2100
agacacctgt acaacgaccc cgtgcctaga agagtgggct ccttctacag agtgccttct 2160
cctagacctg acaactcctt ccacgagaac aacgtgtcaa cccgggtgtc cagcctgcct 2220
tctgagagca gctctggcac aaaccactcc aagaggcagc ccgccttcga tccttggaag 2280
tcccctgaga atatcagcca ctccgagcag ctgaaagaga aagagaagca gggctttttc 2340
cggtccatga agaagaagaa aaagaagtcc cagacagtcc ccaacagcga cagccctgat 2400
ctcctgacac tgcagaagtc catccacagc gccagcacac ctagcagcag acctaaagag 2460
tggcggccag agaagatcag cgacctgcaa acacagagcc agcctctgaa gtccctgagg 2520
aagctgctgc atctgtcctc cgcctctaat caccctgcca gcagcgatcc cagatttcag 2580
ccactgacag cccagcagac caagaactcc ttcagcgaga tccggattca cccactgtct 2640
caggccagcg gcggcagctc taatatcaga caagagcccg ctcctaaggg cagacctgct 2700
ctccaactgc ctggacagat ggatcctggc tggcacgtgt cctctgtgac aagatctgcc 2760
accgagggac ctagctattc tgagcagctg ggcgccaagt ctggccccaa tggacacccc 2820
tacaaccgga ccaatcggag cagaatgccc aacctgaacg acctcaaaga aacagccctc 2880
tga 2883
<210> 23
<211> 466
<212> DNA
<213> Artificial Sequence
<220>
<223> promoter
<400> 23
ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60
gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120
aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180
actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240
ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300
cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360
cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420
tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcg 466
<210> 24
<211> 3009
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence
<400> 24
atgaagatcc ccaatatcgg caacgtgatg aataagttcg agatcctggg agtggtggga 60
gagggagcat acggcgtggt gctgaagtgc agacacaagg agacacacga gatcgtggcc 120
atcaagaagt ttaaggatag cgaggagaat gaggaggtga aggagacaac cctgcgcgag 180
ctgaagatgc tgcggacact gaagcaggag aacatcgtgg agctgaagga ggccttccgg 240
agaaggggca agctgtacct ggtgtttgag tacgtggaga agaacatgct ggagctgctg 300
gaggagatgc ctaatggcgt gccccctgag aaggtgaaga gctacatcta tcagctgatc 360
aaggccatcc actggtgcca caagaacgac atcgtgcacc gcgatatcaa gccagagaac 420
ctgctgatca gccacaatga cgtgctgaag ctgtgcgatt tcggctttgc ccggaacctg 480
tccgagggca acaacgccaa ttacacagag tacgtggcaa ccaggtggta ccggtcccct 540
gagctgctgc tgggagcacc atacggcaag tctgtggaca tgtggagcgt gggctgcatc 600
ctgggagagc tgtccgacgg acagccactg ttccctggcg agtctgagat cgatcagctg 660
tttaccatcc agaaggtgct gggccccctg ccttccgagc agatgaagct gttctactct 720
aacccaaggt tccacggcct gaggtttcca gccgtgaatc acccccagtc tctggagcgc 780
cggtatctgg gcatcctgaa cagcgtgctg ctggatctga tgaagaatct gctgaagctg 840
gaccctgccg atcgctacct gaccgagcag tgtctgaatc acccaacatt tcagacccag 900
agactgctgg acaggagccc ctcccgctct gccaagagga agccttatca cgtggagagc 960
tccaccctga gcaatcgcaa ccaggccggc aagtccacag ccctgcagtc tcaccaccgg 1020
agcaactcca aggacatcca gaatctgagc gtgggcctgc caagggcaga cgagggcctg 1080
cctgccaacg agtccttcct gaatggaaac ctggcaggag cctctctgag cccactgcac 1140
acaaagacct accaggcctc tagccagcct ggctccacat ctaaggacct gaccaacaat 1200
aacatccctc acctgctgag cccaaaggag gccaagtcca agaccgagtt cgactttaat 1260
atcgatccaa agcccagcga gggcccaggc acaaagtatc tgaagagcaa ctccagatct 1320
cagcagaata ggcactcttt catggagtcc tctcagagca aggccggcac cctgcagccc 1380
aacgagaagc agagcaggca ctcctacatc gataccatcc cacagagctc ccgcagcccc 1440
tcctatcgga caaaggccaa gagccacggc gccctgtctg acagcaagtc cgtgtctaat 1500
ctgtccgagg caagagcaca gatcgcagag ccaagcacct ccaggtactt tccctcttcc 1560
tgtctggacc tgaactctcc aacaagccct acaccaacca gacacagcga tacaaggacc 1620
ctgctgtctc ccagcggcag aaataacagg aacgagggca ccctggatag cagaaggacc 1680
acaaccagac actccaagac aatggaggag ctgaagctgc ccgagcacat ggactcctct 1740
cactcccact ctctgagcgc ccctcacgag tccttctctt acggcctggg ctataccagc 1800
ccttttagct cccagcagcg cccacacagg cactccatgt acgtgacaag agacaaggtg 1860
agggccaagg gcctggacgg cagcctgtcc atcggacagg gaatggcagc aagggcaaat 1920
agcctgcagc tgctgtcccc acagcctgga gagcagctgc caccagagat gaccgtggcc 1980
agatctagcg tgaaggagac aagcagggag ggcacctcct ctttccacac aagacagaag 2040
agcgagggcg gcgtgtatca cgacccacac tccgacgacg gaaccgcacc caaggagaac 2100
aggcacctgt acaacgatcc agtgccccgc cgggtgggct ctttctatcg ggtgcctagc 2160
ccacggcccg acaactcctt tcacgagaat aacgtgtcta ccagagtgag ctccctgcct 2220
agcgagtcta gctccggcac aaaccactcc aagaggcagc cagcctttga tccctggaag 2280
tctcctgaga atatctctca cagcgagcag ctgaaggaga aggagaagca gggcttcttt 2340
cgcagcatga agaagaagaa gaagaagagc cagacaaccg acagcaccaa cggcgagaat 2400
cctagcatca agaagtccct gttcccactg tttaactcca agaatcacct gaagcactct 2460
agctccctga agaagctgcc cgtggtgaca cctccaatgg tgcccaattc cgactctcct 2520
gatctgctga ccctgcagaa gagcatccac agcgcctcca caccatctag cagacccaag 2580
gagtggaggc cagagaagat ctccgatctg cagacccagt cccagcccct gaagtctctg 2640
cggaagctgc tgcacctgtc ctctgccagc aaccaccctg caagctccga ccctaggttc 2700
cagccactga cagcccagca gaccaagaac tcttttagcg agatcagaat ccacccactg 2760
tcccaggcct ctggaggctc tagcaacatc cgccaggagc ctgccccaaa gggccggcca 2820
gccctgcagc tgccaggaca gatggacccc ggctggcacg tgtcctctgt gacaagatcc 2880
gccaccgagg gaccatccta ctctgagcag ctgggagcaa agtctggacc aaacggacac 2940
ccttataaca ggaccaatag atccaggatg cctaatctga acgacctgaa ggagacagcc 3000
ctgtgatag 3009
<210> 25
<211> 2835
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence
<400> 25
atgaagatcc ccaatatcgg caacgtgatg aataagttcg agatcctggg agtggtggga 60
gagggagcat acggagtggt gctgaagtgc cggcacaagg agacacacga gatcgtggcc 120
atcaagaagt ttaaggatag cgaggagaat gaggaggtga aggagacaac cctgagggag 180
ctgaagatgc tgcgcacact gaagcaggag aacatcgtgg agctgaagga ggccttccgg 240
agaaggggca agctgtacct ggtgtttgag tacgtggaga agaacatgct ggagctgctg 300
gaggagatgc ctaatggcgt gccccctgag aaggtgaaga gctacatcta tcagctgatc 360
aaggccatcc actggtgcca caagaacgac atcgtgcaca gggatatcaa gccagagaac 420
ctgctgatca gccacaatga cgtgctgaag ctgtgcgatt tcggctttgc ccgcaacctg 480
tccgagggca acaacgccaa ttacacagag tacgtggcaa ccaggtggta ccggtcccca 540
gagctgctgc tgggagcacc atacggcaag agcgtggaca tgtggtccgt gggctgcatc 600
ctgggcgagc tgtctgacgg ccagcctctg ttcccaggcg agagcgagat cgatcagctg 660
tttaccatcc agaaggtgct gggccctctg ccaagcgagc agatgaagct gttctactcc 720
aaccctaggt tccacggcct gcgctttccc gccgtgaatc accctcagag cctggagcgc 780
cggtatctgg gcatcctgaa ctccgtgctg ctggatctga tgaagaatct gctgaagctg 840
gaccccgccg ataggtacct gaccgagcag tgtctgaacc accccacatt ccagacccag 900
agactgctgg acaggtcccc ttctcgcaat caggccggca agtctacagc cctgcagagc 960
caccacagga gcaactccaa ggacatccag aatctgagcg tgggcctgcc tagggcagac 1020
gagggcctgc cagcaaacga gtcctttctg aatggaaacc tggcaggagc ctctctgagc 1080
ccactgcaca caaagaccta ccaggccagc tcccagccag gctccacatc taaggatctg 1140
accaacaata acatcccaca cctgctgtct cccaaggagg ccaagagcaa gaccgagttc 1200
gactttaata tcgatcccaa gcctagcgag ggcccaggca caaagtatct gaagagcaac 1260
tcccggagcc agcagaatag acactccttc atggagtcta gccagtctaa ggccggcacc 1320
ctgcagccca acgagaagca gagccgccac tcctacatcg ataccatccc ccagtcctct 1380
aggagccctt cctatcgcac aaaggccaag agccacggcg ccctgtctga cagcaagtcc 1440
gtgtctaatc tgtccgaggc aagggcacag atcgcagagc ccagcacctc cagatacttt 1500
cctagctcct gtctggacct gaactctcca acaagcccaa cacccacccg gcacagcgat 1560
acaagaaccc tgctgtctcc cagcggcaga aataacagga acgagggcac cctggattct 1620
agaaggacca caacccggca cagcaagaca atggaggagc tgaagctgcc cgagcacatg 1680
gactctagcc actcccactc tctgagcgcc cctcacgagt ccttctctta cggcctgggc 1740
tatacctccc cattttcctc tcaacagcgc ccccaccggc actctatgta cgtgacacgg 1800
gacaaggtga gagccaaggg cctggacggc agcctgtcca tcggacaggg aatggcagca 1860
agagcaaact ccctgcagct gctgtctcct cagccaggag agcagctgcc accagagatg 1920
accgtggcac ggagctccgt gaaggagaca agcagagagg gcacctctag cttccacaca 1980
cggcagaagt ccgagggcgg cgtgtatcac gaccctcact ctgacgacgg caccgcccca 2040
aaggagaaca gacacctgta caacgatcca gtgcctagga gggtgggctc cttctatcgg 2100
gtgccatctc cccgccctga caatagcttt cacgagaata acgtgtccac ccgggtgtcc 2160
tctctgccct ctgagagctc ctctggcaca aaccactcta agagacagcc cgcctttgac 2220
ccttggaaga gcccagagaa tatctctcac agcgagcagc tgaaggagaa ggagaagcag 2280
ggcttcttta ggagcatgaa gaagaagaag aagaagagcc agaccgtgcc taactccgac 2340
tctcccgatc tgctgaccct gcagaagagc atccacagcg cctccacacc aagctcccgg 2400
cctaaggagt ggcggcccga gaagatctcc gatctgcaga cccagagcca gccactgaag 2460
tccctgcgca agctgctgca cctgtctagc gccagcaacc accctgcctc ctctgaccca 2520
aggttccagc ccctgacagc ccagcagacc aagaactctt ttagcgagat ccgcatccac 2580
ccactgtccc aagcctctgg aggcagctcc aacatcaggc aggagccagc accaaagggc 2640
cgccccgccc tgcagctgcc tggacagatg gaccccggat ggcacgtgtc tagcgtgaca 2700
cggtccgcca ccgagggacc atcctactct gagcagctgg gagcaaagag cggacctaac 2760
ggacacccat ataacagaac caatagatcc aggatgccta atctgaacga cctgaaggag 2820
acagccctgt gatag 2835
<210> 26
<211> 2958
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence
<400> 26
atgaagatcc ccaatatcgg caacgtgatg aataagttcg agatcctggg agtggtggga 60
gagggagcat acggagtggt gctgaagtgc cggcacaagg agacacacga gatcgtggcc 120
atcaagaagt ttaaggatag cgaggagaat gaggaggtga aggagacaac cctgagggag 180
ctgaagatgc tgcgcacact gaagcaggag aacatcgtgg agctgaagga ggccttccgg 240
agaaggggca agctgtacct ggtgtttgag tacgtggaga agaacatgct ggagctgctg 300
gaggagatgc caaatggcgt gccccctgag aaggtgaagt cctacatcta tcagctgatc 360
aaggccatcc actggtgcca caagaacgac atcgtgcaca gggatatcaa gcccgagaac 420
ctgctgatct cccacaatga cgtgctgaag ctgtgcgatt tcggctttgc ccgcaacctg 480
agcgagggca acaacgccaa ttacacagag tacgtggcaa ccaggtggta ccggagccct 540
gagctgctgc tgggagcacc atacggcaag tctgtggaca tgtggagcgt gggctgcatc 600
ctgggagagc tgtccgacgg acagccactg ttccctggcg agtctgagat cgatcagctg 660
tttaccatcc agaaggtgct gggccccctg ccttccgagc agatgaagct gttctactct 720
aaccctaggt tccacggcct gcgctttcca gccgtgaatc acccccagtc tctggagcgc 780
cggtatctgg gcatcctgaa cagcgtgctg ctggatctga tgaagaatct gctgaagctg 840
gaccccgccg ataggtacct gaccgagcag tgtctgaacc accctacatt ccagacccag 900
agactgctgg acaggtcccc atctcgcaat caggccggca agtccacagc cctgcagtct 960
caccacagga gcaactccaa ggacatccag aatctgtccg tgggcctgcc aagggcagac 1020
gagggcctgc ctgccaacga gagctttctg aatggaaacc tggcaggagc ctctctgagc 1080
ccactgcaca caaagaccta ccaggccagc tcccagcctg gctccacatc taaggacctg 1140
accaacaata acatccctca cctgctgagc ccaaaggagg ccaagtccaa gaccgagttc 1200
gactttaata tcgatccaaa gccatccgag ggaccaggaa caaagtatct gaagagcaac 1260
tcccggagcc agcagaatag acactctttc atggagtcta gccagagcaa ggccggcacc 1320
ctgcagccta acgagaagca gagccgccac tcctacatcg ataccatccc acagtcctct 1380
aggagcccct cctatcgcac aaaggccaag tcccacggcg ccctgtctga cagcaagtcc 1440
gtgtctaatc tgagcgaggc aagggcacag atcgcagagc caagcacctc cagatacttt 1500
cccagctcct gtctggacct gaactctccc acaagcccta caccaacccg gcacagcgat 1560
acaagaaccc tgctgtctcc tagcggcaga aataacagga acgagggcac cctggatagc 1620
agaaggacca caaccaggca ctccaagaca atggaggagc tgaagctgcc tgagcacatg 1680
gactctagcc actcccactc tctgagcgcc ccacacgagt ccttctctta cggcctgggc 1740
tataccagcc ctttttcctc tcaacaacgc ccacaccggc actccatgta cgtgacacgg 1800
gacaaggtga gagccaaggg cctggacggc agcctgtcca tcggacaggg aatggcagca 1860
agggcaaata gcctgcagct gctgtcccca cagcctggag agcagctgcc accagagatg 1920
accgtggcac ggagctccgt gaaggagaca agcagagagg gcacctctag cttccacaca 1980
cggcagaaga gcgagggcgg cgtgtatcac gacccacact ccgacgacgg aaccgcacct 2040
aaggagaaca gacacctgta caacgatcca gtgccccgcc gggtgggctc tttctatcgg 2100
gtgcctagcc cacgccccga caactccttt cacgagaata acgtgtctac ccgggtgtcc 2160
tctctgccca gcgagagctc ctctggcaca aaccactcca agagacagcc agcctttgat 2220
ccctggaagt ctcctgagaa tatctctcac agcgagcagc tgaaggagaa ggagaagcag 2280
ggcttctttc ggtccatgaa gaagaagaag aagaagagcc agacaaccga cagcaccaac 2340
ggcgagaatc caagcatcaa gaagtccctg ttccccctgt ttaacagcaa gaatcacctg 2400
aagcacagct cctctctgaa gaagctgccc gtggtgacac ctccaatggt gcccaattcc 2460
gactctcctg atctgctgac cctgcagaag tccatccaca gcgcctccac accaagctcc 2520
cggcccaagg agtggcggcc cgagaagatc agcgatctgc agacccagtc ccagcccctg 2580
aagtctctga gaaagctgct gcacctgtct agcgcctcca accacccagc ctcctctgac 2640
cctcggttcc agccactgac agcccagcag accaagaact cttttagcga gatccgcatc 2700
cacccactgt cccaagcctc tggaggcagc tccaacatca ggcaggagcc tgccccaaag 2760
ggccgcccag ccctgcagct gccaggacag atggaccccg gctggcacgt gtctagcgtg 2820
acacggagcg ccaccgaggg accttcctac tctgagcagc tgggagcaaa gtctggacca 2880
aacggacacc cttataacag aaccaataga agcaggatgc caaatctgaa cgacctgaag 2940
gagacagccc tgtgatag 2958
<210> 27
<211> 588
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence
<400> 27
tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc 60
ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat 120
ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg 180
gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg 240
ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat 300
tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 360
gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc 420
ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa 480
tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg 540
ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgca 588
<210> 28
<211> 239
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleic acid sequence
<400> 28
ggccgcttcg agcagacatg ataagataca ttgatgagtt tggacaaacc acaactagaa 60
tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta tttgtaacca 120
ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg tttcaggttc 180
agggggagat gtgggaggtt ttttaaagca agtaaaacct ctacaaatgt ggtaaaatc 239
<210> 29
<211> 7627
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression cassette
<220>
<221> repeat_region
<222> (1)..(130)
<223> 5' ITR
<220>
<221> misc_feature
<222> (130)..(168)
<223> AAV2 seq upstream of 3'ITR
<220>
<221> promoter
<222> (226)..(1454)
<223> UbC promoter
<220>
<221> misc_feature
<222> (308)..(308)
<223> Insertion (C)
<220>
<221> misc_feature
<222> (1009)..(1009)
<223> Insertion (G)
<220>
<221> CDS
<222> (1470)..(4352)
<223> hCDKL5_1
<220>
<221> misc_feature
<222> (4353)..(4353)
<223> Deletion (G)
<220>
<221> misc_feature
<222> (4370)..(4391)
<223> miRNA183
<220>
<221> misc_feature
<222> (4396)..(4417)
<223> miRNA183
<220>
<221> misc_feature
<222> (4424)..(4445)
<223> miRNA183
<220>
<221> misc_feature
<222> (4452)..(4473)
<223> miRNA183
<220>
<221> polyA_signal
<222> (4482)..(4608)
<223> Rabbit Globin polyA
<220>
<221> misc_feature
<222> (4639)..(4677)
<223> AAV2 seq upstream of 3'ITR
<220>
<221> repeat_region
<222> (4677)..(4806)
<223> 3'ITR
<400> 29
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcc tctagaacta tagctagcat gctctaggaa gatctggcct ccgcgccggg 240
ttttggcgcc tcccgcgggc gcccccctcc tcacggcgag cgctgccacg tcagacgaag 300
ggcgcagcga gcgtcctgat ccttccgccc ggacgctcag gacagcggcc cgctgctcat 360
aagactcggc cttagaaccc cagtatcagc agaaggacat tttaggacgg gacttgggtg 420
actctagggc actggttttc tttccagaga gcggaacagg cgaggaaaag tagtcccttc 480
tcggcgattc tgcggaggga tctccgtggg gcggtgaacg ccgatgatta tataaggacg 540
cgccgggtgt ggcacagcta gttccgtcgc agccgggatt tgggtcgcgg ttcttgtttg 600
tggatcgctg tgatcgtcac ttggtgagta gcgggctgct gggctggccg gggctttcgt 660
ggccgccggg ccgctcggtg ggacggaagc gtgtggagag accgccaagg gctgtagtct 720
gggtccgcga gcaaggttgc cctgaactgg gggttggggg gagcgcagca aaatggcggc 780
tgttcccgag tcttgaatgg aagacgcttg tgaggcgggc tgtgaggtcg ttgaaacaag 840
gtggggggca tggtgggcgg caagaaccca aggtcttgag gccttcgcta atgcgggaaa 900
gctcttattc gggtgagatg ggctggggca ccatctgggg accctgacgt gaagtttgtc 960
actgactgga gaactcggtt tgtcgtctgt tgcgggggcg gcagttatgg cggtgccgtt 1020
gggcagtgca cccgtacctt tgggagcgcg cgccctcgtc gtgtcgtgac gtcacccgtt 1080
ctgttggctt ataatgcagg gtggggccac ctgccggtag gtgtgcggta ggcttttctc 1140
cgtcgcagga cgcagggttc gggcctaggg taggctctcc tgaatcgaca ggcgccggac 1200
ctctggtgag gggagggata agtgaggcgt cagtttcttt ggtcggtttt atgtacctat 1260
cttcttaagt agctgaagct ccggttttga actatgcgct cggggttggc gagtgtgttt 1320
tgtgaagttt tttaggcacc ttttgaaatg taatcatttg ggtcaatatg taattttcag 1380
tgttagacta gtaaattgtc cgctaaattc tggccgtttt tggctttttt gttagacgaa 1440
gctttattgc ggtagaattc gccgccacc atg aag atc ccc aac atc ggc aac 1493
Met Lys Ile Pro Asn Ile Gly Asn
1 5
gtg atg aac aag ttc gag atc ctg ggc gtt gtc gga gaa ggc gct tat 1541
Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly Ala Tyr
10 15 20
ggc gtg gtg ctg aag tgc aga cac aaa gaa acc cac gag atc gtg gcc 1589
Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile Val Ala
25 30 35 40
atc aag aag ttc aag gac agc gaa gag aac gag gaa gtg aaa gag aca 1637
Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys Glu Thr
45 50 55
acc ctg cgc gag ctg aag atg ctg aga acc ctg aag caa gag aac atc 1685
Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu Asn Ile
60 65 70
gtg gaa ctg aaa gag gcc ttc cgg cgg aga ggc aag ctg tac ctg gtg 1733
Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr Leu Val
75 80 85
ttc gag tac gtg gaa aag aac atg ctc gag ctg ctg gaa gag atg ccc 1781
Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu Met Pro
90 95 100
aat ggc gtg cca cct gag aaa gtg aag tcc tac atc tac cag ctg atc 1829
Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln Leu Ile
105 110 115 120
aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac aga gac atc 1877
Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg Asp Ile
125 130 135
aag ccc gag aac ctg ctg atc tcc cac aac gac gtg ctg aag ctg tgc 1925
Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys Leu Cys
140 145 150
gac ttc ggc ttc gcc aga aat ctg agc gag ggc aac aac gcc aac tac 1973
Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala Asn Tyr
155 160 165
acc gag tat gtg gcc acc aga tgg tac aga agc cct gaa ctg ctg ctg 2021
Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu Leu Leu
170 175 180
gga gcc cct tac ggc aag tct gtg gat atg tgg tcc gtg ggc tgt atc 2069
Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly Cys Ile
185 190 195 200
ctg gga gag ctg tct gat ggc caa cct ctg ttt cct ggc gag tcc gag 2117
Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu Ser Glu
205 210 215
atc gac cag ctg ttc aca atc cag aag gtg ctg ggc cct ctg cct agc 2165
Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu Pro Ser
220 225 230
gag cag atg aag ctg ttc tac agc aac ccc aga ttc cac ggc ctg aga 2213
Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly Leu Arg
235 240 245
ttc cct gcc gtg aat cac cct cag agc ctg gaa aga aga tac ctg ggc 2261
Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr Leu Gly
250 255 260
atc ctg aac agc gtg ctg ctg gac ctg atg aag aat ctg ctg aaa ctg 2309
Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu Lys Leu
265 270 275 280
gac ccc gcc gac aga tac ctg acc gag cag tgt ctg aac cat cct acc 2357
Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His Pro Thr
285 290 295
ttt cag acc cag aga ctg ctg gat aga agc ccc agc aga agc gcc aag 2405
Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Ser Ala Lys
300 305 310
aga aag ccc tac cac gtg gaa agc agc acc ctg agc aat aga aac cag 2453
Arg Lys Pro Tyr His Val Glu Ser Ser Thr Leu Ser Asn Arg Asn Gln
315 320 325
gcc gga aag agc act gcc ctg cag agc cac cac aga agc aac agc aag 2501
Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn Ser Lys
330 335 340
gac atc cag aac ctg agc gtg ggc ctg cct aga gct gat gaa gga ctg 2549
Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu Gly Leu
345 350 355 360
cct gcc aac gag agc ttc ctg aat gga aat ctg gct ggc gcc tct ctg 2597
Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala Ser Leu
365 370 375
agc cct ctg cac aca aag aca tac cag gcc agc agc cag cct ggc agc 2645
Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro Gly Ser
380 385 390
aca agc aag gac ctg acc aac aac aac atc cct cat ctg ctg agc ccc 2693
Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu Ser Pro
395 400 405
aaa gag gcc aag agc aag acc gag ttc gac ttc aac atc gac ccc aag 2741
Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp Pro Lys
410 415 420
cct agc gaa ggc cct ggc acc aag tac ctg aag tcc aac tcc aga agc 2789
Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser Arg Ser
425 430 435 440
cag cag aac cgg cac tcc ttc atg gaa agc tct cag agc aag gcc ggc 2837
Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys Ala Gly
445 450 455
aca ctg cag cct aac gag aag cag agc aga cac agc tac atc gac aca 2885
Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile Asp Thr
460 465 470
atc cct cag tcc tct cgg agc ccc agc tac aga aca aag gcc aaa tct 2933
Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala Lys Ser
475 480 485
cac ggc gcc ctg agc gat agc aag agc gtg tcc aat ctg tcc gag gct 2981
His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser Glu Ala
490 495 500
aga gcc cag atc gcc gag cct agc acc agc aga tac ttc cct agc agc 3029
Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro Ser Ser
505 510 515 520
tgc ctg gat ctg aac agc cct aca agc ccc aca cct acc agg cac agc 3077
Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg His Ser
525 530 535
gat acc aga aca ctg ctg tcc cca agc ggc cgg aac aac aga aat gag 3125
Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg Asn Glu
540 545 550
ggc acc ctg gac agc aga cgg acc acc aca aga cac agc aag acc atg 3173
Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys Thr Met
555 560 565
gaa gaa ctg aag ctg ccc gag cac atg gac tct agc cac tct cat tct 3221
Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser His Ser
570 575 580
ctg agc gcc cct cac gag tcc ttt agc tac ggc ctg ggc tac aca agc 3269
Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr Thr Ser
585 590 595 600
cca ttt tcc agt cag cag cgg ccc cac aga cac tct atg tac gtg acc 3317
Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr Val Thr
605 610 615
aga gac aaa gtc cgc gcc aaa ggc ctg gat ggc tct ctg tct att gga 3365
Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser Ile Gly
620 625 630
caa ggc atg gcc gcc aga gcc aat agc ctg caa ctt ctg tct cct cag 3413
Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser Pro Gln
635 640 645
cct ggc gaa cag ctg cct cct gaa atg aca gtg gcc cgg tcc agc gtg 3461
Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser Ser Val
650 655 660
aaa gaa acc agc aga gag ggc acc tcc agc ttc cac acc aga cag aaa 3509
Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg Gln Lys
665 670 675 680
agc gaa ggc ggc gtg tac cac gat cct cac tct gat gat ggc aca gcc 3557
Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly Thr Ala
685 690 695
cct aaa gag aac aga cac ctg tac aac gac ccc gtg cct aga aga gtg 3605
Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg Arg Val
700 705 710
ggc tcc ttc tac aga gtg cct tct cct aga cct gac aac tcc ttc cac 3653
Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser Phe His
715 720 725
gag aac aac gtg tca acc cgg gtg tcc agc ctg cct tct gag agc agc 3701
Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu Ser Ser
730 735 740
tct ggc aca aac cac tcc aag agg cag ccc gcc ttc gat cct tgg aag 3749
Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro Trp Lys
745 750 755 760
tcc cct gag aat atc agc cac tcc gag cag ctg aaa gag aaa gag aag 3797
Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys Glu Lys
765 770 775
cag ggc ttt ttc cgg tcc atg aag aag aag aaa aag aag tcc cag aca 3845
Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser Gln Thr
780 785 790
gtc ccc aac agc gac agc cct gat ctc ctg aca ctg cag aag tcc atc 3893
Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys Ser Ile
795 800 805
cac agc gcc agc aca cct agc agc aga cct aaa gag tgg cgg cca gag 3941
His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg Pro Glu
810 815 820
aag atc agc gac ctg caa aca cag agc cag cct ctg aag tcc ctg agg 3989
Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser Leu Arg
825 830 835 840
aag ctg ctg cat ctg tcc tcc gcc tct aat cac cct gcc agc agc gat 4037
Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser Ser Asp
845 850 855
ccc aga ttt cag cca ctg aca gcc cag cag acc aag aac tcc ttc agc 4085
Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser Phe Ser
860 865 870
gag atc cgg att cac cca ctg tct cag gcc agc ggc ggc agc tct aat 4133
Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser Ser Asn
875 880 885
atc aga caa gag ccc gct cct aag ggc aga cct gct ctc caa ctg cct 4181
Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln Leu Pro
890 895 900
gga cag atg gat cct ggc tgg cac gtg tcc tct gtg aca aga tct gcc 4229
Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg Ser Ala
905 910 915 920
acc gag gga cct agc tat tct gag cag ctg ggc gcc aag tct ggc ccc 4277
Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser Gly Pro
925 930 935
aat gga cac ccc tac aac cgg acc aat cgg agc aga atg ccc aac ctg 4325
Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro Asn Leu
940 945 950
aac gac ctc aaa gaa aca gcc ctc tga agcttatcga taccggtagt 4372
Asn Asp Leu Lys Glu Thr Ala Leu
955 960
gaattctacc agtgccatag gatagtgaat tctaccagtg ccatacacgt gagtgaattc 4432
taccagtgcc atagcatgca gtgaattcta ccagtgccat agcggccgcg atctttttcc 4492
ctctgccaaa aattatgggg acatcatgaa gccccttgag catctgactt ctggctaata 4552
aaggaaattt attttcattg caatagtgtg ttggaatttt ttgtgtctct cactcgatcg 4612
ataaggatct tcctagagca tggctacgta gataagtagc atggcgggtt aatcattaac 4672
tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 4732
gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 4792
gagcgagcgc gcagccttaa ttaacctaat tcactggccg tcgttttaca acgtcgtgac 4852
tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc 4912
tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 4972
ggcgaatggg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc 5032
agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc 5092
tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg 5152
ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca 5212
cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc 5272
tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct 5332
tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa 5392
caaaaattta acgcgaattt taacaaaata ttaacgctta caatttaggt ggcacttttc 5452
ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc 5512
cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga 5572
gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt 5632
ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag 5692
tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag 5752
aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta 5812
ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg 5872
agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca 5932
gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag 5992
gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc 6052
gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg 6112
tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc 6172
ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg 6232
cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg 6292
gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga 6352
cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac 6412
tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa 6472
aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 6532
aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 6592
gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 6652
cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 6712
ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttaggcc 6772
accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 6832
tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 6892
cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 6952
gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 7012
ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 7072
cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 7132
tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 7192
ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 7252
ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 7312
ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 7372
gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc agctggcacg 7432
acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg agttagctca 7492
ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg 7552
tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgcc agatttaatt 7612
aaggccttaa ttagg 7627
<210> 30
<211> 960
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 30
Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu
1 5 10 15
Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His
20 25 30
Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu
35 40 45
Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu
50 55 60
Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg
65 70 75 80
Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met
85 90 95
Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val
100 105 110
Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys
115 120 125
Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser
130 135 140
His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu
145 150 155 160
Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp
165 170 175
Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val
180 185 190
Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln
195 200 205
Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln
210 215 220
Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser
225 230 235 240
Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln
245 250 255
Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp
260 265 270
Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr
275 280 285
Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp
290 295 300
Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser
305 310 315 320
Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln
325 330 335
Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly
340 345 350
Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn
355 360 365
Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr
370 375 380
Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn
385 390 395 400
Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu
405 410 415
Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys
420 425 430
Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met
435 440 445
Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln
450 455 460
Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro
465 470 475 480
Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys
485 490 495
Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser
500 505 510
Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr
515 520 525
Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro
530 535 540
Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr
545 550 555 560
Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His
565 570 575
Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe
580 585 590
Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro
595 600 605
His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly
610 615 620
Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn
625 630 635 640
Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu
645 650 655
Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr
660 665 670
Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp
675 680 685
Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr
690 695 700
Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser
705 710 715 720
Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val
725 730 735
Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg
740 745 750
Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser
755 760 765
Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys
770 775 780
Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp
785 790 795 800
Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser
805 810 815
Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln
820 825 830
Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala
835 840 845
Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala
850 855 860
Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser
865 870 875 880
Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys
885 890 895
Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His
900 905 910
Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu
915 920 925
Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr
930 935 940
Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu
945 950 955 960
<210> 31
<211> 7210
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression cassette
<220>
<221> repeat_region
<222> (1)..(130)
<223> 5' ITR
<220>
<221> misc_feature
<222> (130)..(168)
<223> AAV2 seq upstream of 3' ITR
<220>
<221> promoter
<222> (224)..(1021)
<223> CBh
<220>
<221> misc_feature
<222> (801)..(801)
<223> A deletion
<220>
<221> CDS
<222> (1053)..(3935)
<223> hCDKL5-1
<220>
<221> misc_feature
<222> (3936)..(3936)
<223> Deletion (G)
<220>
<221> misc_feature
<222> (3953)..(3974)
<223> miRNA183
<220>
<221> misc_feature
<222> (3979)..(4000)
<223> miRNA183
<220>
<221> misc_feature
<222> (4007)..(4028)
<223> miRNA183
<220>
<221> misc_feature
<222> (4035)..(4056)
<223> miRNA183
<220>
<221> polyA_signal
<222> (4065)..(4191)
<223> Rabbit Globin PolyA
<220>
<221> misc_feature
<222> (4222)..(4260)
<223> AAV2 seq upstream of 3' ITR
<220>
<221> repeat_region
<222> (4260)..(4389)
<223> 3' ITR
<400> 31
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
aggaagatcc tctagaacta tagctagcgc ccttaagggt acccgttaca taacttacgg 240
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca atagtaacgc 300
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 360
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 420
ggcccgcctg gcattgtgcc cagtacatga ccttatggga ctttcctact tggcagtaca 480
tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc 540
tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt 600
gtgcagcgat gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 660
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 720
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 780
ggcgggcggg agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc 900
cttctcctcc gggctgtaat tagctgagca agaggtaagg gtttaaggga tggttggttg 960
gtggggtatt aatgtttaat tacctggagc acctgcctga aatcactttt tttcaggttg 1020
gcttaagctg cagaccggaa ttcgccgcca cc atg aag atc ccc aac atc ggc 1073
Met Lys Ile Pro Asn Ile Gly
1 5
aac gtg atg aac aag ttc gag atc ctg ggc gtt gtc gga gaa ggc gct 1121
Asn Val Met Asn Lys Phe Glu Ile Leu Gly Val Val Gly Glu Gly Ala
10 15 20
tat ggc gtg gtg ctg aag tgc aga cac aaa gaa acc cac gag atc gtg 1169
Tyr Gly Val Val Leu Lys Cys Arg His Lys Glu Thr His Glu Ile Val
25 30 35
gcc atc aag aag ttc aag gac agc gaa gag aac gag gaa gtg aaa gag 1217
Ala Ile Lys Lys Phe Lys Asp Ser Glu Glu Asn Glu Glu Val Lys Glu
40 45 50 55
aca acc ctg cgc gag ctg aag atg ctg aga acc ctg aag caa gag aac 1265
Thr Thr Leu Arg Glu Leu Lys Met Leu Arg Thr Leu Lys Gln Glu Asn
60 65 70
atc gtg gaa ctg aaa gag gcc ttc cgg cgg aga ggc aag ctg tac ctg 1313
Ile Val Glu Leu Lys Glu Ala Phe Arg Arg Arg Gly Lys Leu Tyr Leu
75 80 85
gtg ttc gag tac gtg gaa aag aac atg ctc gag ctg ctg gaa gag atg 1361
Val Phe Glu Tyr Val Glu Lys Asn Met Leu Glu Leu Leu Glu Glu Met
90 95 100
ccc aat ggc gtg cca cct gag aaa gtg aag tcc tac atc tac cag ctg 1409
Pro Asn Gly Val Pro Pro Glu Lys Val Lys Ser Tyr Ile Tyr Gln Leu
105 110 115
atc aag gcc atc cac tgg tgc cac aag aac gac atc gtg cac aga gac 1457
Ile Lys Ala Ile His Trp Cys His Lys Asn Asp Ile Val His Arg Asp
120 125 130 135
atc aag ccc gag aac ctg ctg atc tcc cac aac gac gtg ctg aag ctg 1505
Ile Lys Pro Glu Asn Leu Leu Ile Ser His Asn Asp Val Leu Lys Leu
140 145 150
tgc gac ttc ggc ttc gcc aga aat ctg agc gag ggc aac aac gcc aac 1553
Cys Asp Phe Gly Phe Ala Arg Asn Leu Ser Glu Gly Asn Asn Ala Asn
155 160 165
tac acc gag tat gtg gcc acc aga tgg tac aga agc cct gaa ctg ctg 1601
Tyr Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ser Pro Glu Leu Leu
170 175 180
ctg gga gcc cct tac ggc aag tct gtg gat atg tgg tcc gtg ggc tgt 1649
Leu Gly Ala Pro Tyr Gly Lys Ser Val Asp Met Trp Ser Val Gly Cys
185 190 195
atc ctg gga gag ctg tct gat ggc caa cct ctg ttt cct ggc gag tcc 1697
Ile Leu Gly Glu Leu Ser Asp Gly Gln Pro Leu Phe Pro Gly Glu Ser
200 205 210 215
gag atc gac cag ctg ttc aca atc cag aag gtg ctg ggc cct ctg cct 1745
Glu Ile Asp Gln Leu Phe Thr Ile Gln Lys Val Leu Gly Pro Leu Pro
220 225 230
agc gag cag atg aag ctg ttc tac agc aac ccc aga ttc cac ggc ctg 1793
Ser Glu Gln Met Lys Leu Phe Tyr Ser Asn Pro Arg Phe His Gly Leu
235 240 245
aga ttc cct gcc gtg aat cac cct cag agc ctg gaa aga aga tac ctg 1841
Arg Phe Pro Ala Val Asn His Pro Gln Ser Leu Glu Arg Arg Tyr Leu
250 255 260
ggc atc ctg aac agc gtg ctg ctg gac ctg atg aag aat ctg ctg aaa 1889
Gly Ile Leu Asn Ser Val Leu Leu Asp Leu Met Lys Asn Leu Leu Lys
265 270 275
ctg gac ccc gcc gac aga tac ctg acc gag cag tgt ctg aac cat cct 1937
Leu Asp Pro Ala Asp Arg Tyr Leu Thr Glu Gln Cys Leu Asn His Pro
280 285 290 295
acc ttt cag acc cag aga ctg ctg gat aga agc ccc agc aga agc gcc 1985
Thr Phe Gln Thr Gln Arg Leu Leu Asp Arg Ser Pro Ser Arg Ser Ala
300 305 310
aag aga aag ccc tac cac gtg gaa agc agc acc ctg agc aat aga aac 2033
Lys Arg Lys Pro Tyr His Val Glu Ser Ser Thr Leu Ser Asn Arg Asn
315 320 325
cag gcc gga aag agc act gcc ctg cag agc cac cac aga agc aac agc 2081
Gln Ala Gly Lys Ser Thr Ala Leu Gln Ser His His Arg Ser Asn Ser
330 335 340
aag gac atc cag aac ctg agc gtg ggc ctg cct aga gct gat gaa gga 2129
Lys Asp Ile Gln Asn Leu Ser Val Gly Leu Pro Arg Ala Asp Glu Gly
345 350 355
ctg cct gcc aac gag agc ttc ctg aat gga aat ctg gct ggc gcc tct 2177
Leu Pro Ala Asn Glu Ser Phe Leu Asn Gly Asn Leu Ala Gly Ala Ser
360 365 370 375
ctg agc cct ctg cac aca aag aca tac cag gcc agc agc cag cct ggc 2225
Leu Ser Pro Leu His Thr Lys Thr Tyr Gln Ala Ser Ser Gln Pro Gly
380 385 390
agc aca agc aag gac ctg acc aac aac aac atc cct cat ctg ctg agc 2273
Ser Thr Ser Lys Asp Leu Thr Asn Asn Asn Ile Pro His Leu Leu Ser
395 400 405
ccc aaa gag gcc aag agc aag acc gag ttc gac ttc aac atc gac ccc 2321
Pro Lys Glu Ala Lys Ser Lys Thr Glu Phe Asp Phe Asn Ile Asp Pro
410 415 420
aag cct agc gaa ggc cct ggc acc aag tac ctg aag tcc aac tcc aga 2369
Lys Pro Ser Glu Gly Pro Gly Thr Lys Tyr Leu Lys Ser Asn Ser Arg
425 430 435
agc cag cag aac cgg cac tcc ttc atg gaa agc tct cag agc aag gcc 2417
Ser Gln Gln Asn Arg His Ser Phe Met Glu Ser Ser Gln Ser Lys Ala
440 445 450 455
ggc aca ctg cag cct aac gag aag cag agc aga cac agc tac atc gac 2465
Gly Thr Leu Gln Pro Asn Glu Lys Gln Ser Arg His Ser Tyr Ile Asp
460 465 470
aca atc cct cag tcc tct cgg agc ccc agc tac aga aca aag gcc aaa 2513
Thr Ile Pro Gln Ser Ser Arg Ser Pro Ser Tyr Arg Thr Lys Ala Lys
475 480 485
tct cac ggc gcc ctg agc gat agc aag agc gtg tcc aat ctg tcc gag 2561
Ser His Gly Ala Leu Ser Asp Ser Lys Ser Val Ser Asn Leu Ser Glu
490 495 500
gct aga gcc cag atc gcc gag cct agc acc agc aga tac ttc cct agc 2609
Ala Arg Ala Gln Ile Ala Glu Pro Ser Thr Ser Arg Tyr Phe Pro Ser
505 510 515
agc tgc ctg gat ctg aac agc cct aca agc ccc aca cct acc agg cac 2657
Ser Cys Leu Asp Leu Asn Ser Pro Thr Ser Pro Thr Pro Thr Arg His
520 525 530 535
agc gat acc aga aca ctg ctg tcc cca agc ggc cgg aac aac aga aat 2705
Ser Asp Thr Arg Thr Leu Leu Ser Pro Ser Gly Arg Asn Asn Arg Asn
540 545 550
gag ggc acc ctg gac agc aga cgg acc acc aca aga cac agc aag acc 2753
Glu Gly Thr Leu Asp Ser Arg Arg Thr Thr Thr Arg His Ser Lys Thr
555 560 565
atg gaa gaa ctg aag ctg ccc gag cac atg gac tct agc cac tct cat 2801
Met Glu Glu Leu Lys Leu Pro Glu His Met Asp Ser Ser His Ser His
570 575 580
tct ctg agc gcc cct cac gag tcc ttt agc tac ggc ctg ggc tac aca 2849
Ser Leu Ser Ala Pro His Glu Ser Phe Ser Tyr Gly Leu Gly Tyr Thr
585 590 595
agc cca ttt tcc agt cag cag cgg ccc cac aga cac tct atg tac gtg 2897
Ser Pro Phe Ser Ser Gln Gln Arg Pro His Arg His Ser Met Tyr Val
600 605 610 615
acc aga gac aaa gtc cgc gcc aaa ggc ctg gat ggc tct ctg tct att 2945
Thr Arg Asp Lys Val Arg Ala Lys Gly Leu Asp Gly Ser Leu Ser Ile
620 625 630
gga caa ggc atg gcc gcc aga gcc aat agc ctg caa ctt ctg tct cct 2993
Gly Gln Gly Met Ala Ala Arg Ala Asn Ser Leu Gln Leu Leu Ser Pro
635 640 645
cag cct ggc gaa cag ctg cct cct gaa atg aca gtg gcc cgg tcc agc 3041
Gln Pro Gly Glu Gln Leu Pro Pro Glu Met Thr Val Ala Arg Ser Ser
650 655 660
gtg aaa gaa acc agc aga gag ggc acc tcc agc ttc cac acc aga cag 3089
Val Lys Glu Thr Ser Arg Glu Gly Thr Ser Ser Phe His Thr Arg Gln
665 670 675
aaa agc gaa ggc ggc gtg tac cac gat cct cac tct gat gat ggc aca 3137
Lys Ser Glu Gly Gly Val Tyr His Asp Pro His Ser Asp Asp Gly Thr
680 685 690 695
gcc cct aaa gag aac aga cac ctg tac aac gac ccc gtg cct aga aga 3185
Ala Pro Lys Glu Asn Arg His Leu Tyr Asn Asp Pro Val Pro Arg Arg
700 705 710
gtg ggc tcc ttc tac aga gtg cct tct cct aga cct gac aac tcc ttc 3233
Val Gly Ser Phe Tyr Arg Val Pro Ser Pro Arg Pro Asp Asn Ser Phe
715 720 725
cac gag aac aac gtg tca acc cgg gtg tcc agc ctg cct tct gag agc 3281
His Glu Asn Asn Val Ser Thr Arg Val Ser Ser Leu Pro Ser Glu Ser
730 735 740
agc tct ggc aca aac cac tcc aag agg cag ccc gcc ttc gat cct tgg 3329
Ser Ser Gly Thr Asn His Ser Lys Arg Gln Pro Ala Phe Asp Pro Trp
745 750 755
aag tcc cct gag aat atc agc cac tcc gag cag ctg aaa gag aaa gag 3377
Lys Ser Pro Glu Asn Ile Ser His Ser Glu Gln Leu Lys Glu Lys Glu
760 765 770 775
aag cag ggc ttt ttc cgg tcc atg aag aag aag aaa aag aag tcc cag 3425
Lys Gln Gly Phe Phe Arg Ser Met Lys Lys Lys Lys Lys Lys Ser Gln
780 785 790
aca gtc ccc aac agc gac agc cct gat ctc ctg aca ctg cag aag tcc 3473
Thr Val Pro Asn Ser Asp Ser Pro Asp Leu Leu Thr Leu Gln Lys Ser
795 800 805
atc cac agc gcc agc aca cct agc agc aga cct aaa gag tgg cgg cca 3521
Ile His Ser Ala Ser Thr Pro Ser Ser Arg Pro Lys Glu Trp Arg Pro
810 815 820
gag aag atc agc gac ctg caa aca cag agc cag cct ctg aag tcc ctg 3569
Glu Lys Ile Ser Asp Leu Gln Thr Gln Ser Gln Pro Leu Lys Ser Leu
825 830 835
agg aag ctg ctg cat ctg tcc tcc gcc tct aat cac cct gcc agc agc 3617
Arg Lys Leu Leu His Leu Ser Ser Ala Ser Asn His Pro Ala Ser Ser
840 845 850 855
gat ccc aga ttt cag cca ctg aca gcc cag cag acc aag aac tcc ttc 3665
Asp Pro Arg Phe Gln Pro Leu Thr Ala Gln Gln Thr Lys Asn Ser Phe
860 865 870
agc gag atc cgg att cac cca ctg tct cag gcc agc ggc ggc agc tct 3713
Ser Glu Ile Arg Ile His Pro Leu Ser Gln Ala Ser Gly Gly Ser Ser
875 880 885
aat atc aga caa gag ccc gct cct aag ggc aga cct gct ctc caa ctg 3761
Asn Ile Arg Gln Glu Pro Ala Pro Lys Gly Arg Pro Ala Leu Gln Leu
890 895 900
cct gga cag atg gat cct ggc tgg cac gtg tcc tct gtg aca aga tct 3809
Pro Gly Gln Met Asp Pro Gly Trp His Val Ser Ser Val Thr Arg Ser
905 910 915
gcc acc gag gga cct agc tat tct gag cag ctg ggc gcc aag tct ggc 3857
Ala Thr Glu Gly Pro Ser Tyr Ser Glu Gln Leu Gly Ala Lys Ser Gly
920 925 930 935
ccc aat gga cac ccc tac aac cgg acc aat cgg agc aga atg ccc aac 3905
Pro Asn Gly His Pro Tyr Asn Arg Thr Asn Arg Ser Arg Met Pro Asn
940 945 950
ctg aac gac ctc aaa gaa aca gcc ctc tga agcttatcga taccggtagt 3955
Leu Asn Asp Leu Lys Glu Thr Ala Leu
955 960
gaattctacc agtgccatag gatagtgaat tctaccagtg ccatacacgt gagtgaattc 4015
taccagtgcc atagcatgca gtgaattcta ccagtgccat agcggccgcg atctttttcc 4075
ctctgccaaa aattatgggg acatcatgaa gccccttgag catctgactt ctggctaata 4135
aaggaaattt attttcattg caatagtgtg ttggaatttt ttgtgtctct cactcgatcg 4195
ataaggatct tcctagagca tggctacgta gataagtagc atggcgggtt aatcattaac 4255
tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 4315
gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 4375
gagcgagcgc gcagccttaa ttaacctaat tcactggccg tcgttttaca acgtcgtgac 4435
tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc 4495
tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 4555
ggcgaatggg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc 4615
agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc 4675
tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg 4735
ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca 4795
cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc 4855
tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct 4915
tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa 4975
caaaaattta acgcgaattt taacaaaata ttaacgctta caatttaggt ggcacttttc 5035
ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc 5095
cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga 5155
gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt 5215
ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag 5275
tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag 5335
aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta 5395
ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg 5455
agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca 5515
gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag 5575
gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc 5635
gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg 5695
tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc 5755
ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg 5815
cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg 5875
gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga 5935
cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac 5995
tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa 6055
aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 6115
aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 6175
gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 6235
cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 6295
ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttaggcc 6355
accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 6415
tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 6475
cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 6535
gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 6595
ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 6655
cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 6715
tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 6775
ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 6835
ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 6895
ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 6955
gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc agctggcacg 7015
acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg agttagctca 7075
ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg 7135
tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgcc agatttaatt 7195
aaggccttaa ttagg 7210
<210> 32
<211> 960
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 32
Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu
1 5 10 15
Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His
20 25 30
Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu
35 40 45
Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu
50 55 60
Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg
65 70 75 80
Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met
85 90 95
Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val
100 105 110
Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys
115 120 125
Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser
130 135 140
His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu
145 150 155 160
Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp
165 170 175
Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val
180 185 190
Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln
195 200 205
Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln
210 215 220
Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser
225 230 235 240
Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln
245 250 255
Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp
260 265 270
Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr
275 280 285
Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp
290 295 300
Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser
305 310 315 320
Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln
325 330 335
Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly
340 345 350
Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn
355 360 365
Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr
370 375 380
Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn
385 390 395 400
Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu
405 410 415
Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys
420 425 430
Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met
435 440 445
Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln
450 455 460
Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro
465 470 475 480
Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys
485 490 495
Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser
500 505 510
Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr
515 520 525
Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro
530 535 540
Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr
545 550 555 560
Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His
565 570 575
Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe
580 585 590
Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro
595 600 605
His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly
610 615 620
Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn
625 630 635 640
Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu
645 650 655
Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr
660 665 670
Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp
675 680 685
Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr
690 695 700
Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser
705 710 715 720
Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val
725 730 735
Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg
740 745 750
Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser
755 760 765
Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys
770 775 780
Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp
785 790 795 800
Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser
805 810 815
Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln
820 825 830
Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala
835 840 845
Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala
850 855 860
Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser
865 870 875 880
Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys
885 890 895
Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His
900 905 910
Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu
915 920 925
Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr
930 935 940
Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu
945 950 955 960
<210> 33
<211> 2211
<212> DNA
<213> adeno-associated virus rh91
<220>
<221> CDS
<222> (1)..(2211)
<223> AAVrh.91
<400> 33
atg gct gcc gat ggt tat ctt cca gat tgg ctc gag gac aac ctc tct 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gag ggc att cgc gag tgg tgg gcg ctg aaa cct gga gcc ccg aaa ccc 96
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
aaa gcc aac cag caa aag cag gac gac ggc cgg ggt ctg gtg ctt cct 144
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
ggc tac aag tac ctc gga ccc ttc aac gga ctc gac aag ggg gag ccc 192
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gcg gcg gac gca gcg gcc ctc gag cac gac aag gcc tac gac 240
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctc aaa gcg ggt gac aat ccg tac ctg cgg tat aac cac gcc 288
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
gac gcc gag ttt cag gag cgt ctg caa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctc ggg cga gca gtc ttc cag gcc aag aag cgg gtt ctc gaa cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
ttt ggt ctg gtt gag gaa gca gct aag acg gct cct gga aag aaa cgt 432
Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
ccg gta gag cag tcg ccc caa gaa cca gac tcc tcc tcg ggc att ggc 480
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
aaa tca ggc cag cag ccc gcc aaa aag aga ctc aat ttc ggt cag act 528
Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
ggc gac tca gag tca gtc ccc gac cct caa cct ctc gga gaa cct cca 576
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
gaa acc ccc gct gct gtg gga cct act aca atg gct tca ggc ggt ggc 624
Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt aat gcc 672
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc atc 720
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
acc acc agc acc cga acc tgg gcc ctt cct acc tac aac aac cac ctc 768
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
tac aag caa atc tcc agc gct tca acg ggg gcc agt aac gac aac cac 816
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
tac ttt ggc tac agc acc ccc tgg ggg tat ttt gat ttc aac aga ttc 864
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
cac tgc cac ttc tca cca cgt gac tgg cag cga ctc att aac aac aac 912
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
tgg gga ttc cgg ccc aag aga ctc aac ttc aag ctc ttc aac atc cag 960
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
gtc aag gag gtc acg acg aat gat ggc gtc aca acc atc gct aat aac 1008
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
ctt acc agc acg gtt caa gtg ttc tcg gac tcg gag tac cag ctg ccg 1056
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
tac gtc ctc ggt tct gcg cac cag ggc tgc ctc cct ccg ttc ccg gcg 1104
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
gac gta ttc atg att cct cag tac ggc tac cta acg ctc aac aat ggc 1152
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
agc cag gcc gta gga cgt tca tcc ttt tat tgc ctg gaa tat ttc cca 1200
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
tct caa atg ctg aga acg ggc aac aac ttt acc ttc agc tac acc ttt 1248
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
gaa gat gtg cct ttc cac agc agt tac gcg cac agc cag agc ctg gac 1296
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
agg cta atg aat cct cta atc gac cag tac ctg tat tac cta aac aga 1344
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
act cag aat caa tcc gga agt gca caa aac aag gac ttg ctg ttt agc 1392
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
cgg ggg tct cca gct ggc atg tct gtt cag ccc aaa aac tgg cta ccc 1440
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
ggg ccc tgt tac cga cag cag cgt gtt tct aaa aca aaa aca gac aac 1488
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
aac aac agc aac ttt acc tgg act ggt gcc tcc aaa tac aat ctg aac 1536
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
gga cgt gaa tcc atc att aac cct ggc acc gct atg gca tcc cac aag 1584
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
gac gac gaa gac aaa ttt ttt ccc atg agc ggt gtt atg att ttt ggc 1632
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
aaa gaa aat gca gga gca tca aac act gca tta gac aat gtt atg att 1680
Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
aca gat gaa gag gaa att aaa gct acc aac ccc gtg gcc acc gag aga 1728
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
ttt gga act gtg gca gtc aat ctc caa agc agc aat aca gac cct gca 1776
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala
580 585 590
aca gga gac gtg cat gtc atg ggg gct tta cct ggc atg gtg tgg caa 1824
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
gac aga gac gtg tac ctg cag ggt ccc att tgg gcc aag att cct cac 1872
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
acg gat gga cac ttt cac ccg tct cct ctt atg ggc ggc ttt gga ctt 1920
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
aag cac ccg cct cct cag atc ctc atc aaa aac acg cct gtt cct gcg 1968
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
aat cct ccg gca gag ttt tcg gct aca aag ttt gct tca ttc atc acc 2016
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
cag tac tcc aca gga caa gtg agc gtg gaa att gaa tgg gag ctg cag 2064
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
aaa gaa aac agt aag cgc tgg aat cct gaa gtg cag tac acc tcc aac 2112
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
tac gcg aaa tct gcc aac gtt gat ttc act gtg gac aac aat gga ctt 2160
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
tat act gag cct cgc ccc att ggc acc cgt tac ctt acc cgt ccc ctt 2208
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
taa 2211
<210> 34
<211> 736
<212> PRT
<213> adeno-associated virus rh91
<400> 34
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 35
<211> 2211
<212> DNA
<213> adeno-associated virus rh91
<220>
<221> CDS
<222> (1)..(2211)
<223> AAVrh.91
<400> 35
atg gct gct gac ggt tat ctt cca gat tgg ctc gag gac aac ctt tct 48
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
gaa ggc att cgt gag tgg tgg gct ctg aaa cct gga gcc cct aaa ccc 96
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
aaa gcg aac caa caa aag cag gac gac ggc cgg ggt ctt gtg ctt ccg 144
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
ggt tac aaa tac ctc gga ccc ttc aac gga ctc gac aaa gga gag ccg 192
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
gtc aac gcg gcg gac gcg gca gcc ctc gaa cac gac aaa gct tac gac 240
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
cag cag ctc aag gcc ggt gac aac ccg tac ctc cgg tac aac cac gcc 288
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
gac gcc gag ttt cag gag cgt ctt caa gaa gat acg tct ttt ggg ggc 336
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
aac ctt ggc aga gca gtc ttc cag gcc aaa aag agg gtt ctt gag cct 384
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
ttt ggt ctg gtt gag gaa gca gct aaa acg gct cct gga aag aag agg 432
Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
cct gta gag cag tct cct cag gaa ccg gac tca tca tct ggt att ggc 480
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
aaa tcg ggc cag cag cct gcc aaa aaa aga cta aat ttc ggt cag act 528
Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
ggc gac tca gag tca gtc ccc gac cct caa cct ctc gga gaa cct cca 576
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
gaa acc ccc gct gct gtg gga cct act aca atg gct tca ggc ggt ggc 624
Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
gca cca atg gca gac aat aac gaa ggc gcc gac gga gtg ggt aat gcc 672
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
tca gga aat tgg cat tgc gat tcc aca tgg ctg ggc gac aga gtc atc 720
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
acc acc agc acc cga acc tgg gcc ctt cct acc tac aac aac cac ctc 768
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
tac aag caa atc tcc agc gct tca acg ggg gcc agt aac gac aac cac 816
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
tac ttt ggc tac agc acc ccc tgg ggg tat ttt gat ttc aac aga ttc 864
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
cac tgc cac ttc tca cca cgt gac tgg cag cga ctc att aac aac aac 912
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
tgg gga ttc cgg ccc aag aga ctc aac ttc aag ctc ttc aac atc cag 960
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
gtc aag gag gtc acg acg aat gat ggc gtc aca acc atc gct aat aac 1008
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
ctt acc agc acg gtt caa gtg ttc tcg gac tcg gag tac cag ctg ccg 1056
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
tac gtc ctc ggt tct gcg cac cag ggc tgc ctc cct ccg ttc ccg gcg 1104
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
gac gta ttc atg att cct cag tat gga tac ctc acc ctg aac aac gga 1152
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
agt caa gcg gtg gga cgc tca tcc ttt tac tgc ctg gag tac ttc cct 1200
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
tcg cag atg cta agg act gga aat aac ttc acc ttc agc tat acc ttc 1248
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
gag gat gta cct ttt cac agc agc tac gct cac agc cag agt ttg gat 1296
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
cgc ttg atg aat cct ctt att gat cag tat ctg tac tac ctg aac aga 1344
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
acg caa aat caa tct gga agt gca caa aac aag gac ctg ctt ttt agc 1392
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
cgg ggg tct cct gct ggc atg tct gtt cag ccc aaa aat tgg cta cct 1440
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
ggg ccc tgc tac cgg caa cag aga gtt tca aag act aaa aca gac aac 1488
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
aac aac agt aac ttt acc tgg aca ggt gcc agc aaa tat aat ctc aat 1536
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
ggc cgc gaa tcg atc att aat cca gga acc gct atg gcc agt cac aag 1584
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
gac gat gaa gac aaa ttt ttc cct atg agc ggc gtt atg ata ttt ggc 1632
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
aaa gaa aat gca gga gca agt aac act gca tta gat aat gta atg att 1680
Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
acg gat gaa gaa gag att aaa gct acc aat cct gtg gca aca gag aga 1728
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
ttt gga act gtg gca gtc aac ttg cag agc tca aat aca gac ccc gca 1776
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala
580 585 590
act gga gac gtc cat gtc atg ggg gcc tta cct ggc atg gtg tgg caa 1824
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
gat cgt gac gtg tac ctt caa gga cct atc tgg gca aag att cct cac 1872
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
acg gat gga cac ttt cat cct tct cct ctg atg gga ggc ttt gga ctg 1920
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
aaa cat ccg cct cct caa atc ctc atc aaa aat act ccg gta ccg gca 1968
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
aat cct ccg gca gag ttc agc gct aca aag ttt gct tca ttt atc act 2016
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
cag tac tcc act gga cag gtc agc gtg gaa att gag tgg gag cta cag 2064
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
aaa gaa aac agc aaa cgt tgg aat cca gag gtg cag tac act tcc aac 2112
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
tac gcg aag tct gcc aat gtg gac ttt act gta gac aac aat ggt ctt 2160
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
tat act gaa cct cgc cct att gga acc cgg tat ctc aca cga ccc ttg 2208
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
taa 2211
<210> 36
<211> 736
<212> PRT
<213> adeno-associated virus rh91
<400> 36
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 37
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> engineered nucleic acid sequence CDKL5co-A
<400> 37
atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgtggtgggc 60
gagggcgcct acggcgtggt gctgaagtgc aggcacaagg agacccacga gatcgtggcc 120
atcaagaagt tcaaggacag cgaggagaac gaggaggtga aggagaccac cctgagggag 180
ctgaagatgc tgaggaccct gaagcaggag aacatcgtgg agctgaagga ggccttcagg 240
aggaggggca agctgtacct ggtgttcgag tacgtggaga agaacatgct ggagctgctg 300
gaggagatgc ccaacggcgt gccccccgag aaggtgaaga gctacatcta ccagctgatc 360
aaggccatcc actggtgcca caagaacgac atcgtgcaca gggacatcaa gcccgagaac 420
ctgctgatca gccacaacga cgtgctgaag ctgtgcgact tcggcttcgc caggaacctg 480
agcgagggca acaacgccaa ctacaccgag tacgtggcca ccaggtggta caggagcccc 540
gagctgctgc tgggcgcccc ctacggcaag agcgtggaca tgtggagcgt gggctgcatc 600
ctgggcgagc tgagcgacgg ccagcccctg ttccccggcg agagcgagat cgaccagctg 660
ttcaccatcc agaaggtgct gggccccctg cccagcgagc agatgaagct gttctacagc 720
aaccccaggt tccacggcct gaggttcccc gccgtgaacc acccccagag cctggagagg 780
aggtacttgg gcatcctgaa cagcgtgctg ctggacctga tgaagaacct gctgaagctg 840
gaccccgccg acaggtactt gaccgagcag tgcctgaacc accccacctt ccagacccag 900
aggctgctgg acaggagccc cagcaggagc gccaagagga agccctacca cgtggagagc 960
agcaccctga gcaacaggaa ccaggccggc aagagcaccg ccctgcagag ccaccacagg 1020
agcaacagca aggacatcca gaacctgagc gtgggcctgc ccagggccga cgagggcctg 1080
cccgccaacg agagcttcct gaacggcaac ctggccggcg ccagcctgag ccccctgcac 1140
accaagacct accaggccag cagccagccc ggcagcacca gcaaggacct gaccaacaac 1200
aacatccccc acctgctgag ccccaaggag gccaagagca agaccgagtt cgacttcaac 1260
atcgacccca agcccagcga gggccccggc accaagtacc tgaagagcaa cagcaggagc 1320
cagcagaaca ggcacagctt catggagagc agccagagca aggccggcac cctgcagccc 1380
aacgagaagc agagcaggca cagctacatc gacaccatcc cccagagcag caggagcccc 1440
agctacagga ccaaggccaa gagccacggc gccctgagcg acagcaagag cgtgagcaac 1500
ctgagcgagg ccagggccca gatcgccgag cccagcacca gcaggtactt ccccagcagc 1560
tgcctggacc tgaacagccc caccagcccc acccccacca ggcacagcga caccaggacc 1620
ctgctgagcc ccagcggcag gaacaacagg aacgagggca ccctggacag caggaggacc 1680
accaccaggc acagcaagac catggaggag ctgaagctgc ccgagcacat ggacagcagc 1740
cacagccaca gcctgagcgc cccccacgag agcttcagct acggcctggg ctacaccagc 1800
cccttcagca gccagcagag gccccacagg cacagcatgt acgtgaccag ggacaaggtg 1860
agggccaagg gcctggacgg cagcctgagc atcggccagg gcatggccgc cagggccaac 1920
agcctgcagc tgctgagccc ccagcccggc gagcagctgc cccccgagat gaccgtggcc 1980
aggagcagcg tgaaggagac cagcagggag ggcaccagca gcttccacac caggcagaag 2040
agcgagggcg gcgtgtacca cgacccccac agcgacgacg gcaccgcccc caaggagaac 2100
aggcacctgt acaacgaccc cgtgcccagg agggtgggca gcttctacag ggtgcccagc 2160
cccaggcccg acaacagctt ccacgagaac aacgtgagca ccagggtgag cagcctgccc 2220
agcgagagca gcagcggcac caaccacagc aagaggcagc ccgccttcga cccctggaag 2280
agccccgaga acatcagcca cagcgagcag ctgaaggaga aggagaagca gggcttcttc 2340
aggagcatga agaagaagaa gaagaagagc cagaccgtgc ccaacagcga cagccccgac 2400
ctgctgaccc tgcagaagag catccacagc gccagcaccc ccagcagcag gcccaaggag 2460
tggaggcccg agaagatcag cgacctgcag acccagagcc agcccctgaa gagcctgagg 2520
aagctgctgc acctgagcag cgccagcaac caccccgcca gcagcgaccc caggttccag 2580
cccctgaccg cccagcagac caagaacagc ttcagcgaga tcaggatcca ccccctgagc 2640
caggccagcg gcggcagcag caacatcagg caggagcccg cccccaaggg caggcccgcc 2700
ctgcagctgc ccggccagat ggaccccggc tggcacgtga gcagcgtgac caggagcgcc 2760
accgagggcc ccagctacag cgagcagctg ggcgccaaga gcggccccaa cggccacccc 2820
tacaacagga ccaacaggag caggatgccc aacctgaacg acctgaagga gaccgccctg 2880
tga 2883
<210> 38
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> engineered nucleic acid sequence CDKL5co-B
<400> 38
atgaaaattc ccaatatcgg taacgtgatg aataaattcg aaatacttgg agtggtaggt 60
gagggcgcct atggtgttgt acttaaatgt agacacaaag aaacacacga aatcgtggcg 120
atcaagaaat ttaaggattc cgaggagaat gaggaagtca aagagaccac actacgcgag 180
ttgaaaatgt tacgaactct aaaacaggaa aacattgtag agttaaagga ggcttttcgc 240
cgtcgcggta aactatacct ggtctttgag tatgttgaga aaaacatgct agaactgctc 300
gaggaaatgc ctaatggcgt cccgccagaa aaagtcaaat cgtatattta ccagcttata 360
aaggccatcc attggtgtca taaaaacgat atcgttcatc gcgacattaa gccagaaaat 420
ctattgatat cccacaacga cgtgctaaaa ctttgcgact tcggcttcgc taggaaccta 480
tccgaaggga ataacgcgaa ttataccgaa tatgttgcga cacgatggta ccgtagtcct 540
gaacttctat taggggcgcc ctacggtaaa tctgtagata tgtggtcagt cgggtgtata 600
ttaggagaac tttcagacgg tcaacctctg ttcccaggcg agtccgagat cgatcagctt 660
tttacaatac agaaggtatt aggtcccctc ccaagtgagc aaatgaagct attctattca 720
aatccccggt ttcatggcct tagatttccg gcggtgaacc accctcagag tctggagagg 780
cgttatctcg ggatacttaa ttcagtctta ctcgatctga tgaagaattt gctaaaactg 840
gaccctgctg atcggtacct tacagagcaa tgccttaatc acccgacttt tcaaactcaa 900
cgactgttgg accggagtcc gtcacgctca gctaaaagga aaccatacca cgtagaatca 960
tcgacattat cgaatcgaaa ccaagcgggt aagagtaccg ctttgcaaag ccatcatcga 1020
tccaatagta aagacattca gaatctgtca gtgggattgc ctagagctga cgaaggatta 1080
ccggcgaacg agagttttct gaacggcaac ctcgcaggcg catctctgtc tccgcttcat 1140
acgaaaactt accaagcgtc atcacagcca ggcagtacga gtaaagacct gactaacaat 1200
aatattccac atctgttatc accgaaggaa gctaagagca agaccgagtt cgacttcaac 1260
atagacccca aaccctccga gggtcctggc accaagtatc tcaaatcaaa ctctagatct 1320
cagcagaaca ggcacagctt catggagtcc tcacaaagta aagctgggac actgcagccc 1380
aacgaaaagc aaagccgaca ttcttatatt gacacgatcc ctcagagttc acgcagccct 1440
agctatcgga caaaagctaa gtcccacggt gccctttctg attcgaagag tgttagtaac 1500
ctttccgaag ctagagccca aattgcggag cctagtacat cgagatactt cccctccagc 1560
tgcctggacc ttaactctcc aaccagcccc actccaacgc gccactcaga taccaggaca 1620
ctgctctcac catccggaag aaataataga aatgaaggaa cgcttgactc tcggcgcact 1680
acgacaaggc acagcaagac gatggaagaa cttaagctac ctgagcacat ggacagttcg 1740
cattcccact cactctcggc gccacatgag tcgttttcct atggactggg ttacacaagt 1800
ccctttagct ctcagcagcg tcctcaccgc cactctatgt acgttacaag ggataaagtt 1860
cgcgctaagg ggttggatgg gagtctttcc attggccaag gcatggccgc gcgggcaaat 1920
tctctacaac ttctttcgcc acagccaggt gagcaactcc caccagaaat gaccgtcgcc 1980
agaagcagtg ttaaagaaac ttcgagggag gggacatcat cgtttcatac ccgccagaaa 2040
tctgagggcg gtgtatatca tgatcctcat tccgacgacg gaacggcccc caaagagaac 2100
cgacacctat acaatgaccc tgtcccaagg agagtgggat ctttctatcg agttccttca 2160
ccaagacctg ataacagttt ccatgagaac aacgtttcca cgagggtgtc aagtctacct 2220
tcggaatcat cttccggaac caatcactca aaacgccagc cagctttcga tccatggaaa 2280
tcaccggaaa acatcagtca tagcgagcaa ttgaaagaga aagaaaagca aggttttttc 2340
agaagtatga agaagaagaa aaagaagtca cagaccgtac ctaattcaga tagtccagac 2400
ttgttaacgc tccagaaatc aattcatagc gcatcgactc catcgtcccg accaaaggaa 2460
tggcgccctg agaagatctc cgatctgcag acccaatccc aacccctgaa gtctctcagg 2520
aaattactcc acctctcgtc tgctagtaac caccccgcat cgtctgaccc tcgcttccag 2580
ccgctgacag cccagcaaac aaagaacagt ttctcagaaa tccggattca tcctttaagc 2640
caagctagcg gcggtagttc taacataaga caagagcccg ctccaaaggg cagacccgct 2700
ctgcagttgc ctgggcagat ggatcccggg tggcacgtct catcagtaac ccgaagtgcc 2760
accgagggcc cgtcatattc agagcagctc ggagcgaaaa gtggtcctaa cgggcaccca 2820
tataatcgaa caaaccgttc aaggatgcca aatctcaacg atctaaagga aacggccctt 2880
taa 2883
<210> 39
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> engineered nucleic acid sequence CDKL5co-C
<400> 39
atgaagatcc ccaatatcgg aaacgtgatg aacaaattcg agattctcgg agtggtgggc 60
gagggcgcct atggagtggt tttaaaatgc agacacaagg agacccacga gatcgtcgct 120
atcaaaaagt tcaaagactc cgaggaaaac gaagaggtca aggagaccac cttacgtgag 180
ctcaaaatgc tcagaacact gaagcaagag aatatcgtcg agctcaagga ggccttcaga 240
aggaggggca aactgtattt agtgttcgag tacgtggaga agaacatgct ggagctgctg 300
gaggaaatgc ccaacggcgt cccccccgaa aaggtgaaat cctacattta ccaactgatc 360
aaggccattc actggtgcca caaaaatgat atcgtccatc gtgacatcaa gcccgagaat 420
ctgctgatca gccataacga cgtgctgaaa ctgtgcgact tcggattcgc cagaaattta 480
agcgagggca acaacgccaa ttacaccgag tacgtcgcca caaggtggta taggagcccc 540
gagctgctgc tcggagcccc ttatggcaag agcgtggaca tgtggagcgt gggctgcatt 600
ctgggagaac tgtccgacgg ccagcctctg ttccccggcg agtccgagat tgaccagctg 660
ttcacaatcc agaaagtcct cggccctctg cccagcgaac aaatgaagct cttctacagc 720
aaccctcgtt tccacggttt aaggttcccc gccgtgaatc acccccagag cctcgagaga 780
aggtatctgg gcattctgaa cagcgtgctg ctcgatttaa tgaagaattt attaaagctg 840
gaccccgctg ataggtacct cacagagcag tgtttaaatc accccacctt ccagacccag 900
agactgctcg atcgtagccc tagcagatcc gccaaaagga agccttacca cgtcgagagc 960
tccactttaa gcaatcgtaa ccaagctgga aaatccaccg ctttacagtc ccaccatagg 1020
tccaacagca aagacattca gaatttaagc gtgggactgc ctagggctga cgagggcctc 1080
cccgccaacg aatccttttt aaatggcaat ctcgccggag ccagcctcag ccctttacat 1140
acaaaaacct accaagctag ctcccagccc ggtagcacct ccaaggacct caccaacaac 1200
aacatccccc atttactgtc ccccaaggag gccaagagca agaccgagtt tgactttaat 1260
atcgacccta agcccagcga gggacccggc acaaagtatc tgaagtccaa ttctcgtagc 1320
cagcagaatc gtcacagctt catggagagc tcccaaagca aggccggcac actgcagccc 1380
aatgagaagc aatctcgtca ttcctacatc gacaccatcc cccagagctc tcgtagcccc 1440
tcctatagga caaaggccaa gtcccacggc gctctgtccg attccaagtc cgtctccaat 1500
ttatccgagg ctcgtgccca gatcgccgaa cctagcacct ctcgttattt cccctcctct 1560
tgtctggacc tcaattcccc cacaagccct acacctactc gtcacagcga caccagaact 1620
ttactgagcc ccagcggaag gaataatcgt aacgagggca ctttagactc tcgtagaacc 1680
accacaaggc acagcaagac catggaggag ctgaagctgc ccgaacatat ggactcctcc 1740
cattcccatt ctttatccgc cccccacgag agcttcagct atggtttagg ctatacatcc 1800
cccttcagct cccagcagag accccacaga cactccatgt acgtgactcg tgataaggtg 1860
agggccaaag gactggatgg aagcctctcc atcggccaag gcatggccgc tcgtgccaat 1920
agcctccagt tattatcccc ccaacccgga gaacagctgc ctcccgaaat gacagtggcc 1980
agaagcagcg tcaaggaaac atctcgtgag ggaacctcca gctttcacac aaggcagaag 2040
agcgagggcg gagtctatca tgacccccac tccgatgacg gcacagcccc caaagagaat 2100
cgtcatctct acaacgaccc cgtgcctcgt agagtcggct ccttctacag agtccccagc 2160
cccagacccg acaacagctt tcacgagaac aacgtgagca ctcgtgtctc ctctttacct 2220
agcgagagct cctccggaac caaccacagc aaaaggcagc ccgccttcga cccttggaag 2280
tcccccgaaa acatcagcca cagcgagcag ctgaaggaga aagagaagca aggtttcttc 2340
agaagcatga aaaagaagaa gaaaaaatcc caaaccgtgc ccaactccga ctcccccgat 2400
ttactgaccc tccagaagtc catccactcc gcttccaccc ctagctccag acccaaggag 2460
tggaggcccg agaagatttc cgatttacag acacagagcc agcctctcaa gtctttaaga 2520
aagctgctgc atttatccag cgccagcaat caccccgctt ccagcgaccc taggttccag 2580
cctttaaccg cccagcagac caagaatagc ttttccgaga tccgtattca tcctctgagc 2640
caagctagcg gaggcagctc caacatcaga caagaacccg ctcctaaggg cagacccgct 2700
ttacaactcc ccggtcagat ggatcccggt tggcacgtga gcagcgtcac aaggagcgcc 2760
acagagggcc ccagctatag cgaacagctg ggcgccaaaa gcggacccaa cggccatccc 2820
tacaatagaa ccaatcgttc cagaatgccc aatctcaacg acctcaagga aacagcttta 2880
tga 2883
<210> 40
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> engineered nucleic acid sequence CDKL5co-D
<400> 40
atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgtcgtcggc 60
gaaggcgctt atggcgttgt gctgaagtgc agacacaaag aaacccacga gatcgtggcc 120
atcaagaagt tcaaggacag cgaagagaac gaggaagtga aagagacaac cctgcgcgag 180
ctgaagatgc tgcggaccct gaagcaagag aacatcgtgg aactgaaaga ggccttccgg 240
cggagaggca agctgtacct ggtgttcgag tacgtggaaa agaacatgct cgagctgctg 300
gaagagatgc ccaacggcgt gccacctgag aaagtgaagt cctacatcta ccagctgatc 360
aaggccatcc actggtgcca caagaacgac atcgtgcacc gggacatcaa gcccgagaac 420
ctgctgatct cccacaacga cgtgctgaag ctgtgcgact tcggcttcgc cagaaatctg 480
agcgagggca acaacgccaa ctacaccgaa tacgtggcca ccagatggta cagaagccct 540
gagctgctgc tgggagcccc ttatggcaag tccgtggata tgtggagcgt gggctgtatc 600
ctgggagagc tgtctgatgg ccagcctctg tttcctggcg agtccgagat cgaccagctg 660
ttcaccatcc agaaggtgct gggccctctg cctagcgagc agatgaagct gttctacagc 720
aaccccagat tccacggcct gagattcccc gccgtgaatc accctcagag cctggaaaga 780
agatacctgg gcatcctgaa cagcgtgctg ctggacctga tgaagaatct gctgaaactg 840
gaccccgccg acagatacct gaccgagcag tgcctgaacc atcctacctt tcagacccag 900
agactgctgg atcggagccc tagcagaagc gccaagagaa agccctacca cgtggaaagc 960
agcaccctga gcaacagaaa ccaggccggc aagtctacag ccctgcagag ccaccacaga 1020
agcaacagca aggacatcca gaacctgtcc gtgggcctgc ctagagccga tgaaggactg 1080
cctgccaacg agagcttcct gaacggaaat ctggctggcg cctctctgag ccctctgcac 1140
acaaagacat accaggccag cagccagcct ggcagcacaa gcaaggatct gaccaacaac 1200
aacatccctc atctgctgag ccccaaagag gccaagagca agaccgagtt cgacttcaac 1260
atcgacccca agcctagcga aggccctggc accaagtacc tgaagtccaa cagcagaagc 1320
cagcagaacc ggcactcctt catggaaagc tcccagagca aggccggcac actgcagcct 1380
aatgagaagc agagcagaca cagctacatc gacacaatcc cacagagcag caggtcccca 1440
agctacagga ccaaggccaa atctcacggc gccctgagcg atagcaagag cgtgtccaat 1500
ctgtccgagg ctagagccca gatcgccgag cctagcacca gcagatactt ccctagctcc 1560
tgcctggatc tgaacagccc aacaagcccc acacctacca ggcacagcga caccagaaca 1620
ctgctgtccc catccggcag aaacaaccgg aatgagggca ccctggacag cagacggacc 1680
accacaagac acagcaagac catggaagaa ctgaagctgc ccgagcacat ggactccagc 1740
cactctcatt ctctgagcgc ccctcacgag tccttctctt acggcctggg ctacacaagc 1800
cccttcagct ctcagcagag gccccacaga cactctatgt acgtgacccg ggacaaagtg 1860
cgcgccaaag gcctggatgg ctctctgtct atcggccaag gcatggccgc cagagccaat 1920
tctctgcagc tgctgtctcc tcagcctggg gaacaactgc ctcctgagat gaccgtggcc 1980
agatccagcg tgaaagaaac cagcagagag ggcacctcca gcttccacac cagacagaaa 2040
agcgaaggcg gagtgtacca cgatcctcac agcgacgacg gcacagcccc taaagagaac 2100
agacacctgt acaacgaccc cgtgcctaga agagtgggct ccttctacag agtgccttct 2160
cctagacctg acaactcctt ccacgagaac aatgtgtcca ccagagtgtc cagcctgcct 2220
tccgaaagca gctccggcac caaccactcc aagagacagc ctgctttcga cccctggaag 2280
tcccctgaga acatcagcca ctccgagcag ctgaaagaga aagagaagca gggctttttc 2340
cggtccatga agaagaagaa aaagaagtcc cagacggtcc ccaacagcga ctccccagat 2400
ctgctgaccc tgcagaagtc catccactcc gccagcacac ctagcagcag acccaaagag 2460
tggcggccag agaagatcag cgatctgcag acccagtctc agcctctgaa gtccctgagg 2520
aagctgctgc atctgagcag cgcctctaat caccctgcca gcagcgaccc tagatttcag 2580
ccactgacag cccagcagac caagaactcc ttcagcgaga tccggattca cccactgtct 2640
caggccagcg gcggcagcag caatatcaga caagagcccg ctcctaaggg cagacctgct 2700
ctgcaactgc ctggccagat ggatccagga tggcacgtgt cctctgtgac cagatccgcc 2760
acagagggac ctagctacag cgaacagctc ggcgccaagt ctggccctaa tggacacccc 2820
tacaaccgga ccaaccggtc cagaatgccc aacctgaacg acctcaaaga aacagccctg 2880
tga 2883
<210> 41
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> engineered nucleic acid sequence CDKL5coA1
<400> 41
atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgtcgtcggc 60
gaaggcgctt atggcgttgt gctgaagtgc agacacaaag aaacccacga gatcgtggcc 120
atcaagaagt tcaaggacag cgaagagaac gaggaagtga aagagacaac cctgcgcgag 180
ctgaagatgc tgcggaccct gaagcaagag aacatcgtgg aactgaaaga ggccttccgg 240
cggagaggca agctgtacct ggtgttcgag tacgtggaaa agaacatgct cgagctgctg 300
gaagagatgc ccaacggcgt gccacctgag aaagtgaagt cctacatcta ccagctgatc 360
aaggccatcc actggtgcca caagaacgac atcgtgcacc gggacatcaa gcccgagaac 420
ctgctgatct cccacaacga cgtgctgaag ctgtgcgact tcggcttcgc cagaaatctg 480
agcgagggca acaacgccaa ctacaccgaa tacgtggcca ccagatggta cagaagccct 540
gagctgctgc tgggagcccc ttacggcaag tccgtggata tgtggagcgt gggctgtatc 600
ctgggagagc tgtctgacgg ccagcctctg tttcctggcg agtccgagat cgaccagctg 660
ttcaccatcc agaaggtgct gggccctctg cctagcgagc agatgaagct gttctacagc 720
aaccccagat tccacggcct gagattcccc gccgtgaatc accctcagag cctggaaaga 780
agatacctgg gcatcctgaa cagcgtgctg ctggacctga tgaagaatct gctgaaactg 840
gaccccgccg acagatacct gaccgagcag tgcctgaacc atcctacctt tcaaacccag 900
agactgctgg atcggagccc tagcagaagc gccaagagaa agccctacca cgtggaaagc 960
agcaccctga gcaacagaaa ccaggccggc aagtctacag ccctgcagag ccaccacaga 1020
agcaacagca aggacatcca gaacctgtcc gtgggcctgc ctagagccga cgaaggactg 1080
cctgccaacg agagcttcct gaacggaaat ctggctggcg cctctctgag ccctctgcac 1140
acaaagacat accaggccag cagccagcct ggcagcacaa gcaaggatct gaccaacaac 1200
aacatccctc atctgctgag ccccaaagag gccaagagca agaccgagtt cgacttcaac 1260
atcgacccca agcctagcga aggccctggc accaagtacc tgaagtccaa cagcagaagc 1320
cagcagaacc ggcactcctt catggaaagc tcccagagca aggccggcac actgcagcct 1380
aacgagaagc agagcagaca cagctacatc gacacaatcc cacagagcag caggtcccca 1440
agctacagga ccaaggccaa atctcacggc gccctgagcg atagcaagag cgtgtccaat 1500
ctgtccgagg ctagagccca gatcgccgag cctagcacca gcagatactt ccctagctcc 1560
tgcctggatc tgaacagccc aacaagcccc acacctacca ggcacagcga caccagaaca 1620
ctgctgtccc catccggcag aaacaaccgg aacgagggca ccctggacag cagacggacc 1680
accacaagac acagcaagac catggaagaa ctgaagctgc ccgagcacat ggactccagc 1740
cactctcatt ctctgagcgc ccctcacgag tccttctctt acggcctggg ctacacaagc 1800
cccttcagct ctcagcagag gccccacaga cacagcatgt atgtgacccg ggacaaagtg 1860
cgcgccaaag gcctggacgg ctctctgtct atcggccaag gcatggccgc cagagccaat 1920
tctctgcagc tgctgtctcc tcagcctggg gaacaactgc ctcctgagat gaccgtggcc 1980
agatccagcg tgaaagaaac cagcagagag ggcacctcca gcttccacac cagacagaaa 2040
agcgaaggcg gagtgtacca cgatcctcac agcgacgacg gcacagcccc taaagagaac 2100
agacacctgt acaacgaccc cgtgcctaga agagtgggct ccttctacag agtgccttct 2160
cctagacctg acaactcctt ccacgagaac aacgtgtcca ccagagtgtc cagcctgcct 2220
tccgaaagca gctccggcac caaccactcc aagagacagc ctgctttcga cccctggaag 2280
tcccctgaga acatcagcca ctccgagcag ctgaaagaga aagagaagca gggctttttc 2340
cggtccatga agaagaagaa aaagaagtcc cagacggtcc ccaacagcga ctccccagat 2400
ctgctgaccc tgcagaagtc catccactcc gccagcacac ctagcagcag acccaaagag 2460
tggcggccag agaagatcag cgatctgcag acccagtctc agcctctgaa gtccctgagg 2520
aagctgctgc atctgagcag cgcctctaat caccctgcca gcagcgaccc tagatttcag 2580
ccactgacag cccagcagac caagaactcc ttcagcgaga tccggattca cccactgtct 2640
caggccagcg gcggcagcag caatatcaga caagagcccg ctcctaaggg cagacctgct 2700
ctgcaactgc ctggccagat ggatccaggc tggcacgtgt cctctgtgac cagatccgcc 2760
acagagggac ctagctacag cgaacagctc ggcgccaagt ctggccctaa cggacacccc 2820
tacaaccgga ccaaccggtc cagaatgccc aacctgaacg acctcaaaga gactgccctt 2880
tga 2883
<210> 42
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> engineered nucleic acid sequence CDKL5coB1
<400> 42
atgaagatcc ctaatatcgg caacgtgatg aataagttcg agatcctggg agtggtggga 60
gagggagcat acggagtggt gctgaagtgc cgccacaagg agacccacga gatcgtggcc 120
atcaagaagt ttaaggatag cgaggagaat gaggaggtga aggagaccac actgagagag 180
ctgaagatgc tgaggacact gaagcaggag aacatcgtgg agctgaagga ggccttccgg 240
agaaggggca agctgtacct ggtgtttgag tacgtggaga agaacatgct ggagctgctg 300
gaggagatgc ccaatggcgt gccccctgag aaggtgaagt cctacatcta tcagctgatc 360
aaggccatcc actggtgcca caagaacgac atcgtgcaca gagatatcaa gcctgagaac 420
ctgctgatct cccacaatga cgtgctgaag ctgtgcgatt tcggctttgc caggaacctg 480
agcgagggca acaacgccaa ttacacagag tacgtggcca cccgctggta cagaagccca 540
gagctgctgc tgggagcacc atacggcaag agcgtggaca tgtggtccgt gggctgcatc 600
ctgggcgagc tgtctgacgg ccagcctctg ttcccaggcg agagcgagat cgatcagctg 660
tttaccatcc agaaggtgct gggccctctg ccaagcgagc agatgaagct gttctactcc 720
aaccccagat tccacggcct gaggtttccc gccgtgaatc accctcagag cctggagcgc 780
cggtatctgg gcatcctgaa ctccgtgctg ctggatctga tgaagaatct gctgaagctg 840
gaccccgccg atcgctacct gaccgagcag tgtctgaatc accctacatt tcagacccag 900
cgcctgctgg accggagccc ttccagatct gccaagagga agccatatca cgtggagagc 960
tccaccctgt ccaatagaaa ccaggccggc aagtctacag ccctgcagag ccaccacagg 1020
agcaactcca aggacatcca gaatctgtcc gtgggactgc ctagggcaga cgagggactg 1080
ccagcaaacg agagcttcct gaacggaaac ctggcaggag catctctgag cccactgcac 1140
acaaagacct accaggcctc tagccagccc ggctccacat ctaaggacct gaccaacaat 1200
aacatcccac acctgctgtc tcccaaggag gccaagagca agaccgagtt cgactttaat 1260
atcgatccca agcctagcga gggccctggc acaaagtatc tgaagagcaa ctcccgctct 1320
cagcagaatc ggcactcctt catggagtcc tctcagtcta aggccggcac cctgcagcca 1380
aacgagaagc agagcaggca ctcctacatc gataccatcc cccagagctc cagaagccct 1440
tcctatagaa caaaggccaa gtctcacggc gccctgtctg acagcaagtc cgtgtctaat 1500
ctgagcgagg caagggcaca gatcgcagag cccagcacct cccggtactt tccttcttcc 1560
tgtctggacc tgaactctcc tacaagccca acacccaccc gccactccga tacacggacc 1620
ctgctgtctc caagcggcag aaataacagg aacgagggca ccctggattc tagaaggacc 1680
acaaccagac acagcaagac aatggaggag ctgaagctgc cagagcacat ggactcctct 1740
cactcccact ctctgagcgc ccctcacgag tccttctctt acggcctggg ctatacctcc 1800
cccttctcct cccaacaaag gccacaccgg cacagcatgt atgtgacaag ggacaaggtc 1860
cgggcaaagg gactggacgg aagcctgtcc atcggacagg gaatggcagc aagggccaac 1920
tccctgcagc tgctgtctcc tcagccagga gagcagctgc caccagagat gaccgtggca 1980
cgctctagcg tgaaggagac aagccgggag ggcacctcct ctttccacac acgccagaag 2040
tccgagggcg gcgtgtatca cgacccccac tctgacgacg gcacagcccc taaggagaac 2100
cggcacctgt acaacgatcc cgtgcctagg agggtgggat ccttctatag agtgccatct 2160
cccaggcctg acaatagctt tcacgagaat aacgtgtcca cccgcgtgag ctccctgcca 2220
tctgagtcta gctccggcac aaaccactct aagcggcagc ccgcctttga tccttggaag 2280
agcccagaga atatctctca cagcgagcag ctgaaggaga aggagaagca gggcttcttt 2340
agaagcatga agaagaagaa gaagaagagc cagaccgtgc ctaactccga ctctccagac 2400
ctgctgaccc tgcagaagtc catccacagc gcctccacac catctagcag gcctaaggag 2460
tggcggcctg agaagatcag cgatctgcag acccagagcc agccactgaa gtccctgagg 2520
aagctgctgc acctgtcctc tgccagcaac cacccagcca gctccgaccc aagattccag 2580
cccctgacag cccagcagac caagaacagc ttcagcgaga tcaggatcca cccactgtcc 2640
caggcatctg gaggatctag caacatcaga caggagccag caccaaaggg caggcccgcc 2700
ctgcagctgc ctggccagat ggacccaggc tggcacgtgt cctctgtgac acgctccgcc 2760
accgagggac catcctactc tgagcagctg ggagcaaaga gcggacctaa cggacaccca 2820
tataaccgga ccaatagatc caggatgccc aatctgaacg acctgaagga gacagccctg 2880
tga 2883
<210> 43
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> engineered nucleic acid sequence CDKL5coC1
<400> 43
atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgtggtgggc 60
gagggcgcct acggcgtggt gctgaagtgc aggcacaagg agacccacga gatcgtggcc 120
atcaagaagt tcaaggacag cgaggagaac gaggaggtga aggagaccac cctgagggag 180
ctgaagatgc tgaggaccct gaagcaggag aacatcgtgg agctgaagga ggccttcagg 240
aggaggggca agctgtacct ggtgttcgag tacgtggaga agaacatgct ggagctgctg 300
gaggagatgc ccaacggcgt gccccccgag aaggtgaaga gctacatcta ccagctgatc 360
aaggccatcc actggtgcca caagaacgac atcgtgcaca gggacatcaa gcccgagaac 420
ctgctgatca gccacaacga cgtgctgaag ctgtgcgact tcggcttcgc caggaacctg 480
agcgagggca acaacgccaa ctacaccgag tacgtggcca ccaggtggta caggagcccc 540
gagctgctgc tgggcgcccc ctacggcaag agcgtggaca tgtggagcgt gggctgcatc 600
ctgggcgagc tgagcgacgg ccagcccctg ttccccggcg agagcgagat cgaccagctg 660
ttcaccatcc agaaggtgct gggccccctg cccagcgagc agatgaagct gttctacagc 720
aaccccaggt tccacggcct gaggttcccc gccgtgaacc acccccagag cctggagagg 780
aggtatctgg gcatcctgaa cagcgtgctg ctggacctga tgaagaacct gctgaagctg 840
gaccccgccg acaggtatct gaccgagcag tgcctgaacc accccacctt ccagacccag 900
aggctgctgg acaggagccc cagcaggagc gccaagagga agccctacca cgtggagagc 960
agcaccctga gcaacaggaa ccaggccggc aagagcaccg ccctgcagag ccaccacagg 1020
agcaacagca aggacatcca gaacctgagc gtgggcctgc ccagggccga cgagggcctg 1080
cccgccaacg agagcttcct gaacggcaac ctggccggcg ccagcctgag ccccctgcac 1140
accaagacct accaggccag cagccagccc ggcagcacca gcaaggacct gaccaacaac 1200
aacatccccc acctgctgag ccccaaggag gccaagagca agaccgagtt cgacttcaac 1260
atcgacccca agcccagcga gggccccggc accaagtacc tgaagagcaa cagcaggagc 1320
cagcagaaca ggcacagctt catggagagc agccagagca aggccggcac cctgcagccc 1380
aacgagaagc agagcaggca cagctacatc gacaccatcc cccagagcag caggagcccc 1440
agctacagga ccaaggccaa gagccacggc gccctgagcg acagcaagag cgtgagcaac 1500
ctgagcgagg ccagggccca gatcgccgag cccagcacca gcagatactt ccccagcagc 1560
tgcctggacc tgaacagccc caccagcccc acccccaccc gccacagcga caccaggacc 1620
ctgctgagcc ccagcggcag gaacaacagg aacgagggca ccctggacag caggaggacc 1680
accaccaggc acagcaagac catggaggag ctgaagctgc ccgagcacat ggacagcagc 1740
cacagccaca gcctgagcgc cccccacgag agcttcagct acggcctggg ctacaccagc 1800
cccttcagca gccagcagag gccccacagg cacagcatgt acgtgaccag ggacaaagtg 1860
agggccaagg gcctggacgg cagcctgagc atcggccagg gcatggccgc cagggccaac 1920
agcctgcagc tgctgagccc ccagcccggc gagcagctgc cccccgagat gaccgtggcc 1980
aggagcagcg tgaaggagac cagcagggag ggcaccagca gcttccacac caggcagaag 2040
agcgagggcg gcgtgtacca cgacccccac agcgacgacg gcaccgcccc caaggagaac 2100
aggcacctgt acaacgaccc cgtgcccagg agggtgggca gcttctacag ggtgcccagc 2160
cccaggcccg acaacagctt ccacgagaac aatgtgagca ccagagtcag cagcctgccc 2220
agcgagagca gcagcggcac caaccacagc aagaggcagc ccgccttcga cccctggaag 2280
agccccgaga acatcagcca cagcgagcag ctgaaggaga aggagaagca gggcttcttc 2340
aggagcatga agaagaagaa gaagaagagc cagaccgtgc ccaacagcga cagccccgac 2400
ctgctgaccc tgcagaagag catccacagc gccagcaccc ccagcagcag gcccaaggag 2460
tggaggcccg agaagatcag cgacctgcag acccagagcc agcccctgaa gagcctgagg 2520
aagctgctgc acctgagcag cgccagcaac caccccgcca gcagcgaccc caggttccag 2580
cccctgaccg cccagcagac caagaacagc ttcagcgaga tcaggatcca ccccctgagc 2640
caggccagcg gcggcagcag caacatcagg caggagcccg cccccaaggg caggcccgcc 2700
ctgcagctgc ccggccagat ggaccccggc tggcacgtga gcagcgtgac caggagcgcc 2760
accgagggcc ccagctacag cgagcagctg ggcgccaaga gcggccccaa cggccacccc 2820
tacaacagga ccaacaggag caggatgccc aacctgaacg acctgaagga gaccgccctg 2880
tga 2883
<210> 44
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> engineered nucleic acid sequence CDKL5coD1
<400> 44
atgaagattc ccaacattgg gaatgtcatg aacaagtttg agattctggg cgtggtggga 60
gagggagcct acggcgttgt tctcaagtgc cgccacaagg aaactcacga gatcgtggct 120
atcaagaaat tcaaggatag tgaggaaaat gaagaagtca aggagacaac tcttcgagaa 180
ttaaagatgc tcagaacctt aaaacaagaa aatattgtgg aattgaaaga ggccttcaga 240
agacgaggaa aactctacct ggtgtttgaa tatgtggaga agaacatgct ggaactgttg 300
gaagagatgc ctaatggggt ccctcctgaa aaagtgaagt cctacatcta tcagctaatc 360
aaggccatcc actggtgcca caaaaatgat attgtccacc gggacatcaa accagagaat 420
ttgctcatca gccacaatga tgtgctcaaa ctttgtgatt ttggatttgc ccgaaacctc 480
tccgaaggca ataatgccaa ctacaccgag tacgtggcca cccgctggta tcgctctcca 540
gagcttctgc ttggggcccc ctatggcaag tctgtggaca tgtggagcgt tggctgcatc 600
ctgggcgagc tgtcagatgg gcagccactc ttcccagggg agtccgaaat cgaccagctg 660
ttcaccatcc agaaagtcct ggggccactt cccagcgagc aaatgaaact gttttacagc 720
aatccaagat ttcatggatt acgcttccct gctgtcaacc accctcaatc cctggagagg 780
agatacttgg gcatcctcaa cagtgtgctg ctggacctca tgaagaatct cctcaagttg 840
gaccctgccg acagatatct tactgagcag tgcctgaacc atcccacatt tcagacccag 900
agattgctag acaggagccc atcaaggagt gccaagagaa agccttatca tgtggagagc 960
agcacactat caaacagaaa ccaggctgga aagagtacag ctttacaatc tcaccaccgc 1020
tccaactcaa aggacattca gaacttgtca gttggactgc ccagagcaga tgagggactc 1080
cccgccaatg aaagcttcct gaatggaaac ctggcaggtg cctccctttc tcctctgcac 1140
acaaagacct accaggcgtc cagccaacct ggatccacat caaaagatct gaccaacaac 1200
aatatccccc accttttatc accaaaggaa gccaaaagta aaacagagtt cgacttcaac 1260
atcgacccca aaccttcaga agggcctggc accaaatatt taaaatcaaa ttcaagaagc 1320
cagcagaatc ggcactcatt catggaatcc tcacagagca aagctgggac actccagcca 1380
aatgagaagc agtccagaca tagttatatt gacaccattc ctcagtcatc cagatcccca 1440
agctaccgga caaaagccaa gagccatggc gcgctgtccg attccaagtc agtatcaaat 1500
ctttcagaag caagagctca gatcgcagag ccctccactt cccgctactt cccctcttca 1560
tgtttggatc tcaattcccc tacttcacct acacccaccc gtcatagtga cacacggacc 1620
ctgctcagtc caagcggcag gaataaccgg aacgagggca cactggacag ccgccgcacc 1680
accacaaggc attctaaaac catggaggag ctgaaattgc ccgagcacat ggactcttca 1740
cattctcatt cactatctgc acctcatgaa agttttagct atggattggg atataccagc 1800
cccttctcca gtcagcagag gcctcacaga cacagcatgt atgtcaccag ggacaaggtg 1860
cgggcaaagg gcctggatgg atctttaagt attggccagg gcatggctgc cagagcaaat 1920
tctcttcagc tgctttcacc ccagcctggg gaacaactgc caccagaaat gacagtggca 1980
aggagcagtg taaaagagac ctccagagaa ggaacatcca gcttccatac tcgccagaag 2040
tcggaaggtg gtgtgtacca cgacccacat tctgatgatg ggaccgctcc caaggaaaac 2100
aggcacctgt acaacgatcc tgtgccccgc cgcgtgggct ctttctacag agttccttct 2160
cctagaccag acaactcctt ccacgaaaac aatgtgtcca ccagagtgag cagtttaccc 2220
tctgagagtt ctagtggaac caatcattcc aaaagacagc ctgcatttga cccctggaag 2280
tccccggaga atatctccca ctccgagcag ctcaaagaaa aggagaaaca gggattcttc 2340
aggtccatga aaaagaagaa gaaaaaaagc cagacagtac caaacagcga ttctccagat 2400
cttctcactc tgcaaaaatc catccattct gccagtactc catcatctcg acccaaggag 2460
tggagacctg agaaaatttc agacctgcag actcagtctc agcccctgaa atctttgagg 2520
aagttattac acctctcatc agcttccaat cacccagcca gctcagatcc caggttccag 2580
ccgctcacag cccagcaaac aaaaaactct ttttcagaaa tacgtattca tcctttgtcc 2640
caggcatcag gaggcagcag caacatcagg caggagccag ctccaaaagg aaggcccgct 2700
ctgcagctgc caggacagat ggatccaggc tggcatgttt cctctgtcac tagatcagcc 2760
acagaaggac catcctattc tgaacagctg ggtgcaaaaa gtggccccaa tggccacccc 2820
tacaatagaa caaatcgcag cagaatgccc aacttaaatg acttgaaaga aacagcactg 2880
tga 2883
<210> 45
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> engineered nucleic acid sequence CDKL5coA2
<400> 45
atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgtcgtcggc 60
gaaggcgctt atggcgttgt gctgaagtgc agacacaaag aaacccacga gatcgtggcc 120
atcaagaagt tcaaggacag cgaagagaac gaggaagtga aagagacaac cctgcgcgag 180
ctgaagatgc tgcggaccct gaagcaagag aacatcgtgg aactgaaaga ggccttccgg 240
cggagaggca agctgtacct ggtgttcgag tacgtggaaa agaacatgct cgagctgctg 300
gaagagatgc ccaacggcgt gccacctgag aaagtgaagt cctacatcta ccagctgatc 360
aaggccatcc actggtgcca caagaacgac atcgtgcacc gggacatcaa gcccgagaac 420
ctgctgatct cccacaacga cgtgctgaag ctgtgcgact tcggcttcgc cagaaatctg 480
agcgagggca acaacgccaa ctacaccgaa tacgtggcca ccagatggta cagaagccct 540
gagctgctgc tgggagcccc ttacggcaag tccgtggata tgtggagcgt gggctgtatc 600
ctgggagagc tgtctgacgg ccagcctctg tttcctggcg agtccgagat cgaccagctg 660
ttcaccatcc agaaggtgct gggccctctg cctagcgagc agatgaagct gttctacagc 720
aaccccagat tccacggcct gagattcccc gccgtgaatc accctcagag cctggaaaga 780
agatacctgg gcatcctgaa cagcgtgctg ctggacctga tgaagaatct gctgaaactg 840
gaccccgccg acagatacct gaccgagcag tgcctgaacc atcctacctt tcaaacccag 900
agactgctgg atcggagccc tagcagaagc gccaagagaa agccctacca cgtggaaagc 960
agcaccctga gcaacagaaa ccaggccggc aagtctacag ccctgcagag ccaccacaga 1020
agcaacagca aggacatcca gaacctgtcc gtgggcctgc ctagagccga cgaaggactg 1080
cctgccaacg agagcttcct gaacggaaat ctggctggcg cctctctgag ccctctgcac 1140
acaaagacat accaggccag cagccagcct ggcagcacaa gcaaggatct gaccaacaac 1200
aacatccctc atctgctgag ccccaaagag gccaagagca agaccgagtt cgacttcaac 1260
atcgacccca agcctagcga aggccctggc accaagtacc tgaagtccaa cagcagaagc 1320
cagcagaacc ggcactcctt catggaaagc tcccagagca aggccggcac actgcagcct 1380
aacgagaagc agagcagaca cagctacatc gacacaatcc cacagagcag caggtcccca 1440
agctacagga ccaaggccaa atctcacggc gccctgagcg atagcaagag cgtgtccaat 1500
ctgtccgagg ctagagccca gatcgccgag cctagcacca gcagatactt ccctagctcc 1560
tgcctggatc tgaacagccc aacaagcccc acacctacca ggcacagcga caccagaaca 1620
ctgctgtccc catccggcag aaacaaccgg aacgagggca ccctggacag cagacggacc 1680
accacaagac acagcaagac catggaagaa ctgaagctgc ccgagcacat ggactccagc 1740
cactctcatt ctctgagcgc ccctcacgag tccttctctt acggcctggg ctacacaagc 1800
cccttcagct ctcagcagag gccccacaga cacagtatgt atgtgacccg ggacaaagtg 1860
cgcgccaaag gcctggacgg ctctctgtct atcggccaag gcatggccgc cagagccaat 1920
tctctgcagc tgctgtctcc tcagcctggg gaacaactgc ctcctgagat gaccgtggcc 1980
agatccagcg tgaaagaaac cagcagagag ggcacctcca gcttccacac cagacagaaa 2040
agcgaaggcg gagtgtacca cgatcctcac agcgacgacg gcacagcccc taaagagaac 2100
agacacctgt acaacgaccc cgtgcctaga agagtgggct ccttctacag agtgccttct 2160
cctagacctg acaactcctt ccacgagaac aacgtgtcca ccagagtgtc cagcctgcct 2220
tccgaaagca gctccggcac caaccactcc aagagacagc ctgctttcga cccctggaag 2280
tcccctgaga acatcagcca ctccgagcag ctgaaagaga aagagaagca gggctttttc 2340
cggtccatga agaagaagaa aaagaagtcc cagacggtcc ccaacagcga ctccccagat 2400
ctgctgaccc tgcagaagtc catccactcc gccagcacac ctagcagcag acccaaagag 2460
tggcggccag agaagatcag cgatctgcag acccagtctc agcctctgaa gtccctgagg 2520
aagctgctgc atctgagcag cgcctctaat caccctgcca gcagcgaccc tagatttcag 2580
ccactgacag cccagcagac caagaactcc ttcagcgaga tccggattca cccactgtct 2640
caggccagcg gcggcagcag caatatcaga caagagcccg ctcctaaggg cagacctgct 2700
ctgcaactgc ctggccagat ggatccaggc tggcacgtgt cctctgtgac cagatccgcc 2760
acagagggac ctagctacag cgaacagctc ggcgccaagt ctggccctaa cggacacccc 2820
tacaaccgga ccaaccggtc cagaatgccc aatctgaacg acctcaaaga aacggccctg 2880
tga 2883
<210> 46
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> engineered nucleic acid sequence CDKL5coB2
<400> 46
atgaagatcc caaatatcgg caacgtgatg aataagttcg agatcctggg agtggtggga 60
gagggagcat atggcgtggt gctgaagtgc aggcacaagg agacccacga gatcgtggcc 120
atcaagaagt ttaaggacag cgaggagaat gaggaggtga aggagaccac actgagagag 180
ctgaagatgc tgaggacact gaagcaggag aacatcgtgg agctgaagga ggccttccgg 240
agaaggggca agctgtacct ggtgtttgag tacgtggaga agaacatgct ggagctgctg 300
gaggagatgc caaatggcgt gccccctgag aaggtgaagt cctacatcta tcagctgatc 360
aaggccatcc actggtgcca caagaacgac atcgtgcaca gagatatcaa gcccgagaac 420
ctgctgatct cccacaatga cgtgctgaag ctgtgcgatt tcggctttgc caggaacctg 480
agcgagggca acaacgccaa ttacacagag tacgtggcca ccaggtggta caggagccca 540
gagctgctgc tgggagcacc atacggcaag agcgtggata tgtggtccgt gggctgcatc 600
ctgggcgagc tgtctgacgg ccagcctctg ttcccaggcg agagcgagat cgatcagctg 660
tttaccatcc agaaggtgct gggccctctg ccaagcgagc agatgaagct gttctactcc 720
aaccctagat tccacggcct gaggtttccc gccgtgaatc accctcagag cctggagcgc 780
cggtatctgg gcatcctgaa ctccgtgctg ctggatctga tgaagaatct gctgaagctg 840
gaccccgccg atagatacct gaccgagcag tgtctgaatc accctacatt tcagacccag 900
cgcctgctgg accggagccc ttccagatct gccaagagga agccatatca cgtggagagc 960
tccaccctgt ccaatagaaa ccaggccggc aagtctacag ccctgcagag ccaccacagg 1020
agcaactcca aggacatcca gaatctgtcc gtgggactgc ctagggcaga cgagggactg 1080
ccagccaacg agagcttcct gaacggaaac ctggcaggag catctctgag cccactgcac 1140
acaaagacct accaggcctc tagccagccc ggctccacat ctaaggacct gaccaacaat 1200
aacatcccac acctgctgtc tcccaaggag gccaagagca agaccgagtt cgactttaat 1260
atcgatccaa agcctagcga gggaccaggc acaaagtatc tgaagagcaa ctcccgctct 1320
cagcagaatc ggcactcctt catggagtcc tctcagtcta aggccggcac cctgcagcct 1380
aacgagaagc agagcagaca ctcctacatc gataccatcc cccagagctc cagaagccct 1440
tcctatagaa caaaggccaa gtctcacggc gccctgtctg acagcaagtc cgtgtctaat 1500
ctgagcgagg caagggcaca gatcgcagag cccagcacct cccggtactt tccttcttcc 1560
tgtctggacc tgaactctcc tacaagccca acacccaccc gccacagcga tacacggacc 1620
ctgctgtctc caagcggccg caataaccgg aacgagggca ccctggattc tagaaggacc 1680
acaacccgcc acagcaagac aatggaggag ctgaagctgc cagagcacat ggactcctct 1740
cactcccact ctctgagcgc ccctcacgag tccttctctt acggcctggg ctatacctcc 1800
cccttctcct cccaacaaag accccacagg cacagcatgt acgtgacaag ggacaaggtc 1860
cgggcaaagg gactggacgg aagcctgtcc atcggacagg gaatggcagc aagggccaac 1920
tccctgcagc tgctgtctcc tcagccagga gagcagctgc caccagagat gaccgtggca 1980
cgctctagcg tgaaggagac aagccgggag ggcacctcct ctttccacac acgccagaag 2040
tccgagggag gcgtgtacca cgacccacac tctgacgacg gcacagcccc taaggagaac 2100
cggcacctgt acaacgatcc cgtgcctagg agggtgggat ccttctatag agtgccatct 2160
cccaggcctg acaatagctt tcacgagaat aacgtgtcca cccgcgtgag ctccctgcca 2220
tctgagtcta gctccggcac aaaccactct aagcggcagc ccgcctttga cccttggaag 2280
agcccagaga atatctctca cagcgagcag ctgaaggaga aggagaagca gggcttcttt 2340
cgcagcatga agaagaagaa gaagaagagc cagaccgtgc ctaactccga ctctccagac 2400
ctgctgaccc tgcagaagtc catccacagc gcctccacac catctagcag gcctaaggag 2460
tggcggcctg agaagatcag cgatctgcag acccagagcc agccactgaa gtccctgcgg 2520
aagctgctgc acctgtcctc tgcctccaac cacccagcaa gctccgaccc aagattccag 2580
cccctgacag cccagcagac caagaacagc ttcagcgaga tcaggatcca ccctctgtcc 2640
caagcatctg gaggatctag caacatcaga caggagccag caccaaaggg caggcccgcc 2700
ctgcagctgc ctggccagat ggatccaggc tggcacgtgt cctctgtgac acgcagcgcc 2760
accgagggac catcctactc tgagcagctg ggagcaaaga gcggacctaa cggacaccca 2820
tataaccgga ccaatagatc caggatgccc aatctgaacg acctgaagga gacagccctg 2880
tga 2883
<210> 47
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> engineered nucleic acid sequence CDKL5coC2
<400> 47
atgaagatcc ccaacatcgg caacgtgatg aacaagttcg agatcctggg cgtggtgggc 60
gagggcgcct acggcgtggt gctgaagtgc aggcacaagg agacccacga gatcgtggcc 120
atcaagaagt tcaaggacag cgaggagaac gaggaggtga aggagaccac cctgagggag 180
ctgaagatgc tgaggaccct gaagcaggag aacatcgtgg agctgaagga ggccttcagg 240
aggaggggca agctgtacct ggtgttcgag tacgtggaga agaacatgct ggagctgctg 300
gaggagatgc ccaacggcgt gccccctgag aaggtgaaga gctacatcta ccagctgatc 360
aaggccatcc actggtgcca caagaacgac atcgtgcaca gggacatcaa gcccgagaac 420
ctgctgatca gccacaacga cgtgctgaag ctgtgcgact tcggcttcgc caggaacctg 480
agcgagggca acaacgccaa ctacaccgag tacgtggcca ccaggtggta caggagcccc 540
gagctgctgc tgggcgcccc ctacggcaag agcgtggaca tgtggagcgt gggctgcatc 600
ctgggcgagc tgagcgacgg ccagcccctg ttccccggcg agagcgagat cgaccagctg 660
ttcaccatcc agaaggtgct gggccccctg cccagcgagc agatgaagct gttctacagc 720
aaccccaggt tccacggcct gaggttcccc gccgtgaacc acccccagag cctggagagg 780
agatacctgg gcatcctgaa cagcgtgctg ctggacctga tgaagaacct gctgaagctg 840
gaccccgccg acagatacct gaccgagcag tgcctgaacc accccacctt ccagacccag 900
aggctgctgg acaggagccc cagcaggagc gccaagagga agccctacca cgtggagagc 960
agcaccctga gcaacaggaa ccaggccggc aagagcaccg ccctgcagag ccaccacagg 1020
agcaacagca aggacatcca gaacctgagc gtgggcctgc ccagggccga cgagggcctg 1080
cccgccaacg agagcttcct gaacggcaac ctggccggcg ccagcctgag ccccctgcac 1140
accaagacct accaggccag cagccagccc ggcagcacca gcaaggacct gaccaacaac 1200
aacatccccc acctgctgag ccccaaggag gccaagagca agaccgagtt cgacttcaac 1260
atcgacccca agcccagcga gggccccggc accaagtacc tgaagagcaa cagcaggagc 1320
cagcagaaca ggcacagctt catggagagc agccagagca aggccggcac cctgcagccc 1380
aacgagaagc agagcaggca cagctacatc gacaccatcc cccagagcag caggagcccc 1440
agctacagga ccaaggccaa gagccacggc gccctgagcg acagcaagag cgtgagcaac 1500
ctgagcgagg ccagggccca gatcgccgag cccagcacca gcagatactt ccccagcagc 1560
tgcctggacc tgaacagccc caccagcccc acccccacca ggcacagcga caccaggacc 1620
ctgctgagcc ccagcggcag gaacaacagg aacgagggca ccctggacag caggaggacc 1680
accaccaggc acagcaagac catggaggag ctgaagctgc ccgagcacat ggacagcagc 1740
cacagccaca gcctgagcgc ccctcacgag agcttcagct acggcctggg ctacaccagc 1800
cccttcagca gccagcagag gccccacagg cacagcatgt acgtgaccag ggacaaagtg 1860
agggccaagg gcctggacgg cagcctgagc atcggccagg gcatggccgc cagggccaac 1920
agcctgcagc tgctgagccc ccagcccggc gagcagctgc ctcccgagat gaccgtggcc 1980
aggagcagcg tgaaggagac cagcagggag ggcaccagca gcttccacac caggcagaag 2040
agcgagggcg gcgtgtacca cgacccccac agcgacgacg gcaccgcccc caaggagaac 2100
aggcacctgt acaacgaccc cgtgcccagg agggtgggca gcttctacag ggtgcccagc 2160
cccaggcccg acaacagctt ccacgagaac aatgtgagca ccagagtgag cagcctgccc 2220
agcgagagca gcagcggcac caaccacagc aagaggcagc ccgccttcga cccctggaag 2280
agccccgaga acatcagcca cagcgagcag ctgaaggaga aggagaagca gggcttcttc 2340
aggagcatga agaagaagaa gaagaagagc cagaccgtgc ccaacagcga cagccccgac 2400
ctgctgaccc tgcagaagag catccacagc gccagcaccc ccagcagcag gcccaaggag 2460
tggaggcccg agaagatcag cgacctgcag acccagagcc agcccctgaa gagcctgagg 2520
aagctgctgc acctgagcag cgccagcaac caccccgcca gcagcgaccc caggttccag 2580
cccctgaccg cccagcagac caagaacagc ttcagcgaga tcaggatcca ccccctgagc 2640
caggccagcg gcggcagcag caacatcagg caggagcccg cccccaaggg caggcccgcc 2700
ctgcagctgc ccggccagat ggaccccggc tggcacgtga gcagcgtgac caggagcgcc 2760
accgagggcc ccagctacag cgagcagctg ggcgccaaga gcggccccaa cggccacccc 2820
tacaacagga ccaacaggag caggatgccc aacctgaacg acctgaagga gaccgccctg 2880
tga 2883
<210> 48
<211> 2883
<212> DNA
<213> Artificial Sequence
<220>
<223> engineered nucleic acid sequence CDKL5coD2
<400> 48
atgaagatcc ctaacatcgg gaatgtcatg aacaagtttg aaatcctggg ggtggtgggg 60
gagggagctt atggagttgt tttgaaatgt cgtcataagg aaactcatga aatcgtggcc 120
attaagaagt tcaaggacag tgaggagaat gaagaggtga aggagaccac tctccgcgag 180
ctgaagatgc tgaggacact gaagcaggaa aacattgtgg agctgaagga ggccttccga 240
cgacggggta agttgtacct ggtgtttgag tacgtggaga aaaacatgtt agaacttctg 300
gaggaaatgc caaacggtgt acctccagaa aaagtcaagt catatatcta ccagttgatc 360
aaagccatcc actggtgtca taaaaatgac atcgtccaca gagatataaa accagagaat 420
cttctgatct ctcacaatga tgtattaaaa ctttgtgatt ttggttttgc ccgtaatctg 480
tctgaaggta ataatgctaa ctatactgag tatgtagcaa ctcgctggta cagatcgcct 540
gaactgctac tgggtgctcc ttacggaaaa agtgtggaca tgtggagcgt tggttgtatc 600
ctaggagagc tgagtgatgg gcagccattg ttcccggggg agagtgaaat tgaccaacta 660
ttcacaatcc agaaagtgct ggggccacta ccaagtgaac aaatgaaact tttttattca 720
aatcctagat ttcacggtct acgtttcccc gctgtgaacc atcctcagtc cttagaacgg 780
cgatatttag gcattctgaa ctctgttctg ttagatctga tgaagaattt actaaaatta 840
gacccggctg accgctattt gacagagcag tgtttaaatc atccaacctt ccagacacag 900
agactcctag accgttcacc atctagaagt gcgaaaagaa aaccctacca cgttgaatca 960
agtaccctct ccaatcgcaa ccaggctggg aagagtactg ccctacaatc gcaccacagg 1020
agtaatagta aagatattca gaatctatct gtagggcttc ctcgagcgga cgagggtcta 1080
cctgccaatg aaagtttcct caatggtaac ttagctgggg catcactgtc gccccttcat 1140
actaagacct accaagcctc atctcaaccg gggagtacta gtaaagacct caccaacaat 1200
aacatccccc atttattatc tcccaaggag gcgaaatcca agactgagtt cgatttcaac 1260
attgacccaa agccctctga agggcctggc accaaatacc tgaaatctaa tagcagaagt 1320
caacaaaata ggcacagctt catggagtcc tcgcagagca aagctggcac actgcaacct 1380
aatgaaaagc aaagccgaca ttcatatatt gataccatcc cccaatctag tagaagccct 1440
tcataccgca cgaaagcaaa gtctcatggc gcactgtcag attctaaatc cgtcagcaat 1500
ctcagtgaag ccagggctca gatcgccgag ccctctacat ctcgctactt tccctcatcc 1560
tgcctggacc taaactcccc gacctctccc acccccacgc gtcacagcga cacccgaaca 1620
ttactttcac cttcgggcag gaataatcga aatgagggca ccctagattc gcgccgtacg 1680
actacacggc attcaaaaac catggaagaa ttgaaattgc ctgagcacat ggattcgtca 1740
cactctcaca gtctatcggc ccctcacgag agtttcagtt acgggcttgg ctacaccagt 1800
cccttctcca gccagcaacg cccacaccgc cactccatgt atgtcacccg cgacaaggtc 1860
cgtgccaaag gactcgatgg cagcctaagc ataggacagg gcatggccgc cagggccaac 1920
agtctccagt tactaagtcc ccagcccgga gaacagctgc cacccgagat gactgtggct 1980
agatcgtccg tgaaagagac aagtagggaa gggacctcta gcttccacac cagacagaaa 2040
tccgaggggg gcgtgtatca tgaccctcat agtgatgatg gtacagcccc gaaggaaaat 2100
agacacttgt acaatgaccc tgtgccccga agagttggct ccttctaccg ggtgccctct 2160
ccacggccag acaacagctt ccatgagaac aatgtttcaa cccgggtaag ctccctgcct 2220
agtgaaagtt catccggaac aaatcactcg aagcgtcagc cagccttcga cccctggaag 2280
tctccggaga acataagtca cagcgagcag ctcaaagaaa aagaaaaaca aggcttcttc 2340
agaagcatga agaagaaaaa aaaaaagtct caaacagtgc caaattccga ttcccccgac 2400
ttattaacac tacaaaagag catccattca gcttctacgc caagcagtag gcccaaagag 2460
tggagacccg agaagatttc tgatctacag acccagtctc agcctttaaa atcgctcagg 2520
aagctgctgc acctgtcttc cgcttcaaac cacccggcct ccagtgaccc tcggtttcag 2580
ccactgactg cccagcagac taaaaatagt ttttcagaga tcaggattca tcccttatca 2640
caggcctctg gcggcagcag caatatccgg caggagcctg cccctaaagg ccggcccgcg 2700
ttgcagctgc ccggccagat ggacccaggc tggcatgtgt catcagttac acgcagtgcc 2760
acagaaggcc ccagctactc agaacaattg ggtgctaagt caggacccaa tggccaccca 2820
tacaaccgaa ccaacagatc aaggatgccc aacctcaacg acctcaaaga aacagctctc 2880
tga 2883
Claims (41)
- CDKL5 결핍 장애 (CDD)를 치료하는데 유용한 재조합 아데노 관련 바이러스 (rAAV)로서, 상기 rAAV는
(a) AAV 캡시드; 및
(b) (a)의 상기 AAV 캡시드에 포장된 벡터 게놈
을 포함하고, 상기 벡터 게놈은 역전된 말단 반복서열 (ITR), 및 중앙 신경계 세포에서 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 상기 기능적 인간 CDKL5 (hCDKL5)를 인코딩하는 핵산 서열인 hCDKL5 코딩 서열을 포함하고, 상기 hCDKL5 코딩 서열은 서열번호 3의 뉴클레오티드 699번 내지 3581번 (서열번호 22) 또는 서열번호 3의 뉴클레오티드 699번 내지 3581번 (서열번호 22)과 적어도 약 95% 일치하는 서열인, 재조합 아데노 관련 바이러스 (rAAV). - 제 1항에 있어서,
상기 hCDKL5 코딩 서열은 hCDKL5 전사물 변이체 1 내지 3 (NM_001037343.1 (서열번호 16), NM_ NM_001323289.2 (서열번호 17) 및 NM_003159.2 (서열번호 18)) 중 어느 하나와 80% 미만으로 일치하는, rAAV. - 제 1항 또는 제 2항에 있어서,
상기 기능적 hCDKL5는 서열번호 2의 아미노산 서열을 갖는, rAAV. - CDKL5 결핍 장애 (CDD)를 치료하는데 유용한 재조합 아데노 관련 바이러스 (rAAV)로서, 상기 rAAV는
(a) AAV 캡시드; 및
(b) (a)의 상기 rAAV 캡시드에 포장된 벡터 게놈
을 포함하고, 상기 벡터 게놈은 역전된 말단 반복서열 (ITR), 및 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 상기 기능적 인간 CDKL5 (hCDKL5)를 인코딩하는 핵산 서열인 hCDKL5 코딩 서열을 포함하고, 상기 기능적 hCDKL5은 기능적 hCDKL5 이소형 2 (hCDKL5-2GS), 기능적 hCDKL5 이소형 3 (hCDKL5-3GS) 또는 기능적 hCDKL5 이소형 4 (hCDKL5-4GS)인, 재조합 아데노 관련 바이러스 (rAAV). - 제 4항에 있어서,
상기 벡터 게놈은 서열번호 6의 아미노산 서열을 갖는 기능적 hCDKL5-2GS를 인코딩하는 핵산 서열을 포함하는, rAAV. - 제 4항 또는 제 5항에 있어서,
상기 hCDKL5 코딩 서열은 서열번호 6을 인코딩하는 서열번호 24 또는 이와 적어도 95% 일치하는 서열인, rAAV. - 제 4항에 있어서,
상기 벡터 게놈은 서열번호 8의 아미노산 서열을 갖는 기능적 hCDKL5-3GS를 인코딩하는 핵산 서열을 포함하는, rAAV. - 제 4항 또는 제 7항에 있어서,
상기 hCDKL5 코딩 서열은 서열번호 8을 인코딩하는 서열번호 25 또는 이와 적어도 95% 일치하는 서열인, rAAV. - 제 4항에 있어서,
상기 벡터 게놈은 서열번호 10의 아미노산 서열을 갖는 기능적 hCDKL5-4GS를 인코딩하는 핵산 서열을 포함하는, rAAV. - 제 4항 또는 제 9항에 있어서,
상기 hCDKL5 코딩 서열은 서열번호 10을 인코딩하는 서열번호 26 또는 이와 적어도 95% 일치하는 서열인, rAAV. - 제 1항 내지 제 10항 중 어느 한 항에 있어서,
상기 조절 서열은 뉴런 특이적 프로모터를 포함하는, rAAV. - 제 1항 내지 제 11항 중 어느 한 항에 있어서,
상기 조절 서열은 인간 시냅신 프로모터를 포함하는, rAAV. - 제 1항 내지 제 10항 중 어느 한 항에 있어서,
상기 조절 서열은 전신발현 프로모터를 포함하는, rAAV. - 제 1항 내지 제 10항 또는 제 13항 중 어느 한 항에 있어서,
상기 조절 서열은 CB7 프로모터를 포함하는, rAAV. - 제 1항 내지 제 10항 또는 제 13항 중 어느 한 항에 있어서,
상기 조절 서열은 UbC 프로모터를 포함하는, rAAV. - 제 1항 내지 제 6항 중 어느 한 항에 있어서,
상기 조절 서열은 코작 서열, 인트론, 인핸서, TATA 신호 및 폴리 A 서열 중 하나 이상을 추가로 포함하는, rAAV. - 제 1항 내지 제 6항 또는 제 16항 중 어느 한 항에 있어서,
상기 조절 서열은 WPRE 요소를 추가로 포함하는, rAAV. - 제 1항 내지 제 16항 중 어느 한 항에 있어서,
상기 벡터 게놈은 hCDKL5의 3' 미번역 영역에서 등쪽 뿌리 신경절 (drg) 특이적 miRNA 표적 서열의 적어도 2개의 일렬 반복서열을 추가로 포함하고, 상기 적어도 2개의 일렬 반복서열은 동일하거나 상이하고, miR-183 또는 miR-182를 표적할 수 있는 적어도 제 1 miRNA 표적 서열 및 적어도 제 2 miRNA 표적 서열을 포함하는, rAAV. - 제 1항 내지 제 16항 또는 제 18항 중 어느 한 항에 있어서,
상기 발현 카세트 mRNA 또는 DNA 양성 가닥에 대한 상기 적어도 제 1 및/또는 적어도 제 2 miRNA 표적 서열의 상기 miRNA 표적 서열은 (i) AGTGAATTCTACCAGTGCCATA (miR-183, 서열번호 11); 및 (ii) AGCAAAAATGTGCTAGTGCCAAA (서열번호 12)인, rAAV. - 제 18항 또는 제 19항에 있어서,
상기 둘 이상의 miRNA 표적 서열은 (A) GGAT; (B) CACGTG; 또는 (C) GCATGC 중 하나 이상으로부터 독립적으로 선택되는, rAAV. - 제 20항에 있어서,
상기 miRNA 표적 서열 사이에 위치한 스페이서는 첫 번째 miRNA 표적 서열의 3' 및/또는 마지막 miRNA 표적 서열의 5'에 위치할 수 있는, rAAV. - 제 20항 또는 제 21항에 있어서,
상기 miRNA 표적 서열 사이의 스페이서는 동일한, rAAV. - 제 1항 내지 제 22항 중 어느 한 항에 있어서,
상기 캡시드는 AAVhu68 캡시드, AAV9 캡시드 또는 AAVrh91 캡시드인, rAAV. - 제 1항 내지 제 23항 중 어느 한 항에 따른 rAAV의 스톡 및 수성 현탁 매질을 포함하는 조성물.
- 제 24항에 있어서,
상기 현탁액은 정맥내 투여, 경막내 투여, 대수조내 투여 또는 뇌실내 투여를 위해 제형화되는, 조성물, - 발현 카세트를 포함하는 벡터로서, 상기 발현 카세트는 hCDKL5 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5 (hCDKL5)를 인코딩하는 핵산 서열인 상기 hCDKL5 코딩 서열을 포함하고, 상기 hCDKL5 코딩 서열은 서열번호 22 또는 서열번호 22와 적어도 약 95% 일치하는 서열인, 벡터.
- 제 26항에 있어서,
상기 벡터는
재조합 파보바이러스, 재조합 렌티바이러스, 재조합 레트로바이러스 또는 재조합 아데노바이러스로부터 선택된 바이러스성 벡터; 또는
노출 DNA, 노출 RNA, 무기 입자, 지질 입자, 중합체 기반의 벡터 또는 키토산 기반의 제형물로부터 선택된 비-바이러스성 벡터인, 벡터. - CDD를 치료하는 방법으로서, 제 1항 내지 제 23항 중 어느 한 항에 따른 rAAV, 또는 제 26항 또는 제 27항에 따른 벡터의 유효량을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는, 방법.
- 제 1항 내지 제 23항 중 어느 한 항에 따른 rAAV를 생산하는데 유용한 rAAV 생산 시스템으로서,
(a) 클라드 F 캡시드 단백질을 인코딩하는 핵산 서열;
(b) 벡터 게놈; 및
(c) 상기 클라드 F 캡시드 내에 상기 벡터 게놈의 포장을 허용하기에 충분한 AAV rep 기능 및 헬퍼 기능
을 포함하는 세포 배양물을 포함하는, rAAV 생산 시스템. - 제 29항에 있어서,
상기 벡터 게놈은 서열번호 1인, rAAV 생산 시스템. - 제 29항에 있어서,
상기 벡터 게놈은 서열번호 29인, rAAV 생산 시스템. - 제 29항에 있어서,
상기 벡터 게놈은 서열번호 31인, rAAV 생산 시스템. - 제 29항 내지 제 32항 중 어느 한 항에 있어서,
상기 세포 배양물은 인간 배아 신장 293 세포 배양물인, rAAV 생산 시스템. - 제 29항 내지 제 33항 중 어느 한 항에 있어서,
상기 AAV rep은 상이한 AAV로부터 나오는, rAAV 생산 시스템. - 제 29항에 있어서,
상기 벡터 게놈은 서열번호 3인, rAAV 생산 시스템. - 제 29항에 있어서,
상기 벡터 게놈은 서열번호 5인, rAAV 생산 시스템. - 제 29항에 있어서,
상기 벡터 게놈은 서열번호 7인, rAAV 생산 시스템. - 제 29항에 있어서,
상기 벡터 게놈은 서열번호 9인, rAAV 생산 시스템. - 발현 카세트를 포함하는 벡터로서, 상기 발현 카세트는 hCDKL5-2GS 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5 이소형 2 (hCDKL5-2GS)를 인코딩하는 핵산 서열인 상기 hCDKL5-2GS 코딩 서열을 포함하고, 상기 hCDKL5-2GS 코딩 서열은 서열번호 24 또는 서열번호 24와 적어도 약 95% 일치하는 서열인, 벡터.
- 발현 카세트를 포함하는 벡터로서, 상기 발현 카세트는 hCDKL5-3GS 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5 이소형 3 (hCDKL5-3GS)를 인코딩하는 핵산 서열인 상기 hCDKL5-3GS 코딩 서열을 포함하고, 상기 hCDKL5-3GS 코딩 서열은 서열번호 25 또는 서열번호 25와 적어도 약 95% 일치하는 서열인, 벡터.
- 발현 카세트를 포함하는 벡터로서, 상기 발현 카세트는 hCDKL5-4GS 발현을 안내하는 조절 서열의 제어 하에 기능적 인간 CDKL5 이소형 4 (hCDKL5-4GS)를 인코딩하는 핵산 서열인 상기 hCDKL5-4GS 코딩 서열을 포함하고, 상기 hCDKL5-4GS 코딩 서열은 서열번호 26 또는 서열번호 26과 적어도 약 95% 일치하는 서열인, 벡터.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063016036P | 2020-04-27 | 2020-04-27 | |
US63/016,036 | 2020-04-27 | ||
US202063091032P | 2020-10-13 | 2020-10-13 | |
US63/091,032 | 2020-10-13 | ||
US202063109608P | 2020-11-04 | 2020-11-04 | |
US63/109,608 | 2020-11-04 | ||
PCT/US2021/029185 WO2021222118A1 (en) | 2020-04-27 | 2021-04-26 | Compositions useful in treatment of cdkl5 deficiency disorder (cdd) |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230003569A true KR20230003569A (ko) | 2023-01-06 |
Family
ID=78374221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227041749A KR20230003569A (ko) | 2020-04-27 | 2021-04-26 | Cdkl5 결핍 장애 (cdd)의 치료에 유용한 조성물 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20230167455A1 (ko) |
EP (1) | EP4150051A1 (ko) |
JP (1) | JP2023524437A (ko) |
KR (1) | KR20230003569A (ko) |
CN (1) | CN115885040A (ko) |
AU (1) | AU2021262735A1 (ko) |
BR (1) | BR112022021762A2 (ko) |
CA (1) | CA3176788A1 (ko) |
CO (1) | CO2022016956A2 (ko) |
IL (1) | IL297635A (ko) |
MX (1) | MX2022013504A (ko) |
WO (1) | WO2021222118A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL312241A (en) * | 2021-10-18 | 2024-06-01 | Univ Pennsylvania | Compositions useful in the treatment of CDKL5 deficiency disorder (CDD) |
WO2023102518A1 (en) * | 2021-12-03 | 2023-06-08 | The Board Of Regents Of The University Of Texas System | Gnao1 gene therapy vectors and uses thereof |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8999380B2 (en) * | 2012-04-02 | 2015-04-07 | Moderna Therapeutics, Inc. | Modified polynucleotides for the production of biologics and proteins associated with human disease |
EP3452101A2 (en) * | 2016-05-04 | 2019-03-13 | CureVac AG | Rna encoding a therapeutic protein |
-
2021
- 2021-04-26 EP EP21796098.8A patent/EP4150051A1/en active Pending
- 2021-04-26 MX MX2022013504A patent/MX2022013504A/es unknown
- 2021-04-26 US US17/997,301 patent/US20230167455A1/en active Pending
- 2021-04-26 IL IL297635A patent/IL297635A/en unknown
- 2021-04-26 CA CA3176788A patent/CA3176788A1/en active Pending
- 2021-04-26 KR KR1020227041749A patent/KR20230003569A/ko active Search and Examination
- 2021-04-26 JP JP2022565789A patent/JP2023524437A/ja active Pending
- 2021-04-26 CN CN202180045235.0A patent/CN115885040A/zh active Pending
- 2021-04-26 BR BR112022021762A patent/BR112022021762A2/pt unknown
- 2021-04-26 AU AU2021262735A patent/AU2021262735A1/en active Pending
- 2021-04-26 WO PCT/US2021/029185 patent/WO2021222118A1/en unknown
-
2022
- 2022-11-25 CO CONC2022/0016956A patent/CO2022016956A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
BR112022021762A2 (pt) | 2023-01-17 |
WO2021222118A1 (en) | 2021-11-04 |
AU2021262735A1 (en) | 2022-12-22 |
CO2022016956A2 (es) | 2022-12-09 |
CN115885040A (zh) | 2023-03-31 |
CA3176788A1 (en) | 2021-11-04 |
JP2023524437A (ja) | 2023-06-12 |
EP4150051A1 (en) | 2023-03-22 |
IL297635A (en) | 2022-12-01 |
US20230167455A1 (en) | 2023-06-01 |
MX2022013504A (es) | 2023-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220313760A1 (en) | Gene therapy for treating phenylketonuria | |
JP7037574B2 (ja) | 脊髄性筋萎縮症の治療に有用な組成物 | |
AU2018265531B2 (en) | Gene therapy for neuronal ceroid lipofuscinoses | |
CA3068328A1 (en) | Aav9-mediated gene therapy for treating mucopolysaccharidosis type i | |
JP2024063154A (ja) | ムコ多糖症ii型を治療するための遺伝子療法 | |
US20220202960A1 (en) | Compositions useful in treatment of rett syndrome | |
CN111718947A (zh) | 用于治疗ⅲa或ⅲb型粘多糖贮积症的腺相关病毒载体及用途 | |
US20230295660A1 (en) | Gene therapy for treating citrullenemia | |
KR20230003569A (ko) | Cdkl5 결핍 장애 (cdd)의 치료에 유용한 조성물 | |
CN113438954A (zh) | 可用于治疗gm1神经节苷脂病的组合物 | |
CA3185281A1 (en) | Compositions useful for treatment of charcot-marie-tooth disease | |
JP2023513487A (ja) | Gm1ガングリオシドーシスを治療するのに有用な組成物 | |
TW202045728A (zh) | 用於治療克拉培氏病之組成物 | |
CN118401667A (zh) | 用于治疗cdkl5缺乏症(cdd)的组合物 | |
JP2023526311A (ja) | クラッベ病の治療に有用な組成物 | |
WO2022094078A1 (en) | Compositions useful in treatment of rett syndrome | |
WO2023049846A1 (en) | Compositions useful for treatment of charcot-marie-tooth disease |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |